Mythos: Model, který Anthropic radši zamkl do trezoru
52:27
Podcast: Prompt

Mythos: Model, který Anthropic radši zamkl do trezoru

pred 1 dňom

Anthropic představil model Mythos, který podle firmy prolomil dosud neznámé softwarové bezpečnostní díry a zvládl kompletní simulaci velkého kybernetického útoku. Zároveň ho firma označila za tak nebezpečný, že ho veřejnosti raději vůbec neuvolní.

👇👇👇👇👇👇
Staňte se členy Voxpot Klubu! Přispějete tak na provoz nejen tohoto podcastu, získáte přístup na redakční Discord, k plným článkům a dalším klubovým bonusům. Vstup do Klubu najdete na https://www.voxpot.cz/klub/
👇👇👇👇👇👇

V bezpečnostních testech dokázal nový model Mythos údajně samostatně plánovat a provádět komplexní útoky, nacházet dosud nezdokumentované chyby v infrastruktuře a obcházet vlastní sandbox.

V novém dílu podcastu Prompt řešíme, jak se v Mythosu projevují dlouho diskutované problémy jako reward hacking a „řetěz myšlenek“, a proč se Anthropic pokouší měřit „emoce“ modelů.

Ptáme se, co z toho je reálný průlom ve výzkumu bezpečnosti, co naopak připomíná spíš PR, a proč část výzkumné scény tvrdí, že jsme s chápáním vnitřního fungování velkých jazykových modelů pořád na začátku.

Shownotes:
banger

Project Glasswing

Mythos System Card (244 stran)

Emotion Concepts paper

Attribution Graphs / Biology of LLM (mar 2025)

80,000 Hours — How scary is Claude Mythos?

Neel Nanda — mechanistic interpretability (EA Forum)

Steven Casper — reflections on Anthropic SAE research

Podcast Prompt je vložený na túto stránku z otvoreného informačného zdroja RSS. Všetky informácie, texty, predmety ochrany a ďalšie metadáta z informačného zdroja RSS sú majetkom autora podcastu a nie sú vlastníctvom prevádzkovateľa Podmaz, ktorý ani nevytvára ani nezodpovedá za ich obsah podcastov. Ak máš za to, že podcast porušuje práva iných osôb alebo pravidlá Podmaz, môžeš nahlásiť obsah. Ak je toto tvoj podcast a chceš získať kontrolu nad týmto profilom klikni sem.

Autor: Voxpot
Kategórie: Technológia
Táto webová stránka používa súbory cookies, ktoré sú potrebné pre správne fungovanie a skvalitňovanie webovej stránky. Ďalšie informácie o tom, ako používame súbory cookies, nájdete tu.
Bližšie informácie o spracúvaní osobných údajov ako aj o súboroch cookies nájdete tu.

Technické cookies

Vždy aktívne cookies sú nevyhnutne potrebné na základné fungovanie. Bez týchto súborov by sme nemohli poskytovať služby, ktoré umožňujú tejto stránke fungovať.

Funkčné cookies

Funkčné cookies vylepšujú fungovanie webových stránok, nakoľko si môžu pamätať napríklad informácie ako používateľské meno, jazyk alebo preferovanú polohu. Vďaka zapamätaniu si Vašich volieb môže stránka poskytovať vylepšené a osobnejšie služby.

Analytické cookies

Tieto cookies zhromažďujú anonymné informácie o tom, ako používatelia využívajú webové stránky. Z týchto dát sa dozvieme, ako používatelia reagujú na stránku poskytnutím informácií o tom, aké oblasti navštívili, aký čas na našej stránke strávili, a či sa pri tom vyskytli nejaké problémy, napríklad chybové hlásenia, čo nám pomáha vylepšovať webovú stránku.

Marketingové cookies

Marketingové cookies pomáhajú sledovať Vaše online návštevy a aktivitu na našich webových stránkach. Uvedené pomáha poskytovať a zobrazovať Vám relevantnejšie reklamy alebo obmedzujú počet zobrazení reklamy. Tieto súbory cookie môžu zdieľať tieto informácie s inými organizáciami alebo inzerentmi. Ide o trvalé súbory cookie a takmer vždy pochádzajú od tretích strán.