Štít, který zastaví AI v poskytování nebezpečných informací
07:29
Podcast: Uměligence

Štít, který zastaví AI v poskytování nebezpečných informací

06.08.2025

Velké jazykové modely jsou mocné nástroje, ale jak je ochránit před zneužitím? Podíváme se na inovativní způsob obrany proti "jailbreakům" - útokům, které se snaží z AI získat zakázané informace. Konstituční klasifikátory fungují jako systém digitálních strážců, kteří kontrolují jak vstupy, tak výstupy modelu. Jejich síla spočívá v principu "švýcarského sýra" - více vrstev ochrany, kde každá zachytí jiné typy útoků. Klíčovou roli hraje "konstituce" - soubor pravidel definujících nežádoucí obsah, který lze průběžně aktualizovat proti novým hrozbám. Testování je působivé: 400 expertů strávilo přes 3000 hodin pokusy o prolomení, všechny neúspěšně. Praktické nasazení přidává pouhých 24% k době odpovědi a minimálně falešných poplachů. Nejcennější schopností je detekce problémů za běhu - systém nemusí čekat na celou odpověď, může ji zastavit během generování.#konverzace


Podcast Uměligence je vložený na túto stránku z otvoreného informačného zdroja RSS. Všetky informácie, texty, predmety ochrany a ďalšie metadáta z informačného zdroja RSS sú majetkom autora podcastu a nie sú vlastníctvom prevádzkovateľa Podmaz, ktorý ani nevytvára ani nezodpovedá za ich obsah podcastov. Ak máš za to, že podcast porušuje práva iných osôb alebo pravidlá Podmaz, môžeš nahlásiť obsah. Ak je toto tvoj podcast a chceš získať kontrolu nad týmto profilom klikni sem.

Kategórie: Technológia
Táto webová stránka používa súbory cookies, ktoré sú potrebné pre správne fungovanie a skvalitňovanie webovej stránky. Ďalšie informácie o tom, ako používame súbory cookies, nájdete tu.
Bližšie informácie o spracúvaní osobných údajov ako aj o súboroch cookies nájdete tu.

Technické cookies

Vždy aktívne cookies sú nevyhnutne potrebné na základné fungovanie. Bez týchto súborov by sme nemohli poskytovať služby, ktoré umožňujú tejto stránke fungovať.

Funkčné cookies

Funkčné cookies vylepšujú fungovanie webových stránok, nakoľko si môžu pamätať napríklad informácie ako používateľské meno, jazyk alebo preferovanú polohu. Vďaka zapamätaniu si Vašich volieb môže stránka poskytovať vylepšené a osobnejšie služby.

Analytické cookies

Tieto cookies zhromažďujú anonymné informácie o tom, ako používatelia využívajú webové stránky. Z týchto dát sa dozvieme, ako používatelia reagujú na stránku poskytnutím informácií o tom, aké oblasti navštívili, aký čas na našej stránke strávili, a či sa pri tom vyskytli nejaké problémy, napríklad chybové hlásenia, čo nám pomáha vylepšovať webovú stránku.

Marketingové cookies

Marketingové cookies pomáhajú sledovať Vaše online návštevy a aktivitu na našich webových stránkach. Uvedené pomáha poskytovať a zobrazovať Vám relevantnejšie reklamy alebo obmedzujú počet zobrazení reklamy. Tieto súbory cookie môžu zdieľať tieto informácie s inými organizáciami alebo inzerentmi. Ide o trvalé súbory cookie a takmer vždy pochádzajú od tretích strán.