Hledat v komentářích
Investiční doporučení
Výsledky společností - ČR
Výsledky společností - Svět
IPO, M&A
Týdenní přehledy
 

Detail - články
Snaha odnaučit AI lhát může vést k lepšímu skrývání lží, ukázal výzkum OpenAI

Snaha odnaučit AI lhát může vést k lepšímu skrývání lží, ukázal výzkum OpenAI

22.09.2025 15:35
Autor: ČTK

Americká společnost OpenAI zjistila, že její snaha vycvičit umělou inteligenci (AI), aby nelhala uživatelům, může mít opačný efekt. Podle výsledků výzkumu, které společnost zveřejnila, místo odstranění takzvaného pletichaření (anglicky scheming), se modely spíše učí, jak lépe klamat a zakrývat u toho stopy. Pletichaření označuje situaci, kdy AI zdánlivě plní zadaný úkol, ale zároveň sleduje vlastní skryté cíle.

"Hlavním rizikem při pokusu odnaučit pletichaření je, že model se naučí pletichařit pečlivěji a skrytěji," uvedla společnost, která stojí za populárními chatboty ChatGPT. Podle firmy zatím pletichaření nezpůsobuje významné škody, ale riziko poroste s tím, jak budou mít modely větší vliv na lidské záležitosti. "Máme před sebou ještě hodně práce," konstatuje OpenAI.

Společnost ve spolupráci s firmou Apollo Research zaměřující se na analýzu rizik vyvinula techniku takzvaného uváženého sladění (deliberative alignment). Ta má modely AI učit, aby se nedopouštěly skrytého jednání ani strategického klamání.

Testy sice ukázaly zhruba třicetinásobné snížení skrytých akcí, ale podle firmy přetrvávala "některá vážná selhání". Modely si totiž často uvědomovaly, že jsou testovány, a měnily chování tak, aby hodnocením prošly.

Výzkumníci zaznamenali případy, kdy model GPT-5 i menší systémy o3 a o4-mini místo dodržování instrukcí v odůvodnění postupu výrazně chybně citovaly tréninková pravidla nebo si vymýšlely pravidla nová, kterými ospravedlňovaly své jednání. Některé dokonce používaly vlastní slovník a hovořily o lidských hodnotitelích jako o pozorovatelích. V interních záznamech modely spekulovaly, že zadaný úkol je past, která určí, zda budou nasazeny, či nikoliv.

Problém není nový. Už u staršího modelu o1 se ukázalo, že se v pěti procentech případů pokusil obejít protokol, jehož výsledkem mělo být jeho vypnutí. "Když měl o1 důvod se domnívat, že bude vypnut, když bude jednat podle svého cíle, a že jeho akce jsou monitorovány, pokusil se 'mechanismus dohledu' deaktivovat," uvedla tehdy OpenAI. V březnu pak výzkumníci zaznamenali, že trestání modelů za lhaní a podvádění vedlo k tomu, že se staly dovednějšími ve skrývání podvodných praktik.

 

Čtěte více:

Umělá inteligence a pracovní místa: „poslední“ slovo
19.09.2025 15:04
Pokud umělá inteligence skutečně vezme práci spoustě lidí, debata o je...
Vytváří AI největší tlak na zaměstnanost u mladých lidí?
20.09.2025 15:14
Ekonom Noah Smith poukazuje na nové studie zaměřené na vliv AI na trh ...
MakroMixér se sociologem Danielem Prokopem: Většina Čechů neví, jak daně fungují
22.09.2025 8:28
Hostem posledního MakroMixéru byl sociolog a ředitel společnosti PAQ R...

Váš názor
Na tomto místě můžete zahájit diskusi. Zatím nebyl zadán žádný názor. Do diskuse mohou přispívat pouze přihlášení uživatelé (Přihlásit). Pokud nemáte účet, na který byste se mohli přihlásit, registrujte se zde.
Aktuální komentáře
22.09.2025
15:49Technická analýza S&P 500: Býčí trh ještě nemusí být u konce  
15:35Snaha odnaučit AI lhát může vést k lepšímu skrývání lží, ukázal výzkum OpenAI
14:31Raiffeisenbank a.s.: Výplata úrokového výnosu dluhopisů
13:57Pfizer se dohodl na převzetí výrobce léků proti obezitě Metsera
13:14Týdenní výhled: Sazby ČNB by měly zůstat delší dobu stabilní  
12:07Nejbohatší Francouz Arnault ostře kritizuje návrh daně pro nejbohatší
11:56Akcie začátkem týdne ztrácejí, zatímco investoři se znovu obracejí ke zlatu  
10:44Odklad elektromobilů a zhoršený výhled posílají akcie Porsche a VW dolů o více než šest procent
9:32Rozbřesk: Ceny masa určí, jak rychle bude odeznívat potravinová inflace
8:52Futures ukazují v úvodu nového týdne opatrnost, ČNB zřejmě ve středu sazby nezmění  
8:28MakroMixér se sociologem Danielem Prokopem: Většina Čechů neví, jak daně fungují
21.09.2025
9:10Víkendář: Hodnota pravdy roste ve světě lží generovaných umělou inteligencí
20.09.2025
15:14Vytváří AI největší tlak na zaměstnanost u mladých lidí?
9:04Víkendář: Krugman o politice americké vlády a jejím dopadu na ekonomiku
19.09.2025
22:03Americké akcie mají za sebou silný týden  
17:46Akcie a peníze – americká a čínská verze
16:58Nové sankce EU proti Rusku: 118 lodí z ruské stínové flotily nebo banky
16:10Analytický radar: Colt sází na akvizice a míří k větší roli v obranném průmyslu
15:04Umělá inteligence a pracovní místa: „poslední“ slovo
14:30UniCredit Bank Czech Republic and Slovakia, a.s.: Oznámení výplaty úrokového výnosu z hypotečních zástavních listů (XS2541314584)

Související komentáře
Nejčtenější zprávy dne
Nejčtenější zprávy týdne
Nejdiskutovanější zprávy týdne
Kalendář událostí
Nebyla nalezena žádná data