CoolClub pro IT odborníky

OpenAI má nástroj odhalující text generovaný ChatGPT, proč ho tajil?

26.08.2024

OpenAI má už minimálně rok nástroj, který dokáže odhalit užívání vlastního jazykového modelu ChatGPT. Zatímco pedagogům by se značně ulevilo, studenti by za tento krok rozhodně nepoděkovali. Zveřejní ho přece jenom?

 

Novinky

 

OpenAI si nástroj pro rozpoznání původu textu drží už nějakou dobu pod pokličkou. Proč? Přílišná transparentnost by mohla odlákat uživatele.

Nejde o nepodložené sdělení, naopak, OpenAI provedlo mezi svými “věrnými“ průzkum, z něhož vyplývá, že by podobný nástroj mohl od užívání ChatGPT odradit přibližně třetinu z nich.

To ale není jedinou nevýhodou releasu takové technologie. Kromě byznysových důvodů, je tu také znevýhodnění systémem. Text generovaný umělou inteligencí nástroj totiž označuje neviditelným vodoznakem. O velký bonus, který jazykový model přináší, by tak přišli i například uživatelé bez plynné angličtiny.

 

 

Stejně tak je tento nástroj strašákem pro studenty, kteří prostřednictvím ChatGPT zpracovávají nejrůznější eseje či seminární práce, a tak si usnadňují své studium. To jim samozřejmě prochází bez postihu, protože pedagogové jsou na rozeznání generativní umělé inteligence většinou krátcí.

A tak se s touto technologií spíše smiřovali s vědomím, že zakazovat její používání studentům je beze smyslu. Systém k rozpoznání AI přímo od OpenAI by jim konečně vytrhl trn z paty a poskytl nástroj proti podvodníkům.

 

Jak funguje zmíněný vodoznak?

 Zmíněný vodoznak v generovaných AI textech představuje skrytý podpis. Právě ten odlišuje text vytvořený člověkem od toho, se kterým pomohla umělá inteligence. Nepředstavujte si ho ale jako obrázek, spíše jako statistickou charakteristiku textu.

Funguje totiž na principu předpovědi slov a jejich pořadí. To je totiž zároveň úkol, který AI řeší při samotné tvorbě textu. Právě způsob, jakým AI vybírá slova, tvoří specifický vzor, sice nerozeznatelný pro lidské oko, ale jednoznačný pro počítačový algoritmus.

OpenAI si ale uvědomuje i zranitelnost tohoto systému. Charakteristiku lze poměrně jednoduše obejít, ať už užitím pokročilého překladače či emoji, který uživatel následně odstraní.

 

 

Připravila: Petra Sauerová