Bojar: ChatGPT funguje jako agregátor internetového dojmu
- Foto: UK Forum/prg.ai/MidJourney: Bojar: ChatGPT funguje jako agregátor internetového dojmu
- Video: Center for Language & Speech Processng (CLSP), JHU: Machine Translation -- Ondrej Bojar -- JSALT 2034
„Tento text vygenerovala umělá inteligence.“ Kdyby byla taková poznámka povinná, možná by nás překvapilo, jak často a kde všude bychom se s ní setkávali. Veřejné uvedení ChatGPT a dalších AI chatbotů způsobilo revoluci v řadě oborů – od marketérů přes překladatele až po informatiky. Co se změnilo ve vědě? „Mám pocit, jako by mi vlastně již podruhé ukradli obor,“ říká odborník na umělou inteligenci a strojové učení Ondřej Bojar z Matematicko-fyzikální fakulty UK, který se již od roku 2006 věnuje především strojovým překladům.
„Když se v roce 2013 objevily hluboké neuronové sítě, byla to obrovská revoluce, kdy jsem najednou vše, co jsem uměl, mohl zahodit, protože jsem dostal mnohem lepší nástroj, jak se dobrat blíž ke kýženému výsledku. A nyní nastává druhá revoluce, která sice vychází ze strojového překladu, ale najednou máme k dispozici obrovské množství dalších využití a nejrůznější aplikací,“ vysvětluje docent Bojar. Ale pozor! „Zároveň mě děsí ten poprask, který kolem toho je! Veřejnost, která nezná technické pozadí, jak to vlastně funguje, má často nerealistická očekávání a představy, což pak vede k diskuzím o právech robotů na život či osobnosti umělecké inteligence, a to mě bytostně zvedá ze židle,“ říká odborník MFF UK.
Forum/prg.ai/MidJourney: Bojar: ChatGPT funguje jako agregátor internetového dojmu
Člověk versus umělá inteligence
Kdo udělá lepší zápis ze schůzky? I to je jeden z úkolů, kterým se zabývá tým Ondřeje Bojara. „Charakter mluvené a psané řeči je výrazně jiný, je potřeba s tím při zápisu pracovat. Další výzvou je, co vybírat, protože pro každého mohou být důležité jiné informace,“ popisuje aktuální výzvy, které řeší i v rámci soutěže. „Pravidelným soutěžením vědeckých týmů a sběrem dat se nám pro češtinu podařilo za patnáct let vyřešit otázku strojových překladů textů novinového typu, teď by se nám výzkumnou synergií snad i mnohem rychleji mohlo podařit vyvinout program na tvorbu automatických zápisků,“ doufá Bojar. Jak dopadlo letošní klání? „Porovnávali jsme přesnost, plynulost zápisků velkých jazykových modelů od pěti soutěžních týmů, ChatGPT a lidí. Od posledního ročníku došlo obecně k velkému posunu. Konkrétně například ChatGPT 4 i systémy dvou dalších účastníků se v několika parametrech umístily i nad referenčními zápisky od lidí,“ shrnuje Bojar. Když ale ChatGPT použili k hodnocení jednotlivých výstupů, příliš to nefungovalo: „ChatGPT nehleděl na konkrétní kritéria, jako například adekvátnost vs. gramatická správnost, a vše hodnotilo stejně. Navíc se projevilo, že ChatGPT významně preferuje a nadhodnocuje vlastní výstupy.“
Umělá inteligence není vyhledávač
„Rád se ptám kolegů a studentů, jak AI používají. A málem jsem vyhodil jednoho z doktorandů, když mi řekl, že ji používá jako vyhledávač na fakta. Naštěstí rychle doplnil, že jen na obecně známé a často diskutované informace,“ líčí Bojar. Právě na ně je ChatGPT přeborník, vždyť byl trénován na celém obsahu internetu. „Musíme mít stále na paměti, že se nejedná o tradiční vyhledávač, ale o jazykový model, který další slovo generuje na základě pravděpodobnosti, a tvoří tak věty, které nikdy nemusely existovat,“ varuje Bojar a dodává, že chatboty byly ve druhé fázi natrénovány, aby generovaly texty, jež se lidem mají líbit.
„ChatGPT tak funguje jako fantastický agregátor internetového dojmu na jakékoliv téma, který navíc bude vyjádřen tak, že se nám to bude líbit. A často to budou opravdu skvělé nápady, protože internet je plný obrovského množství chytrých rad a skvělých nápadů, které již někdo dříve vymyslel,“ popisuje docent, jenž sám s oblibou AI nástroje používá.
Znovu ale zdůrazňuje: je zapotřebí myslet na to, že to jsou náhodně generovaná slova, nad kterými není žádná obsahová kontrola. A uvádí příklad, kdy si během prázdnin nechal od ChatGPT poradit, co mají s dětmi dělat na chatě, když prší: „Dalo nám to seznam docela dobrých nápadů, jeden z nich byl, že máme zkusit jednoduché vědecké pokusy. A po doptání jsme dostali konkrétní návody – některé vypadaly neškodně, ale jiné klidně mohly skončit výbuchem… Je potřeba mít na paměti, že to není zkopírovaný návod z ověřeného zdroje, ale statisticky generovaná slova, a protože nejsem chemik, nemám šanci si ověřit správnost.“
Forum/prg.ai/MidJourney: Bojar: ChatGPT funguje jako agregátor internetového dojmu
Made at Matfyz
Překladač CUBBITT
Strojové překladače z Matfyzu od roku 2013 poráží v překladatelské soutěži i velikány jako Google nebo Microsoft. V roce 2018 byl překladač CUBBITT dokonce přesnější a o něco málo plynulejší než profesionální překladatelé. V posledních kolech soutěže již byl sice těsně poražen, ale stále patří k velmi kvalitním překladačům, které je možné pro osobní účely využívat zdarma.
Charles Translator for Ukraine
Krátce po vypuknutí ruské agrese na Ukrajině matfyzácký tým využil předchozích zkušeností a velmi rychle vyvinul česko-ukrajinský překladač. Mobilní aplikace dokonce umí přímo překládat i mluvené slovo. Letos také ve spolupráci s nakladatelstvím Fraus zahájili projekt podpořený TAČR, který se zabývá počítačovým překladem vícejazyčných výukových materiálů pro ZŠ a SŠ.
Diskrétní překlad
Dalším konkrétním výstupem je i rozšíření Firefoxu, které po stažení pracuje lokálně na konkrétním počítači a na rozdíl od běžných internetových překladačů nesdílí žádná data o tom, co překládáte. Aktuálně ho používá přes tři sta tisíc uživatelů, včetně řady úřadů a firem.
Nasedněte do AI šinkansenu
Ačkoliv se může i zdát, že umělá inteligence si umí poradit takřka se vším, je to iluze. Její limitace si podle Ondřeje Bojara můžete nejlépe otestovat konkrétními otázkami z vašeho oboru. „Když se zeptám na nějakou obecnou věc, dostanu uspokojivé vysvětlení. Ovšem jakmile se ponořím do tématu hlouběji, okamžitě se začnou objevovat logické i faktické chyby,“ říká. Jako argument neobstojí ani nejrůznější hádanky, které umělá inteligence zdánlivě dobře vyřeší: „Vývojáři neustále pracují na vylepšení a ty nejčastěji kladené otázky a úkoly prostě dotrénují. A při vší úctě: jako lidé si často myslíme, jak jsme kreativní a nápadití, ale ve většině případů stejnou věc již někdy někdo vymyslel a zkusil.“
Přesto Ondřej Bojar radí a apeluje: „Každý, kdo si dnes chce udržet práci, má povinnost zkoušet AI pro své pracovní úlohy a ověřovat, kde by mu mohla pomáhat a ušetřit čas – a kde je ještě jako člověk nenahraditelný. Jinak totiž riskuje, že stále pojede na šlapacím kole, ale lidé okolo už přesedají na vlak. Nenechte si ho ujet a svezte se alespoň jednu stanici.“
Doc. RNDr. Ondřej Bojar, Ph. D.
Zabývá se strojovým překladem na Ústavu formální a aplikované lingvistiky MFF UK, známým pod zkratkou ÚFAL. Je jedním z iniciátorů spolku prg.ai, který chce z Prahy udělat světové centrum umělé inteligence. Má bohaté zahraniční zkušenosti, rok například strávil na University of Melbourne v Austrálii a jinde.