nyní skrytá reklamní sdělení v textu

Na navigaci | Klávesové zkratky

AI překlady: Opravdu nahradí lidské mozky?

Viktor Janiš v DVTV vysvětluje, jak zásadně se liší překlad od profesionála v porovnání s AI. Pokud nemáte DVTV, popisuje to ještě ve svém postu.

A teď k tomu, v čem nemá úplně pravdu 🙂

Samozřejmě platí, že současné nástroje na bázi neuronových sítí, jako je GPT nebo DeepL, překládají větu od věty bez ohledu na širší kontext. V jedné větě tak může být podmětem muž, ve druhé najednou žena. Nedokážou najít vhodné analogie pro cizí popkulturní odkazy. Nebo překládat jazykové hříčky s ohledem na to, jak budou teprve v následujícím textu využité. A tak dále.

V případě Google Translate nebo DeepL jde o dané omezení. Které samozřejmě pro technické texty nevadí. DeepL tak plní skvělou službu při překládání návodů, dokumentací, běžných blogpostů nebo novinových článků.

Obří jazykové modely, jako je GPT, ale dokáží víc. Dokáží se poprat s beletrií. Dokáží pochopit kontext, ironii, humor. Ale nedokáží to v režimu, kdy generují jedno slovo za druhým. Tedy pokud dám jako prompt „Přelož následující text ###“, bude výsledek na úrovní DeepL. Při překladu do češtiny dokonce horší.

Pokud na to ale půjdu jinak a nechám jej nejprve text vysvětlit, včetně idiomů, ironie nebo humoru, poté požádám o návrh možných alternativ v jiném jazyce a teprve poté budu chtít překládat s využitím těchto informací, výsledek bude řádově lepší.

Technice se říká chain of thought.

Příklad odjinud: když budu chtít, aby ChatGPT napsal třetí odmocninu z obrovského čísla, s tím, že má napsat jen odpověď, vrátí úplný nesmysl. Když ho nechám se vykecávat o tom, jak se taková věc počítá, vrátí výrazně přesnější výsledek (ale ne přesný, není to kalkulačka). Podobně to bude fungovat i s překládáním.

Dnes existuje řada omezení: celý vstup a výstup včetně mezifází se musí vlézt do limitu tokenů. GPT bylo málo trénované na češtině. České popkulturní odkazy zná z rychlíku. A tak dále. Ale tohle se za pár let změnit může.

Mohlo by vás zajímat