V úterý jsem školil umělou inteligenci v Sazce. Dorazil jsem ráno do
jejich krásných nových kanceláří, kde mě vyzvedl pan Petr a vedl
dovnitř. Starší chlapík na recepci po mě chtěl občanku, bez které mě
nepustí dovnitř, říkám si kua, neměl jsem u sebe ani peněženku, ani
žádný doklad, tak jsem rychle na mobilu nějakou občanku vygooglil a ukázal
mu ji. Chvíli si z mobilu něco opisoval a pak se rozevřela brána a já mohl
dovnitř.
Zaujalo to Petra a když jsem mobil strkal zpátky do kapsy, říká: „Hmm,
myslel jsem, že eDoklad spouští až v sobotu.“
Absolutně jsem neměl tušení, co je to eDoklad nebo kdy se spouští, ale
pochopil jsem, že se mi tu otevřela příležitost udělat ze sebe insidera
s konexemi, navíc těsně před začátkem školení, což není vůbec od
věci, tak jsem tajemně přikývl.
Dnes čtu, že skutečně spustili eDoklad. Wow, říkám si, Petr má
přehled. Ale stalo se něco nemilého, co se spouštěním státních projektů
vůbec spojené nemáme: socky jsou plné zpráv od lidí, kterým aplikace
nefunguje, a ani na několikanásobný pokus se jim nepodařilo do ní nahrát
svou občanku.
Pro tyto lidi mám vzkaz: já se s ní prokázal už v úterý, vy
loseři!!!!!
Nádherné. Lidé z Alarmu natočí video, které má obhájit Magdalena
Dušková, co způsobila kontroverzi prohlášením, že by humor neměl být
postavený na urážení. Hned v úvodu se opírají do Erik Tabery, který na
to reagoval editorialem, ze které prý vyplývá, že Magda „chce zakazovat
humor“ a společně se mu s moderátorem Standa Biler vysmějí, jaký je
to blbec.
Načež paní (v čase 5:55) prohlásí: „většinu českého humoru bych
klidně zakázala.“
Děcka, soudruzi, tak to kua aspoň vystřihněte! Tyhle věci se přece
vytahujou vždycky až po revoluci. Sou náký pravidla
přece 🤦♂️
Jak vyrobit fejkové video, ve kterém bude třeba Biden ohlašovat konec
světa? (nebo Jan Tuna dělat reportáž o pejskovi s kočičkou, co
pekli dort?)
Je to opravdu jednoduché. Můžete k tomu použít napříkladu službu
RASK.AI, která slouží k předabování videí. Stačí do ní nahrát video,
vybrat si jeden z 60 jazyků, do kterého se má přeložit, chvíli to
chroustá a pak se stane zázrak: vidíte původní video, kde všechny postavy
hovoří svým hlasem, svou jedinečnou dikcí, ale v jiném jazyce. Dokonce
zachová původní hudbu nebo zvukové efekty v pozadí.
Tuhle službu použiju trošku jiným způsobem: místo překladu do cizího
jazyka zvolím jako cílový jazyk ten původní. Využiju tak čistě schopnost
klonovat hlasy a nahrazovat ve videu původní mluvené slovo za jiné.
Přeložené dialogy poté nahradím za vlastní text a je hotovo.
Služba RASK.AI umožňuje předabovat až 3 minuty videa zdarma. Bohužel
v bezplatném tarifu není funkce lip-sync, tedy synchronizace rtů s tím, co
osoba říká. Nemusí to vadit, pokud nové dialogy napíšete tak, aby se
„trefily do pusy“ (tedy tak, jak opravdu dabing funguje). Nebo pusa není
úplně jasně vidět v záběru, a tak dále. V ostatních situacích je
synchronizace obrazu se zvukem docela žádoucí.
Jestli kvůli tomu nechcete platit tarif, lze k lip-syncu využít jinou
službu (link v komentářích, ovládání je složitější). Do ní
nahrajete původní video, vygenerovanou zvukovou stopu z RASK.AI, zase to
necháte chvíli počítat a výsledkem je video, kde se pusa hýbe podle
zvukové stopy. Problém je, že rozhýbá všechny pusy v záběru, což
samozřejmě není žádoucí, ale je to docela vtipné 🙂
Na uměligenci mě nejvíce fascinuje její „fluidnost“, kterou se
radikálně odlišuje od všeho, co jsem jako programátor dosud znal. Mám na
mysli skutečnost, že její chování není pevně dané a často působí
nevyzpytatelně. Což je v úplném kontrastu s rigidním světem tradičního
programování, kde jakákoliv odchylka od očekávaného chování je
považována za chybu. Neexistuje žádný konkrétní seznam příkazů,
kterými ji ovládat. Naopak jsem v neustálém procesu experimentování a
učení se. Navíc modely se vyvíjejí přímo před očima a to, co fungovalo
včera, nemusí platit dnes.
Porozumět generativní umělé inteligenci znamená ponořit se do úplně
nového paradigmatu učení. To není jako naučit se ovládat nový mobil. Za
poslední dva roky jsem získal tunu nových technických znalostí, ale co je
ještě důležitější, naučil jsem se myslet jinak. Otevřel se novým
přístupům. Je opravdu škoda, když se dnes někdo uzavírá
v přesvědčení, že všechno kolem AI je humbuk, a čeká, až mu svět dá
za pravdu. Ten promarněný čas bude obtížné dohnat.
Občas se mě ptají, jestli existuje nástroj, co rozpozná, že text
generovala AI. Nebo jak Google přistupuje k obsahu generovanému
pomocí GPT.
Odpověď je jednoduchá: žádný takový nástroj neexistuje a nikdy
existovat nebude. Nemá jej ani Google. Kdyby totiž takový nástroj existoval,
bylo by možné jej použít k učení jazykových modelů. Tedy jednoduše,
levně a automatizovaně zlepšovat jazykové modely, aby generovaly text,
který už nástrojem odhalit nepůjde. Čímž by ten nástroj přestal
existovat.
Včera na Letné křtila Bianca Bellová svou novou knihu Transfer. Jako ta
přestupní hala na letišti. Stylově zvolila útulný podnik Avion Club,
stylově proto, že avion znamená letoun, tuším francouzsky nebo španělsky,
a aby nikdo nezůstal na pochybách, uvnitř na strop zavěsila letadlo a na
stěnu přibila vrtuli, ale je možné, že to bylo součástí interiéru už
před křtem, kdo ví.
A já na to letadlo koukal a dlouze se zamyslel, čím to je, že to přece
nemůže být náhoda. Sledujte: v naší ulici otevřeli příjemnou kavárnu
s názvem Pilot Cafe. Hospůdka na téže ulici se jmenuje Hangár Pub.
Nechávají si vařit vlastní piva (létající pivovar!) a ty se jmenují:
Knipl (jasně), Tleskač (jo aha!) a nejnověji úžasný kyseláč Sršeň.
Což může být létající hmyz, ale spíš půjde o typ letadla
Messerschmitt. Která distribuční společnost sídlí na naší ulici?
Aerofilms! Na budově Národního technického muzea stojí co? Letadlo.
Jana Vlková si objednala snídani. Vyfotil jsem ji mobilní apkou
ChatGPT.
ChatGPT: Na fotografii je jídlo, které vypadá jako Eggs Benedict –
klasické americké snídaňové jídlo. Vidím krajíc anglického muffinu na
spodní části, na němž je plátek šunky nebo možná lososa, pak vrstva
avokáda a na tom všechno je pošírované vejce pokryté bohatou vrstvou
hollandaise omáčky. Jídlo je posypané nasekanou pažitkou a servírováno na
temně zeleném talíři.
Já: Kolik je třeba uběhnout koleček kolem stadionu, aby se spálily
kalorie získané tímto jídlem?
ChatGPT: (…chvíli počítá kalorie a rozměry stadionu…) Pokud bychom
předpokládali, že jídlo má 600 kalorií, a předpokládali, že spálíte
100 kalorií za kilometr, musíte uběhnout 15 koleček,
Jana konsternovaně odsouvá snídani. Beru si vidličku 😈
Přihlásil jsem se na online konferenci o AI a vyslechl pár desítek
přednášek od nejrůznějších osobností, povětšinou o ChatGPT. Zarazilo
mě, že v podstatě nikdo nezmínil ty nejdůležitější základy, které
musíte mít v krvi, abyste mohli ChatGPT správně využívat. Ba co víc,
některé prezentace byly doslova nesmyslné a vedly posluchače rovnou do
slepých ulic a tam je ponechaly ztracené, hladové a opuštěné.
Je to tím, že tyhle nástroje vyžadují docela hluboké poznání po
technické stránce. Což spíš získají ajťáci než markeťáci, protože
je to přirozeně láká. K tomu, abyste řídili auto, nemusíte nic moc
vědět o jeho konstrukci. Dnes. Ale před sto lety, když se teprve sériová
výroba rozjížděla, majitel auta toho musel vědět násobně víc. Jinak by
na to dojel.
Takže k tomu dát dohromady školení AI mě
postrčilo hlavně zjištění, kolik nepřesností až úplných bullshitů
jsem slyšel. Zaznamenal jsem, že školení spustil taky Tomáš Kapler.
S ním jsem se náhodou potkal před pár dny na Lamaday.ai a po chvíli
kecání mi bylo jasné, že má do problematiky taky hluboký vhled. Takže
hádám, že i jeho školení budou přínosná. A bezpochyby jsou tu další
skvělí školitelé.
Máme tu technologii schopnou lidem zásadně ulehčit práci a něco
takového předávat je prostě radost. (Obzvlášť, když to nemusím
vyvíjet.)
Kdekdo to zná. Vyzkoušeli jste ono slavné ChatGPT, zeptali se na
jednoduchou úlohu z Bělouna nebo jak uzavřít povinné ručení, a odpověď
byla úplná blbost. „Běloun je přece středoškolská matika a jaký platí
zákon není těžké ověřit na internetu! To že má být
inteligence?!“
Jak je možné, že jedni považují ChatGPT za zázrak a jiní za úplnou
kravinu?
Někteří si pochutnávají na rohlíku, zatímco jiní jsou rozčarovaní,
že s ním nejde zatlouct hřebík. A vůbec se jim nedivím, protože
pochopit, jak celé GPT funguje, jak je správně používat a čím mi může
změnit život, vyžaduje obrovské množství času.
…anebo můžete vytáhnout knowhow z někoho, kdo už tyto vody proplul.
Odkaz v komentáři 🙂
Musím vzdát hold každému, kdo se odhodlá uspořádat konferenci,
protože to znamená připravit se na nečekané, plánovat nepředvídatelné a
zápasit se vším. Jako zástupce ze světa řečníků mám pro vás pár
tipů. Ano, je pravda, že s některými z nás komunikovat je horší než
porod a jiní mají ego větší než rozpočet vaší konference, ale na konci
dne chceme všichni to samé: spokojené diváky odcházející
s úsměvem.
Každý řečník chce vypadat na pódiu jako rocková hvězda, ale to se
nedá, když musí bojovat s technikou, ohlížet se za sebe, jaký se
promítá slajd, nebo když zapomene klíčový bod své prezentace. Proto
zajistěte, aby měli na očích obrazovku se svými poznámkami a náhledem na
slajd, který je na řadě. Ne všichni mají svou prezentaci tak zažitou, že
by ji přednesli ve spánku.
Technika musí šlapat jako švýcarské hodinky. Klikátko na slajdy musí
reagovat na každé stisknutí. Nikdo nechce vidět řečníka v panice, jak se
snaží přežít klikací apokalypsu a tancuje smutnou polku „jeden vpřed,
dva zpět“ se svou prezentací.
Na podiu se ztrácí pojem o čase. Takže dát prezentujícímu hodiny
s odpočtem je základní předpoklad dodržení harmonogramu. Nicméně já
přetékám do basketbalu pravidelně i když časomíru mám, takže je k ní
potřeba ještě vyhazovač.
PechaKucha nebo Lightning talk jsou řečnickým maratonem. Slajdy se totiž
automaticky každých 15 sekund mění, což vyžaduje perfektní timing. Bez
časomíry pro každý slide je to jako balancovat na laně s klapkami
na očích.
Mikrofon v ruce se může stát speakerovým nejhorším nepřítelem,
odhalí každý chvějící se projev nervozity. Což řečníka znervózní
ještě víc, přitom by měl být v klidu, ne ve spirále úzkosti.
Doporučuji lehké headsety. A když už musíte držet mikrofon v ruce,
čokoláda (mrk mrk) před akcí může výborně uklidnit.
Nemluvňata? Rozkošné, ale na konferenci nejsou právě nejlepším
publikem. Žádný řečník nechce soutěžit s brekotem o nejlepší
sólový výkon. Máme v sobě zakódované, že nás takový zvuk automaticky
rozhodí.
Samozřejmě existují různé zábavné akce, kde je naopak účelem
potrápit řečníka. Vězte ale, že na standardních konferencích chceme
speakerům umožnit plynulou prezentaci bez zbytečných překážek. Držím
vám i nám palce, ať se to daří!