Článek

Zatím se z AI radujte, dokud ji nebudeme vážně mít

V posledních měsících zažíváme boom různých umělých inteligencí. S nadsázkou lze říct, že téměř každý den vznikne jedna nová, ať už jde o generování a úpravy textu, obrazu, videa nebo zvuku. Máme se bát, že nás umělá inteligence vyhladí jako ve filmu Terminátor, nebo že někomu sebere práci a nahradí ho?

AI je pomocníkem usnadňující náš osobní i profesní život, není důvod k obavám. V grafické a webové agentuře Beneš & Michl jsme postupem času vyzkoušeli mnoho AI nástrojů. Poradíme vám, které stojí za to.

„Říct: ‚Nepotřebujeme copywritera, když máme ChatGPT‘ je na stejné úrovni jako: ‚Nepotřebujeme chirurga, když máme skalpel‘.“
Jan Beneš, Beneš & Michl

Co vše lze nazvat umělou inteligencí?

Umělá inteligence (angl. Artificial intelligence, AI) je široký pojem. Není jasně definována a existuje mnoho definicí. Obecně vyjadřuje schopnost strojů napodobit lidské chování a schopnosti. Patří sem způsobilost učit se, uvažovat, tvořit nebo řešit složité úlohy a úkoly. Umělá inteligence má mnoho podoborů jako strojové učení (Machine Learning), umělé neuronové sítě (Artificial neural networks), počítačové vidění (Computer vision) nebo zpracování přirozeného jazyka (Natural Language Processing, zkráceně NLP) ale i další.

Jestli už jsme vytvořili umělou inteligenci, která se skutečně chová inteligentně, testuje tzv. Turingův test. Jedná se o jednoduchý test, který vznikl již v roce 1950, v němž v podstatě člověk komunikuje s dvěma entitami. Jedna je člověk a druhá stroj/algoritmus a není již schopen rozpoznat rozdíl.

Samotný obor umělé inteligence není nic nového, přeci jen nějaký ten rok už na umělé inteligenci vědci i soukromé společnosti pracují. Příkladem, kdy s ní běžně přicházíte do styku, je například rozpoznávání řeči (diktování zpráv do telefonu, ovládání navigace v autě hlasem) nebo počítačové vidění s využitím neuronových sítí (rozpoznávání a hledání podle fotografií, rozpoznávání dopravních značek) atd.
Nejznámější umělá inteligence současnosti

Mezi nejvýznamnější nástroje se aktuálně řadí ChatGPT od společnosti OpenAI. Jedná se o tzv. velký jazykový model (Large language model), který je postaven na modelu neuronové sítě a vytrénovaný pomocí strojového učení. Jde o algoritmus, který navenek působí, že přemýšlí a má vlastní inteligenci, ale ve skutečnosti předkládá na základě statistiky nejpravděpodobnější jazykové vzory, co předtím viděl a naučil se je. Myslící stroj za tím rozhodně nehledejme. Za povšimnutí určitě stojí, že se model GTP-3 učil až 175 miliard parametrů, slov. Pro srovnání, předchozí model GPT-2 XL jich měl “pouze” 1.5 mld, což je polovina celé Wikipedie. GPT-4 zatím nebyl uvolněn pro veřejnost. Je pouze pro platící klienty a musíte na čekací listinu, abyste jej mohli vyzkoušet.

Jaké nástroje AI určitě vyzkoušet?

V agentuře Beneš & Michl neustále sledujeme nové trendy a zkoušíme různé AI nástroje. Některé vypadají skvěle a jednoduše na promo videu, ale když potřebujete reálný výstup pro klienta, už to s nimi tak lehce a rychle nejde. Jiné zase zkusíte jednou a budete chtít s nimi pracovat napořád.

Generování textů (text-to-text)

Chat GPT

ChatGPT, přesněji GTP-3, používá skoro celý náš tým. Nejen kreativci a designéři, ale i třeba projektoví manažeři. Od generování textů pro sociální sítě a obsah webu až po kontrolu textu samotného. Možností, jak využít tento jazykový model, je mnoho. Nám se osvědčilo jej používat i jako parťáka pro brainstorming, pokud něco vymýšlíme. Pro kreativní práci, vymýšlení, tvoření se hodí skvěle, ale aktuální informace a fakta o čemkoli po něm nechtějte. Nejen, že si často vymýšlí, ale z principu pracuje na starších datech.

MS Bing

Pro aktuální výsledky s využitím AI použijte raději vyhledávač Bing od Microsoftu. Oba pracují v českém jazyce, takže komunikace je dostupná pro každého. Vyžaduje prohlížeč Microsoft Edge.

Ukázka odpovědí na stejnou otázku (GPT vs Bing):

DeepL

Překladač postavený na umělé inteligenci. Skvělý a neocenitelný pomocník pro překlad, ale i pro kontrolu textů (zatím pouze EN a DE). Jde nainstalovat i jako aplikace pro iOS, Android nebo Windows. Případně použít jako doplněk do prohlížeče Chrome. Používáme jej velmi často.

Generování obrázků (text-to-image)

Generování obrázků pomocí AI může vypadat jako opravdové kouzlo. Za pár vteřin skvělý obrázek, ušetřena spousta peněz za produkci, nemusíme už… tak tak to zase není. Ano, dnes už můžeme říct, že generované obrázky tvoří AI v použitelné kvalitě pro klientskou práci. Ne tedy, že nahradí produktové focení, ale pro generování moodboardů, skicování nápadů je to skvělý nástroj.

DALL-E

Jeden z prvních AI nástrojů pro generování obrázků z textu. Naskočili jsme na vlnu a začali jej využívat. Má jednoduché rozhraní, ale výstupy nebyly vždy optimální, proto jsme místo něj brzy začali využívat Midjourney, které má mnohem kvalitnější a použitelnější výstup. DALL-E jsme ale nezavrhli, stále ho využíváme pro tzv. „outpainting“, tedy dokreslování obrazu okolo (ale i uvnitř) fotografie. Nelíbí se vám, jak vypadá kus fotografie, stačí ji štětcem vymazat a do promptu (inputu/příkazového řádku) napsat, čím se má fotografie doplnit.

Ukázka výstupu DALL-E. Použili jsme zadání (prompt): „man with coffee in his hand, forrest in the background“:

Midjourney

Oproti DALL-E jsou výstupy z Midjourney daleko více použitelné i pro finální výstup klientovi. Po vyzkoušení jsme ihned přešli na placenou verzi, protože výstupy byly natolik super, že nám to dávalo smysl (free verze je už skoro nepoužitelná, protože nedostanete strojový čas na generování obrázků). DALL-E, ale i jiné systémy mají problém s tím, aby výsledný obrázek působil přirozeně a „nepočítačově“. A přesně toho jsme se s poslední verzí Midjourney v5 dočkali. Fotorealistické výstupy jsou pro prvotní koncepty perfektně použitelné, díky nim nemusíme čekat na fotografa, nebo hledat hodiny vhodnou fotku ve fotobance.

Drobnou nevýhodu MJ lze spatřovat ve skutečnosti, že prostředí se ovládá skrze sociální síť Discord a je uživatelsky složitější. Na webu ale naleznete hromadu tutoriálů, jak MJ ovládnout. Kvalita výstupů dost záleží na tom, jak detailně a dobře je prompt napsaný. Doporučuji sledovat např. uživatele Nick St. Pierre , který se promtptům a zkoumání MJ věnuje na svém Twittrovém účtu.

Ukázka jen mezi MJ v4 a MJ v5. Použili jsme stejný promt: „man with coffee in his hand, forrest in the background“. Rozdíl je více než patrný:

A to je pouze přechod z verze 4 na verzi 5. Ještě výraznější je porovnat verzi 5 s první generací z července loňského roku.

MJ je pro vyzkoušení zdarma, ale je omezeno na několik minut strojového času (kdy aplikace počítá obrázek). Tady se vyplatí investovat a zakoupit jeden z tarifů, který se pohybuje v řádech jednotek dolarů měsíčně. Jak jsem již psal, my jsme na placenou verzi přešli díky kvalitě výstupů okamžitě.

Lexica

Další z generátorů obrázků, jenž je určitě dobré vyzkoušet. Má jednoduché rozhraní a dokáže přímo z výsledků generovat outpainting. Kvalita výsledku se pohybuje v rozmezí Dall-e a Midjourney. Pro moodboardy a koncepty skvělé a dostatečně použitelné řešení.

Ukázka stejného promptu, který jsme již použili:

A outpainting (dokreslení okolí) prvního obrázku:

Další skvělou věcí na Lexica je, že umí dle vygenerované fotografie vytvořit podobnou dle jiného promptu. To umí např i Midjourney, jen tady je to uživatelsky mnohem přívětivější a rychlejší. Právě pro jeho jednoduché a přehledné rozhraní ho někteří kolegové používají raději než Midjourney, (převážně projekťáci, co nechtějí psát a studovat tolik proměnných pro MJ).

Ukázka promptu „Cute little smiling girl with a cute bunny in her hand, detailed, pixar style“:

Když první obrázek použijeme jako vstup pro nový a prompt změníme na “Smiling girl working out at outdoor gym, park, pixar style”, výsledkem bude:

Let’s Enhance

V současné době (konec dubna 2023) už umí také generovat obrázky, my jej ale využíváme primárně pro zvětšování rozlišení fotografií. Zvládá to lépe než samotný Photoshop (a že s ním lze dosáhnout dobrých výsledků). Využíváme placenou verzi, kde máme k dispozici zakoupené kredity pro platbu za převod fotografií.

Adobe Firefly (Beta)

Novinka, na kterou se opravdu všichni těšíme. AI nástroje pro generování obrázků, přebarvování, doplňování, outpainting přímo v rámci programů Adobe. Půjde o nástroj, jenž práci obrovsky urychlí. Uživatelsky bude rozhodně nejkomfortnější si přímo ve Photoshopu vybrat ve fotce oblast a napsat, čím ji má Photoshop nahradit.

Zatím je možné se přihlásit pouze k beta testování a na co se můžeme těšit, si lze prohlédnout jen v promo videích. Co zatím ostatní AI generátory moc nezvládají, je práce se samotným fontem, potažmo jednotlivými literami. Jde o další z taháků, které si pro nás Adobe připravilo:

Generátory videa (text-to-video)

Kdyby vám generování statických obrázků na základě textového popisu přišlo málo, můžete vyzkoušet generování rovnou celých videí.

Runway

Jeden z nejlepších AI nástrojů, které jsou v současnosti k dispozici. Nejen, že umí skvěle generovat video na základě promptu, ale má i další užitečné tooly. A ty možná i využijete častěji, než samotné generování videa. Co určitě využijete, a my s tím pracujeme, je nástroj Gen-1 video-to-video, kde můžete nechat vlastní video přepočítat do zcela jiného stylu. Natočte se v kanceláři při chůzi na mobil a nechte umělou inteligenci předělat video, na kterém budete chodit po vroucí lávě.

Runway nabízí mnoho dalších nástrojů pro čištění videa, například odstranění něčeho v obraze (využíváme asi nejčastěji), dopočítání dalších framů na slow-motion video atd. Určitě také vyzkoušejte a posuňte se v tvorbě o velký kus dopředu.

D-ID

AI nástroj pro tvorbu mluvících avatarů. Možnosti jejich využití jsou takřka neomezené. Můžete vybírat z již předvybraných avatarů nebo si nechat z vlastní fotografie vytvořit rozhýbanou postavičku, která mluví. Skvělé je, že jsou tu i dva české hlasy. Bezplatná verze je omezena na 20 slov.

OXOLO

Chcete natočit reklamní video jedním kliknutím? Díky tomuto nástroji to může být otázka chvilky. Stačí zadat URL adresu, kde je váš produkt a vybrat jazyk, kterým bude reklama namluvena. Analýza zadané stránky trvá i několik minut, ale výsledek vás překvapí a budete nadšeni.
(prokliky na video v obrázku

Generátory hlasu (text-to-voice)

Murf AI

Generátor hlasu. Převádí psaný text na audio a dělá to opravdu skvěle. Lze v textu přidávat pauzy, měnit tón hlasu, na výběr je z mnoha jazyků a virtuálních mluvčích. Lze vyzkoušet i bezplatně. Bohužel chybí podpora češtiny.

Micmonster

Generátor hlasu, který sice kvalitativně nedosahuje na Murf.ai, ale jeho hlavní předností jsou dva české hlasy, Antonín a Vlasta. Bezplatná verze je omezena na 300 znaků. Určitě vyzkoušejte a budete překvapeni.

Voicemod

AI modulátor hlasu v reálném čase. Překvapíte ostatní na meetu nebo zoomu. Nalezneme zde i nástroj Text to Song, kterým lze vytvořit song na základě obyčejného vloženého textu. Na výběr jsou různé melodie i hlasy. Češtinu bohužel nepodporuje, ale to co dělá, umí skvěle.

Další AI nástroje

Generování obsahu, textu a obrázků je tím hlavním, co denně využíváme při své práci. Občas se ale hodí i další AI vychytávky. Pojďme si ty nejzajímavější představit.

Looka

AI nástroj pro tvorbu loga i celé vizuální identity. Pro náhled to lze využít, ale propracovanou identitu v něm nehledejte. Pro rychlý náhled na mockupech postačující.

Google Autodraw

Jednoduchý AI prográmek, který pomocí náčrtků vyhledává již hotové kresby, jež můžete na online plátno rozmístit. Jednoduché a intuitivní prostředí. Hotové plátno lze jednoduše sdílet. Ideální pro “negrafiky” pro popsání nápadu, skici, diagramu apod.

Namelix

Generátor názvů společností na základě zadaných hesel. Lze z něj dostat opravdu kreativní názvy, ale dost často se stává, že pro .com doménu jsou již obsazené. Pokud budete hledat název pro českou doménu, určitě přijdete na spoustu dobrých nápadů. Lze následně vygenerovat rovnou logotyp díky propojení na další AI nástroj Brandmak.io.

Jak je to s právy či licencí?

Pohybujeme se bohužel na tenkém ledě. Některé modely, ať již jazykové nebo rozpoznávací se učily na veřejných datech, tedy i na něčem, čeho jste mohli být autory. Jak to tedy rozhodnout? Například Midjourney v podmínkách uvádí, že cokoliv jste vygenerovali pomocí promptu, stáváte se autory vygenerovaného obrázku. Jenže co když se na něm objevuje veřejně známá osobnost, nebo je založen na uměleckém stylu či typickém stylu konkrétního malíře? Na to bohužel neznáme odpověď, ale věřím, že to nebude dlouho trvat a díky žalobám a soudům budeme mít precedens, jak se bude k autorství generovaného obsahu přistupovat z hlediska autorského zákona. Regulací nástrojů umělé inteligence se zabývají i výbory Evropské unie, které nedávno schválily přísnější návrh legislativy, než se očekávalo.

Budoucnost AI

Vyzkoušeli jsme i další AI nástroje, ale je jich tolik, že bych o nich ani nestíhal psát. Ty, o nichž se zmiňuji, určitě otestujte, budete nadšeni. Díky obrovsky rychlému vývoji si moc nedokážeme představit, kam se umělá inteligence a její využití posune za jediný rok. Určitě bude o čem znovu psát. Kdo ví, možná si za pár let budeme běžně povídat s lednicí, kávovarem nebo autem. Zatím se na to můžeme těšit.

Zdroj a foto: benes-michl.cz