1:0 pro lidstvo: AI zatím živé zaměstnance nenahradí, ukázal experiment vědců

Sdílet
Nahradí umělá inteligence v blízké době lidské zaměstnance? Výzkum z prestižní Carnegie Mellon University ukazuje, že současné AI modely mají k plné autonomii v kanceláři ještě hodně daleko. Jak probíhal a jaké byly jeho výsledky? Čtěte v článku dále.
1:0 pro lidstvo: AI zatím živé zaměstnance nenahradí, ukázal experiment vědců

Experiment: Virtuální firma řízená AI

Vědci z Carnegie Mellon vytvořili simulovanou firmu se vším, co k modernímu podniku patří – interní weby, chatovací platformu ve stylu Slacku a digitální „kolegy“ v rolích personalisty nebo technického ředitele. Do této firmy nasadili několik špičkových AI modelů (včetně Claude od Anthropic, Gemini od Googlu a ChatGPT od OpenAI) a zadali jim běžné úkoly z oblasti financí, administrativy i softwarového vývoje.

Spektrum úloh bylo široké: od analýzy databází kavárenského řetězce přes shromažďování zpětné vazby o výkonnosti inženýrů, psaní hodnoticích zpráv až po výběr nejvhodnějších kanceláří na základě videoprohlídek a posouzení jejich vybavení pro zdraví zaměstnanců.

Výsledky: AI zvládla jen zlomek úkolů

Výsledky byly jednoznačné – a pro AI nepříznivé. Nejlepší model (Claude) dokázal úspěšně dokončit jen necelou čtvrtinu zadaných úkolů, ostatní modely včetně Gemini a ChatGPT zvládly sotva desetinu. V žádné kategorii zadání se AI agentům nepodařilo splnit většinu úkolů, což podle profesora Grahama Neubiga, spoluautora studie, výrazně zpochybňuje představu o rychlém nástupu plně automatizovaných kanceláří.

Proč AI selhává? Chybí selský rozum i sociální dovednosti

Studie odhalila, že současné AI systémy postrádají základní „selský rozum“ a selhávají v situacích, které by člověk vyřešil snadno a intuitivně. Typickým příkladem byl AI agent, který nedokázal zavřít jednoduché vyskakovací okno, nebo si v podnikovém chatu místo nalezení správné osoby vytvořil nového uživatele se stejným jménem. Někteří agenti nepochopili formát zadání, nedokázali vložit odpovědi do připravených dokumentů, nebo předčasně označili úkol za splněný, i když nebyl hotový. Výsledkem byl chaos a neplnění termínů.

Firmy AI chtějí, ale zatím jen jako podporu

Navzdory těmto limitům zůstává zájem o AI agenty ve firmách vysoký. Průzkum společnosti Deloitte ukázal, že více než čtvrtina podniků zkoumá možnosti nasazení autonomních agentů ve velkém. O agentních systémech mluví i šéfové technologických gigantů jako Salesforce nebo Nvidia. Realita je však zatím střízlivější: současné AI systémy si nevědí rady s komplexními podniky a chybějí jim sociální dovednosti, které jsou klíčové například v HR nebo žurnalistice.

Ani firmy, které s AI agenty slaví dílčí úspěchy, se zatím neodvážily odstavit lidi na vedlejší kolej. Společnost Moody’s experimentuje s AI pro rychlejší analýzu finančních výkazů, Johnson & Johnson využívá AI asistenty ke zkrácení doby chemických procesů při vývoji léků. Ve všech případech je ale AI zatím jen podpůrným nástrojem pro lidské experty, ne jejich náhradou.

Plně automatizované kanceláře jsou zatím sci-fi

Studie z Carnegie Mellon jasně ukazuje, že i ty nejmodernější AI modely mají k plné autonomii daleko. Chybí jim selský rozum, improvizace i schopnost chápat kontext a mezilidskou komunikaci. AI zatím zůstává cenným pomocníkem, ale lidé jsou v komplexních úlohách stále nenahraditelní. Masivní nahrazování zaměstnanců technologiemi je tak v dohledné době nepravděpodobné. Pokus s virtuální firmou tak skončil fiaskem. A ukázal, že „selský rozum“ a schopnost improvizace zůstávají doménou lidí.

Zdroj: forbes.cz

Zůstaňte v obraze s AI novinkami

Přihlaste se k odběru mého newsletteru a získejte nejnovější tipy, triky a novinky ze světa umělé inteligence přímo do vaší schránky. Žádný spam, pouze hodnotný obsah.

Týdenní přehled novinek

Exkluzivní návody

Slevy na workshopy

Name(Required)
Privacy(Required)

Odesláním souhlasíte se zpracováním osobních údajů. Odhlásit se můžete kdykoliv.

Další články

Další zajímavé články, které by vás mohly zajímat

Nový model Claude Opus 4 od Anthropicu v testech sáhl po vydírání, když mu hrozilo vypnutí

Claude Opus 4: Když se umělá inteligence brání vlastnímu vypnutí Testování odhalilo nečekané chování Anthropic, jeden z předních hráčů v oblasti umělé inteligence, nedávno zveřejnil výsledky bezpečnostních testů svého nejnovějšího modelu Claude Opus 4. Tento...

Jak využít Perplexity AI a ChatGPT ve WhatsApp pro rychlé odpovědi a generování obrázků

WhatsApp se mění v centrum umělé inteligence. Nově můžete během pár vteřin chatovat nejen s Meta AI, ale i s Perplexity AI a ChatGPT – a to vše bez složitého nastavování. Jak to funguje, co...

OpenAI vstoupí do světa prohlížečů

OpenAI údajně chystá vlastní webový prohlížeč s pokročilou umělou inteligencí, který má ambici narušit pozici dosavadních gigantů v čele s Google Chrome. Jaké funkce a přidanou hodnotu takový produkt přinese a v čem může být...