szerző:
hvg.hu
Tetszett a cikk?

A Google egy hat és fél perces videóban prezentálta, milyen interakcióra képes legújabb mesterséges intelligenciája, a Gemini. Csak aztán kiderült, hogy az algoritmus nem úgy működik, mint ahogy azt a videó sugallja.

A múlt héten mutatta be a Google a mobilokba is bekerülő mesterséges intelligenciáját, a Geminit, amellyel majd a ChatGPT-t szeretné letaszítani a trónról. Nagy előrelépés ahhoz képest, hogy egy évvel ezelőtt még pánikolt a cég a ChatGPT érkezése miatt, a demo alapján ugyanis rendkívül izgalmasnak ígérkezik a mostani fejlesztés.

Ez egy multimodális modell, azaz többféle input (bemenet) is adható neki, a szöveges mellett képi, videós, sőt, hangalapú is. Ezzel komplex érvelő feladatokat is meg tud oldani a rendszer, ahogyan akár fizikával kapcsolatos dolgokat is képes abszolválni. Mutatjuk, ez a videó szerint mit jelent.

A Geminit bemutató videónak négy nap kellett a kétmilliós megtekintésszám eléréséhez.

A videó elején felhívja a Google a figyelmet arra, hogy az anyag elkészítése során a bemutatóból kihagyhattak részleteket, például kivágták a szüneteket, amikor túl sokáig gondolkodott a Gemini a válaszon. Összességében azonban még így is lenyűgözőnek hat, mire képes a Google mesterséges intelligenciája.

És itt kezdenek igazán érdekessé válni a dolgok: kiderült, a videó nem valós.

Pontosabban: először felvették a jeleneteket, majd arra szólították fel a Geminit, hogy az abban látható egyes képkockák alapján hozzon létre választ, illetve szöveges parancsot is adtak neki – írja a TechCrunch. Vagyis a mesterséges intelligencia valójában nem úgy és nem ott adott válaszokat, ahol és amikor azt a videó sugallja.

Mint kiderült, a Google maga is közzétette, milyen parancsokat adott a Gemininek, hogy elkészülhessen a videó. Csakhogy ezt egyetlen helyen jelezte csak: a videó leírásában, ami csak a továbbiak gomb megnyomása után jelenik meg. Vagyis bár az információt nem zárták el teljesen, sokat tett azért a Google, hogy ne legyen feltűnő, hogy

a videóban látott jeleneteknek nincs közük a valósághoz.

Mindez a felvétel egészére igaz. Annál a jelenetnél például, amikor a Naprendszer égitesteit tette helyes sorrendbe a Gemini, egy olyan szöveges parancsot kapott, amellyel sikerült elérni a helyes választ. A kérdés így hangzott:

„Ez a helyes sorrend? Vedd figyelembe az égitestek Naptól távolságát, és magyarázd meg a válaszod.”

Google

Vagyis a helyes válasz nem azért született meg, mert a Gemini ránézett a cetlikre és tudta a választ, hanem azért, mert egy szöveges kérdés kicsikarta belőle azt.

Mindez nem kérdőjelezi meg ugyan azt, hogy milyen teljesítményre képes a Gemini, de a hitelességét jelentősen aláásta a Google azzal, hogy nem bontotta ki a valóság minden elemét.

Ha máskor is tudni szeretne hasonló dolgokról, lájkolja a HVG Tech rovatának Facebook-oldalát.