szerző:
hvg.hu
Tetszett a cikk?

Felturbózta mesterséges intelligenciás eszköztárát a Google: az ImageFX képgeneráló megjelentetése mellett frissítették a zenés MI-t is.

Újabb konkurenciát kap a Microsoft Designer (Tervező), a DALL-E és a Midjourney – némi lemaradással, de a Google is kiadta a maga képgeneráló mesterséges intelligenciáját, az ImageFX-et.

A minap bejelentett újdonság az Imagen 2 nyelvi modellen alapszik, és a cég saját chatbotján, az éppen átnevezés előtt álló Bardon belül lehet majd működésre bírni. Ennek metódusa is ismerős lehet már azoknak, akik használták bármelyik, fentebb vázolt képgenerátort: szövegben beírt parancsok mentén lehet kérni a fotók generálását és szerkesztését az MI-től; minél részletesebb a prompt, annál jobb a végeredmény.

Aprócska plusz került a Google megoldásába: ez az „expressive chips” nevet kapta, és ez nem más, mint egyfajta ötletbörze a beírt szavak dimenzióit kibővítve. Például, ha valaki beírja, hogy „portré”, és hogy „fotorealisztikusan” szeretné megkapni az eredményt, utóbbi szóra kattintva egy legördölő menüt kap. Ebből választhat más stílusokat a szolgáltatás javaslataiból, mint mondjuk a fotorealisztikus helyett kézzel rajzolt, vagy absztrakt stílust.

A visszaéléseket egy nem részletezett módszerrel igyekeznek szűrni, így elméletileg nem lehet olyan képek generálására használni, mint amibe a Microsoft Tervező bicskája a napokban beletört – de a szexuális tartalmú mellett erőszakos fotókimenetet sem ad az ImageFX.

Végül, annak érdekében, hogy az MI-vel generált fotókat meg lehessen különböztetni a valós képektől, egy SynthID nevű digitális vízjelet is kap minden MI-fénykép. Ezt az emberi szem nem észleli, ellenben szoftveresen azonosítható – és az ígéret szerint a fotó szerkesztése, vágása sem semlegesíti.

Az ImageFX mellett a Google a zenegeneráló MI-jét, a MusicFX-et is frissítette. Ez szintén a Bardon belül használható, és legfeljebb 70 másodperces felvételeket lehet generáltatni vele a MusicLM nyelvi modell segítségével.

A fent vázolt szolgáltatások jelen állás szerint az Egyesült Államokban, Kenyában és Ausztráliában érhetők el, a világ többi pontjáról egyelőre nem szól a fáma. Az azonban elég valószínű, hogy idővel az Európában is elérhetővé teszi majd őket a Google.

Ha máskor is tudni szeretne hasonló dolgokról, lájkolja a HVG Tech rovatának Facebook-oldalát.