Google je predstavio novu generativnu platformu umjetne inteligencije – Google Gemini. Uz ChatGPT, Google Gemini predstavlja najnaprednije rješenje umjetne inteligencije (AI) koje nam je danas dostupno.
Što je zapravo Google Gemini?
Google predstavlja Gemini kao svoj najmoćniji i najveći model umjetne inteligencije koji može besprijekorno razumjeti i generalizirati, operirati te kombinirati različite vrste informacija: zvuk, videozapise, slike, tekstove i kodove. Gemini ima napredne sposobnosti kodiranja i sofisticirane multimodalne sposobnosti zaključivanja. Prva verzija Gemini 1.0 optimizirana je za različite veličine: Ultra, Pro i Nano.
Iz Googlea navode kako su temeljito testirali modele Gemini-a i evaluirali njihovu izvedbu na skupu različitih zadataka. Izvedba Gemini Ultra-e premašuje trenutačne najmodernije rezultate na 30 od 32 široko korištenih akademskih referentnih mjera u istraživanju i razvoju velikih jezičnih modela, od razumijevanja prirodnih slika, videozapisa i zvukova, pa sve do matematičkog zaključivanja. Gemini Ultra s rezultatom od 90 % predstavlja prvi model koji nadmašuje ljudske stručnjake u masovnom razumijevanju jezika uz istovremeno obavljanje više zadataka, a koji koristi kombinaciju od 57 predmeta poput fizike, matematike, prava, povijesti, etike i medicine za testiranje sposobnosti rješavanja problema i općeg znanja. Njihov novi referentni pristup masovnom razumijevanju jezika uz istovremeno obavljanje više zadataka omogućuje Gemini-u da koristi svoje mogućnosti zaključivanja kako bi pažljivije razmislio pri odgovaranju na teška pitanja, što dovodi do značajnog poboljšanja.
Razlika između Geminija i modela poput Google-ovog vlastitog jezičnog modela za aplikacije dijaloga – LaMDA – leži u tome što LaMDa ne može generirati niti razumjeti ništa osim teksta, dok Gemini ima sposobnost razumjeti zvukove, videozapise, kodove, tekstove i slike.
Što sve Google Gemini može?
U teoriji, Gemini modeli mogu obavljati različite zadatke, od opisivanja videozapisa i slika do generiranja umjetničkih djela i transkripcije govora. Mali dio tih mogućnosti je dostigao fazu proizvoda, no Google obećava da će tu fazu doseći i ostali u bliskoj budućnosti.
- Gemini Ultra: Moći će se koristiti kao pomoć kod rješavanja domaće zadaće, primjerice iz fizike, rješavanja problema korak po korak te ukazivanja na moguće pogreške kod ranije ispunjenih odgovora. Osim toga, moći će se primjenjivati na zadatke poput identificiranja znanstvenih radova koji su relevantni za određeni problem, moći će izvlačiti informacije iz tih radova te ažurirati grafikone generiranjem formula koje su potrebne za ponovno stvaranje grafikona s novijim podatcima.
- Gemini Pro: Istraživanje istraživača Carnegie Mellon-a i BerriAl-a je otkrilo da je Gemini Pro bolji od GPT-3.5 tvrtke OpenAI u rukovanju sa složenijim i duljim lančanim zaključcima. Osim toga, istraživanje je otkrilo i da Gemini Pro ima problema s matematičkim problemima koji uključuju više znamenki, te su korisnici pronašli mnogo primjera lošeg zaključivanja i mnogo pogrešaka. Google je obećao poboljšanja, no nije poznato kada. Gemini Pro dostupan je putem API-a u Vertex AI – potpuno upravljanoj platformi za razvoj umjetne inteligencije tvrtke Google, koja prihvaća tekst kao ulaz te generira tekst kao izlaz. Vertex korisnici biti će u mogućnosti koristiti Gemini Pro za napajanje prilagođenih konverzacijskih glasova i chatbot-ova. Gemini Pro moći će se koristiti i za pogon značajki sažimanja pretraživanja, preporuka i generiranja odgovora u Vertex Ai, koristeći dokumente različitih modaliteta iz različitih izvora.
- Gemini Nano: Gemini Nano značajnije je manja verzija od modela Gemini Ultra i Gemini Pro. Dovoljno je učinkovita da se pokreće izravno na nekim pametnim telefonima umjesto da šalje zadatke negdje drugdje na servere. Do sada pokreće dvije značajke na Pixel 8 Pro-u: sažimanje u Snimaču i pametni odgovori u Gboard-u. Aplikacija Snimač uključuje Gemini-ev sažetak vaših snimljenih razgovora. Gemini Nano je također dostupan i u Gboard-u, odnosno Google-ovoj aplikaciji tipkovnice, gdje pokreće značajku pametnog odgovora koja pomaže predložiti sljedeću stvar koju želite reći tijekom razgovora u aplikaciji za dopisivanje. Značajka za sada radi samo na Whatsapp-u, no Google navodi da će s vremenom raditi i na više aplikacija.
Usporedba ChatGPT-a i Google Gemini-a:
- Google Gemini Pro i ChatGPT-3.5: Gemini Pro nadmašuje GPT-3.5 u razumijevanju pitanja iz različitih područja. Što se tiče aritmetičkog zaključivanja, Gemini Pro se više ističe. Kada govorimo o generiranju koda, Gemini Pro postiže više bodova. Jedino područje u kojem se GPT-3.5 bolje snalazi je matematika.
- Google Gemini Ultra i ChatGPT-4: Gemini Ultra postiže bolje rezultate od GPT-4 kod općih jezičnih sposobnosti i zaključivanja, kao i kod razumijevanja čitanja. Također ima blagu prednost i kod zahtjevnijih matematičkih procjena. Kod generiranja koda Gemini Ultra nadmašuje GPT-4.
Kada govorimo o zadacima obrade fotografija, videozapisa i audiozapisa, razumijevanju i opisivanju istih te prevođenju, Gemini Ultra također ima prednost i pokazuje se boljim.
Imate dodatnih pitanja o ovoj temi? Stručnjaci Centra za sigurniji Internet vam stoje na raspolaganju za sva pitanja i nedoumice na besplatnoj i anonimnoj liniji Centra dostupnoj na broju 0800 606 606, svaki radni dan od 08:00 do 16:00 sati.
Powered by A1 Hrvatska.