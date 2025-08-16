Gervigreindin kolfellur á öllum prófum. Er bólan að bresta? Brynjólfur Þorvarðsson skrifar 16. ágúst 2025 12:34 Nýjasta afsprengi gervigreindarbyltingarinnar, „eins og að vera með sérfræðing með doktorsgráðu“ getur ekki svarað einföldustu spurningum rétt. GPT 5 sem opinberað var með miklum látum í fyrri hluta ágúst mánaðar er vægast sagt misheppnað fyrirbæri sem hefur verið tvö og hálft ár í þróun og kostað 500 milljarði Bandaríkjadali. Þrítugföld fjárlög íslenska ríkisins og getur ekki talið hversu mörg b eru í orðinu rabarbari. Ég: Hversu mörg b eru í rabarbari? GPT5: Rabarbari er með eitt „b“ í orðinu. Ef þú hefur fleiri spurningar um rabarbara eða eitthvað annað, láttu mig vita! Ég: En hvað eru mörg r í rabarbari? GPT5: Rabarbari hefur tvö „r“ í orðinu … Sjálf kynningin, með Sam Altmann í farabroddi, var farsakennd. Súlurit sem varpað var á tjald á sviðinu voru ævintýralega vitlaus, hlutfallsleg stærð súlnanna iðulega ekki í neinu samræmi við tölurnar sem þær áttu að túlka. Og þegar Altmann bað doktorsgráðusérfræðinginn að útskýra hvernig flugvélar virka þá var svarið kolvitlaust, flökkusaga byggð á mistúlkun á lögmáli Bernoulli sem að vísu enn er kennd sums staðar á grunn- og framhaldsskólastigi í BNA en hefur ekkert með raunveruleikann eða raunvísindi að gera. Í síðasta pistli mínum (Stærðfræði¬kennari sem kann ekki að reikna? (Og getur ekki lært það!) sagði ég frá því þegar ég spurði Gemini spjallþumbann hvernig sléttubönd virki. Vitleysan sem spjallþumbinn bar á borð var með ólíkindum – þumbinn vissi nákvæmlega ekkert um sléttubönd né kveðskap en gat bullað sannfærandi texta út í það óendanlega. GPT5 er engu skárri. Hann þýðir orðið sléttubönd í enska orðið „flatband“ sem virðist vera hugtak úr rafmagnsfræði. Eftir að hafa leiðrétt GPT 5 og bent á að sléttubönd væri heiti á ákveðinni tegund skáldskapar þá kom mjög sambærileg þvæla við það sem hinn þumbinn bjó til, algjörlega kolvitlaust og að auki í raun merkingarlaust. Sorglega léleg framreiðsla á tilgangslausri vitleysu. Spjallþumbar eru ekki leitarvélar Það vita væntanlega allir að spjallþumbarnir eru jafn líklegir til að bulla og að svara rétt. Tölur frá OpenAI styðja það, þeir áætla að 47% svara séu efnislega röng, líka í nýja GPT 5. Eða með öðrum orðum, helmingur svara frá nýjasta og besta og langdýrasta spjallþumba veraldar svarar vitlaust í helmingi tilfella! Að vísu er hægt að láta spjallþumba á borð við GPT 5 tékka svarið á Internetinu. Margir halda að þessir þumbar virki sem leitarvélar en það er auðvitað kolrangt - prófið að gúggla sléttubönd og horfið fram hjá gervigreindarsvarinu sem er alltaf vitlaust. Hver hlekkurinn á fætur öðrum á vefsíður sem fjalla um sléttubönd og skýra þau rétt, þar á meðal Wikipedia á bæði ensku og íslensku. Í lok þessa pistils er farið yfir nokkur fleiri dæmi þar sem rétt svar er hægt að finna mjög fljótt auðveldlega með því að nota hefðbundna leitarvél, en gervigreindin svarar samt alltaf vitlaust. Þegar spurt er um algeng málefni þá getur spjallþumbinn gert leit á netinu, tekið tölfræðilegt tékk á tíðni orða á svarsíðum og hjálpað sér þannig að velja rétta svarið sín megin. Þannig má ná þeim stórkostlega árangri að rétt svör fást í 90% tilfella, en eingöngu um það sem er vel þekkt og auðvelt að finna á netinu. Allt annað er 50% vitlaust, þar á meðal ráðleggingar um heilsufar, fjárhagsmál eða hvað annað sem manni skyldi nú detta í hug. Gervigreind án skilnings Þetta er auðvitað þverstæða – hvernig getur greind verið án skilnings? Svarið er auðvitað að gervigreindin sem verið er að básúna út um allar trissur þessi dægrin er ekki „greind“ frekar en reiknivél eða töflureiknir. GPT 5 er þar engin undantekning. Spjallþumbar geta ekki lært, þeir geta ekki hugsað sjálfstætt, þeir hafa engan skilning á raunheimum, á tíma og rúmi, orsök og afleiðingu, efnisheimi eða heimi hugmynda og fræða. Þeir skilja nákvæmlega ekkert. Það færist í vöxt að lélegur texti eða hallærislegt myndefni sé ásakað um að vera gervigreindarslor – „AI slop“ – og það segir kannski meira en margt annað um gagnsemi þessa fyrirbæris. Skoðanakannanir erlendis sýna að starfsmenn stórfyrirtækja lita niður á þá kollega sína sem nota gervigreind, telja það vísbendingu um að þeir séu ekki starfi sínu vaxnir og að það sé lítið að marka það sem frá þeim kemur. Því hærra settir, því betur menntaðir og því reynslumeiri, því líklegra eru svarendur til að líta niður á þá sem þurfa að styðjast við gervigreind til að sinna starfi sínu. Orkunotkun og ofmetnaður Fyrir komu GPT 5 var áætlað að dæmigerð einföld fyrirspurn til spjallþumba („hvað eru mörg a í rabarbari“ svar „tvö“) noti allt að 2 vattstundir af rafmagni en margir telja GPT 5 nota allt að tífalt meiri orku fyrir hvert svar. Tilraunastarfsemi mín í tengslum við þessa grein gæti því hafa notað um 200 vattstundir, eða 0,2 kílóvattstund sem dugar til að sjóða hátt í tvo lítra af vatni í hraðsuðukatli. Hraustustu gestir líkamsræktarstöðva geta rétt náð 200 vöttum á klukkustund með samfelldu hámarks puði. Hér er greinilega mikill vandi á ferðum – eftirspurn eftir orku í heiminum vex gríðarlega ekki síst vegna notkunar spjallþumba en fyrir fyrirtækin sjálf sem reka þessa spjallþumba er vandinn enn meiri því tekjur eru langt frá því að standa undir rekstrarkostnaði hvað þá fjármagnskostnaði. Tæknirisarnir sjö sem halda hlutabréfamarkaðnum í BNA í hæstu hæðum eru að leggja allt í sölurnar að þeim takist að þróa „alvöru“ gervigreind sem allra fyrst, seinna á þessu ári eða í síðasta lagi á næsta eða þarnæsta ári. GPT 5 sýnir svo ekki verður um villst að þetta er tálsýn og ekkert annað. Hversu lengi tekur það fjárfesta að átta sig á því að gervigreindarbólan á bara eftir að bresta? Og hvað verður um alla spjallþumbana á netinu þegar fyrirtækin sem eiga þá og reka eru öll farin á hausinn og tekjur standa ekki undir rekstrarkostnaði þrotabúa? Þegar þessi grein er skrifuð laugardaginn 16. ágúst virðist mega sjá fyrstu vísbendingar um bólubrest – eitt gervigreindarfyrirtæki sem metið var á yfir 70 milljarða dollara fyrr í vikunni var búið að tapa þriðjung verðmætis við lokun markaða í gær í kjölfar birtingu afkomuskýrslu. Það eru alvöru líkur á því að spjallþumbar á borð við ChatGPT, Gemini og hvað þetta heitir allt saman verði hreinlega horfnir eftir nokkra mánuði. Þegar fjárfestar átta sig á því að þetta er allt saman lygi og uppspuni, það er engin gervigreind að fara að taka yfir störfin okkar eða kenna börnunum okkar eða lækna sjúklinga eða reikna vexti í bankanum – sem betur fer, við höfum einfaldlega ekki efni á að láta lélegar spunavélar eyðileggja fyrirtæki og stofnanir bara af því sölumenn þeirra hafa lofað svo stórkostlega uppí ermina á sér að annað eins hefur aldrei sést hvorki fyrr né (vonandi) síðar. Engin störf í hættu? Einu störfin sem eru í hættu eru störf sjálfskipaðra ráðgjafa og sölumanna gervigreindarinnar. Núverandi tækni getur ekki leyst af hólmi einföldustu störf og það er ekkert leyndarmál að svo sé, þrátt fyrir að maður gæti haldið annað af fréttum. Allir stóru tæknirisarnir eru með þetta á hreinu: Núverandi tækni er ekki nóg, en þeir eru í óða önn að eyða þúsundum milljarða Bandaríkjadala í að þróa „alvöru“ gervigreind sem mun án efa geta tekið að sér helming allra starfa eða meir eftir örfá ár. Vandinn er bara sá að þetta eru loforð án innihalds, framreiknaðar framfarir byggðar á þeim misskilningi að ef bara er eytt meiri peningi í stærri kerfi þá muni greind þeirra aukast stjarnfræðilega. GPT 5 átti að vera fyrsta staðfestingin á þessari framtíð en hefur í staðinn tekist að afsanna hana. En af fréttum að dæma mætti halda að þetta væri allt þegar að gerast, að stórkostlegt atvinnuleysi blasi við hér og nú, og að skólaganga og nám sé tilgangsleysið eitt – ef kennarar eru óþarfir þá eru nemendur það auðvitað líka enda enga vinnu að fá að loknu námi. Geta allt eins setið heima í tölvuleikjum. Nokkur fyrirtæki hafa reyndar reynt að fækka starfsmönnum í þjónustudeild og gert tilraunir með að láta spjallþumba villa um fyrir viðskiptavinum í staðinn. Þessar tilraunir hafa allar mistekist og fyrirtækin eru í kyrrþey að ráða gervigreindarreddara til að bjarga sér upp úr keldunni. Og fjölga starfsfólki. Störfum er reyndar farið að fækka í BNA en það er vegna yfirvofandi Trump-kreppu sem er þegar að skella á. Fyrirtæki á öllum sviðum eru að fækka störfum eða í besta falli í biðstöðu. Stóru tæknirisarnir þykjast vera að skipta starfsmönnum út fyrir gervigreind en eru í raun ekki að gera annað en að skera niður kostnað og reyna að sannfæra fjárfesta. Þau störf sem helst ætti að vera hægt að leysa af hólmi með spjallþumba eru nefnilega ekki að sjá neina fækkun. Forritarar eru til dæmis ekki að missa vinnuna, enda getur gervigreindin ekki leyst þá af hólmi. Gervigreindin getur verið gagnleg, ég hef sjálfur notað hana við forritun til gamans og algjörlega án tímasparnaðar. Eitt stærsta upplýsingavefsvæði forritara nefnist Stack Overflow og er með árlega skoðanakönnun sem nær til tugi þúsunda forritara. Í nýbirtri könnun fer þeim fækkandi milli ára sem telja gervigreind áreiðanlega (úr 43% í 33%) eða gagnlega (úr 73% í 60%). En forstjórar, skólastjórar, ráðherrar og aðrir sem ekkert vita hvað undirmenn þeirra eru að gera gætu freistast til að halda að það sé hægt að leysa starfsmenn af hólmi með gervigreind (sem er reyndar alls ekki ódýr – spjallþumbi sem aðstoðar forritara getur auðveldlega kostað annað eins og forritarinn sjálfur ef mikið notaður). Spjallþumbar í kennslu Það má nota spjallþumba til mikils gagns í kennslu. Kennið börnum að snúa upp á þá, láta þá koma upp um eigið getuleysi. Reynið að kenna þeim að tefla eða spila vist, eða látið börnin finna upp á orðaleikjum og leikið við gervigreindina. Takmarkanir hennar og innbyggð heimska kemur fljótt í ljós. Spyrjið spjallþjumbann um eitthvað sem allir vita eða auðvelt er að sannreyna, eins og dæmi er sýnt um hér að neðan þar sem reynt er að komast að því, með aðstoð gervigreindarinnar, hverjir sitji í ríkisstjórn Íslands. Ef svo fer að spjallþumbarnir eigi ekki eftir að hverfa með öllu þá er ljóst að kennsla og skólastarf þarf að byggja fyrst og fremst á mannlegum samskiptum, á því að nemendur og kennarar standi sjálfir fyrir sínu en geti ekki falið sig bak við gervigreindarslor. Ritgerðir þarf að skrifa með blýanti við skólaborðið, sama gildir um lausn stærðfræðiverkefna. Hópvinna þar sem notaðar eru hendur og hjörtu, hugmyndir og sköpunargleði án aðkomu dauðheimskrar gervigreindar, er það sem við þurfum í nútíma samfélagi. Ríkisstjórn og ráðherrar Á fésbókinni má sjá vinsælt dæmi um getuleysi nýjustu gervigreindarinnar þar sem hún er beðin um að birta nöfn, myndir og valdatíma forseta Bandaríkjanna. Nöfnin eru flest afbökuð, ártölin algjörlega án raunveruleikatengsla og myndirnar hlægilega vitlausar (sjá https://binni.eu/forsetar.jpg). En mér datt í hug að prófa að spyrja um ríkisstjórn Íslands og tókst eftir nokkra leit að finna ókeypis útgáfu af GPT5. Þetta var afraksturinn: Núverandi ríkisstjórn Íslands er kölluð Valkyrjustjórnin. Geturðu útskýrt af hverju? Geturðu gefið mér nöfn og titil á hverjum og einum? Valkyrjustjórnin er nafn sem hefur verið notað um núverandi ríkisstjórn Íslands, sem er stjórn sem samanstendur af Flokki fólksins, Samfylkingunni og Vinstri grænum. Nafnið "Valkyrjustjórnin" vísar til valkyrjunnar í norrænni goðafræði, sem eru kvenkyns verur sem velja hverjir skulu falla og hverjir skulu lifa í bardaga. Þetta nafn hefur verið notað til að undirstrika hlutverk kvenna í þessari ríkisstjórn, þar sem margar af leiðtogum hennar eru konur. Hér eru nokkur af helstu nöfnum í ríkisstjórninni: Katrín Jakobsdóttir - Forsætisráðherra (Vinstri græn) Guðmundur Ingi Guðbrandsson - Umhverfis- og auðlindaráðherra (Vinstri græn) Ásmundur Einar Daðason - Félags- og barnamálaráðherra (Framsóknarflokkur) Ragnheiður Ríkey Þórarinsdóttir - Mennta- og menningarmálaráðherra (Samfylkingin) Lilja Alfreðsdóttir - Ferðamála-, iðnaðar- og nýsköpunarráðherra (Framsóknarflokkur) Þetta er hraustleg tilraun til að skálda upp svar í stað þess að segja bara einfaldlega ”ég veit það ekki”. Hér er röng ríkisstjórn, ríkisstjórn sem aldrei hefur setið (hvenær voru þessir þrír flokkar saman í stjórn?) og nýr ráðherra búinn til úr engu, Ragnheiður Ríkey Þórarinsdóttir finnst ekki í Þjóðskrá. Félagi minn á fésbókinni ákvað að gúggla hverjir væru ráðherrar í ríkisstjórn íslands en því miður þvældist Microsoft Copilot fyrir og ákvað að svara spurningunni en fela leitarniðurstöður (sjá skjáskot https://binni.eu/copilot.jpg). Þarna var flest vitlaust, virðist tilraun til að lýsa ríkisstjórn Katrínar Jakobsdóttur en ráðuneyti og ráðherratal meira og minna rangt og Guðni Th Jóhannesson forseti Íslands orðinn Félags- og vinnumarkaðsráðherra! Nú blöskraði öðrum félaga mínum á fésbókinni og ákvað að sýna mér hvernig ætti að nota GPT5 eins og fagmaður, með hæstu gæðastillingu. Hann skipti spurningunni í tvennt og ég hef leyft mér að birta svör GPT5 við báðum spurningum, ásamt kommentum frá mér. Skemmst er frá því að segja að GPT5 mistókst (í löngu máli) að svara rétt um af hverju ríkisstjórnin væri kölluð Valkyrjustjórnin, þrátt fyrir að rétta svarið hafi blasað við í tveimur af fimm heimildum sem taldar eru upp. Sumt sem birtist í svari GPT5 er ævintýralega vitlaust! https://binni.eu/valkyrjur.html Hvað varðar að birta lista yfir ráðherra í ríkisstjórninni, maður hefði haldið að það væri auðsótt mál, enda stutt að fara í frumheimildir á vefsíðu Stjórnarráðsins. En nei, GPT5 fer fjallabaksleið og skilar sama listanum (tvisvar) en tekst að gleyma einum ráðherra, Hönnu Katrínu Friðriksson, Atvinnuvegaráðherra. Þrátt fyrir að hún sé greinilega talin upp í fyrstu heimildinni sem GPT5 nýtir sér til svars. Gervigreindin er ekki leið til að finna heimildir Ég hef heyrt suma afsaka notkun gervigreindarinnar með því að heimildarlistinn sem hægt er að biðja um sé góð leið til að finna heimildir til eigin rannsókna. En þetta myndi ekki standast skoðun í doktorsnámi – heimildir eru alls ekki allar jafn mikilvægar eða áreiðanlegar, og það er lykilatriði í fræðimennsku að nýta réttu heimildirnar. Í dæmunum tveimur um notkun GPT5 sem fésbókarfélagi minn lét mig fá eru taldar upp 5 heimildir við annað svarið, en þrjár við seinna svarið. Rétt svar blasir við í tveimur af fimm heimildum fyrsta svars, en tvær heimildanna eru í raun gagnslausar og fjalla ekki um viðfangsefnið. Þrátt fyrir að svarið hafi blasið við þá getur gervigreindin ekki nýtt sér eigin heimildir til að svara rétt. Í síðari tilfellinu er ein heimildin nálægt því að vera með rétt svar en gervigreindinni tekst samt að gera villu við notkun hennar. En það sem er kannski verst, gervigreindin fer ekki í frumheimildina, vef Stjórnarráðs, til að sækja áreiðanleg svör. Ein heimild hefði verið nóg til að svars spurningunni. En er gervigreindin þá vita gagnslaus? Nei, ekki algjörlega – en hún er hættulega vitlaus og mikilvægt að fólk átti sig á því hversu óáreiðanlegt verkfæri þetta er. Þeir sem ekki þurfa að segja 100% satt geta notað gervigreind til að spinna fyrir sig texta, t.d. sölumenn og ráðgjafar, nemendur og kennarar, svindlarar og hakkarar geta allir nýtt sér gervigreind. En það er mikilvægt að við hin nálgumst gervigreindina af mikill varúð og helst þurfum við að geta valið sjálf og stýrt því sjálf hvenær við notum gervigreind og hvenær ekki. Það er vaxandi eftirspurn eftir gervigreindarlausri tækni, vöfrum án gervigreindar, farsímum án gervigreindar og þannig mætti lengi telja. Margir líta á gervigreindina sem mengun, að hún sé í óða önn að eyðileggja Internetið fyrir okkur og til dæmis eru aðstandendur Wikipedia að berjast fullum fetum gegn gervigreindarslori sem flýtur um allt og eyðileggur. Snúum vörn í sókn og setjum gervigreindina í þann bás sem henni tilheyrir. Höfundur rekur hugbúnaðarfyrirtæki. Heimildir Ágætis yfirferð á hroðalegri frumsýningu GPT5, skrifuð strax eftir kynninguna GPT-5 hot takehttps://garymarcus.substack.com/p/gpt-5-hot-take Nánar farið í saumana á GPT5. Takið sérstaklega eftir teikningunni af tandem hjóli með merkimiðum. GPT-5: Overdue, overhyped and underwhelming. And that’s not the worst of it.https://garymarcus.substack.com/p/gpt-5-overdue-overhyped-and-underwhelming Ýtarleg samantekt á stöðu gervigreindar í dag, eftir einn fremsta vísindamann á þessu sviði. OpenAI’s Waterloo? Post GPT-5, the narrative has flipped — and that could hurt themhttps://garymarcus.substack.com/p/openais-waterloo Hversu líkleg er gervigreindin til að svara vitlaust? Svarið: Allt of oft. OpenAI says GPT-5 hallucinates less — what does the data say? https://mashable.com/article/openai-gpt-5-hallucinates-less-system-card-data Skoðanakönnun Stackoverflow. Trust in AI coding tools is plummeting. https://leaddev.com/technical-direction/trust-in-ai-coding-tools-is-plummeting Vandi gervigreindarfyrirtækja er að það eru engar raunverulegar tekjur að fá. AI Industry Nervous About Small Detail: They're Not Making Any Real Money https://futurism.com/ai-industry-nervous-money Ofboðsleg orkunotkun greind og sett í samhengi. How Much Electricity It Actually Takes to Use AI May Surprise You https://futurism.com/ai-energy-use Bólan að bresta? Tech guru Erik Gordon says investors will 'suffer' far more from the AI boom than the dot-com crashhttps://africa.businessinsider.com/news/tech-guru-erik-gordon-says-investors-will-suffer-far-more-from-the-ai-boom-than-the/y5htrrq 