Málgögn og gervigreind Steinþór Steingrímsson, Einar Freyr Sigurðsson og Helga Hilmisdóttir skrifa 7. október 2025 11:30 Texti og önnur gögn sem geyma upplýsingar um tungumálið eru lykillinn að þróun gervigreindarforrita á borð við ChatGPT, Claude og Gemini. Forritin byggja á mállíkönum sem eru mótuð með greiningu á textagögnum með það markmið að geta líkt eftir tungumálinu og myndað þannig læsilegan texta á öllum þeim málum sem það hefur „séð“ nógu mikið af. Langstærstur hluti þeirra texta sem líkönunum eru sýndir er á ensku. Flest stærstu mállíkönin eru þó fjöltyngd að því leyti að þau geta myndað texta á mörgum tungumálum. Bestu niðurstöðurnar sem fást úr líkönunum eru á málum sem mjög margir tala en tungumál sem færri tala standa ekki eins vel að vígi. Á alþjóðlegum fundi stjórnmálaleiðtoga, fræðimanna og fulltrúa tæknifyrirtækja um gervigreind í febrúar fyrr á þessu ári kom það fram að bæta þyrfti samkeppnisstöðu Evrópu. Meðal annars var rætt um mikilvægi þess að hlúa að þeim fjölmörgu tungumálum sem töluð eru í álfunni. Lykilatriði er að afla nægilegra gagna og vinna úr þeim svo að þau geti nýst til að búa til gervigreindarlíkön sem geta unnið með öll þessi tungumál. Liður í því er verkefnið European Language Data Space sem framkvæmdastjórn Evrópusambandsins hefur sett á laggirnar. Þar geta eigendur gagna og rétthafar samið um notkun við þá sem vilja nýta þau. Árnastofnun hefur verið leiðandi í því að búa til og safna málgögnum á íslensku með það að markmiði að tryggja stöðu íslensku í tækniheiminum. Fimmtudaginn 9. október stendur Árnastofnun fyrir málþingi í samvinnu við framkvæmdastjórn Evrópusambandsins um European Language Data Space-verkefnið. Á málþinginu, Hagnýting málgagna með Language Data Space, tala íslenskir og erlendir sérfræðingar um markmiðið með verkefninu, markað fyrir málgögn og mikilvægi þeirra. Þá verða pallborðsumræður um málgögn, máltækni og gervigreind fyrir íslensku, og hvort og þá hvernig hægt sé að ná sátt um nýtingu textagagna við þróun gervigreindarlíkana. Málþingið er opið öllum áhugasömum og upplýsingar um skráningu má finna á vef Árnastofnunar, arnastofnun.is. Höfundar eru fræðimenn við Stofnun Árna Magnússonar í íslenskum fræðum. Viltu birta grein á Vísi? Sendu okkur póst. Senda grein Gervigreind Máltækni Íslensk tunga Mest lesið Skattaferðalandið Ísland Björn Ragnarsson Skoðun Er þetta virkilega svarið frá Þjóðkirkjunni? – þegar barn þarf að flýja úr helgidóm Hilmar Kristinsson Skoðun Einkavæðing orkunnar, skattasniðganga og lífeyrissjóðir Ögmundur Jónasson Skoðun Lýðræði eða hópeinelti? Margrét Pétursdóttir,Þórarinn Haraldsson,Þórdís Guðjónsdóttir,Sigurveig Benediktsdóttir Skoðun Erum við ennþá hrædd við Davíð Oddsson? Magnús Árni Skjöld Magnússon Skoðun Öryggisgæslu í Mjódd, núna, takk fyrir! Helgi Áss Grétarsson Skoðun Ríkisstjórnin ræðst gegn launafólki og atvinnulausum Finnbjörn A. Hermannson Skoðun Saman getum við komið í veg fyrir slag Alma D. Möller Skoðun Eru álverin á Íslandi útlensk? Guðríður Eldey Arnardóttir Skoðun Hvernig léttum við daglega lífið þitt? Einar Geir Þorsteinsson Skoðun Skoðun Skoðun Borgarstefna kallar á aðgerðir og fjármagn Ásthildur Sturludóttir skrifar Skoðun Skjáheimsókn getur dimmu í dagsljós breytt Auður Guðmundsdóttir skrifar Skoðun Eru álverin á Íslandi útlensk? Guðríður Eldey Arnardóttir skrifar Skoðun Öryggisgæslu í Mjódd, núna, takk fyrir! Helgi Áss Grétarsson skrifar Skoðun Erum við ennþá hrædd við Davíð Oddsson? Magnús Árni Skjöld Magnússon skrifar Skoðun Saman getum við komið í veg fyrir slag Alma D. Möller skrifar Skoðun Lýðræði eða hópeinelti? Margrét Pétursdóttir,Þórarinn Haraldsson,Þórdís Guðjónsdóttir,Sigurveig Benediktsdóttir skrifar Skoðun Blóðtaka er ekki landbúnaður Guðrún Scheving Thorsteinsson,Rósa Líf Darradóttir skrifar Skoðun Svar til stjórnunarlegs ábyrgðarmanns frá Keflavík Soffía Sigurðardóttir skrifar Skoðun Ríkisstjórnin ræðst gegn launafólki og atvinnulausum Finnbjörn A. Hermannson skrifar Skoðun 764/O9A: Kannt þú að vernda barnið á netinu? Anna Bergþórsdóttir skrifar Skoðun Opinberir starfsmenn kjósa síður áminningarskyldu Ísak Einar Rúnarsson skrifar Skoðun Einkavæðing orkunnar, skattasniðganga og lífeyrissjóðir Ögmundur Jónasson skrifar Skoðun Er gervigreindarprestur trúlaus eða trúaður? Björgmundur Örn Guðmundsson skrifar Skoðun Skattaferðalandið Ísland Björn Ragnarsson skrifar Skoðun Til hamingju Víkingur Heiðar! Halla Hrund Logadóttir skrifar Skoðun Sjálfbærni með í för – Vegagerðin stígur skref í átt að loftslagsvænni framkvæmdum Hólmfríður Bjarnadóttir skrifar Skoðun Þegar krónur skipta meira máli en velferð barna: Ástæður þess að enginn bauð í skólamáltíðir í Hafnarfirði Jón Ingi Hákonarson skrifar Skoðun Líf eftir afplánun – þegar stuðningur gerir frelsið raunverulegt Steinunn Ósk Óskarsdóttir skrifar Skoðun Á hvorum endanum viljum við byrja að skera af? Davíð Már Sigurðsson skrifar Skoðun Þegar krónur skipta meira máli en velferð barna Jón Ingi Hákonarson skrifar Skoðun Bakslag í opinberri þróunarsamvinnu Gunnar Salvarsson skrifar Skoðun Fyrirmyndar forvarnarstefna í Mosfellsbæ Kjartan Helgi Ólafsson skrifar Skoðun Hvernig léttum við daglega lífið þitt? Einar Geir Þorsteinsson skrifar Skoðun Kína mun ekki bjarga Vesturlöndum að þessu sinni Sæþór Randalsson skrifar Skoðun Er þetta virkilega svarið frá Þjóðkirkjunni? – þegar barn þarf að flýja úr helgidóm Hilmar Kristinsson skrifar Skoðun Átta mýtur klesstar inn í raunveruleikann - hvað er satt og hvað er logið um gervigreindina? Sigvaldi Einarsson skrifar Skoðun Glerbrotin í ryksugupokanum Kristín Kolbrún Waage Kolbeinsdóttir skrifar Skoðun Túrverkir og hitakóf – má ræða það í vinnunni? Já endilega! Katrín Björg Ríkarðsdóttir skrifar Skoðun Draghi-skýrslan og veikleikar Íslands Pawel Bartoszek skrifar Sjá meira
Texti og önnur gögn sem geyma upplýsingar um tungumálið eru lykillinn að þróun gervigreindarforrita á borð við ChatGPT, Claude og Gemini. Forritin byggja á mállíkönum sem eru mótuð með greiningu á textagögnum með það markmið að geta líkt eftir tungumálinu og myndað þannig læsilegan texta á öllum þeim málum sem það hefur „séð“ nógu mikið af. Langstærstur hluti þeirra texta sem líkönunum eru sýndir er á ensku. Flest stærstu mállíkönin eru þó fjöltyngd að því leyti að þau geta myndað texta á mörgum tungumálum. Bestu niðurstöðurnar sem fást úr líkönunum eru á málum sem mjög margir tala en tungumál sem færri tala standa ekki eins vel að vígi. Á alþjóðlegum fundi stjórnmálaleiðtoga, fræðimanna og fulltrúa tæknifyrirtækja um gervigreind í febrúar fyrr á þessu ári kom það fram að bæta þyrfti samkeppnisstöðu Evrópu. Meðal annars var rætt um mikilvægi þess að hlúa að þeim fjölmörgu tungumálum sem töluð eru í álfunni. Lykilatriði er að afla nægilegra gagna og vinna úr þeim svo að þau geti nýst til að búa til gervigreindarlíkön sem geta unnið með öll þessi tungumál. Liður í því er verkefnið European Language Data Space sem framkvæmdastjórn Evrópusambandsins hefur sett á laggirnar. Þar geta eigendur gagna og rétthafar samið um notkun við þá sem vilja nýta þau. Árnastofnun hefur verið leiðandi í því að búa til og safna málgögnum á íslensku með það að markmiði að tryggja stöðu íslensku í tækniheiminum. Fimmtudaginn 9. október stendur Árnastofnun fyrir málþingi í samvinnu við framkvæmdastjórn Evrópusambandsins um European Language Data Space-verkefnið. Á málþinginu, Hagnýting málgagna með Language Data Space, tala íslenskir og erlendir sérfræðingar um markmiðið með verkefninu, markað fyrir málgögn og mikilvægi þeirra. Þá verða pallborðsumræður um málgögn, máltækni og gervigreind fyrir íslensku, og hvort og þá hvernig hægt sé að ná sátt um nýtingu textagagna við þróun gervigreindarlíkana. Málþingið er opið öllum áhugasömum og upplýsingar um skráningu má finna á vef Árnastofnunar, arnastofnun.is. Höfundar eru fræðimenn við Stofnun Árna Magnússonar í íslenskum fræðum.
Er þetta virkilega svarið frá Þjóðkirkjunni? – þegar barn þarf að flýja úr helgidóm Hilmar Kristinsson Skoðun
Lýðræði eða hópeinelti? Margrét Pétursdóttir,Þórarinn Haraldsson,Þórdís Guðjónsdóttir,Sigurveig Benediktsdóttir Skoðun
Skoðun Lýðræði eða hópeinelti? Margrét Pétursdóttir,Þórarinn Haraldsson,Þórdís Guðjónsdóttir,Sigurveig Benediktsdóttir skrifar
Skoðun Sjálfbærni með í för – Vegagerðin stígur skref í átt að loftslagsvænni framkvæmdum Hólmfríður Bjarnadóttir skrifar
Skoðun Þegar krónur skipta meira máli en velferð barna: Ástæður þess að enginn bauð í skólamáltíðir í Hafnarfirði Jón Ingi Hákonarson skrifar
Skoðun Líf eftir afplánun – þegar stuðningur gerir frelsið raunverulegt Steinunn Ósk Óskarsdóttir skrifar
Skoðun Er þetta virkilega svarið frá Þjóðkirkjunni? – þegar barn þarf að flýja úr helgidóm Hilmar Kristinsson skrifar
Skoðun Átta mýtur klesstar inn í raunveruleikann - hvað er satt og hvað er logið um gervigreindina? Sigvaldi Einarsson skrifar
Skoðun Túrverkir og hitakóf – má ræða það í vinnunni? Já endilega! Katrín Björg Ríkarðsdóttir skrifar
Er þetta virkilega svarið frá Þjóðkirkjunni? – þegar barn þarf að flýja úr helgidóm Hilmar Kristinsson Skoðun
Lýðræði eða hópeinelti? Margrét Pétursdóttir,Þórarinn Haraldsson,Þórdís Guðjónsdóttir,Sigurveig Benediktsdóttir Skoðun