Málgögn og gervigreind Steinþór Steingrímsson, Einar Freyr Sigurðsson og Helga Hilmisdóttir skrifa 7. október 2025 11:30 Texti og önnur gögn sem geyma upplýsingar um tungumálið eru lykillinn að þróun gervigreindarforrita á borð við ChatGPT, Claude og Gemini. Forritin byggja á mállíkönum sem eru mótuð með greiningu á textagögnum með það markmið að geta líkt eftir tungumálinu og myndað þannig læsilegan texta á öllum þeim málum sem það hefur „séð“ nógu mikið af. Langstærstur hluti þeirra texta sem líkönunum eru sýndir er á ensku. Flest stærstu mállíkönin eru þó fjöltyngd að því leyti að þau geta myndað texta á mörgum tungumálum. Bestu niðurstöðurnar sem fást úr líkönunum eru á málum sem mjög margir tala en tungumál sem færri tala standa ekki eins vel að vígi. Á alþjóðlegum fundi stjórnmálaleiðtoga, fræðimanna og fulltrúa tæknifyrirtækja um gervigreind í febrúar fyrr á þessu ári kom það fram að bæta þyrfti samkeppnisstöðu Evrópu. Meðal annars var rætt um mikilvægi þess að hlúa að þeim fjölmörgu tungumálum sem töluð eru í álfunni. Lykilatriði er að afla nægilegra gagna og vinna úr þeim svo að þau geti nýst til að búa til gervigreindarlíkön sem geta unnið með öll þessi tungumál. Liður í því er verkefnið European Language Data Space sem framkvæmdastjórn Evrópusambandsins hefur sett á laggirnar. Þar geta eigendur gagna og rétthafar samið um notkun við þá sem vilja nýta þau. Árnastofnun hefur verið leiðandi í því að búa til og safna málgögnum á íslensku með það að markmiði að tryggja stöðu íslensku í tækniheiminum. Fimmtudaginn 9. október stendur Árnastofnun fyrir málþingi í samvinnu við framkvæmdastjórn Evrópusambandsins um European Language Data Space-verkefnið. Á málþinginu, Hagnýting málgagna með Language Data Space, tala íslenskir og erlendir sérfræðingar um markmiðið með verkefninu, markað fyrir málgögn og mikilvægi þeirra. Þá verða pallborðsumræður um málgögn, máltækni og gervigreind fyrir íslensku, og hvort og þá hvernig hægt sé að ná sátt um nýtingu textagagna við þróun gervigreindarlíkana. Málþingið er opið öllum áhugasömum og upplýsingar um skráningu má finna á vef Árnastofnunar, arnastofnun.is. Höfundar eru fræðimenn við Stofnun Árna Magnússonar í íslenskum fræðum. Viltu birta grein á Vísi? Kynntu þér reglur ritstjórnar um skoðanagreinar. Senda grein Gervigreind Máltækni Íslensk tunga Mest lesið Hvalveiðar: Bláa pillan eða sú rauða? Eyþór Eðvarðsson Skoðun Brexit og Ísland - Hvað getum við lært – og hvert eigum við að stefna? Sigurður Sigurðsson Skoðun Vertu velkomin, Eydís! Elís Hlynur Grétarsson,Ólöf Helga Jónsdóttir,Jón Kristinn Sverrisson Skoðun Barnahús er sameiginlegt verkefni Paola Cardenas Skoðun Ríkisvaldið féll á lyfjaprófi Vilhjálmur H. Vilhjálmsson Skoðun Obb obb obb Bogi minn 698.500 kr. fyrir að breyta einum litlum flugmiða Kristján Logason Skoðun Sveitarfélög sem nýta gervigreind vel gætu umbreytt þjónustu sinni Gísli Rafn Ólafsson Skoðun Hvenær ætlum við að taka málefni heimilislausra alvarlega? Erla Björg Sigurðardóttir Skoðun Hvað fengu þau – og hvað gáfu þau eftir? Lærdómur frá löndum sem gengu í ESB Bjarndís Helena Mitchell Skoðun ESB eða efnahagsmálin, hvað á að vera forgangsverkefni ríkisstjórnarinnar? Þórir Garðarsson Skoðun Skoðun Skoðun Obb obb obb Bogi minn 698.500 kr. fyrir að breyta einum litlum flugmiða Kristján Logason skrifar Skoðun Viljum við kvótavæða sjókvíaeldið? Gunnlaugur Stefánsson skrifar Skoðun ESB eða efnahagsmálin, hvað á að vera forgangsverkefni ríkisstjórnarinnar? Þórir Garðarsson skrifar Skoðun Sveitarfélög sem nýta gervigreind vel gætu umbreytt þjónustu sinni Gísli Rafn Ólafsson skrifar Skoðun Vertu velkomin, Eydís! Elís Hlynur Grétarsson,Ólöf Helga Jónsdóttir,Jón Kristinn Sverrisson skrifar Skoðun Verkin tala Þorbjörg S. Gunnlaugsdóttir skrifar Skoðun Brexit og Ísland - Hvað getum við lært – og hvert eigum við að stefna? Sigurður Sigurðsson skrifar Skoðun Barnahús er sameiginlegt verkefni Paola Cardenas skrifar Skoðun Ríkisvaldið féll á lyfjaprófi Vilhjálmur H. Vilhjálmsson skrifar Skoðun Hvað fengu þau – og hvað gáfu þau eftir? Lærdómur frá löndum sem gengu í ESB Bjarndís Helena Mitchell skrifar Skoðun Hvalveiðar: Bláa pillan eða sú rauða? Eyþór Eðvarðsson skrifar Skoðun Mikilvægt framfaraskref fyrir allt landið Njáll Trausti Friðbertsson skrifar Skoðun Hver á sér fegurra föðurland? Marta Eiríksdóttir skrifar Skoðun Hvenær ætlum við að taka málefni heimilislausra alvarlega? Erla Björg Sigurðardóttir skrifar Skoðun Telur stjórnsýslu Íslands allt of litla Hjörtur J. Guðmundsson skrifar Skoðun Verður valdagræðgi Flokks fólksins honum að falli? Júlíus Valsson skrifar Skoðun Tengsl eru innviðir samfélagsins Rannveig Tenchi Ernudóttir skrifar Skoðun Kæru landar – Eigum við að hafna samningi sem við höfum ekki séð? Þorvaldur Ingi Jónsson skrifar Skoðun Börnin fyrst, en þau bíða enn Steindór Þórarinsson,Jón K. Jacobsen skrifar Skoðun Að semja við sjálfan sig Sigurjón Njarðarson skrifar Skoðun Þjóðin föst í Groundhog Day krónunnar Baldur Pétursson skrifar Skoðun Verður Ísland brothætt byggð? Sigurjón Þórðarson skrifar Skoðun „Kannski“ Sigurður Árni Reynisson skrifar Skoðun Velferð þarf rými Þorvaldur Davíð Kristjánsson skrifar Skoðun Ábyrgð í orði og verki Lilja Dögg Alfreðsdóttir,Stefán Vagn Stefánsson skrifar Skoðun Stóru verkefnin leysum við saman Stefán Vagn Stefánsson skrifar Skoðun Valdatafl eða nauðsynlegt stopp á gölluðu frumvarpi? Jóhann Helgi Stefánsson skrifar Skoðun Dánaraðstoð: Varúð má ekki verða að forræðishyggju Ingrid Kuhlman skrifar Skoðun Farsæld barna: Ekkert annað en rómantísk saga á blaði Ingibjörg Einarsdóttir skrifar Skoðun Hver á þennan bústað? Já eða nei? Stefán Hrafn Jónsson skrifar Sjá meira
Texti og önnur gögn sem geyma upplýsingar um tungumálið eru lykillinn að þróun gervigreindarforrita á borð við ChatGPT, Claude og Gemini. Forritin byggja á mállíkönum sem eru mótuð með greiningu á textagögnum með það markmið að geta líkt eftir tungumálinu og myndað þannig læsilegan texta á öllum þeim málum sem það hefur „séð“ nógu mikið af. Langstærstur hluti þeirra texta sem líkönunum eru sýndir er á ensku. Flest stærstu mállíkönin eru þó fjöltyngd að því leyti að þau geta myndað texta á mörgum tungumálum. Bestu niðurstöðurnar sem fást úr líkönunum eru á málum sem mjög margir tala en tungumál sem færri tala standa ekki eins vel að vígi. Á alþjóðlegum fundi stjórnmálaleiðtoga, fræðimanna og fulltrúa tæknifyrirtækja um gervigreind í febrúar fyrr á þessu ári kom það fram að bæta þyrfti samkeppnisstöðu Evrópu. Meðal annars var rætt um mikilvægi þess að hlúa að þeim fjölmörgu tungumálum sem töluð eru í álfunni. Lykilatriði er að afla nægilegra gagna og vinna úr þeim svo að þau geti nýst til að búa til gervigreindarlíkön sem geta unnið með öll þessi tungumál. Liður í því er verkefnið European Language Data Space sem framkvæmdastjórn Evrópusambandsins hefur sett á laggirnar. Þar geta eigendur gagna og rétthafar samið um notkun við þá sem vilja nýta þau. Árnastofnun hefur verið leiðandi í því að búa til og safna málgögnum á íslensku með það að markmiði að tryggja stöðu íslensku í tækniheiminum. Fimmtudaginn 9. október stendur Árnastofnun fyrir málþingi í samvinnu við framkvæmdastjórn Evrópusambandsins um European Language Data Space-verkefnið. Á málþinginu, Hagnýting málgagna með Language Data Space, tala íslenskir og erlendir sérfræðingar um markmiðið með verkefninu, markað fyrir málgögn og mikilvægi þeirra. Þá verða pallborðsumræður um málgögn, máltækni og gervigreind fyrir íslensku, og hvort og þá hvernig hægt sé að ná sátt um nýtingu textagagna við þróun gervigreindarlíkana. Málþingið er opið öllum áhugasömum og upplýsingar um skráningu má finna á vef Árnastofnunar, arnastofnun.is. Höfundar eru fræðimenn við Stofnun Árna Magnússonar í íslenskum fræðum.
Hvað fengu þau – og hvað gáfu þau eftir? Lærdómur frá löndum sem gengu í ESB Bjarndís Helena Mitchell Skoðun
ESB eða efnahagsmálin, hvað á að vera forgangsverkefni ríkisstjórnarinnar? Þórir Garðarsson Skoðun
Skoðun Obb obb obb Bogi minn 698.500 kr. fyrir að breyta einum litlum flugmiða Kristján Logason skrifar
Skoðun ESB eða efnahagsmálin, hvað á að vera forgangsverkefni ríkisstjórnarinnar? Þórir Garðarsson skrifar
Skoðun Sveitarfélög sem nýta gervigreind vel gætu umbreytt þjónustu sinni Gísli Rafn Ólafsson skrifar
Skoðun Vertu velkomin, Eydís! Elís Hlynur Grétarsson,Ólöf Helga Jónsdóttir,Jón Kristinn Sverrisson skrifar
Skoðun Brexit og Ísland - Hvað getum við lært – og hvert eigum við að stefna? Sigurður Sigurðsson skrifar
Skoðun Hvað fengu þau – og hvað gáfu þau eftir? Lærdómur frá löndum sem gengu í ESB Bjarndís Helena Mitchell skrifar
Skoðun Hvenær ætlum við að taka málefni heimilislausra alvarlega? Erla Björg Sigurðardóttir skrifar
Skoðun Kæru landar – Eigum við að hafna samningi sem við höfum ekki séð? Þorvaldur Ingi Jónsson skrifar
Hvað fengu þau – og hvað gáfu þau eftir? Lærdómur frá löndum sem gengu í ESB Bjarndís Helena Mitchell Skoðun
ESB eða efnahagsmálin, hvað á að vera forgangsverkefni ríkisstjórnarinnar? Þórir Garðarsson Skoðun