Málgögn og gervigreind Steinþór Steingrímsson, Einar Freyr Sigurðsson og Helga Hilmisdóttir skrifa 7. október 2025 11:30 Texti og önnur gögn sem geyma upplýsingar um tungumálið eru lykillinn að þróun gervigreindarforrita á borð við ChatGPT, Claude og Gemini. Forritin byggja á mállíkönum sem eru mótuð með greiningu á textagögnum með það markmið að geta líkt eftir tungumálinu og myndað þannig læsilegan texta á öllum þeim málum sem það hefur „séð“ nógu mikið af. Langstærstur hluti þeirra texta sem líkönunum eru sýndir er á ensku. Flest stærstu mállíkönin eru þó fjöltyngd að því leyti að þau geta myndað texta á mörgum tungumálum. Bestu niðurstöðurnar sem fást úr líkönunum eru á málum sem mjög margir tala en tungumál sem færri tala standa ekki eins vel að vígi. Á alþjóðlegum fundi stjórnmálaleiðtoga, fræðimanna og fulltrúa tæknifyrirtækja um gervigreind í febrúar fyrr á þessu ári kom það fram að bæta þyrfti samkeppnisstöðu Evrópu. Meðal annars var rætt um mikilvægi þess að hlúa að þeim fjölmörgu tungumálum sem töluð eru í álfunni. Lykilatriði er að afla nægilegra gagna og vinna úr þeim svo að þau geti nýst til að búa til gervigreindarlíkön sem geta unnið með öll þessi tungumál. Liður í því er verkefnið European Language Data Space sem framkvæmdastjórn Evrópusambandsins hefur sett á laggirnar. Þar geta eigendur gagna og rétthafar samið um notkun við þá sem vilja nýta þau. Árnastofnun hefur verið leiðandi í því að búa til og safna málgögnum á íslensku með það að markmiði að tryggja stöðu íslensku í tækniheiminum. Fimmtudaginn 9. október stendur Árnastofnun fyrir málþingi í samvinnu við framkvæmdastjórn Evrópusambandsins um European Language Data Space-verkefnið. Á málþinginu, Hagnýting málgagna með Language Data Space, tala íslenskir og erlendir sérfræðingar um markmiðið með verkefninu, markað fyrir málgögn og mikilvægi þeirra. Þá verða pallborðsumræður um málgögn, máltækni og gervigreind fyrir íslensku, og hvort og þá hvernig hægt sé að ná sátt um nýtingu textagagna við þróun gervigreindarlíkana. Málþingið er opið öllum áhugasömum og upplýsingar um skráningu má finna á vef Árnastofnunar, arnastofnun.is. Höfundar eru fræðimenn við Stofnun Árna Magnússonar í íslenskum fræðum. Viltu birta grein á Vísi? Kynntu þér reglur ritstjórnar um skoðanagreinar. Senda grein Gervigreind Máltækni Íslensk tunga Mest lesið Alræmdur faðir stígur fram Atli Heiðar Gunnlaugsson Skoðun Halldór 23.05.2026 Halldór Dagur og Diljá - dómur er fallinn Halldór Jörgen Olesen Skoðun Líffræðileg fjölbreytni og sveitarfélög Rannveig Magnúsdóttir,Ragnhildur Guðmundsdóttir,Sæunn Júlía Sigurjónsdóttir,Skúli Skúlason Skoðun Það er gott að vera kristinn, en slæmt þegar fáfræðin fær að ráða för María Gunnarsdóttir Skoðun Hundrað milljarða loforð Dags Diljá Mist Einarsdóttir Skoðun Hvað myndir þú gera við auka milljón á ári? Ása Berglind Hjálmarsdóttir Skoðun Norður-Kórea, íslensk stjórnmál og raunveruleikinn Mía Marselína Alexa Guðmundsdóttir Skoðun Króatar og ávextir ESB-aðildar Gunnar Hólmsteinn Ársælsson Skoðun Galin skattheimta ríkisstjórnarinnar Bjarnheiður Hallsdóttir Skoðun Skoðun Skoðun Friður í Segulfirði Bjarni Karlsson skrifar Skoðun Vindorkan – ný fjármálabóla í ríkjum ESB? Júlíus Valsson skrifar Skoðun Skipulag, ábyrgð og meirihlutamyndun Marta Rut Ólafsdóttir,Lárus Jónsson skrifar Skoðun Enginn kaus Bjarna eða Brynjar Gunnar Salvarsson skrifar Skoðun Hvað myndir þú gera við auka milljón á ári? Ása Berglind Hjálmarsdóttir skrifar Skoðun Galin skattheimta ríkisstjórnarinnar Bjarnheiður Hallsdóttir skrifar Skoðun Fyrst upplýsingar og stöðugleiki, svo má kjósa Þórarinn Ingi Pétursson skrifar Skoðun Króatar og ávextir ESB-aðildar Gunnar Hólmsteinn Ársælsson skrifar Skoðun Þegar hlutverkin deyja og sjálfið vaknar Sigurður Árni Reynisson skrifar Skoðun Dagur og Diljá - dómur er fallinn Halldór Jörgen Olesen skrifar Skoðun Styrkur í fjárfestingu í sjávarútvegi Heiðrún Lind Marteinsdóttir skrifar Skoðun Það er gott að vera kristinn, en slæmt þegar fáfræðin fær að ráða för María Gunnarsdóttir skrifar Skoðun Alþjóðasamstarf í umhverfismálum er ekki háð Evrópusambandsaðild Haraldur Ólafsson skrifar Skoðun Norður-Kórea, íslensk stjórnmál og raunveruleikinn Mía Marselína Alexa Guðmundsdóttir skrifar Skoðun Stóreflum námsefnisgerð í íslenska skólakerfinu Magnús Þór Jónsson,Steinn Jóhannsson skrifar Skoðun Hundrað milljarða loforð Dags Diljá Mist Einarsdóttir skrifar Skoðun Líffræðileg fjölbreytni og sveitarfélög Rannveig Magnúsdóttir,Ragnhildur Guðmundsdóttir,Sæunn Júlía Sigurjónsdóttir,Skúli Skúlason skrifar Skoðun Nokkur orð um einföldun eftirlits Ásmundur E. Þorkelsson,Hörður Þorsteinsson,Sigrún Guðmundsdóttir skrifar Skoðun Fólkið fær að ráða för Kolbrún Áslaugar Baldursdóttir skrifar Skoðun Alræmdur faðir stígur fram Atli Heiðar Gunnlaugsson skrifar Skoðun Lýðræðislegt, sanngjarnt, gott Alex Leó Kristinsson skrifar Skoðun Nei, ég vil ekki vinna með þér! Björn Leví Gunnarsson skrifar Skoðun Þrefölda svipa verðtryggingar á Íslandi Guðmundur Ari Sigurjónsson skrifar Skoðun Hver borgar brúsann? Ásmundur E. Þorkelsson,Hörður Þorsteinsson,Sigrún Guðmundsdóttir skrifar Skoðun Hvaða áhrif hefði ESB-aðild á verðbólguna? Halldór Jörgen Olesen skrifar Skoðun Er aithingi.is hættulegt lýðræðinu? Kristján Logason skrifar Skoðun Rafbyssugríman er fallin Þórhildur Sunna Ævarsdóttir skrifar Skoðun Af hverju upplifa sumir kjósendur fjarlægð frá Samfylkingunni? Valerio Gargiulo skrifar Skoðun Launastefna Seðlabankans: Hverjir sitja eftir? Ingvar Freyr Ingvarsson,Sigrún Brynjarsdóttir skrifar Skoðun Ár í eldlínunni Einar Bárðarson skrifar Sjá meira
Texti og önnur gögn sem geyma upplýsingar um tungumálið eru lykillinn að þróun gervigreindarforrita á borð við ChatGPT, Claude og Gemini. Forritin byggja á mállíkönum sem eru mótuð með greiningu á textagögnum með það markmið að geta líkt eftir tungumálinu og myndað þannig læsilegan texta á öllum þeim málum sem það hefur „séð“ nógu mikið af. Langstærstur hluti þeirra texta sem líkönunum eru sýndir er á ensku. Flest stærstu mállíkönin eru þó fjöltyngd að því leyti að þau geta myndað texta á mörgum tungumálum. Bestu niðurstöðurnar sem fást úr líkönunum eru á málum sem mjög margir tala en tungumál sem færri tala standa ekki eins vel að vígi. Á alþjóðlegum fundi stjórnmálaleiðtoga, fræðimanna og fulltrúa tæknifyrirtækja um gervigreind í febrúar fyrr á þessu ári kom það fram að bæta þyrfti samkeppnisstöðu Evrópu. Meðal annars var rætt um mikilvægi þess að hlúa að þeim fjölmörgu tungumálum sem töluð eru í álfunni. Lykilatriði er að afla nægilegra gagna og vinna úr þeim svo að þau geti nýst til að búa til gervigreindarlíkön sem geta unnið með öll þessi tungumál. Liður í því er verkefnið European Language Data Space sem framkvæmdastjórn Evrópusambandsins hefur sett á laggirnar. Þar geta eigendur gagna og rétthafar samið um notkun við þá sem vilja nýta þau. Árnastofnun hefur verið leiðandi í því að búa til og safna málgögnum á íslensku með það að markmiði að tryggja stöðu íslensku í tækniheiminum. Fimmtudaginn 9. október stendur Árnastofnun fyrir málþingi í samvinnu við framkvæmdastjórn Evrópusambandsins um European Language Data Space-verkefnið. Á málþinginu, Hagnýting málgagna með Language Data Space, tala íslenskir og erlendir sérfræðingar um markmiðið með verkefninu, markað fyrir málgögn og mikilvægi þeirra. Þá verða pallborðsumræður um málgögn, máltækni og gervigreind fyrir íslensku, og hvort og þá hvernig hægt sé að ná sátt um nýtingu textagagna við þróun gervigreindarlíkana. Málþingið er opið öllum áhugasömum og upplýsingar um skráningu má finna á vef Árnastofnunar, arnastofnun.is. Höfundar eru fræðimenn við Stofnun Árna Magnússonar í íslenskum fræðum.
Líffræðileg fjölbreytni og sveitarfélög Rannveig Magnúsdóttir,Ragnhildur Guðmundsdóttir,Sæunn Júlía Sigurjónsdóttir,Skúli Skúlason Skoðun
Skoðun Það er gott að vera kristinn, en slæmt þegar fáfræðin fær að ráða för María Gunnarsdóttir skrifar
Skoðun Norður-Kórea, íslensk stjórnmál og raunveruleikinn Mía Marselína Alexa Guðmundsdóttir skrifar
Skoðun Stóreflum námsefnisgerð í íslenska skólakerfinu Magnús Þór Jónsson,Steinn Jóhannsson skrifar
Skoðun Líffræðileg fjölbreytni og sveitarfélög Rannveig Magnúsdóttir,Ragnhildur Guðmundsdóttir,Sæunn Júlía Sigurjónsdóttir,Skúli Skúlason skrifar
Skoðun Nokkur orð um einföldun eftirlits Ásmundur E. Þorkelsson,Hörður Þorsteinsson,Sigrún Guðmundsdóttir skrifar
Skoðun Launastefna Seðlabankans: Hverjir sitja eftir? Ingvar Freyr Ingvarsson,Sigrún Brynjarsdóttir skrifar
Líffræðileg fjölbreytni og sveitarfélög Rannveig Magnúsdóttir,Ragnhildur Guðmundsdóttir,Sæunn Júlía Sigurjónsdóttir,Skúli Skúlason Skoðun