Málgögn og gervigreind Steinþór Steingrímsson, Einar Freyr Sigurðsson og Helga Hilmisdóttir skrifa 7. október 2025 11:30 Texti og önnur gögn sem geyma upplýsingar um tungumálið eru lykillinn að þróun gervigreindarforrita á borð við ChatGPT, Claude og Gemini. Forritin byggja á mállíkönum sem eru mótuð með greiningu á textagögnum með það markmið að geta líkt eftir tungumálinu og myndað þannig læsilegan texta á öllum þeim málum sem það hefur „séð“ nógu mikið af. Langstærstur hluti þeirra texta sem líkönunum eru sýndir er á ensku. Flest stærstu mállíkönin eru þó fjöltyngd að því leyti að þau geta myndað texta á mörgum tungumálum. Bestu niðurstöðurnar sem fást úr líkönunum eru á málum sem mjög margir tala en tungumál sem færri tala standa ekki eins vel að vígi. Á alþjóðlegum fundi stjórnmálaleiðtoga, fræðimanna og fulltrúa tæknifyrirtækja um gervigreind í febrúar fyrr á þessu ári kom það fram að bæta þyrfti samkeppnisstöðu Evrópu. Meðal annars var rætt um mikilvægi þess að hlúa að þeim fjölmörgu tungumálum sem töluð eru í álfunni. Lykilatriði er að afla nægilegra gagna og vinna úr þeim svo að þau geti nýst til að búa til gervigreindarlíkön sem geta unnið með öll þessi tungumál. Liður í því er verkefnið European Language Data Space sem framkvæmdastjórn Evrópusambandsins hefur sett á laggirnar. Þar geta eigendur gagna og rétthafar samið um notkun við þá sem vilja nýta þau. Árnastofnun hefur verið leiðandi í því að búa til og safna málgögnum á íslensku með það að markmiði að tryggja stöðu íslensku í tækniheiminum. Fimmtudaginn 9. október stendur Árnastofnun fyrir málþingi í samvinnu við framkvæmdastjórn Evrópusambandsins um European Language Data Space-verkefnið. Á málþinginu, Hagnýting málgagna með Language Data Space, tala íslenskir og erlendir sérfræðingar um markmiðið með verkefninu, markað fyrir málgögn og mikilvægi þeirra. Þá verða pallborðsumræður um málgögn, máltækni og gervigreind fyrir íslensku, og hvort og þá hvernig hægt sé að ná sátt um nýtingu textagagna við þróun gervigreindarlíkana. Málþingið er opið öllum áhugasömum og upplýsingar um skráningu má finna á vef Árnastofnunar, arnastofnun.is. Höfundar eru fræðimenn við Stofnun Árna Magnússonar í íslenskum fræðum. Viltu birta grein á Vísi? Kynntu þér reglur ritstjórnar um skoðanagreinar. Senda grein Gervigreind Máltækni Íslensk tunga Mest lesið Hinseginfræðsla á ekki heima í leik- og grunnskólum Hlynur Áskelson,Baldur Borgþórsson,Sigfús Aðalsteinsson Skoðun Svo mikill hagvöxtur og svo mikil framför! - Tími nýfrjálshyggjunnar Davíð Aron Routley Skoðun Enn verið að svindla á ellilífeyrisþegum Björn Leví Gunnarsson Skoðun Stöldrum við Ebba Margrét Magnúsdóttir Skoðun Biðin bitnar á börnunum Þorvaldur Davíð Kristjánsson,Margrét Rós Sigurjónsdóttir Skoðun Mútur eða séríslensk aðför? María Lilja Ingveldar Þrastardóttir Kemp Skoðun Húsnæðislán eða húsnæðis-lán? Stefán Ómar Stefánsson Skoðun Með páskaegg á andlitinu Þorsteinn Sæmundsson Skoðun Smámenni Snorri Sturluson Skoðun Að tala og tilheyra Baldur Sigurðsson Skoðun Skoðun Skoðun Dauðarefsing gegn börnum Yousef Tamimi skrifar Skoðun Þarf íþróttamaður að vera áhrifavaldur til að ná árangri? Egill Gunnarsson skrifar Skoðun Fjárfestum í verðmætasköpun Ragnar Sigurðsson skrifar Skoðun Kennslutími, kostnaður og árangur – hvað segja gögnin í raun Ómar Örn Magnússon,Linda Heiðarsdóttir,Jón Páll Haraldsson skrifar Skoðun Tvennt getur verið rétt á sama tíma Þorgerður Katrín Gunnarsdóttir skrifar Skoðun Er aðildarumsókn að ESB eins og hvert annað hefðbundið dægurmálaþras? Gunnar Ármannsson skrifar Skoðun Húsnæðislán eða húsnæðis-lán? Stefán Ómar Stefánsson skrifar Skoðun Smámenni Snorri Sturluson skrifar Skoðun Um mannréttindi allra kvenna Tatjana Latinović skrifar Skoðun Svo mikill hagvöxtur og svo mikil framför! - Tími nýfrjálshyggjunnar Davíð Aron Routley skrifar Skoðun Ef við erum öll almannavarnir – hver fer þá með forræðið? Jón Svanberg Hjartarson skrifar Skoðun Markvissar aðgerðir til að styrkja landamæri Þorbjörg S. Gunnlaugsdóttir skrifar Skoðun Biðin bitnar á börnunum Þorvaldur Davíð Kristjánsson,Margrét Rós Sigurjónsdóttir skrifar Skoðun Að tala og tilheyra Baldur Sigurðsson skrifar Skoðun Með páskaegg á andlitinu Þorsteinn Sæmundsson skrifar Skoðun Austurland má ekki sitja eftir Berglind Harpa Svavarsdóttir skrifar Skoðun Enn verið að svindla á ellilífeyrisþegum Björn Leví Gunnarsson skrifar Skoðun „Elskið óvini yðar“ – Óhugsandi siðfræði Jesú Dr. Sigurvin Lárus Jónsson skrifar Skoðun Stöldrum við Ebba Margrét Magnúsdóttir skrifar Skoðun Hraðbanki fyrir fjármagnseigendur? Bogi Ragnarsson skrifar Skoðun Óseðjandi útvistunarblæti Samfylkingar og Vinstrisins (2/3) Orð Vinstrisins á móti verkum Guðröður Atli Jónsson skrifar Skoðun Mútur eða séríslensk aðför? María Lilja Ingveldar Þrastardóttir Kemp skrifar Skoðun Kæri Hitler frændi Þorvaldur Logason skrifar Skoðun Forvarnir eru fjárfesting – ekki sparnaður Ellý Tómasdóttir skrifar Skoðun Traust fæst ekki með orðum einum saman – Verkalýðsfélög eru fyrirmyndir Bergþóra Haralds Eiðsdóttir skrifar Skoðun Óskað eftir aðhaldi á frasahlið ríkisstjórnarinnar Gísli Stefánsson skrifar Skoðun Hjólum í þetta Óli Örn Eiríksson skrifar Skoðun Baðlónabullið - stjórnvöld hlaupast undan ábyrgð Pétur Óskarsson skrifar Skoðun Hinseginfræðsla á ekki heima í leik- og grunnskólum Hlynur Áskelson,Baldur Borgþórsson,Sigfús Aðalsteinsson skrifar Skoðun Ef þú átt rætur í Grindavík - þá getur þú haft áhrif á framtíð hennar Ásrún Helga Kristinsdóttir skrifar Sjá meira
Texti og önnur gögn sem geyma upplýsingar um tungumálið eru lykillinn að þróun gervigreindarforrita á borð við ChatGPT, Claude og Gemini. Forritin byggja á mállíkönum sem eru mótuð með greiningu á textagögnum með það markmið að geta líkt eftir tungumálinu og myndað þannig læsilegan texta á öllum þeim málum sem það hefur „séð“ nógu mikið af. Langstærstur hluti þeirra texta sem líkönunum eru sýndir er á ensku. Flest stærstu mállíkönin eru þó fjöltyngd að því leyti að þau geta myndað texta á mörgum tungumálum. Bestu niðurstöðurnar sem fást úr líkönunum eru á málum sem mjög margir tala en tungumál sem færri tala standa ekki eins vel að vígi. Á alþjóðlegum fundi stjórnmálaleiðtoga, fræðimanna og fulltrúa tæknifyrirtækja um gervigreind í febrúar fyrr á þessu ári kom það fram að bæta þyrfti samkeppnisstöðu Evrópu. Meðal annars var rætt um mikilvægi þess að hlúa að þeim fjölmörgu tungumálum sem töluð eru í álfunni. Lykilatriði er að afla nægilegra gagna og vinna úr þeim svo að þau geti nýst til að búa til gervigreindarlíkön sem geta unnið með öll þessi tungumál. Liður í því er verkefnið European Language Data Space sem framkvæmdastjórn Evrópusambandsins hefur sett á laggirnar. Þar geta eigendur gagna og rétthafar samið um notkun við þá sem vilja nýta þau. Árnastofnun hefur verið leiðandi í því að búa til og safna málgögnum á íslensku með það að markmiði að tryggja stöðu íslensku í tækniheiminum. Fimmtudaginn 9. október stendur Árnastofnun fyrir málþingi í samvinnu við framkvæmdastjórn Evrópusambandsins um European Language Data Space-verkefnið. Á málþinginu, Hagnýting málgagna með Language Data Space, tala íslenskir og erlendir sérfræðingar um markmiðið með verkefninu, markað fyrir málgögn og mikilvægi þeirra. Þá verða pallborðsumræður um málgögn, máltækni og gervigreind fyrir íslensku, og hvort og þá hvernig hægt sé að ná sátt um nýtingu textagagna við þróun gervigreindarlíkana. Málþingið er opið öllum áhugasömum og upplýsingar um skráningu má finna á vef Árnastofnunar, arnastofnun.is. Höfundar eru fræðimenn við Stofnun Árna Magnússonar í íslenskum fræðum.
Hinseginfræðsla á ekki heima í leik- og grunnskólum Hlynur Áskelson,Baldur Borgþórsson,Sigfús Aðalsteinsson Skoðun
Skoðun Kennslutími, kostnaður og árangur – hvað segja gögnin í raun Ómar Örn Magnússon,Linda Heiðarsdóttir,Jón Páll Haraldsson skrifar
Skoðun Er aðildarumsókn að ESB eins og hvert annað hefðbundið dægurmálaþras? Gunnar Ármannsson skrifar
Skoðun Svo mikill hagvöxtur og svo mikil framför! - Tími nýfrjálshyggjunnar Davíð Aron Routley skrifar
Skoðun Óseðjandi útvistunarblæti Samfylkingar og Vinstrisins (2/3) Orð Vinstrisins á móti verkum Guðröður Atli Jónsson skrifar
Skoðun Traust fæst ekki með orðum einum saman – Verkalýðsfélög eru fyrirmyndir Bergþóra Haralds Eiðsdóttir skrifar
Skoðun Hinseginfræðsla á ekki heima í leik- og grunnskólum Hlynur Áskelson,Baldur Borgþórsson,Sigfús Aðalsteinsson skrifar
Skoðun Ef þú átt rætur í Grindavík - þá getur þú haft áhrif á framtíð hennar Ásrún Helga Kristinsdóttir skrifar
Hinseginfræðsla á ekki heima í leik- og grunnskólum Hlynur Áskelson,Baldur Borgþórsson,Sigfús Aðalsteinsson Skoðun