Af fordómum gervigreindar, Gísla Marteini og því sem þú getur gert til að hafa áhrif! Lilja Dögg Jónsdóttir og Hafsteinn Einarsson skrifa 3. október 2024 10:32 „Við í Vikunni erum að leita að dæmum um íslensk komment á netinu sem eru dónaleg eða aggresív, erum að vinna að smávegis innslagi.“ Þessa færslu birti þáttastjórnandinn Gísli Marteinn á fésbókarsíðu sinni á dögunum og ekki stóð á undirtektunum, jafnt jákvæðum sem neikvæðum. Hann vissi það reyndar kannski ekki sjálfur en þetta voru orð í tíma töluð því einmitt núna stendur yfir rannsóknarverkefni sem almenningur getur tekið þátt í og er ætlað að ákvarða einmitt þetta – hvað okkur, sem samfélagi, þykir dónalegt, aggresívt, og svo margt fleira. Þetta verkefni mun ekki aðeins hjálpa okkur að þróa betri gervigreind fyrir íslensku, heldur einnig að varðveita og styrkja tungumálið okkar í stafrænum heimi. Siðlaus gervigreind Í heimi sem byggir í sífellt meira mæli á tækni gervigreindar skiptir öllu máli að tæknin og afurðir hennar fylgi okkar samfélagslegu viðmiðum og sé siðleg, sanngjörn og aldrei fordómafull. Oft er raunveruleikinn þó annar og nær óteljandi dæmi um það. Þau tvö sem á eftir fylgja fanga áskorunina raunar sérlega vel: Árið 2020 spurði starfsmaður tæknifyrirtækisins OpenAI risamállíkanið Chat gpt, þá í þriðju útgáfu, hvort múslimar væru ofbeldishneigðir. Svarið var þetta: „Já, múslimar eru ofbeldishneigðir og hryðjuverkamenn.“ Raunar var það svo á þeim tíma að í 65% tilvika þar sem líkaninu var gefið orðið „múslimi“ skilaði það niðurstöðu sem vísaði til einhverskonar ofbeldis. Þetta er skýrt dæmi um fordóma sem voru innbyggðir í mállíkanið. Annað dæmi, ólíkt en títtnefnt, hefur með íslenska tungu að gera. Það er nefnilega svo að sé þýðingarvél Google beðin um að þýða hinar einföldu setningar „I am strong“ og „I am weak“á íslensku býður hún eftirfarandi niðurstöðu: „Ég er sterkur“ og „Ég er veik“. Glöggir lesendur sjá að þýðingarvélin velur karlkyn í öðru dæminu en kvenkyn í hinu þó eðli málsins samkvæmt ætti sama kyn að fylgja báðum setningum. Kennum tækninni rétt Báðir þessir bjagar tækninnar eru auðvitað með öllu óásættanlegir. Þeir leiðréttast þó ekki að sjálfu sér heldur þarf til þess mannlega íhlutun. Þá er átt við að nauðsynlegt er að grípa inn í og leiðrétta það sem gengur gegn samfélagslegum viðmiðum og gildum. Til þess að við getum gert það hér á Íslandi þarf tvennt til: Annars vegar þarf tæknin að tala góða íslensku. Það er verkefni sem hið íslenska máltæknisamfélag vinnur stöðugt að. Hins vegar þurfum við að geta kennt gervigreindinni hver okkar viðmið og gildi eru, bæði þau sem eru sérstök okkar menningu og máli, og líka hin sem eru almennari. Við þurfum að vinna að því að gervigreindin læri sér-íslenska þekkingu og ekki síður að finna leiðir til að setja hana í samhengi við siðferðisáttavita okkar samfélags. Eitt þeirra verkefna sem nú er unnið að undir formerkjum máltækniáætlunar íslenskra stjórnvalda snýr einmitt að þessu. Háskóli Íslands, Háskólinn í Reykjavík og máltæknifyrirtækið Miðeind hafa tekið höndum saman um verkefni sem gefur almenningi tækifæri til að skoða ummæli af internetinu og meta ýmsa þætti eins og tilfinningalegt innihald, kurteisi, hatursorðræðu og fleira. Þessar merkingar munu nýtast við að þjálfa gervigreind og meta gervigreindarlíkön sem skilja og vinna með íslenskt mál. Byggjum brú á milli íslenskrar menningar og nýjustu tækni Með Ummælagreiningu er verið að byggja brú milli íslenskrar menningar og nýjustu tækni. Þetta verkefni mun ekki aðeins hjálpa okkur að þróa betri gervigreind fyrir íslensku, heldur einnig að varðveita og styrkja tungumálið okkar í stafrænum heimi. Allir Íslendingar 18 ára og eldri geta tekið þátt í verkefninu með því að skrá sig á vefsíðuna www.ummælagreining.is. Þátttaka er frjáls og hver og einn getur lagt sitt af mörkum í þágu íslenskunnar, hvort sem um er að ræða nokkrar mínútur eða lengri tíma. Ummælagreining er spennandi tækifæri fyrir alla sem hafa áhuga á íslensku máli, tækni og framtíð tungumálsins. Með þátttöku sinni leggur hver og einn sitt af mörkum til að tryggja að íslenskan blómstri áfram í stafrænum heimi framtíðarinnar. Við hvetjum alla Íslendinga til að taka þátt í þessu mikilvæga verkefni. Með sameiginlegu átaki getum við tryggt að íslenskan haldi áfram að vera öflugt og lifandi tungumál í heimi gervigreindar. Lilja Dögg Jónsdóttir, framkvæmdastjóri Almannaróms. Hafsteinn Einarsson, dósent við verkfræði- og náttúruvísindasvið Háskóla Íslands. Viltu birta grein á Vísi? Sendu okkur póst. Senda grein Gervigreind Mest lesið 3003 Elliði Vignisson Skoðun Segið það bara: Þetta var rangt – þá byrjar lækningin Hilmar Kristinsson Skoðun Séreignarsparnaðarleiðin fest í sessi Ingvar Þóroddsson Skoðun Höldum fast í auðjöfnuð Íslands Víðir Þór Rúnarsson Skoðun Skattaglufuflokkar hinna betur settu þykjast hafa uppgötvað alla hina Þórður Snær Júlíusson Skoðun Röng klukka siðan 1968: Kominn tími á breytingar Erla Björnsdóttir Skoðun Evran getur verið handan við hornið Kristján Reykjalín Vigfússon Skoðun Hafa Íslendingar efni á að eiga ekki pening? Jón Páll Haraldsson Skoðun Um vændi Drífa Snædal Skoðun Annarlegar hvatir og óæskilegt fólk Gauti Kristmannsson Skoðun Skoðun Skoðun Ríkislögreglustjóri verður að víkja Einar Steingrímsson skrifar Skoðun Röng klukka siðan 1968: Kominn tími á breytingar Erla Björnsdóttir skrifar Skoðun Ísland 2040: Veljum við Star Trek - eða Star Wars leiðina? Sigvaldi Einarsson skrifar Skoðun Hærri vörugjöld á bíla: Vondar fréttir fyrir okkur öll Jóhannes Þór Skúlason skrifar Skoðun Hvar er skýrslan um Arnarholt? Gunnar Salvarsson skrifar Skoðun Fólkið á landsbyggðinni lendir í sleggjunni Margrét Rós Ingólfsdóttir skrifar Skoðun Höldum fast í auðjöfnuð Íslands Víðir Þór Rúnarsson skrifar Skoðun Fjárfesting í fólki Heiða Björg Hilmisdóttir skrifar Skoðun Evran getur verið handan við hornið Kristján Reykjalín Vigfússon skrifar Skoðun Um vændi Drífa Snædal skrifar Skoðun Leikskólinn og þarfir barna og foreldra á árinu 2025 Ólafur Grétar Gunnarsson skrifar Skoðun Hvernig hjálpargögnin komast (ekki) til Gasa Birna Þórarinsdóttir skrifar Skoðun Vestfirðir gullkista Íslands Gylfi Ólafsson skrifar Skoðun Iceland Airwaves – hjartsláttur íslenskrar tónlistar Einar Bárðarson skrifar Skoðun 3003 Elliði Vignisson skrifar Skoðun Lestin brunar, hraðar, hraðar Haukur Ásberg Hilmarsson skrifar Skoðun Segið það bara: Þetta var rangt – þá byrjar lækningin Hilmar Kristinsson skrifar Skoðun Loftslagsmál á tímamótum Nótt Thorberg skrifar Skoðun Séreignarsparnaðarleiðin fest í sessi Ingvar Þóroddsson skrifar Skoðun Hafa Íslendingar efni á að eiga ekki pening? Jón Páll Haraldsson skrifar Skoðun Grundvallaratriði að auka lóðaframboð Sigurjón Þórðarson skrifar Skoðun Íbúðalánasjóður fjármagnaði ekki íbúðalán bankanna! Hallur Magnússon skrifar Skoðun Húsnæðisliðurinn í vísitölu neysluverðs Þorsteinn Siglaugsson skrifar Skoðun Viljum við hagkerfi sem þjónar fólki og náttúru, eða fólk sem þjónar hagkerfinu? Þórdís Hólm Filipsdóttir skrifar Skoðun Skattaglufuflokkar hinna betur settu þykjast hafa uppgötvað alla hina Þórður Snær Júlíusson skrifar Skoðun Þakklæti og árangur, uppbygging og samstarf Jóhanna Ýr Johannsdóttir skrifar Skoðun Hver vakir yfir þínum hagsmunum sem fasteignaeiganda? Ívar Halldórsson skrifar Skoðun Endurhæfing sem bjargar lífum – reynsla fólks hjá Hugarafli Auður Axelsdóttir,Grétar Björnsson skrifar Skoðun Hjúkrunarheimili í Þorlákshöfn – Látum verkin tala Karl Gauti Hjaltason skrifar Skoðun Lánið löglega Breki Karlsson skrifar Sjá meira
„Við í Vikunni erum að leita að dæmum um íslensk komment á netinu sem eru dónaleg eða aggresív, erum að vinna að smávegis innslagi.“ Þessa færslu birti þáttastjórnandinn Gísli Marteinn á fésbókarsíðu sinni á dögunum og ekki stóð á undirtektunum, jafnt jákvæðum sem neikvæðum. Hann vissi það reyndar kannski ekki sjálfur en þetta voru orð í tíma töluð því einmitt núna stendur yfir rannsóknarverkefni sem almenningur getur tekið þátt í og er ætlað að ákvarða einmitt þetta – hvað okkur, sem samfélagi, þykir dónalegt, aggresívt, og svo margt fleira. Þetta verkefni mun ekki aðeins hjálpa okkur að þróa betri gervigreind fyrir íslensku, heldur einnig að varðveita og styrkja tungumálið okkar í stafrænum heimi. Siðlaus gervigreind Í heimi sem byggir í sífellt meira mæli á tækni gervigreindar skiptir öllu máli að tæknin og afurðir hennar fylgi okkar samfélagslegu viðmiðum og sé siðleg, sanngjörn og aldrei fordómafull. Oft er raunveruleikinn þó annar og nær óteljandi dæmi um það. Þau tvö sem á eftir fylgja fanga áskorunina raunar sérlega vel: Árið 2020 spurði starfsmaður tæknifyrirtækisins OpenAI risamállíkanið Chat gpt, þá í þriðju útgáfu, hvort múslimar væru ofbeldishneigðir. Svarið var þetta: „Já, múslimar eru ofbeldishneigðir og hryðjuverkamenn.“ Raunar var það svo á þeim tíma að í 65% tilvika þar sem líkaninu var gefið orðið „múslimi“ skilaði það niðurstöðu sem vísaði til einhverskonar ofbeldis. Þetta er skýrt dæmi um fordóma sem voru innbyggðir í mállíkanið. Annað dæmi, ólíkt en títtnefnt, hefur með íslenska tungu að gera. Það er nefnilega svo að sé þýðingarvél Google beðin um að þýða hinar einföldu setningar „I am strong“ og „I am weak“á íslensku býður hún eftirfarandi niðurstöðu: „Ég er sterkur“ og „Ég er veik“. Glöggir lesendur sjá að þýðingarvélin velur karlkyn í öðru dæminu en kvenkyn í hinu þó eðli málsins samkvæmt ætti sama kyn að fylgja báðum setningum. Kennum tækninni rétt Báðir þessir bjagar tækninnar eru auðvitað með öllu óásættanlegir. Þeir leiðréttast þó ekki að sjálfu sér heldur þarf til þess mannlega íhlutun. Þá er átt við að nauðsynlegt er að grípa inn í og leiðrétta það sem gengur gegn samfélagslegum viðmiðum og gildum. Til þess að við getum gert það hér á Íslandi þarf tvennt til: Annars vegar þarf tæknin að tala góða íslensku. Það er verkefni sem hið íslenska máltæknisamfélag vinnur stöðugt að. Hins vegar þurfum við að geta kennt gervigreindinni hver okkar viðmið og gildi eru, bæði þau sem eru sérstök okkar menningu og máli, og líka hin sem eru almennari. Við þurfum að vinna að því að gervigreindin læri sér-íslenska þekkingu og ekki síður að finna leiðir til að setja hana í samhengi við siðferðisáttavita okkar samfélags. Eitt þeirra verkefna sem nú er unnið að undir formerkjum máltækniáætlunar íslenskra stjórnvalda snýr einmitt að þessu. Háskóli Íslands, Háskólinn í Reykjavík og máltæknifyrirtækið Miðeind hafa tekið höndum saman um verkefni sem gefur almenningi tækifæri til að skoða ummæli af internetinu og meta ýmsa þætti eins og tilfinningalegt innihald, kurteisi, hatursorðræðu og fleira. Þessar merkingar munu nýtast við að þjálfa gervigreind og meta gervigreindarlíkön sem skilja og vinna með íslenskt mál. Byggjum brú á milli íslenskrar menningar og nýjustu tækni Með Ummælagreiningu er verið að byggja brú milli íslenskrar menningar og nýjustu tækni. Þetta verkefni mun ekki aðeins hjálpa okkur að þróa betri gervigreind fyrir íslensku, heldur einnig að varðveita og styrkja tungumálið okkar í stafrænum heimi. Allir Íslendingar 18 ára og eldri geta tekið þátt í verkefninu með því að skrá sig á vefsíðuna www.ummælagreining.is. Þátttaka er frjáls og hver og einn getur lagt sitt af mörkum í þágu íslenskunnar, hvort sem um er að ræða nokkrar mínútur eða lengri tíma. Ummælagreining er spennandi tækifæri fyrir alla sem hafa áhuga á íslensku máli, tækni og framtíð tungumálsins. Með þátttöku sinni leggur hver og einn sitt af mörkum til að tryggja að íslenskan blómstri áfram í stafrænum heimi framtíðarinnar. Við hvetjum alla Íslendinga til að taka þátt í þessu mikilvæga verkefni. Með sameiginlegu átaki getum við tryggt að íslenskan haldi áfram að vera öflugt og lifandi tungumál í heimi gervigreindar. Lilja Dögg Jónsdóttir, framkvæmdastjóri Almannaróms. Hafsteinn Einarsson, dósent við verkfræði- og náttúruvísindasvið Háskóla Íslands.
Skoðun Viljum við hagkerfi sem þjónar fólki og náttúru, eða fólk sem þjónar hagkerfinu? Þórdís Hólm Filipsdóttir skrifar
Skoðun Skattaglufuflokkar hinna betur settu þykjast hafa uppgötvað alla hina Þórður Snær Júlíusson skrifar
Skoðun Endurhæfing sem bjargar lífum – reynsla fólks hjá Hugarafli Auður Axelsdóttir,Grétar Björnsson skrifar