Viðskipti innlent

Álfur og Diljá hefja upp raust sína

Eiður Þór Árnason skrifar
Jóhanna Vigdís Guðmundsdóttir, framkvæmdastjóri Almannaróms, segir mikið verk óunnið.
Jóhanna Vigdís Guðmundsdóttir, framkvæmdastjóri Almannaróms, segir mikið verk óunnið. Saga Sig/Getty

Nýju íslensku talgervlarnir Álfur og Diljá hafa nú litið dagsins ljós en verkefnið er hluti af umfangsmikilli máltækniáætlun stjórnvalda. Talgervlar breyta texta í talað mál og voru 48 mannsraddir teknar upp við þróun nýju máltæknilausnanna. 

Álfur og Diljá eru á þróunarstigi og eru meðal annars notaðar í nýju smáforriti fyrir Android-tæki sem ber nafnið Símarómur. Einnig er komin út frumgerð veflesara sem les upp texta á vefsíðum en stefnt er að því að almennir notendur geti sótt hugbúnaðinn sem viðbót við vafra á næsta ári. 

Byrjað var að þróa nýju raddirnar á seinasta ári og voru frumgerðir af smáforritinu og veflesaranum gefnar út í september.

Svöruðu neyðarkalli frá Blindrafélaginu

Þróuninni var flýtt snemma á þessu ári eftir að ljóst var að gömlu talgervlarnir Karl og Dóra voru hættir að virka á nýlegum Android-símum og að detta út úr hugbúnaðarveitunni Google Play Store. Þá misstu notendur sem uppfærðu í nýjasta Android-stýrikerfið raddirnar úr tækjum sínum. 

Heyra má Álf lesa upp sýnishorn í spilaranum hér fyrir neðan.

Fjöldi Íslendinga, þar á meðal blindir og sjónskertir, reiða sig á talgervla við skjálestur og til að nota síma sína en stærstur hluti snjallsíma hér á landi notast við Android-stýrikerfið. Þessir notendur geta nú náð í Símaróm og notfært sér Álf og Diljá. Apple hefur ekki stutt íslenskar raddir í sínum snjalltækjum fram að þessu.

Blindrafélagið hafði forgöngu um að fjármagna og láta smíða íslensku raddirnar Karl og Dóru sem kynntar voru til leiks árið 2011. Erfitt hefur reynst að viðhalda hugbúnaðinum og eru raddirnar nú sagðar barn síns tíma. 

Stórt verkefni að gera íslenskuna gjaldgenga í stafrænum heimi

Mæltæknimiðstöðin Almannarómur ber ábyrgð á framkvæmd máltækniáætlunar stjórnvalda og hefur yfirumsjón með verkefnum á borð við þróun talgervla, talgreinis, vélþýðinga, sjálfvirkra leiðréttinga og gagnasafna sem er ætlað að gera íslenskunni betur kleift að þrífast í stafrænum heimi. 

Mörg verkefni Almannaróms eru nú langt komin og er afraksturinn nú farinn að koma í ljós. Auk þess að hlusta á talgervlanna Álf  og Diljá, er nú hægt að ræða við Emblu, prófa talgreiningu Tiro, keyra ritgerð í gegnum Yfirlestur og þýða texta með Vélþýðingu.

Samstarf um íslenska máltækni (SÍM) þróar Álf og Diljá en SÍM er samstarfsvettgangur háskóla, fyrirtækja og stofnana sem vinna að rannsóknum og þróun innan íslensku máltækniáætlunarinnar.

Aðilar að Samstarfi um íslenska máltækni (SÍM) undirrituðu samninga við Almannaróm um nýtt verkefnisár í máltækniáætlun í september síðastliðnum. Samningsupphæðin er ríflega 386 milljónir króna.

Jóhanna Vigdís Guðmundsdóttir, framkvæmdastjóri Almannaróms, segir að grunnstefið í verkefnum Almannaróms séu að tæknilausnirnar séu öllum opnar, allir geti tekið þær upp á sína arma og notað í sínum vörum og verkefnum, að endurgjaldslausu.

Í því samhengi bendir hún áhugasömum að kynna sér hugbúnaðarhirslur sem eru öllum aðgengilegar á vef Almannaróms.

„Það er stórt verkefni að íslensku gjaldgenga á sem flestum snertiflötum tungumála og hugbúnaðar en það hefur gengið vonum framar,“ segir Jóhanna.

Lásu inn 366 þúsund upptökur á einni viku

Á mánudag lauk sérstöku átaki Almannaróms, HR og Símans þar sem vinnustaðir voru hvattir til að safna raddsýnum fyrir gagnagrunn Samróms. Gagnagrunnurinn samanstendur af setningum og lesnum hljóðbrotum en gögnin eru nýtt til að þjálfa talgreini sem skilur talað íslenskt mál.

Jóhanna segir að vikulöng vinnustaðakeppnin, sem bar nafnið Reddum málinu, hafi gengið vonum framar og að 366 þúsund raddsýni hafi safnast á þessu stutta tímabili. Geymir gagnagrunnurinn nú rúmlega 1,5 milljón setninga og rúmlega 2.242 klukkustundir af efni en söfnunin hófst fyrir rúmum tveimur árum.

„Við þurfum svo mikið af raddgögnum til þess að geta unnið þessar tallausnir og þess vegna erum við alltaf að safna lesnum setningum í gegnum Samróm,“ segir Jóhanna.

Menntaskólinn á Tröllaskaga sigraði vinnustaðakeppnina Reddum málinu í flokki lítilla fyrirtækja, Elko í flokki millistórra fyrirtækja og Advania í flokki stórra fyrirtækja. Þrátt fyrir að átakinu sé nú lokið mun gagnasöfnun halda áfram á vef Samróms og hvetur Jóhanna fólk til þess að fara þangað inn til að leggja verkefninu lið.

Verkinu langt því frá lokið

Útlit er fyrir að flest verkefnin í núverandi máltækniáætlun muni klárast á þriðja verkefnisári sem lýkur í október 2022. Jóhanna segir kominn tíma á að stjórnvöld hugi að næstu skrefum.

„Verkefninu er langt í frá lokið þegar þessir innviðir hafa verið byggðir. Í næstu máltækniáætlun þurfum við öll að taka höndum saman og nýta þá innviði sem eru komnir og þann öfluga hóp sérfræðinga sem geta núna unnið að máltækniverkefnum úti í atvinnulífinu,“ segir Jóhanna.

„Röddin er eðlilegasti samskiptimáti mannsins og notkun hennar við og í gegnum tölvur gerir samskiptin og aðgengi að upplýsingum auðveldari.“

Fréttin hefur verið uppfærð.


Tengdar fréttir

Nýja ofur­tölvan liður í að vernda ís­lenskuna

Gagnaversfyrirtækið atNorth, sem hét áður Advania Data Centers, hefur afhent sprotafyrirtækinu Miðeind eina öflugustu ofurtölvu landsins til afnota. Tölvan verður notuð í verkefnum á sviði máltækni og gervigreindar fyrir íslensku.





Athugið. Vísir hvetur lesendur til að skiptast á skoðunum. Allar athugasemdir eru á ábyrgð þeirra er þær rita. Lesendur skulu halda sig við málefnalega og hófstillta umræðu og áskilur Vísir sér rétt til að fjarlægja ummæli og/eða umræðu sem fer út fyrir þau mörk. Vísir mun loka á aðgang þeirra sem tjá sig ekki undir eigin nafni eða gerast ítrekað brotlegir við ofangreindar umgengnisreglur.

Fleiri fréttir

Sjá meira


Mesta hækkun dagsins


Félag
Br.%
Fjöldi
Velta*
SYN
2,46
27
321.952
FESTI
0
5
63.908

Mesta lækkun dagsins


Félag
Br.%
Fjöldi
Velta*
ICEAIR
-4,73
94
456.960
EIM
-3,21
17
602.240
MAREL
-3,1
44
328.901
REITIR
-2,96
15
105.484
KVIKA
-2,9
59
1.048.345
Velkomin á Vísi. Þessi vefur notar vafrakökur. Sjá nánar.