Ótrúlegt hve hratt Google lærði íslensku Breki Logason skrifar 3. september 2012 22:51 Í síðasta mánuði gátu Íslendingar byrjað að tala íslensku við Google leitarvélina. Fyrrverandi starfsmaður fyrirtækisins og lektor við Háskólann í Reykjavík eru mennirnir á bakvið hugmyndina, sem þeir segja í upphafi hafa verið líkasta draumi. Í raun sé ótrúlegt hversu fljótt þeir náðu að kenna íslenskuna. Hingað til hefur það ekki talist neitt tiltökumál að tala íslensku í símann. Þannig hefur maður getað rætt við vini og vandamenn um nánast hvað sem er á hinu ástkæra og ylhýra. En nú getur maður talað íslensku við internetið í símanum. Þannig getur maður spurt sjálfan Google um nánast hvað sem er. Þetta eru þeir Trausti og Jón. Mennirnir á bakvið tungumálakunnáttu Google, sem nú í ágúst byrjaði að skilja íslensku. Íslenska er ekki beint efst á lista hjá Google en Trausti var þar starfsmaður og ýtti á eftir sínu móðurmáli. Hann leitaði til Jóns sem í samvinnu við fleiri hóf söfnun á íslenskum setningum. „Fyrst létum við einhverja fá síma og vonuðumst til að þeir söfnuðu. Það gekk voða hægt. Svo sátum við fyrir gestum og gangandi hérna í HR og veiddum inn fólk. Þá gekk þetta aðeins," segir Jón Guðnason, lektor við HR. en það komst ekki skriður á söfnunina fyrr en fyrirtæki og stofnanir hoppuðu um borð. Á endanum voru þetta um 230 þúsund setningar sem söfnuðust hjá rúmlega 500 manns. Íslenskan virkar vel að sögn strákanna en þeir vildu fá eins marga og þeir gátu til þess að tala eins fjölbreytt íslenskt mál og hægt er. Tölvan lærir síðan nokkurskonar meðaltals íslensku, og þjálfar sig í að tengja hljóð og texta. Og þeir eru óneitanlega stoltir. „Ég er búinn að vera í talgreiningu núna í 15 ár. Gerði fyrst talgervil. Þetta var lokatakmarkið. Ég vildi ekki fara frá Google fyrr en þetta yrði að veruleika," segir Trausti Kristjánsson, stofnandi. „Við erum með svona svipaðan bakgrunn við Trausti. Ég var í svona svipuðum sporum og hann. Þetta var draumur þegar maður kom út úr meistaranámi og eitthvað sem maður ætlaði að vinna að. Talgreining var augljóslega komin af stað. En það að ná talgreiningu fyrir íslensku var bara fjarlægur draumur. Og það er í raun bara ótrúlegt hvað við náðum þessu á stuttum tíma," segir Jón. Mest lesið Rak í rogastans þegar hann las viðtalið við Bubba Innlent Tugir með magapínu eftir þríþraut við Laugarvatn Innlent Ekki efni til að ákæra þá sem fötluð kona var látin hafa samræði við Innlent Samgönguráðherrann lést daginn sem Pútín rak hann Erlent Aldrei séð annan eins hraðakstur eftir þrjátíu ár í lögreglunni Innlent Grunaðir um að stinga mann í rassinn að tilefnislausu Innlent Fimm grunuð um að ráðast á mann sem kom öðrum til bjargar Innlent Líkir tilætlunum Musk við lestarslys Erlent Sjö ára dómur fyrir að stinga tvo: Hittu árásarmanninn í fyrsta skipti þessa nýársnótt Innlent Ákvörðun saksóknara sendi undarleg skilaboð Innlent Fleiri fréttir „Kemur ekki til greina að fresta þessu máli“ Fimm grunuð um að ráðast á mann sem kom öðrum til bjargar Þrír milljarðar til viðbótar í viðhald vega Sjö ára dómur fyrir að stinga tvo: Hittu árásarmanninn í fyrsta skipti þessa nýársnótt Vill vindorkuver í Garpsdal og breytir tillögu stjórnar Tugir með magapínu eftir þríþraut við Laugarvatn „Við erum með háskólakerfi sem er fjármagnað undir OECD meðaltali“ Rembihnútur á þinginu en örþrifaráð ekki til umræðu Ákvörðun saksóknara sendi undarleg skilaboð Þinglok ekki í augnsýn og háskólarnir undirfjármagnaðir Grunaðir um að stinga mann í rassinn að tilefnislausu Ný kort sýna hvernig almyrkvinn verður á Íslandi Bandarískur kjarnorkukafbátur í heimsókn Formenn þingflokka halda spilunum þétt að sér Skjálfti upp á 3,4 í morgun á Suðurlandi Ekki efni til að ákæra þá sem fötluð kona var látin hafa samræði við Hiti nær 22 stigum fyrir austan Fjarlægðu „óvelkominn aðila“ af öldrunarheimili Rak í rogastans þegar hann las viðtalið við Bubba Árbæingar áhyggjufullir vegna umdeildra framkvæmda Aldrei séð annan eins hraðakstur eftir þrjátíu ár í lögreglunni Metfjöldi á biðlista og mögulega þarf að vísa frá Einstök litasamsetning á Prinsi Greifa Bíll í ljósum logum á Skaganum Vatnslögn í sundur í Smáralind Aldrei fleiri börn á biðlista og útrás í Kína Á hundrað og þrjátíu á sextíu götu Gul viðvörun: Brýna fyrir fólki á húsbílum að vara sig á vindinum Boltaleikir bannaðir á skólalóðinni eftir klukkan tíu Leggja til 80 milljónum árlega í nýja líkbrennslu Sjá meira
Í síðasta mánuði gátu Íslendingar byrjað að tala íslensku við Google leitarvélina. Fyrrverandi starfsmaður fyrirtækisins og lektor við Háskólann í Reykjavík eru mennirnir á bakvið hugmyndina, sem þeir segja í upphafi hafa verið líkasta draumi. Í raun sé ótrúlegt hversu fljótt þeir náðu að kenna íslenskuna. Hingað til hefur það ekki talist neitt tiltökumál að tala íslensku í símann. Þannig hefur maður getað rætt við vini og vandamenn um nánast hvað sem er á hinu ástkæra og ylhýra. En nú getur maður talað íslensku við internetið í símanum. Þannig getur maður spurt sjálfan Google um nánast hvað sem er. Þetta eru þeir Trausti og Jón. Mennirnir á bakvið tungumálakunnáttu Google, sem nú í ágúst byrjaði að skilja íslensku. Íslenska er ekki beint efst á lista hjá Google en Trausti var þar starfsmaður og ýtti á eftir sínu móðurmáli. Hann leitaði til Jóns sem í samvinnu við fleiri hóf söfnun á íslenskum setningum. „Fyrst létum við einhverja fá síma og vonuðumst til að þeir söfnuðu. Það gekk voða hægt. Svo sátum við fyrir gestum og gangandi hérna í HR og veiddum inn fólk. Þá gekk þetta aðeins," segir Jón Guðnason, lektor við HR. en það komst ekki skriður á söfnunina fyrr en fyrirtæki og stofnanir hoppuðu um borð. Á endanum voru þetta um 230 þúsund setningar sem söfnuðust hjá rúmlega 500 manns. Íslenskan virkar vel að sögn strákanna en þeir vildu fá eins marga og þeir gátu til þess að tala eins fjölbreytt íslenskt mál og hægt er. Tölvan lærir síðan nokkurskonar meðaltals íslensku, og þjálfar sig í að tengja hljóð og texta. Og þeir eru óneitanlega stoltir. „Ég er búinn að vera í talgreiningu núna í 15 ár. Gerði fyrst talgervil. Þetta var lokatakmarkið. Ég vildi ekki fara frá Google fyrr en þetta yrði að veruleika," segir Trausti Kristjánsson, stofnandi. „Við erum með svona svipaðan bakgrunn við Trausti. Ég var í svona svipuðum sporum og hann. Þetta var draumur þegar maður kom út úr meistaranámi og eitthvað sem maður ætlaði að vinna að. Talgreining var augljóslega komin af stað. En það að ná talgreiningu fyrir íslensku var bara fjarlægur draumur. Og það er í raun bara ótrúlegt hvað við náðum þessu á stuttum tíma," segir Jón.
Mest lesið Rak í rogastans þegar hann las viðtalið við Bubba Innlent Tugir með magapínu eftir þríþraut við Laugarvatn Innlent Ekki efni til að ákæra þá sem fötluð kona var látin hafa samræði við Innlent Samgönguráðherrann lést daginn sem Pútín rak hann Erlent Aldrei séð annan eins hraðakstur eftir þrjátíu ár í lögreglunni Innlent Grunaðir um að stinga mann í rassinn að tilefnislausu Innlent Fimm grunuð um að ráðast á mann sem kom öðrum til bjargar Innlent Líkir tilætlunum Musk við lestarslys Erlent Sjö ára dómur fyrir að stinga tvo: Hittu árásarmanninn í fyrsta skipti þessa nýársnótt Innlent Ákvörðun saksóknara sendi undarleg skilaboð Innlent Fleiri fréttir „Kemur ekki til greina að fresta þessu máli“ Fimm grunuð um að ráðast á mann sem kom öðrum til bjargar Þrír milljarðar til viðbótar í viðhald vega Sjö ára dómur fyrir að stinga tvo: Hittu árásarmanninn í fyrsta skipti þessa nýársnótt Vill vindorkuver í Garpsdal og breytir tillögu stjórnar Tugir með magapínu eftir þríþraut við Laugarvatn „Við erum með háskólakerfi sem er fjármagnað undir OECD meðaltali“ Rembihnútur á þinginu en örþrifaráð ekki til umræðu Ákvörðun saksóknara sendi undarleg skilaboð Þinglok ekki í augnsýn og háskólarnir undirfjármagnaðir Grunaðir um að stinga mann í rassinn að tilefnislausu Ný kort sýna hvernig almyrkvinn verður á Íslandi Bandarískur kjarnorkukafbátur í heimsókn Formenn þingflokka halda spilunum þétt að sér Skjálfti upp á 3,4 í morgun á Suðurlandi Ekki efni til að ákæra þá sem fötluð kona var látin hafa samræði við Hiti nær 22 stigum fyrir austan Fjarlægðu „óvelkominn aðila“ af öldrunarheimili Rak í rogastans þegar hann las viðtalið við Bubba Árbæingar áhyggjufullir vegna umdeildra framkvæmda Aldrei séð annan eins hraðakstur eftir þrjátíu ár í lögreglunni Metfjöldi á biðlista og mögulega þarf að vísa frá Einstök litasamsetning á Prinsi Greifa Bíll í ljósum logum á Skaganum Vatnslögn í sundur í Smáralind Aldrei fleiri börn á biðlista og útrás í Kína Á hundrað og þrjátíu á sextíu götu Gul viðvörun: Brýna fyrir fólki á húsbílum að vara sig á vindinum Boltaleikir bannaðir á skólalóðinni eftir klukkan tíu Leggja til 80 milljónum árlega í nýja líkbrennslu Sjá meira