• Kona situr við tölvu

Eydís Huld Magnúsdóttir - Mál- og raddtæknistofu Gervigreindarseturs HR

Gætum orðið leiðarljós annarra lítilla málsvæða

Eitt af stærri úrlausnarefnum okkar Íslendinga á næstunni er framtíð tungumálsins okkar. Innan Háskólans í Reykjavík er fólk að vinna að því hörðum höndum að íslenskan lifi af hina stafrænu framtíð.

Ríkisstjórn Íslands samþykkti fyrir um tveimur árum að veita fjármunum í að efla viðspyrnu tungumálsins við örum tækniframförum sem meðal annars lýsa sér í gríðarlegu áreiti ensku. 

Háskólinn í Reykjavík skipar stóran sess í þessari vegferð enda gengur verkefnið þvert á svið tölvutækni, gervigreindar, verkfræði og verkefnastjórnunar.

Ef vel tekst til gæti vinna hópsins hjálpað til við að tryggja framtíð íslenskunnar og jafnframt orðið leiðarljós annarra lítilla málsvæða við varðveislu sinna tungumála. Takmarkið er að geta notað íslensku í samskiptum við tækin sem við notum svo mikið dag frá degi. Nú er fyrsta áfanga fyrsta árs lokið af metnaðarfullri fimm ára verkáætlun og áhugavert að taka stöðuna.

Talgreining, talgerving og vélþýðingar

Eydís Huld Magnúsdóttir er nýdoktor og meðlimur máltæknihópsins. „Fyrir ári kláraði ég doktorsnámið mitt frá verkfræðideild HR þar sem ég rannsakaði hugrænt vinnuálag. Ég greindi lífeðlisfræðilegar upplýsingar frá röddinni og hjarta- og æðakerfinu og flokkaði í þrjá flokka með gervigreind, meðal annars til að greina hvort einstaklingur væri undir óeðlilega miklu álagi.“ Rannsóknir sem þessar skipta gríðarlega miklu máli fyrir vinnu við máltækniáætlun, ekki aðeins okkar, heldur sem framlag Íslendinga til verndunar lítilla málsvæða um allan heim enda nýtast niðurstöðurnar óháð landsvæðum. 

Hluti HR innan áætluninarinnar er:

  • talgreining, að breyta tali í texta
  • talgerving, að breyta texta í tal
  • vélþýðingar, að þýða úr og í íslensku og yfir á önnur tungumál
  • útdrættir, að breyta löngum texta í styttri texta með aðstoð gervigreindar

Hópur fólks vinnur saman í HRHluti máltækniteymisins í HR.

Samrómur safnar tali

„Fyrsta árið okkar fer að miklu leyti í gagnasöfnun. Við getum sem dæmi sýnt fram á árangur af fjöldasöfnun, eða crowdsourcing, með Samrómsverkefninu sem gengur út á að safna tali. Þetta átak hefur farið fram úr öllum væntingum og hópurinn náði öllum markmiðum í fyrsta áfanga. Það hefur strax verið eftir þessu tekið erlendis og við finnum jafnframt fyrir miklum áhuga hér heima á að vita hvernig gengur,“ útskýrir Eydís.

Árangurinn alltaf sýnilegur

En hvernig er haldið utan um verkefni af þessari stærðargráðu? „Við höfum markmið, eða vörður, sem eru vel skilgreindar. Hver sérfræðihópur skilar niðurstöðum reglulega og erlent fagráð metur árangur hópsins fyrir ríkisstjórnina.“ Hún segir það skýrt markmið að alltaf liggi eitthvað sýnilegt eftir að hverri vörðu er náð, „hvort sem það er vísindagrein, kóði eða slóð á Github.“ Einnig er haldið utan um meistaranám í máltækni við tölvunarfræðideild HR, sem er samstarf HR og HÍ. „Krakkarnir þar eru hjá okkur í alls konar verkefnum.“

Sprettirnir venjast

Hópurinn vinnur í sprettum sem eru notaðir víða í verkefnastjórnun. Eydís segist hafa þurft að stilla sig inn á lýðræðislegri vinnubrögð en hún átti að venjast úr doktorsnáminu þar sem rannsóknir eru yfirleitt unnar af einstaklingnum.

Kona setur límmiða á töflu

„Það tók mig smá tíma að venjast þessu vinnulagi en núna sé ég kostinn við aðkomu allra á öllum stigum verkefnisins. Maður þarf bara að stilla sig inn á það og svo verður maður sífellt opnari fyrir hugmyndum annarra. Maður nefnilega lærir alltaf svo mikið af öðrum, þannig að þetta hefur verið erfitt en vel þess virði.“

Almannarómur er miðstöð máltækni og ber ábyrgð á að framkvæma máltækniáætlun samkvæmt samningi við mennta- og menningarmálaráðuneytið frá árinu 2018. Samtökum um íslenska máltækni (SÍM) er falið að framkvæma áætlunina. SÍM hefur innan sinna vébanda aðila sem búa yfir viðtækri og fjölbreyttri sérfræðiþekkingu. Auk Mál- og raddtæknistofu Gervigreindarseturs HR eru í SÍM Háskóli Íslands, Árnastofnun, RÚV, CreditInfo, Miðeind, Tiro, Grammatek og Blindrafélagið.