Fréttir

Einar Freyr Sigurðsson í málvísindakaffi 10. maí

Í málvísindakaffi í stofu 104 í Odda föstudaginn 10. maí kl. 12-13 flytur Einar Freyr Sigurðsson rannsóknarlektor erindi sem nefnist

Universal Dependencies-málheild fyrir íslensku

Útdráttur:

Í fyrirlestrinum verður sagt frá rannsóknarverkefninu „Universal Dependencies-málheild fyrir íslensku“ sem fékk nýlega styrk til eins árs úr Markáætlun í tungu og tækni. Verkefnið gengur út á að búa til nýja málheild innan Universal Dependencies-kerfisins (UD) sem inniheldur rúmlega 100 trjábanka úr meira en 70 tungumálum. Enn er þó engin slík málheild til fyrir íslensku. Við gerð nýju málheildarinnar verður tveimur meginaðferðum beitt. Í fyrsta lagi verður Sögulegi íslenski trjábankinn (http://linguist.is/icelandic_treebank), sem er setningafræðilega þáttuð málheild og inniheldur eina milljón orða, notaður til að búa til UD-málheild. Máltæknitól verður hannað sem varpar þáttuðum texta úr sögulega trjábankanum yfir í UD-kerfið. Í öðru lagi verða tekin 100.000 orð úr Risamálheildinni (http://malheildir.arnastofnun.is/) og þau þáttuð fyrir UD-málheildina. Þannig mun UD-málheildin innihalda um 1,1 milljón orða og nýtast við margvíslegar rannsóknir.