Til þess eru refarnir skornir. Lýsandi og vísandi gögn um beygingarkerfið
„En hugtökin rétt mál og rangt eru býsna margslungin. Í fyrsta lagi eru orðin rétt og rangt auðvitað afstæð í sjálfu sér. Forsendurnar ráða því hvaða útkoma telst rétt í hverju reikningsdæmi.“ (Kristján Árnason. 2018. Á vora tungu, bls. 13.)
Upprunalegt markmið við gerð Beygingarlýsingar íslensks nútímamáls (BÍN) var að koma upp beygingarlýsingu á tölvutæku formi sem nýtast mætti til máltækniverkefna af ýmsu tagi, í orðabókargerð og við málfræðirannsóknir. Jafnframt var markmiðið að gera BÍN aðgengilega fyrir almenning á vefnum. Eins og nafnið bendir til þá eru gögnin í BÍN lýsandi en ekki vísandi (leiðbeinandi). Þar eru bæði orð, beygingarafbrigði og stafsetningarafbrigði sem teljast ekki endilega til vandaðs máls enda myndu vísandi gögn duga skammt í máltækni eða til málfræðirannsókna. Notendur BÍN á vefnum ætlast hins vegar oftar en ekki til þess að fá leiðbeiningar um rétt mál og rangt. Þessu er reynt að mæta með athugasemdum sem birtast ofan við beygingardæmin á vefnum en þessi margfaldi tilgangur BÍN getur valdið misskilningi.
Á undanförnum árum hafa komið fram óskir um aðgang að gögnum úr BÍN sem nýtist betur í vísandi efni um beygingarkerfið, t.d. í kennsluefni o.þ.h. Jafnframt er þörf á að bæta inn flokkun á orðum og beygingarmyndum eftir málsniði o.þ.h. til þess að gögnin úr BÍN nýtist betur í stafsetningarleiðréttingarforrit og önnur sambærileg máltækniverkefni. Í janúar 2018 fékkst styrkur úr Máltæknisjóði til þess að endurgera BÍN og unnið hefur verið við nýjan gagnagrunn síðan í mars 2018. Þar er hægt að búa til sérvalið úttak úr BÍN sem gengur undir nafninu BÍN-kjarninn en honum er ætlað vísandi hlutverk. Kjarninn verður aðgengilegur með REST-þjónustu hjá Stofnun Árna Magnússonar í íslenskum fræðum.
Eins og Kristján Árnason bendir á í tilvitnuninni hér að ofan eru hugtökin rétt og rangt býsna margslungin og þau sannindi eiga við í afmörkun á orðum og beygingarmyndum í BÍN til vísandi nota. Orðaforðinn í Kjarnanum miðast við orðaforðann í Íslenskri nútímamálsorðabók (sjá málið.is), auk viðbóta úr lista um 50.000 algengustu uppflettiorðin í Risamálheildinni (sjá malheildir.arnastofnun.is). Í Kjarnanum eru u.þ.b. 61.000 beygingardæmi þar sem stafsetning er í samræmi við núgildandi reglur og víkjandi afbrigðum af beygingarmyndum sleppt. Beygingarmyndin refarnir er því ekki í Kjarnanum þar sem hún er úrelt og aðeins notuð í orðasambandinu til þess eru refarnir skornir. Orðmyndin mánaðarmót á ekki heldur heima í Kjarnanum þar sem betra þykir að nota mánaðamót (sbr. Stafsetningarorðabókina á málið.is). Í Kjarnanum eru orð og afbrigði flokkuð eftir þáttum á borð við málsnið, stafsetningu, tíðni, aldur og gott/vont-kvarða sem enn er í þróun. Í erindinu verður sagt frá forsendum og niðurstöðum flokkunarinnar, í ljósi munarins á vísandi og lýsandi gögnum.
Tilvitnun:
Kristján Árnason. 2018. Á vora tungu. Afmælisrit til heiðurs Kristjáni Árnasyni. Reykjavík, Háskólaútgáfan og Málvísindastofnun Háskóla Íslands.