Gagnaöflun í íslensku sem öðru máli: málnemamálheild og CEFR-samræming
Málnemamálheildir (e. learner corpora) gegna lykilhlutverki í skilningi á tileinkun annars máls, veita nauðsynleg gögn fyrir tungumálarannsóknir, tungumálakennslu og þróun tóla fyrir sjálfvirk námsmat. Þessi örfyrirlestur kynnir nýja málheild fyrir annarsmálsíslensku (L2) sem er mikilvægt framlag til hágæða rannsókna á þessu sviði. Þetta nýja gagnasafn er hannað til að auðvelda rannsóknir á íslensku sem öðru máli og tengingu hennar við CEFR (Common European Framework of Reference for Languages) mælikvarða. Það samanstendur af 156 textum sem skrifaðir eru af annarsmálshöfum undir eftirliti kennara án aðgangs að hjálpargögnum. Hver texti er merktur með CEFR-stigi af teymi reyndra kennara sem tryggir mikið samræmi og áreiðanleika.
Þau annarsmálsgagnasöfn sem voru til nú þegar á íslensku voru með mismunandi textalengd og ójafnvægi í framsetningu CEFR-stiga, auk þess sem ekki var hægt að vita hvort höfundar notuðust við hjálpargögn og leiðréttingartól, en þessi gagnagrunnur veitir jafna framsetningu texta á CEFR-stigum með samræmdum söfnunarskilyrðum. Þessir eiginleikar gera hana að öflugri málheild til að kanna máleinkenni íslenskunema á ýmsum færnistigum og til að þróa tól til að meta texta nemenda með meiri nákvæmni.
Fyrirlesturinn mun varpa ljósi á áskoranir og lausnir sem felast í því að búa til slíka málheild, framtíðarnotkun hennar í annarsmálsrannsóknum og mikilvægi hennar í samanburði við fyrri gagnasöfn. Einnig verður fjallað um víðtækara mikilvægi málnemamálheilda við að efla tungumálakennslu og máltæknilausnir, með áherslu á hvernig slík úrræði efla gagnastýrðar aðferðir við kennslu og námsmat á sama tíma og þeir stuðla að fræðilegri innsýn í tileinkun annars máls.