Af langtíma pólitískum ágreiningi:
Örsaga um villugreiningu, orðmyndun og orðflokkagreiningu og vangaveltur um vélræna leiðréttingu
Í ritreglum er langur kafli um eitt orð og tvö og víst er að þetta atriði vefst fyrir mörgum málnotendum. Hér verður sögð örsaga af einu slíku fyrirbæri, langtíma, sem samkvæmt Málfarsbanka er fyrri hluti samsetts orðs:
Orðið langtími er til í ýmsum samsetningum sem ávallt eru ritaðar í einu orði: langtímaaukaverkun, langtímalán, langtímamarkmið, langtímaskuld, langtímasparnaður, langtímaspá, langtímastefnumörkun, langtímaþróun, o.s.frv.
Í villuleiðréttingu, bæði handvirkri og sjálfvirkri, virðist auðvelt að búa til reglu sem skellir langtíma framan á næsta orð en svo einfalt er þetta ekki. Það er ágreiningurinn sem er til langtíma, ekki pólítikin: pólitískur langtímaágreiningur ekki *langtímapólitískur ágreiningur. Þarna þarf langtíma að hoppa yfir lýsingarorðið til þess að fá niðurstöðu sem er í samræmi við Málfarsbankann. Hinn kosturinn er að greina langtíma sem óbeygjanlegt lýsingarorð sem virðist nærtækast þegar lýsingarorðin eru mörg:
langtíma vitsmunaleg, tilfinningaleg og hegðunartengd vandamál hjá börnum
Orðið langtímavandamál er vissulega til en þarna þyrfti orðhlutinn að hoppa yfir þrjú lýsingarorð til þess að lenda á réttum stað. Það er sennilega gerlegt fyrir fólk en líklega nokkuð snúið fyrir forrit. Í öðrum tilfellum kemur merkingarmunur í veg fyrir svona færslu: langtíma fastir vextir er ekki sama fyrirbærið og fastir langtímavextir. Í fyrra tilfellinu er óhjákvæmilegt að greina langtíma sem óbeygjanlegt lýsingarorð.
Formlega séð virðist ekkert vera því til fyrirstöðu að greina langtíma sem lýsingarorð. Í BÍN eru 951 óbeygjanleg lýsingarorð sem enda á -a og sum þeirra virðast vera sömu gerðar og langtíma, þ.e. mynduð af samsettu nafnorði með viðskeytinu -a: fjárþrota, holgóma, landflótta og langstofna. Í öðrum orðum virðist afleiðslan vera aðeins flóknari og þar þarf að gera ráð fyrir setningarlið í afleiðslunni þar sem samsvarandi samsett nafnorð finnast ekki: einbíla ([[einn<lo> bíll<kk>]<Nl>[-a<lo.vsk>]]<lo>), fínkorna, flatbotna, háhæla, margnota, skrækróma, stutterma. Annar möguleiki er að gera ráð fyrir að þessi orð séu aukafallsliðir en hlutverk þeirra í orðmyndun er vanrækt svið og á það bæði við um lýsingarorð og atviksorð.
Í gögnum Árnastofnunar (sjá málið.is) er hvergi gefinn kostur á óbeygjanlega lýsingarorðinu langtíma, ekki einu sinni í BÍN. Það verk er auðvitað ekki tæmandi, eins og vandlega er gerð grein fyrir á BÍN-síðunni. Í seinni tíð hefur villugreining í BÍN fengið meira og meira vægi, m.a. sem efniviður fyrir leiðréttingarforrit og þá skiptir máli að gögnin séu nothæf. Þá eru gloppur í gögnunum vondar, t.d. sú gloppa að birta ekki óbeygjanlega lýsingarorðið langtíma. Orðið er til, eins og dæmi sanna, og það er sömu gerðar og einnota, fjölnota, margnota sem eru greind sem óbeygjanleg lýsingarorð í Málfarsbanka og Íslenskri stafsetningarorðabók og sýnd með dæmum: einnota umbúðir, fjölnota íþróttahús, margnota hitabakstrar.
Með tilkomu Risamálheildarinnar og annarra rafrænna textasafna er í fyrsta skipti hægt að ráðast í villugreiningu í stórum stíl. Um leið er óhjákvæmilegt að grandgæfa þá forskrift sem farið er eftir við leiðréttingar. Reglurnar verða að vera rökréttar ef forrit eiga að skilja þær og það gæti m.a.s. komið fólki að notum líka. Í fyrirlestrinum verður þetta atriði skoðað út frá örsögunni um langtíma, með tilvísun til fleiri atriða sem snúast um eitt og tvö orð.