[hunspell-fi-devel] [patch] [suomi-malaga] Lyhenteitä

Harri Pitkänen hatapitk at cc.jyu.fi
Thu May 4 21:06:32 EEST 2006


http://www.hunspell-fi.org/patches/sm/0.6/07lyhenteet.diff

Lisää mahdollisuuden rajata lyhenteiden taivutuksia siten, että hyväksytään 
USA:ssa mutta ei USA:ssä. Lisäksi säännöstä "combi_rule kaksoispiste" on 
poistettu tarkistus, joka mielestäni on tarpeeton: on oltava length($vasen) > 
0 koska kaksoispistettä ei hyväksytä sanan alussa eikä tämä sääntö ole mukana 
initial-listassa.

Tuossa lyhenteiden tarkistamisessa olisi muuten jollekulle mukava homma joka 
ei vaadi erityistä teknistä asiantuntemusta. Eli pitäisi käydä läpi 
Suomi-Malagan tiedosto sanat/lyhenteet.lex jossa on seuraavantyylisiä rivejä:

[alku: "USA", luokka: lyhenne, jatko: @lyhenteen_jatko, äs: a];

Kentistä pitäisi tutkia seuraavaa:
- alku: tässä on itse lyhenne. Aikaisemmin kaikki lyhenteen on kirjoitettu 
pienillä kirjaimilla, mutta ne jotka oikeasti tulee kirjoittaa isoilla 
kirjaimilla voi muuttaa isoilla kirjoitetuksi. Oikeasti tällä asialla ei 
vielä ole merkitystä Malagan tai Voikon toiminnalle, mutta tätä tietoa 
tarvitaan myöhemmin joten on ihan hyvä korjata nämä jo tässä vaiheessa.
- luokka: tämä on aina lyhenne, ei tarvitse tehdä mitään.
- jatko: tämä on joko @lyhenteen_jatko tai <loppu>. @lyhenteen_jatko 
tarkoittaa sitä, että lyhenne voi olla osa yhdyssanaa ("atk-tukihenkilö") ja 
sitä voi taivuttaa kaksoispisteen kanssa ("atk:ssa"). <loppu> tarkoittaa 
sitä, että lyhenteen perään ei voi lisätä enää yhtään mitään. Ei siis edes 
pistettä, eli näiden sanojen kohdalla on hyvä tarkistaa, että alku-kentässä 
on sanan perässä piste jos lyhenne vaatii pisteen peräänsä.
- äs: taivutusmuodon vokaalisointu (siis ääntiösointu). Tämä on a, jos 
hyväksytään :ssa-pääte mutta ei :ssä-päätettä, ja ä jos tilanne on toisin 
päin. aä tarkoittaa sitä, että molemmat päätteet hyväksytään. Aikaisemmin 
kaikissa lyheteissä oli aä (koska tuota kenttää ei käytetty missään) mutta 
nyt sen arvo huomioidaan, joten aä:t kannattaa vaihtaa a:ksi tai ä:ksi niissä 
kohdissa joissa se on mahdollista.

Tuosta patchista 07lyhenteet.diff voi katsoa esimerkkiä siitä, millaisia 
muutoksia tarvitsee siis tehdä. Lähinnä on oleellista korjata lyhenteitä 
isoille kirjaimille ja vaihtaa aä -> a tai ä koska näitä ei aikaisemmin ole 
ollenkaan tehty. Oikeinkirjoitussäännöt kannattaa kerrata lukemalla 
http://www.cs.tut.fi/~jkorpela/kielenopas/8.5.html . Asia, missä helpoiten 
tulee ehkä tehtyä virheitä on äs-kentän arvossa. Siihen pitää yllättävän 
usein jättää aä.

Harvinaisempien lyhenteiden kohdalle kannattaa varmaan myös lisätä kommentti, 
jossa kerrotaan lyhenteen merkitys. Ainakaan minulle monet noista eivät ole 
tuttuja.

Harri



More information about the devel mailing list