[voikko-devel] Tavutusvihjeet

Harri Pitkänen hatapitk at cc.jyu.fi
Tue Nov 21 18:42:00 EET 2006


On Tuesday 21 November 2006 11:53, Teemu Likonen wrote:
> Harri kirjoitti:
> > Tuopa vaan ei toimi taipuvilla sanoilla, joita suomen kielessä
> > valitettavasti on melko paljon... Perusmuodossa olevan sanan loppu ei
> > useinkaan ole mukana saman sanan taivutusmuodoissa, joten jos sanaan
> > asetetaan kaikki tavurajat valmiiksi, sanan lopussa olevat rajat
> > menevät taivutetuissa muodoissa suurella todennäköisyydellä vääriin
> > paikkoihin. Automaattitavutusta tarvitaan siis aina apuna, siitä ei
> > pääse mihinkään.
>
> En välttämättä ihan pysy enää kärryillä mutta ajatuksenani oli, että
> tavutuskielto pätisi sanan loppuun saakka, siis myös
> taivutuspäätteisiin. Jos merkityn tavutuskohdan jommaltakummalta
> puolelta on kirjain muuttunut, silloin kyseisestä kohdasta ei tavuteta.
> Voi kyllä hyvin olla, että täydellinen tavutuskielto, joka koskee myös
> päätteitä, kannattaa tai pitää jättää tavutuspalveluja käyttävän
> sovelluksen harteille.

En ihmettele jos et pysynyt kärryillä, sillä eilisiltaisessa ehdotuksessani 
oli ikävä virhe, riittävän paha että se ei käytännössä ollut 
toteuttamiskelpoinen. Enpä lähde sitä tässä selvittelemään, vaan tein uuden 
ehdotuksen soveltamisohjeineen, ja vein sen SVN:ään. Jospa tämän pohjalta 
pääsisimme asiassa eteen päin:

http://svn.sourceforge.net/viewvc/*checkout*/hunspell-fi/trunk/docs/kirjoitusasut.html

Tuossa ehdotuksessa merkkien [, ], + ja ? merkitys on tosiaankin 
luonnosasteella: niiden käsittelyä ei ole toteutettu vielä Joukahaisessa, 
teen sen vasta sitten kun on selvää mitä niiden kanssa tehdään. Muilta osin 
tuon pitäisi kuvata nykyistä käytäntöä, tai ainakin sitä miten itse olen 
asioita ajatellut.

> Voisi esimerkiksi olla tarpeen kieltää vieraskielisten ja teknisten
> ilmaisujen tavutus vartalosta kokonaan (Renault'l-la-kin).
> Vieraskielisten sanojen translitterointi suomeen saa joskus aikaan,
> että yhtä äännettä merkitään kahdella tai kolmellakin kirjaimella.
> Sanan ääntämistä helpottava tavutus voi johtaa kummallisen näköisiin
> tavutustilanteisiin. Lisäksi voi olla hyvin vaikeaa selvittää, miten
> sana äännetään ja mitä translitteroinnissa on tapahtunut, ja näin onkin
> turvallisinta olla joko tavuttamatta sanaa lainkaan tai sitten jostain
> sanavartalon ulkopuolelta.

Tämä ratkaisu on siinä mielessä ongelmallinen, että se ei oikein sovi yhteen 
sen periaatteen kanssa, että Voikon perussanastoon vältetään ottamasta 
vieraskielisiä sanoja. Koska Voikko kuitenkin tavuttaa (ainakin toistaiseksi) 
nekin sanat, joita se ei tunnista, johtaisi tämä siihen että sanan lisääminen 
sanastoon muuttaisi sen tavutusta aika lailla. Yhtenäisyyden säilyttämiseksi 
on siis mielestäni parempi jättää sellaiset vierasperäiset sanat, joiden 
tavutuksesta emme osaa sanoa mitään, sääntöpohjaisen tavutuksen 
hoidettavaksi. Sillä tavalla tavutus ainakin näyttää suomalaisen lukijan 
silmissä järkevältä, ja jos ei näytä, niin kirjoittaja voi sitä sitten itse 
korjata. Tietysti sitten, jos joskus poistamme automaattitavutuksen 
tuntemattomilta sanoilta, on ehdottamasi menettely varmasti parempi. Sitä ei 
kuitenkaan voida tehdä ennen Voikon 2.0 -versiota, koska en halua tehdä 
1.x-versioiden välillä mitään sellaisia muutoksia jotka suuresti muuttaisivat 
olemassa olevaa perustoiminnallisuutta.

Harri



More information about the devel mailing list