[voikko-devel] Tavutusvihjeet
Harri Pitkänen
hatapitk at cc.jyu.fi
Tue Nov 21 18:42:00 EET 2006
On Tuesday 21 November 2006 11:53, Teemu Likonen wrote:
> Harri kirjoitti:
> > Tuopa vaan ei toimi taipuvilla sanoilla, joita suomen kielessä
> > valitettavasti on melko paljon... Perusmuodossa olevan sanan loppu ei
> > useinkaan ole mukana saman sanan taivutusmuodoissa, joten jos sanaan
> > asetetaan kaikki tavurajat valmiiksi, sanan lopussa olevat rajat
> > menevät taivutetuissa muodoissa suurella todennäköisyydellä vääriin
> > paikkoihin. Automaattitavutusta tarvitaan siis aina apuna, siitä ei
> > pääse mihinkään.
>
> En välttämättä ihan pysy enää kärryillä mutta ajatuksenani oli, että
> tavutuskielto pätisi sanan loppuun saakka, siis myös
> taivutuspäätteisiin. Jos merkityn tavutuskohdan jommaltakummalta
> puolelta on kirjain muuttunut, silloin kyseisestä kohdasta ei tavuteta.
> Voi kyllä hyvin olla, että täydellinen tavutuskielto, joka koskee myös
> päätteitä, kannattaa tai pitää jättää tavutuspalveluja käyttävän
> sovelluksen harteille.
En ihmettele jos et pysynyt kärryillä, sillä eilisiltaisessa ehdotuksessani
oli ikävä virhe, riittävän paha että se ei käytännössä ollut
toteuttamiskelpoinen. Enpä lähde sitä tässä selvittelemään, vaan tein uuden
ehdotuksen soveltamisohjeineen, ja vein sen SVN:ään. Jospa tämän pohjalta
pääsisimme asiassa eteen päin:
http://svn.sourceforge.net/viewvc/*checkout*/hunspell-fi/trunk/docs/kirjoitusasut.html
Tuossa ehdotuksessa merkkien [, ], + ja ? merkitys on tosiaankin
luonnosasteella: niiden käsittelyä ei ole toteutettu vielä Joukahaisessa,
teen sen vasta sitten kun on selvää mitä niiden kanssa tehdään. Muilta osin
tuon pitäisi kuvata nykyistä käytäntöä, tai ainakin sitä miten itse olen
asioita ajatellut.
> Voisi esimerkiksi olla tarpeen kieltää vieraskielisten ja teknisten
> ilmaisujen tavutus vartalosta kokonaan (Renault'l-la-kin).
> Vieraskielisten sanojen translitterointi suomeen saa joskus aikaan,
> että yhtä äännettä merkitään kahdella tai kolmellakin kirjaimella.
> Sanan ääntämistä helpottava tavutus voi johtaa kummallisen näköisiin
> tavutustilanteisiin. Lisäksi voi olla hyvin vaikeaa selvittää, miten
> sana äännetään ja mitä translitteroinnissa on tapahtunut, ja näin onkin
> turvallisinta olla joko tavuttamatta sanaa lainkaan tai sitten jostain
> sanavartalon ulkopuolelta.
Tämä ratkaisu on siinä mielessä ongelmallinen, että se ei oikein sovi yhteen
sen periaatteen kanssa, että Voikon perussanastoon vältetään ottamasta
vieraskielisiä sanoja. Koska Voikko kuitenkin tavuttaa (ainakin toistaiseksi)
nekin sanat, joita se ei tunnista, johtaisi tämä siihen että sanan lisääminen
sanastoon muuttaisi sen tavutusta aika lailla. Yhtenäisyyden säilyttämiseksi
on siis mielestäni parempi jättää sellaiset vierasperäiset sanat, joiden
tavutuksesta emme osaa sanoa mitään, sääntöpohjaisen tavutuksen
hoidettavaksi. Sillä tavalla tavutus ainakin näyttää suomalaisen lukijan
silmissä järkevältä, ja jos ei näytä, niin kirjoittaja voi sitä sitten itse
korjata. Tietysti sitten, jos joskus poistamme automaattitavutuksen
tuntemattomilta sanoilta, on ehdottamasi menettely varmasti parempi. Sitä ei
kuitenkaan voida tehdä ennen Voikon 2.0 -versiota, koska en halua tehdä
1.x-versioiden välillä mitään sellaisia muutoksia jotka suuresti muuttaisivat
olemassa olevaa perustoiminnallisuutta.
Harri
More information about the devel
mailing list