[voikko] Sanastotiedostojen sisällöistä

Hannu Väisänen hannu.vaisanen at joensuu.fi
Mon Nov 26 07:46:15 EET 2007


On Sun, Nov 25, 2007 at 05:25:59PM +0200, Harri Pitkänen wrote:
> Tiedostossa poikkeavat.lex olevat tietueet ovat niitä, joilla on vastine 
> Joukahaisessa taivutusluokassa "poikkeava". Tästä onkin kommentti tiedoston 
> alussa. Tänne kuuluisivat oikeastaan kaikki substantiivit, adjektiivit ja 
> verbit, joita ei toistaiseksi voida suoraan generoida Joukahaisesta, mutta 
> jotka halutaan sinne joskus laittaa.
> 
> Tiedostot erikoiset.lex, erikoissanat.lex ja lainen.lex sisältävät kaikki 
> enemmän tai vähemmän sekalaista tavaraa. Niillä on vain kullakin erilainen 
> syntyhistoria.

Tiedosto erikoissanat.lex taitaa olla minun peruja. Kuten sen alussa
mainitaan, siinä on "sanoja joilla on niin erikoinen taivutus, että
jokainen taivutusmuoto on parasta esittää erikseen". Nykyään siinä on
myös eräitten sanojen yksittäisiä epäsäännöllisiä taivutusmuotoja
kuten esim. vuonna, maailmoiden (joka ei kuulu oikolukusanastoon).



> Minun puolesta näiden sisällön saisi mielellään järjestellä 
> uudelleen kuvaavamman luokituksen mukaan, jos joku jaksaa asian ottaa 
> hoitaakseen. Esimerkiksi huudahdussanat omaan tiedostoonsa, "väliaikaiset" 
> bugikorjaukset omaansa jne.

Voin ottaa sen taakakseni.

Ehdotan järjestelyä sanaluokkien mukaan: asemosanat.lex,
huudahdussanat.lex jne, ja sitten tietysti tarvitaan myös tiedosto
semmoisille sanoille, joita ei osata laittaa mihinkään muuhun
tiedostoon. (-:



More information about the voikko mailing list