[voikko-devel] Erisnimet ja yhdyssanat

Harri Pitkänen hatapitk at cc.jyu.fi
Fri Sep 29 10:09:28 EEST 2006


On Friday 29 September 2006 08:56, Hannu Väisänen wrote:
> > Hannu: aiotko vielä jatkossa ylläpitää Sukijaa varten tuota sanastoa
> > käsin, vai alatko käyttää Joukahaisesta generoitua versiota? Olen
> > pyrkinyt parhaani mukaan säilyttämään kaiken Sukijaa varten oleellisen
> > tiedon myös Joukahaisessa, joten periaatteessa tuon pitäisi onnistua.
>
> Jos se vain on mahdollista. Sinä tiedät paremmin kuin minä, mitkä ovat
> tällä hetkellä sanastojen erot. Yhdistäminen kannattaa tehdä silloin,
> kun muukin koodi yhdistetään.

Pitäisi olla mahdollista. Sanastojen nykyiset erot ovat lähinnä siinä, että 
Voikko-versiossa on jonkin verran uusia sanoja (joista joihinkin ehkä pitää 
lisätä lippu ei_sukija) ja korjauksia alku- ja äs-kenttiin, joiden pitäisi 
olla täysin käyttökelpoisia myös Sukijassa. Taivutusluokitusta on hiukan 
muutettu, mutta koska olet muuttamassa sitä itsekin, joudumme joka 
tapauksessa käymään luokituksen uudestaan läpi yhdistämisvaiheessa.

> Tarvitaanko itse sanastossa muuta tietoa kuin se, että joitakin sanoja
> ei ole Sukija"-versiossa ja joitakin taas ei Voikko"-versiossa?
> Voidaanko muut erot käsitellä allomorfitiedostossa suomi.all tai
> morfologiatiedostossa suomi.mor?

Ei mielestäni tarvita muuta tietoa, ja erot voidaan ainakin toistaiseksi 
käsitellä tiedostoissa suomi.all, suomi.mor ja *.pro.

> Suomi-malagaan pitäisi mielestäni jättää mahdollisuus lisätä sanastoon
> sanoja menemättä Joukahaisen kautta. Tämä voidaan tehdä
> yksinkertaisesti niin, että jätetään sanat-alihakemistoon tiedosto
> omat.lex. Jakeluversiossa siinä on vain kommentti, että tähän voi itse
> lisätä sanoja, joita ei ole sanastossa.

Tämä mahdollisuus säilyy. Itse asiassa Voikkoa varten pitää mahdollistaa 
useampienkin lisäsanastojen käyttö. Lisäksi osa sanoista (mm. pronominit, 
numeraalit ja partikkelit) jätetään Joukahaisen ulkopuolelle.

Harri



More information about the devel mailing list