[hunspell-fi-devel] Lisätäänkö nämä sanat, vai johdetaanko ne muista?
Harri Pitkänen
hatapitk at cc.jyu.fi
Wed Nov 23 23:45:13 EET 2005
On Wednesday 23 November 2005 23:07, Tuomo Koistinen wrote:
> Tässä tullaan taas siihen, että kuinka hyvin hunspell-fi osaa ketjuttaa
> johtimia, ja erityisesti kuinka hyvin se osaa tulkita johdoksia
> "takaperin"? Riittääkö, että perimmäinen kantasana listataan, vai onko
> tarpeen lisätä joitakin yksinkertaisimpia ja yleisimpiä johdoksia erikseen?
Tässä ei oikeastaan ole mitään tiukkoja teknisiä rajoituksia. Niin kauan kun
johtaminen ylipäätään voidaan tehdä järkevällä tavalla (eli johtimet
liitetään kantasanaan jonkun selkeän säännön mukaan, joka riippuu korkeintaan
sanan taivutusluokasta) on johdoksia mahdollista tehdä automaattisesti, ja
niitä voi myös ketjuttaa äärellisen mittaisiksi ketjuiksi. Äärellinen on
tässä oleellinen asia, eli päättymätön rekursio on kielletty. Siis ei näin:
puhua -> puhuttaa -> puhututtaa -> puhututattaa -> puhututattuttaa jne. (tuo
ei tainnut mennä edes oikein, mutta ehkä tajuatte idean) vaan tuo ketju pitää
johonkin kohtaan katkaista, vaikka loogisesti sitä voisikin jatkaa
loputtomiin.
Tällä hetkellä johdoksia tehdään ainoastaan adjektiiveista, ja johdetut muodot
ovat adverbit (nopea -> nopeasti) sekä ominaisuuksien nimet (nopea ->
nopeus). Mutta lisää johdoksia voidaan lisätä sitä mukaan, kun pääsemme ensin
selvyyteen siitä, mitkä niistä ovat järkeviä ja helpoimmin toteutettavissa.
Sitä ennen ei ole sinänsä mikään suuri virhe lisätä noita johdoksia sanastoon
(ne saadaan kyllä sieltä tarvittaessa pois täysin automaattisesti,) mutta
systemaattisesti sitä ei kannata ryhtyä tekemään. Ja uskoisin ainakin, että
maa -> maallinen -tyyppiä olevat johdokset tullaan tekemään automaattisesti,
siihen ei näytä olevan mitään erityistä estettä. Ja tällöinhän jo
muodoistuisi kahden johdoksen ketju maa -> maallinen -> maallisuus.
Harri
More information about the devel
mailing list