[voikko] Ensimmäisyys-tyyppiset johdokset

Hannu Väisänen pyrrhula.pyrrhula at meiliboxi.fi
Mon Nov 22 09:38:17 EET 2021


ma, 2021-11-22 kello 08:37 +0200, Jukka K. Korpela kirjoitti:
> En ymmärrä, mitä tarkoitat tuolla, enkä varsinkaan sitä, miten se
> liittyy kysymykseeni. (Tietysti sana on enemmän kuin merkkijonoja, ja
> tokihan tietokoneohjelmilla voi käsitellä sanoja muutenkin kuin
> merkkijonoina.)

(Ensin kohta 2: vaikka sanat esitettäisiin tietokoneohjelmassa
muutenkin kuin merkkijonona, tietokone ei edelleenkään käsittele
sanoja, vaan sitä tietorakennetta, jolla sana on esitetty
ohjelmakoodissa, ***mikä ei ole ollenkaan sama asia*** aivan kuten
tietotyyppi int/integer ei ole sama asia kuin matemaattinen käsite
kokonaislukujen joukko.)


Enpä osannut selittää asiaa, mutta yritän uudelleen.

Alkuperäinen ongelmahan oli se, miksi ensimmänen-merkkijonosta
ei johdeta merkkijonoa ensimmäisyys.

Se johtuu siitä, että ohjelmakoodissa uus/yys-loppuiset merkkijonot
generoidaan vain sellaisista -inen-loppuisista merkkijonoista, jotka
on merkitty laatu- tai nimi-laatusanoiksi.


Merkkijono "aalloittaisuus" tunnistetaan siksi, että merkkijono
"aalloittainen" on sanastossa.

Jos taas kaikista ittain/ittäin-loppuisista merkkijoinoista
generoidaan automaattisesti inen-loppuiset merkkijonot, saadaan muun
muassa seuraavat merkkijonot

eroittaisin | eroittainen
haavoittaisinkin | haavoittainen
haittaisin | haittainen
harjoittaisin | harjoittainen
hengittäisin | hengittäinen
huolittaisiin | huolittainen
ilmoittaisiin | ilmoittainen
iloittaisiin | iloittainen
juhlittaisiin | juhlittainen 
karsittaisiin | karsittainen
katkeroittaisin | katkeroittainen
kehittäisin | kehittäinen
kehoittaisinpa | kehoittainen
kengittäisin | kengittäinen
kiilloittaisin | kiilloittainen
kirjoittaisin | kirjoittainen
kirvoittaisin | kirvoittainen
kopioittaisin | kopioittainen
kuorittaisiin | kuorittainen
kuormittaisin | kuormittainen

Ja enempää en viitsinyt kopioida.

Jotkut merkkijonot tuntuvat sanoilta, jotkut eivät, mutta oikoluvussa
Voikko hyväksyisi oikeiksi sanoiksi kaikki ne merkkijonot, jotka se
tunnistaisi noitten sanojen taivutusmuodoiksi eli se hyväksyisi paljon
merkkijonoja, jotka kirjoittajan mielestä olisivat kirjoitusvirheitä.




More information about the voikko mailing list