[voikko-devel] Isot kirjaimat vaihtuvat pieniksi oikoluvun jälkeen (Ooo2)

Harri Pitkänen hatapitk at cc.jyu.fi
Mon Aug 21 22:44:12 EEST 2006


On Monday 21 August 2006 10:32, Petteri Wirkkala wrote:
> Alkuperäinen teksti: Kirjaittaminen on hauskai. Oekoluku toimie hyvim.
>
> Voikko: Kirjaittaminen on hauskai. ekoluku toimi hyvim.
> - Miksi muuttaa "ekoluvun" pieneksi kirjaimeksi pisteen jälkeen??)

Oikolukuohjelma ei tiedä, että edellinen sana päättyy pisteeseen. Tämä on 
kieliopin tarkistimen vastuualuetta, ja tällaista ei OOo:ssa vielä ole. Mutta 
alkuperäisen sanan kirjaintason voi tässä silti säilyttää, ja tämän 
parannuksen tein libvoikkoon jo viikko sitten, eli homman pitäisi toimia 
paremmin seuraavassa versiossa. Huomasin itse asiassa tämän ongelman 
ensimmäisen kerran Asmon Ubuntu-käyttäjille kirjoittaman ohjeen 
kuvankaappauksista, joissa myös ehdotetaan turhaan isolla kirjoitetun sanan 
korvaamista pienellä kirjoitetulla :)

> - Ei ehdottanut mitään: Kirjaittaminen, hauskai, hyvim.

Minulla ehdotuksia (tosin pääasiassa vääriä, mutta katso perustelut tälle 
alempaa) tulee Voikon 1.0 -versiolla. Mikäköhän on pielessä? Hyvim-sanalle 
tulee myös aivan oikea ehdotus "hyvin". Tosin jäljessä oleva piste saattaa 
sotkea asiaa OOo:ssa, pitää tutkia asiaa ja korjata tarvittaessa.

> Toimie-sanalle ehdotti ehdotti vain imperfektiä vaikka ajattelin
> preesens-muotoa 'toimii' alkup. 
> tekstissä.

W: toimie
S: toimis
S: toimi
S: toimite
S: toimine
S: toimien

Katso eroa on sanojen "toimie" ja "toimii" välillä. I-kirjain on vaihtunut 
e-kirjaimeksi. Kuinka todennäköistä tämä on tosielämässä, kun nämä kirjaimet 
harvoin kirjoittajan päässä sekoittuvat toisiinsa ja ne ovat 
näppäimistölläkin aika kaukana toisistaan? Voikko ehdottaa 
ensimmäisenä "toimis", koska tässä olisi tapahtunut korvaus s->e eli 
näppäilyvirhe, jossa sormi on osunut viereiseen merkkiin. Voikko ei itse 
asiassa koskaan yritä ehdottaa korvausta i- ja e-kirjaimien välillä, enkä 
katso tätä bugiksi koska antamasi esimerkki on oletettavasti keinotekoinen 
eikä todellinen kirjoitusvirhe.
Näin on myös "kirjaittaminen" ja "hauskai" -sanoissa, joissa oikeat merkit 
ovat aika kaukana virheellisistä.

Voikon korjausehdotusalgoritmi painottuu näppäilyvirheiden ja samankaltaisten 
äänteiden välisten sekaannusten etsimiseen. Tämän pitäisi olla varsin 
riittävää useimmille käyttäjille, ja muuhun ei ole toistaiseksi 
mahdollisuutta syistä joita tällä listalla on käsitelty viimeksi viime 
viikolla.

Harri



More information about the devel mailing list