[hunspell-fi-devel] Lista johtimista ja rajapinta-asiaa

Jori Mantysalo jori at cs.uta.fi
Sat Nov 26 10:32:21 EET 2005


On Fri, 25 Nov 2005, Harri Pitkänen wrote:

> Tuossa listassa on tämänhetkinen käsitykseni siitä, mitkä yhdyssanat ja
> johdokset ainakin saadaan automaattisesti

Miten kolmiosaiset, kuten kieltoaluemerkki ja aliupseerikoulu?

> Olen myös mietiskellyt tuota Jorin esittämää ajatusta oikolukuohjelman
> rajapinnan laajennuksesta. - -
>
> Jos tätä nyt haluttaisiin viedä eteenpäin, niin olen sitä mieltä, että tämä
> tavoite kannattaa huomioida mahdollisimman aikaisessa vaiheessa, siis
> käytännössä jo heti. Eli vaikkapa siten, että sanastotietokantaan
> lisättäisiin uusi kenttä, johon merkittäisiin jollakin asteikolla, kuinka
> tavallisesta sanasta on kyse.

En nyt välttämättä sano, että esittämäni ajatus on hyvä. Ennemminkin ehkä
toimiva. Toinen vaihtoehtohan on, että oikoluku palauttaa tuloksen "kahvi,
genetiivi", josta toinen apuohjelma sitten laskee tuosta luettavuusarvon.

Mutta jos komponentti joka tapauksessa tehdään palauttamaan enemmän kuin
1/0, niin se voi sitten saman tien palauttaa luvun 1-100 tai vaikka
1-1000000000.

Ensimmäinen kokeilu olisi varmaan helpointa tehdä niin, että tietyillä
sanoilla olisi "erittäin tavanomainen" -merkki. Tähän ryhmään kuuluisivat
vaikka "auto", "talo", "punainen" jne, ehkä 1000..3000 sanaa. Jos joku
sitten innostuu kokeilemaan tuota, saisi tällä jo testattua idean
toimivuutta.

Luettavuudessahan sanasto on tietysti vain yksi osa, lauseiden ja
virkkeiden pituus ym. vaikuttavat myös. Ja tietysti kaikkein tärkeintä on
tekstin päärakenne, se että teksti vastaa oikeaan kysymykseen. Sitä ei
kone vielä nykyään pysty päättelemään.

-- 
Jori Mäntysalo
Laboratorioinsinööri
TAUCHI / Tietojenkäsittelytieteiden laitos / Tampereen yliopisto
Puh. 03-35518893, email jori at cs.uta.fi, kotisivu http://www.uta.fi/%7ejm58660/



More information about the devel mailing list