[hunspell-fi-devel] Fwd: Re: Tavutus

Harri Pitkänen hatapitk at cc.jyu.fi
Wed Feb 8 19:13:26 EET 2006


Alla Jukan lähettämä viesti. Ei mennyt listalle kun siinä oli mukana ylisuuri 
liitetiedosto. Laitoin tuon tiedoston Hunspell-fi -palvelimelle osoitteeseen
http://www.hunspell-fi.org/hyphsamples/Aho_Rautatie-hyphenated.txt

Ainakin nopeasti katsottuna näyttää oikein hyvältä. Hienoa työtä, Jukka! 
Tarvitsemme tietysti tuosta myös tavuttamattoman version, joten jos sinulla 
on sellainen, lähettäisitkö sen minulle niin laitan tuon tavutetun rinnalle. 
Tuota kannattaa tosiaan oikolukea, saatanpa itsekin sen lukaista läpi joskus 
kun ehdin. Nähtävästi tuo Perl-lisensoitu tavutus on melko toimiva kapistus, 
joten siinä käytettyyn algoritmiin voisi varmaan tutustua ja toteuttaa 
sopivin osin C++:lla. Tuo jako kahden ä:n välistä on tietysti kielletty 
samoin kuin kahden a:n välistä, eli varmaankin kyse on jostain aivan 
yksinkertaisesta bugista. Muutenkin kannattaa varmaan kerätä kasaan lista 
sanoja jotka sisältävät muita hankalia merkkejä jotta voimme varmistua, että 
tavutus ei niidenkään kohdalla tee mitään järjettömiä ratkaisuja.

Harri

----------  Forwarded Message  ----------

Subject: Re: [hunspell-fi-devel] Tavutus
Date: Wednesday 08 February 2006 18:27
From: Jukka Jalava <jukka at tuukka.com>
To: Hunspell-fi - kehitys <devel at hunspell-fi.org>
Cc: jhi at iki.fi

Morjens,

Hain Project Gutenbergista Junahi Ahon Rautatien, ja filtteröin siitä
sanalistan.
Sitten aloin miettiä, miten sen saisi tavutettua ja löysin Jarkko
Hietaniemen Perl-modulin Lingua::FI::Hyphenate.
http://cpan.uwinnipeg.ca/htdocs/Lingua-FI-Hyphenate/Lingua/FI/Hyphenate.html

Eli siinä olisi valmis Perl-lisensoitu tavutusfunktio!

No tavutin sitten listani, pari riviä Perliä ja se oli siinä
En ole sitä kattavasti oikolukenut, mutta silmäilemällä  huomasin
virheitä vain peräkkäisten ä-kirjainten kanssa:
Esim. hei-nä-än
Lienee merkistöriippuvainen juttu.
Korjasin nämä ja poistin muutania "epäsanoja" ja päädyin oheiseen listaan.

Jos joku viitsii oikolukea sen, niin tulee ainakin todistetuksi
Hietaniemen ohjelman toimivuus.

-JJ





More information about the devel mailing list