[hunspell-fi-devel] Tavutus
Jarkko Hietaniemi
jhietaniemi at gmail.com
Wed Feb 8 22:11:16 EET 2006
Jukka Jalava wrote:
> Morjens,
>
> Hain Project Gutenbergista Junahi Ahon Rautatien, ja filtteröin siitä
> sanalistan.
> Sitten aloin miettiä, miten sen saisi tavutettua ja löysin Jarkko
> Hietaniemen Perl-modulin Lingua::FI::Hyphenate.
> http://cpan.uwinnipeg.ca/htdocs/Lingua-FI-Hyphenate/Lingua/FI/Hyphenate.html
>
> Eli siinä olisi valmis Perl-lisensoitu tavutusfunktio!
>
> No tavutin sitten listani, pari riviä Perliä ja se oli siinä
> En ole sitä kattavasti oikolukenut, mutta silmäilemällä huomasin
> virheitä vain peräkkäisten ä-kirjainten kanssa:
> Esim. hei-nä-än
> Lienee merkistöriippuvainen juttu.
> Korjasin nämä ja poistin muutania "epäsanoja" ja päädyin oheiseen listaan.
>
> Jos joku viitsii oikolukea sen, niin tulee ainakin todistetuksi
> Hietaniemen ohjelman toimivuus.
Moduli on hyvin simppeli, sen logiikka on Fred Karlssonin jostain
opuksesta, en nyt tähän hätään muista mistä, pitäisi mennä hyllylle
selailemaan. Peruslogiikka on siis kunnossa, mutta hyvää tavutustahan
ei ilman sanalistoja ja tekoälyä (tai ainakin tarpeeksi hyvää vastaavaa
heuristiikkaa) saa aikaan... jonkinlaista klassikoitahan (testilistalle)
ovat
kaivosaukko
syysilta
öljysheikki
Merkistön suhteen modulini on muistaakseni niin kranttu että vain
Latin-1 kelpaa, kauhean vanhanaikaista...
More information about the devel
mailing list