[hunspell-fi-devel] Tavutus

Jarkko Hietaniemi jhietaniemi at gmail.com
Wed Feb 8 22:11:16 EET 2006


Jukka Jalava wrote:
> Morjens,
> 
> Hain Project Gutenbergista Junahi Ahon Rautatien, ja filtteröin siitä 
> sanalistan.
> Sitten aloin miettiä, miten sen saisi tavutettua ja löysin Jarkko 
> Hietaniemen Perl-modulin Lingua::FI::Hyphenate.
> http://cpan.uwinnipeg.ca/htdocs/Lingua-FI-Hyphenate/Lingua/FI/Hyphenate.html
> 
> Eli siinä olisi valmis Perl-lisensoitu tavutusfunktio!
> 
> No tavutin sitten listani, pari riviä Perliä ja se oli siinä
> En ole sitä kattavasti oikolukenut, mutta silmäilemällä  huomasin 
> virheitä vain peräkkäisten ä-kirjainten kanssa:
> Esim. hei-nä-än
> Lienee merkistöriippuvainen juttu.
> Korjasin nämä ja poistin muutania "epäsanoja" ja päädyin oheiseen listaan.
> 
> Jos joku viitsii oikolukea sen, niin tulee ainakin todistetuksi 
> Hietaniemen ohjelman toimivuus.

Moduli on hyvin simppeli, sen logiikka on Fred Karlssonin jostain
opuksesta, en nyt tähän hätään muista mistä, pitäisi mennä hyllylle
selailemaan.  Peruslogiikka on siis kunnossa, mutta hyvää tavutustahan
ei ilman sanalistoja ja tekoälyä (tai ainakin tarpeeksi hyvää vastaavaa
heuristiikkaa) saa aikaan... jonkinlaista klassikoitahan (testilistalle)
ovat

	kaivosaukko
	syysilta
	öljysheikki

Merkistön suhteen modulini on muistaakseni niin kranttu että vain
Latin-1 kelpaa, kauhean vanhanaikaista...




More information about the devel mailing list