[hunspell-fi-devel] Yhdyssanat ja CVS:n käyttöönotto

Harri Pitkänen hatapitk at cc.jyu.fi
Fri Jan 27 13:05:20 EET 2006


On Friday 27 January 2006 11:53, Harri Pitkänen wrote:
> Pitääkin katsella tuota tarkemmin, ehkä tähän sitenkin ratkaisu löytyy kun
> virhe on saatu rajattua.

Eipä ollut sittenkään niin helppoa. Minulla on seuraavanlaiset testitiedostot:

harri at c2:~/tmp/hunspell-bug$ cat test.aff
COMPOUNDRULE 1
COMPOUNDRULE CC
SFX S Y 1
SFX S 0 s . +S
harri at c2:~/tmp/hunspell-bug$ cat test.dic
1
abc/CS  [WORD]
harri at c2:~/tmp/hunspell-bug$ cat test.txt
abcabcs

Näitä kun testaa komennolla "hunmorph test.aff test.dic test.txt" voisi 
olettaa saavansa tulokseksi "abc[WORD]abc[WORD]+S", mutta tuleekin 
seuraavanlaisia tuloksia:

1) Alkuperäinen hunspell-1.1.3:
> abcabcs
Segmentation fault

2) Reijon korjaus:
> abcabcs
abc[WORD]

3) Oma korjaukseni, jossa muutin rivit 2105 ja 2187 muotoon
if ((!m || *m == '\0') /*&& compoundend*/)
antaa seuraavan tuloksen:
> abcabcs
abc[WORD](abc[WORD]+S|)

Tämä viimeinen on jo lähellä. Nuo sulkumerkit voi vielä ymmärtää (tätä 
formaattia ei nimittäin missään ole dokumentoitu joten ei voi tietää, missä 
muodossa morfologinen rakenne edes on tarkoitus esittää) mutta pystyviiva 
lopussa on vähän outo. Ehkä sillä on tarkoitus erottaa toisistaan 
vaihtoehtoisia rakenteita.

Tämän pidemmälle en pääse, alkaa mennä jo liikaa arvailuksi. Jätän tämän nyt 
Hunspellin kehittäjien selvitettäväksi.

Harri



More information about the devel mailing list