[hunspell-fi-devel] Yhdyssanat ja CVS:n käyttöönotto
Harri Pitkänen
hatapitk at cc.jyu.fi
Fri Jan 27 13:05:20 EET 2006
On Friday 27 January 2006 11:53, Harri Pitkänen wrote:
> Pitääkin katsella tuota tarkemmin, ehkä tähän sitenkin ratkaisu löytyy kun
> virhe on saatu rajattua.
Eipä ollut sittenkään niin helppoa. Minulla on seuraavanlaiset testitiedostot:
harri at c2:~/tmp/hunspell-bug$ cat test.aff
COMPOUNDRULE 1
COMPOUNDRULE CC
SFX S Y 1
SFX S 0 s . +S
harri at c2:~/tmp/hunspell-bug$ cat test.dic
1
abc/CS [WORD]
harri at c2:~/tmp/hunspell-bug$ cat test.txt
abcabcs
Näitä kun testaa komennolla "hunmorph test.aff test.dic test.txt" voisi
olettaa saavansa tulokseksi "abc[WORD]abc[WORD]+S", mutta tuleekin
seuraavanlaisia tuloksia:
1) Alkuperäinen hunspell-1.1.3:
> abcabcs
Segmentation fault
2) Reijon korjaus:
> abcabcs
abc[WORD]
3) Oma korjaukseni, jossa muutin rivit 2105 ja 2187 muotoon
if ((!m || *m == '\0') /*&& compoundend*/)
antaa seuraavan tuloksen:
> abcabcs
abc[WORD](abc[WORD]+S|)
Tämä viimeinen on jo lähellä. Nuo sulkumerkit voi vielä ymmärtää (tätä
formaattia ei nimittäin missään ole dokumentoitu joten ei voi tietää, missä
muodossa morfologinen rakenne edes on tarkoitus esittää) mutta pystyviiva
lopussa on vähän outo. Ehkä sillä on tarkoitus erottaa toisistaan
vaihtoehtoisia rakenteita.
Tämän pidemmälle en pääse, alkaa mennä jo liikaa arvailuksi. Jätän tämän nyt
Hunspellin kehittäjien selvitettäväksi.
Harri
More information about the devel
mailing list