[hunspell-fi-devel] Fwd: Re: Aho_Rautatie-hyphenated.txt: A - L

Harri Pitkänen hatapitk at cc.jyu.fi
Thu Feb 9 11:40:38 EET 2006


Alkuperäinen ja tavutettu lista löytyvät nyt osoitteesta
http://www.hunspell-fi.org/hyphsamples/

En laittanut yhdistettyä listaa, koska listan keskivaiheilla oli käynyt niin, 
että rivit eivät vastanneet toisiaan. Eli listojen välillä oli kaksi yhden 
sanan eroavuutta, joiden takia sen alku- ja loppupää näyttivät menevän 
oikein. Tuo eroavaisuus on nyt korjattu erillisissä listoissa. Yhdistetty 
lista voi tosin olla kätevä virheitä etsiessä. Voitte tehdä sellaisen itse 
helposti komennolla

paste Aho_Rautatie-hyphenated.txt Aho_Rautatie-unhyphenated.txt > yhdiste.txt

tai toisin päin, riippuen siitä haluatteko tavutetun vai tavuttamattoman sanan 
riville ensimmäisenä.

Korjasin samalla myös eilen löytämäni tavutusvirheet ja vaihdoin joitakin 
alkukirjaimia isoiksi kirjaimiksi. Sen sijaan virheellisiä tai outoja sanoja 
en ajatellut poistaa, sillä onhan tavutusohjelman selvittävä sellaisistakin 
tapauksista joita oikoluku ei tunne.

Tämä testisanalista on varmaan aika lailla riittävä meidän tarpeisiimme, joten 
uusia laajoja listoja ei kenenkään varmaan kannata ryhtyä väsäämään. Noita 
erikoistapauksia ja vierasperäisiä sanoja voin koota erilliselle listalle.

Harri

----------  Forwarded Message  ----------

Subject: Re: [hunspell-fi-devel] Aho_Rautatie-hyphenated.txt: A - L
Date: Thursday 09 February 2006 00:13
From: Jukka Jalava <jukka at tuukka.com>
To: Harri Pitkänen <hatapitk at cc.jyu.fi>

Morjens,

Pistän replyn suoraan sinulle, jottei se juutu taas liitteineen
sensuuriin :)

No enpä tullut jättäneeksi tuota tavuttamatonta listaa talteen, vaan
kirjoitin päälle :-{
Piti koittaa generoida lista uudestaan, että sain originaalin
heittomerkkeineen, väliviivoineen.

Toivottavasti listat nyt vastaavat toisiaan. Vertailun helpottamiseksi
tein vielä tiedoston jossa ovat molemmat rinnakkain, alkuperinen ja
tavutettu sana samalla rivillä.

Tällaiset pistivät silmään listaa penkoessa:

hieroja-lienaksi
ju-umala - juumala
kuppari-lienahan
li
nä-nä-nä
teh-herve
ty
ville-löyhkä
ähähäijä

Ne pitäisi poistaa, mutta jätin listalle jotta se olisi yhteneväinen
lähettämäni tavutetun version kanssa.
Poistele kaikki epämääräiset sanat häiritsemästä.

-JJ

P.S. tämä on kokonaan pienillä kirjaimilla, koska olisi ollut mahdotonta
kertoa skriptille, milloin lauseen alussa pitää säilyttää iso
alkukirjain, milloin ei.

-------------------------------------------------------



More information about the devel mailing list