[hunspell-fi-devel] Sanoja webbisivuilta

Harri Pitkänen hatapitk at cc.jyu.fi
Wed Nov 30 23:37:14 EET 2005


On Wednesday 30 November 2005 23:08, Jarno Kiuttu wrote:
> > pyytäisin teitä Reijo ja Jarno
> > ajamaan www-liittymän kautta saadut sanalistat Hunspellin läpi ja
> > poistamaan tunnistetut sanat ennen kuin alatte luokittelemaan niitä.
>
> Jos tässä tarkoitat hf-testaa työkalua niin tämä ei toimi.

Tiedän, siksi suosittelinkin toistaiseksi käyttämään OpenOfficea (kuten olit 
tehnytkin). Korjaan hf-testaa -skriptiä huomenna siten, että sitäkin voi 
jatkossa käyttää.

On Wednesday 30 November 2005 23:12, Jarno Kiuttu wrote:
> > Ja tietysti kaikki tunnistetu sanat pitää
> > edelleen käsin käydä poistamassa sanastonkeruuohjelmasta.
>
> Ainakin ne sanat jotka olen varannut ja luokitellut www-sanastosta ovat
> kadonneet sieltä itsestään sanastoon lisäyksen jälkeen.

Mutta ne, joita ei luokitella koska Hunspell jo ne tunnistaa, on poistettava 
käsin tai ne jäävät sinne roikkumaan. Tähän on kyllä kieltämättä kehitettävä 
jotain automaatiota, koska muuten tästä tulee meille kaikille kohtuuttomasti 
vaivaa. Kuten täällä on aikaisemmin todettukin, suurin osa suomen kielen 
sanoista on johdoksia eivätkä satunnaisesti tuota www-liittymää käyttävät 
varmaankaan jaksa tutkia johdintaulukon koko sisältöä, varsinkaan siinä 
vaiheessa kun se sisältää kaikki ne noin 130 erilaista johdinta :)

Harri



More information about the devel mailing list