[voikko] Raaka voima lähestymistapa

Hannu Väisänen Hannu.Vaisanen at uef.fi
Thu May 7 08:06:30 EEST 2015


ke, 2015-05-06 kello 09:50 +0200, Harri Pasanen kirjoitti:
>   Esimerkiksi 
> http://norvig.com/spell-correct.html esittää yksinkertaisen algoritmin 
> tätä lähestymistapaa käyttäen.

Tämä muistuttaa kovasti hermoverkkoa. Hmmm....
Kehtinpä tästä algoritmin. (-:

1. Poimitaan isosta aineistosta kaikki sanat (sijamuodot), jotka Voikko
tunnistaa. Tähän tulee tietysti mukaan myös sellaisia sanoja kuin
suu=tela=hila=iset, mutta haittaako se???

2. Lajitellaan aineisto aakkosjärjestykseen ja poimitaan joka toinen
koultusaineistoon ja loput testiaineistoon.

3. Koulutetaan hermoverkko kohdan 2 aineistolla. Valmiita
hermoverkko-ohjelmia löytyy netistä.

4. Sovelletaan hermoverkkoa tunnistamattomaan sanaan (sijamuotoon) niin,
että korjausehdotuksena palautetaan hermoverkon ilmoittama todennäköisin
vaihtoehto tai n todennäköisintä vaihtoehtoa.




More information about the voikko mailing list