[voikko] Raaka voima lähestymistapa
Hannu Väisänen
Hannu.Vaisanen at uef.fi
Thu May 7 08:06:30 EEST 2015
ke, 2015-05-06 kello 09:50 +0200, Harri Pasanen kirjoitti:
> Esimerkiksi
> http://norvig.com/spell-correct.html esittää yksinkertaisen algoritmin
> tätä lähestymistapaa käyttäen.
Tämä muistuttaa kovasti hermoverkkoa. Hmmm....
Kehtinpä tästä algoritmin. (-:
1. Poimitaan isosta aineistosta kaikki sanat (sijamuodot), jotka Voikko
tunnistaa. Tähän tulee tietysti mukaan myös sellaisia sanoja kuin
suu=tela=hila=iset, mutta haittaako se???
2. Lajitellaan aineisto aakkosjärjestykseen ja poimitaan joka toinen
koultusaineistoon ja loput testiaineistoon.
3. Koulutetaan hermoverkko kohdan 2 aineistolla. Valmiita
hermoverkko-ohjelmia löytyy netistä.
4. Sovelletaan hermoverkkoa tunnistamattomaan sanaan (sijamuotoon) niin,
että korjausehdotuksena palautetaan hermoverkon ilmoittama todennäköisin
vaihtoehto tai n todennäköisintä vaihtoehtoa.
More information about the voikko
mailing list