[voikko] Raaka voima lähestymistapa
Harri Pasanen
harri at mpaja.com
Wed May 6 15:00:34 EEST 2015
On 06/05/2015 13:39, Sami Liedes wrote:
> On Wed, May 06, 2015 at 01:07:06PM +0200, Harri Pasanen wrote:
>> >Todennäköisyyksillähän tässä pelataan, ja mitä enemmän aineistoa sitä
>> >tarkempia ennusteita. Eli kokonaisen lauseen oikeellisuuden
>> >todennäköisyyttäkin voi varmaan ennustaa siinä esiintyvien sanojen
>> >perusteella. Se tosin kasvattaa hakuavaruutta aika lailla, että voi olla
>> >vielä turhan raskasta.
> En usko, että ongelma on niinkään algoritmin raskaus kuin se, että
> aineistoa ei yksinkertaisesti ole riittävästi vaikka otettaisiin
> kaikki netistä löytyvä suomenkielinen teksti (ja oletettaisiin se
> virheettömäksi). Mitä vapaammin sanoja voi muodostaa, sitä vähemmän
> niitä esiintyy laajassakaan aineistossa.
>
Voi olla, tosin ilman dataa on vaikea sanoa kuinka luovasti suomalainen
keskimäärin kieltä käyttää.
t. Harri P.
More information about the voikko
mailing list