[voikko] Raaka voima lähestymistapa

Harri Pasanen harri at mpaja.com
Wed May 6 15:00:34 EEST 2015


On 06/05/2015 13:39, Sami Liedes wrote:
> On Wed, May 06, 2015 at 01:07:06PM +0200, Harri Pasanen wrote:
>> >Todennäköisyyksillähän tässä pelataan, ja mitä enemmän aineistoa sitä
>> >tarkempia ennusteita.  Eli kokonaisen lauseen oikeellisuuden
>> >todennäköisyyttäkin voi varmaan ennustaa siinä esiintyvien sanojen
>> >perusteella.  Se tosin kasvattaa  hakuavaruutta aika lailla, että voi olla
>> >vielä turhan raskasta.
> En usko, että ongelma on niinkään algoritmin raskaus kuin se, että
> aineistoa ei yksinkertaisesti ole riittävästi vaikka otettaisiin
> kaikki netistä löytyvä suomenkielinen teksti (ja oletettaisiin se
> virheettömäksi). Mitä vapaammin sanoja voi muodostaa, sitä vähemmän
> niitä esiintyy laajassakaan aineistossa.
>
Voi olla, tosin ilman dataa on vaikea sanoa kuinka luovasti suomalainen 
keskimäärin kieltä käyttää.

t. Harri P.


More information about the voikko mailing list