[voikko] Raaka voima lähestymistapa

Sami Liedes sami.liedes at iki.fi
Wed May 6 14:39:24 EEST 2015


On Wed, May 06, 2015 at 01:07:06PM +0200, Harri Pasanen wrote:
> Todennäköisyyksillähän tässä pelataan, ja mitä enemmän aineistoa sitä
> tarkempia ennusteita.  Eli kokonaisen lauseen oikeellisuuden
> todennäköisyyttäkin voi varmaan ennustaa siinä esiintyvien sanojen
> perusteella.  Se tosin kasvattaa  hakuavaruutta aika lailla, että voi olla
> vielä turhan raskasta.

En usko, että ongelma on niinkään algoritmin raskaus kuin se, että
aineistoa ei yksinkertaisesti ole riittävästi vaikka otettaisiin
kaikki netistä löytyvä suomenkielinen teksti (ja oletettaisiin se
virheettömäksi). Mitä vapaammin sanoja voi muodostaa, sitä vähemmän
niitä esiintyy laajassakaan aineistossa.

	Sami
-------------- next part --------------
A non-text attachment was scrubbed...
Name: signature.asc
Type: application/pgp-signature
Size: 819 bytes
Desc: Digital signature
URL: <http://lists.puimula.org/pipermail/voikko/attachments/20150506/81b2d537/attachment.sig>


More information about the voikko mailing list