[voikko-devel] Malaga 7.7
Harri Pitkänen
hatapitk at cc.jyu.fi
Fri Sep 22 11:19:39 EEST 2006
Björn Beutel keksi vaihtoehtoisen ratkaisun pitkien monikäsitteisten sanojen
käsittelyyn. Tämä vaatii Malagan version 7.7 ja viestin lopussa olevan
korjauksen Suomi-malagaan.
Hyvinä puolina tässä ratkaisussa on ehdottamaani verrattuna se, että se on
yksinkertaisempi ja mahdollistaa jopa tietyissä olosuhteissa erittäin
monikäsitteisten sanojen oikoluvun (tämän hyödyllisyys on kyllä käytännössä
aika kyseenalaista). Lisäksi tällä pruning_rule -ominaisuudella voisi
jatkossa tehdä jotain muutakin hyödyllistä. Haittapuolina on se, että se on
hitaampi (4 - 10 % hidastus oikoluvun toimintaan, tosin Björnillä on idea
tämän tilanteen parantamiseksi) eikä se korjausehdotuksia tehtäessä salli
käytettävissä olevan prosessoriajan tarkkaa hallintaa.
En ota tätä ominaisuutta vielä käyttöön, jottei kaikkien tarvitse heti siirtyä
Malagan aivan uusimpaan versioon. Katsotaan asiaa uudestaan myöhemmin
syksyllä.
Harri
PS. Minulla on jonkinlainen ratkaisuidea siihen, miten Hannun uusi
suomi.all -tiedosto saataisiin nopeammin mukaan Voikko-versioon, ehkä vielä
tämän syksyn aikana. Pitää vielä vähän hioa sitä.
Index: suomi.mor
===================================================================
--- suomi.mor (revision 509)
+++ suomi.mor (working copy)
@@ -1491,3 +1491,12 @@
! $string matches ".": $first, ".*";
return $first;
end;
+
+pruning_rule prune ($list):
+ define $filter := <>;
+ foreach $i in length($list):
+ $filter :=+ <($i less_equal 20)>;
+ end;
+ return $filter;
+end;
+
Index: voikko-fi_FI.pro
===================================================================
--- voikko-fi_FI.pro (revision 509)
+++ voikko-fi_FI.pro (working copy)
@@ -87,6 +87,7 @@
mallex: set use-display yes
malaga: set use-display yes
+malaga: set mor-pruning yes
# Lipuilla malli ja tulostus voidaan säätää suomi-malagan toimintaa.
More information about the devel
mailing list