[voikko-devel] Malaga 7.7

Harri Pitkänen hatapitk at cc.jyu.fi
Fri Sep 22 11:19:39 EEST 2006


Björn Beutel keksi vaihtoehtoisen ratkaisun pitkien monikäsitteisten sanojen 
käsittelyyn. Tämä vaatii Malagan version 7.7 ja viestin lopussa olevan 
korjauksen Suomi-malagaan.
Hyvinä puolina tässä ratkaisussa on ehdottamaani verrattuna se, että se on 
yksinkertaisempi ja mahdollistaa jopa tietyissä olosuhteissa erittäin 
monikäsitteisten sanojen oikoluvun (tämän hyödyllisyys on kyllä käytännössä 
aika kyseenalaista). Lisäksi tällä pruning_rule -ominaisuudella voisi 
jatkossa tehdä jotain muutakin hyödyllistä. Haittapuolina on se, että se on 
hitaampi (4 - 10 % hidastus oikoluvun toimintaan, tosin Björnillä on idea 
tämän tilanteen parantamiseksi) eikä se korjausehdotuksia tehtäessä salli 
käytettävissä olevan prosessoriajan tarkkaa hallintaa.

En ota tätä ominaisuutta vielä käyttöön, jottei kaikkien tarvitse heti siirtyä 
Malagan aivan uusimpaan versioon. Katsotaan asiaa uudestaan myöhemmin 
syksyllä.

Harri

PS. Minulla on jonkinlainen ratkaisuidea siihen, miten Hannun uusi 
suomi.all -tiedosto saataisiin nopeammin mukaan Voikko-versioon, ehkä vielä 
tämän syksyn aikana. Pitää vielä vähän hioa sitä.


Index: suomi.mor
===================================================================
--- suomi.mor   (revision 509)
+++ suomi.mor   (working copy)
@@ -1491,3 +1491,12 @@
   ! $string matches ".": $first, ".*";
   return $first;
 end;
+
+pruning_rule prune ($list):
+  define $filter := <>;
+  foreach $i in length($list):
+    $filter :=+ <($i less_equal 20)>;
+  end;
+  return $filter;
+end;
+
Index: voikko-fi_FI.pro
===================================================================
--- voikko-fi_FI.pro    (revision 509)
+++ voikko-fi_FI.pro    (working copy)
@@ -87,6 +87,7 @@
 mallex: set use-display yes
 malaga: set use-display yes

+malaga: set mor-pruning yes


 # Lipuilla malli ja tulostus voidaan säätää suomi-malagan toimintaa.



More information about the devel mailing list