[voikko-devel] Suomi-malagan dokumentointi

Harri Pitkänen hatapitk at cc.jyu.fi
Fri Aug 25 09:04:40 EEST 2006


On Friday 25 August 2006 08:08, Hannu Väisänen wrote:
> On Wed, Aug 23, 2006 at 09:54:38PM +0300, Harri Pitkänen wrote:
> > Olen tässä miettinyt illan aikana, että voisi olla tulevaisuuden kannalta
> > hyödyllisempää kirjoittaa auki nämä sananmuodostussäännöt sellaisessa
> > muodossa, että niitä osaavat tulkita muutkin kuin ne, jotka ymmärtävät
> > Malaga-koodia.
> > # Sääntöjä yleisnimien muodostamiseksi sanoja yhdistämällä
> > # "kuusi+puu"
> > yleisnimi_vartalo -> yleisnimi_vartalo nimentö_yks_pääte
> > yleisnimi_vartalo
>
> Koska LAG tietää vain kaksi asiaa: syötteen (analysoitavasta tekstistä
> luetun merkkijonon) ja SÄÄNNÖN, jolla analysointia jatketaan,
> malagamaisempi kuvaus voisi mennä jotenkin näin (sinun esitysmuoto
> lienee kuitenkin helpompi ymmärtää, jos ei ole perehtynyt LAGiin):
>
>
>             syöte     SÄÄNTÖ            esimerkkejä
> NIMISANA := vartalo   LOPPU             talo
>                       LIITESANA         talo+kin, talo+ko, talo+pa
>                       OMISTUSLIITE      talo+ni, talo+si, talo+nsa
>                       SIJAPÄÄTE         talo+n, talo+na, talo+ksi
>                       TAVUVIIVA         linja-auto
>                       NIMISANA          kuusi+puu
>                       NIMISANAN_JOHDOS  talo+llinen, talo+mainen, talo+ton
>
> SIJAPÄÄTE := sijapääte LOPPU            (talo)n, (talo)ssa, (talo)t
>                        LIITESANA        (talo)n+kin, (talo)n+ko, (talo)n+pa
>                        OMISTUSLIITE     (talo)ssa+mme [1]
>                        NIMISANA         (talo)n+poika
>                        LAATUSANA        (kulla)n+värinen
>

Tämä olisi siinä mielessä parempi, että kuvauksen muuttaminen ohjelmakoodiksi 
olisi helpompaa. Pelkäänpä vaan, että tällaisen kuvauksen kirjoittaminen on 
oleellisesti vaikeampaa kuin sen mitä itse ehdotin. Ajatellaanpa vaikka 
sanaa "matka+ui+nti" jossa siis on yhdistetty substantiivi ja verbistä 
johdettu substantiivi. Ehdottamani kielioppi tunnistaa tämän automaattisesti 
heti kun se tunnistaa sanan "uinti", mikä onnistuu lisäämällä sääntö

yleisnimi_vartalo -> verbi_vartalo johdin_verbistä_yleisnimeksi

Tuossa Malaga-tyylisessä kuvauksessa tämä ei ilmeisesti toimisi näin helposti? 
Nämä ovat juuri niitä ongelmia, joita kesän aikana Suomi-malagan 
Voikko-versiossa korjailin, ja joita edelleen on jäljellä. Kyse ei siis ole 
teoreettisesta ongelmasta vaan ihan käytännön kannalta tärkeästä asiasta.

Harri



More information about the devel mailing list