[voikko-devel] Suomi-malagan dokumentointi (oli: Malagan optimointi (-:)

Hannu Väisänen hvaisane at joyx.joensuu.fi
Fri Aug 25 08:08:24 EEST 2006


On Wed, Aug 23, 2006 at 09:54:38PM +0300, Harri Pitkänen wrote:
> Olen tässä miettinyt illan aikana, että voisi olla tulevaisuuden kannalta 
> hyödyllisempää kirjoittaa auki nämä sananmuodostussäännöt sellaisessa 
> muodossa, että niitä osaavat tulkita muutkin kuin ne, jotka ymmärtävät 
> Malaga-koodia.
> # Sääntöjä yleisnimien muodostamiseksi sanoja yhdistämällä
> # "kuusi+puu"
> yleisnimi_vartalo -> yleisnimi_vartalo nimentö_yks_pääte yleisnimi_vartalo

Koska LAG tietää vain kaksi asiaa: syötteen (analysoitavasta tekstistä
luetun merkkijonon) ja SÄÄNNÖN, jolla analysointia jatketaan,
malagamaisempi kuvaus voisi mennä jotenkin näin (sinun esitysmuoto
lienee kuitenkin helpompi ymmärtää, jos ei ole perehtynyt LAGiin):


            syöte     SÄÄNTÖ            esimerkkejä
NIMISANA := vartalo   LOPPU             talo
                      LIITESANA         talo+kin, talo+ko, talo+pa
                      OMISTUSLIITE      talo+ni, talo+si, talo+nsa
                      SIJAPÄÄTE         talo+n, talo+na, talo+ksi
                      TAVUVIIVA         linja-auto
                      NIMISANA          kuusi+puu
                      NIMISANAN_JOHDOS  talo+llinen, talo+mainen, talo+ton

SIJAPÄÄTE := sijapääte LOPPU            (talo)n, (talo)ssa, (talo)t
                       LIITESANA        (talo)n+kin, (talo)n+ko, (talo)n+pa
                       OMISTUSLIITE     (talo)ssa+mme [1]
                       NIMISANA         (talo)n+poika
                       LAATUSANA        (kulla)n+värinen

[1] Suomi-malaga jäsentää merkkijonon "taloni" ainoastaan talo + ni
eli nimentö/nominatiivi + omistusliite "ni". Se voidaan tulkita myös
omannoksi/genetiiviksi, jossa sijapääte "n" ja omistusliitteen
n-kirjain ovat sulautuneet yhteen (talo + n + ni => taloni). Tällöin
kuitenkin merkkijonoa "taloni" pitäisi jäsentää oikealta vasemmalle,
mitä LAG (LEFT associative grammar) ei voi tehdä. Ratkaisu olisi, että
yksikön omannon/genetiivin jälkeen omistusliite on "i" eikä "ni":
talo/n/i.

Samoin myös yksikön toisessa persoonassa: "talonsa" voisi olla sekä
talo/nsa/ (nimentö/nominatiivi, omistusliite "nsa") tai talo/n/sa
(omanto/genetiivi, omistusliite "sa").

Koska tämmöistä erottelua ei tarvita sanojen muuttamisessa
perusmuotoon, en ole tehnyt sitä.



More information about the devel mailing list