[voikko-devel] Suomi-malagan dokumentointi (oli: Malagan optimointi (-:)
Hannu Väisänen
hvaisane at joyx.joensuu.fi
Fri Aug 25 08:08:24 EEST 2006
On Wed, Aug 23, 2006 at 09:54:38PM +0300, Harri Pitkänen wrote:
> Olen tässä miettinyt illan aikana, että voisi olla tulevaisuuden kannalta
> hyödyllisempää kirjoittaa auki nämä sananmuodostussäännöt sellaisessa
> muodossa, että niitä osaavat tulkita muutkin kuin ne, jotka ymmärtävät
> Malaga-koodia.
> # Sääntöjä yleisnimien muodostamiseksi sanoja yhdistämällä
> # "kuusi+puu"
> yleisnimi_vartalo -> yleisnimi_vartalo nimentö_yks_pääte yleisnimi_vartalo
Koska LAG tietää vain kaksi asiaa: syötteen (analysoitavasta tekstistä
luetun merkkijonon) ja SÄÄNNÖN, jolla analysointia jatketaan,
malagamaisempi kuvaus voisi mennä jotenkin näin (sinun esitysmuoto
lienee kuitenkin helpompi ymmärtää, jos ei ole perehtynyt LAGiin):
syöte SÄÄNTÖ esimerkkejä
NIMISANA := vartalo LOPPU talo
LIITESANA talo+kin, talo+ko, talo+pa
OMISTUSLIITE talo+ni, talo+si, talo+nsa
SIJAPÄÄTE talo+n, talo+na, talo+ksi
TAVUVIIVA linja-auto
NIMISANA kuusi+puu
NIMISANAN_JOHDOS talo+llinen, talo+mainen, talo+ton
SIJAPÄÄTE := sijapääte LOPPU (talo)n, (talo)ssa, (talo)t
LIITESANA (talo)n+kin, (talo)n+ko, (talo)n+pa
OMISTUSLIITE (talo)ssa+mme [1]
NIMISANA (talo)n+poika
LAATUSANA (kulla)n+värinen
[1] Suomi-malaga jäsentää merkkijonon "taloni" ainoastaan talo + ni
eli nimentö/nominatiivi + omistusliite "ni". Se voidaan tulkita myös
omannoksi/genetiiviksi, jossa sijapääte "n" ja omistusliitteen
n-kirjain ovat sulautuneet yhteen (talo + n + ni => taloni). Tällöin
kuitenkin merkkijonoa "taloni" pitäisi jäsentää oikealta vasemmalle,
mitä LAG (LEFT associative grammar) ei voi tehdä. Ratkaisu olisi, että
yksikön omannon/genetiivin jälkeen omistusliite on "i" eikä "ni":
talo/n/i.
Samoin myös yksikön toisessa persoonassa: "talonsa" voisi olla sekä
talo/nsa/ (nimentö/nominatiivi, omistusliite "nsa") tai talo/n/sa
(omanto/genetiivi, omistusliite "sa").
Koska tämmöistä erottelua ei tarvita sanojen muuttamisessa
perusmuotoon, en ole tehnyt sitä.
More information about the devel
mailing list