[voikko-devel] Suomi-malagan dokumentointi
Harri Pitkänen
hatapitk at cc.jyu.fi
Fri Aug 25 09:04:40 EEST 2006
On Friday 25 August 2006 08:08, Hannu Väisänen wrote:
> On Wed, Aug 23, 2006 at 09:54:38PM +0300, Harri Pitkänen wrote:
> > Olen tässä miettinyt illan aikana, että voisi olla tulevaisuuden kannalta
> > hyödyllisempää kirjoittaa auki nämä sananmuodostussäännöt sellaisessa
> > muodossa, että niitä osaavat tulkita muutkin kuin ne, jotka ymmärtävät
> > Malaga-koodia.
> > # Sääntöjä yleisnimien muodostamiseksi sanoja yhdistämällä
> > # "kuusi+puu"
> > yleisnimi_vartalo -> yleisnimi_vartalo nimentö_yks_pääte
> > yleisnimi_vartalo
>
> Koska LAG tietää vain kaksi asiaa: syötteen (analysoitavasta tekstistä
> luetun merkkijonon) ja SÄÄNNÖN, jolla analysointia jatketaan,
> malagamaisempi kuvaus voisi mennä jotenkin näin (sinun esitysmuoto
> lienee kuitenkin helpompi ymmärtää, jos ei ole perehtynyt LAGiin):
>
>
> syöte SÄÄNTÖ esimerkkejä
> NIMISANA := vartalo LOPPU talo
> LIITESANA talo+kin, talo+ko, talo+pa
> OMISTUSLIITE talo+ni, talo+si, talo+nsa
> SIJAPÄÄTE talo+n, talo+na, talo+ksi
> TAVUVIIVA linja-auto
> NIMISANA kuusi+puu
> NIMISANAN_JOHDOS talo+llinen, talo+mainen, talo+ton
>
> SIJAPÄÄTE := sijapääte LOPPU (talo)n, (talo)ssa, (talo)t
> LIITESANA (talo)n+kin, (talo)n+ko, (talo)n+pa
> OMISTUSLIITE (talo)ssa+mme [1]
> NIMISANA (talo)n+poika
> LAATUSANA (kulla)n+värinen
>
Tämä olisi siinä mielessä parempi, että kuvauksen muuttaminen ohjelmakoodiksi
olisi helpompaa. Pelkäänpä vaan, että tällaisen kuvauksen kirjoittaminen on
oleellisesti vaikeampaa kuin sen mitä itse ehdotin. Ajatellaanpa vaikka
sanaa "matka+ui+nti" jossa siis on yhdistetty substantiivi ja verbistä
johdettu substantiivi. Ehdottamani kielioppi tunnistaa tämän automaattisesti
heti kun se tunnistaa sanan "uinti", mikä onnistuu lisäämällä sääntö
yleisnimi_vartalo -> verbi_vartalo johdin_verbistä_yleisnimeksi
Tuossa Malaga-tyylisessä kuvauksessa tämä ei ilmeisesti toimisi näin helposti?
Nämä ovat juuri niitä ongelmia, joita kesän aikana Suomi-malagan
Voikko-versiossa korjailin, ja joita edelleen on jäljellä. Kyse ei siis ole
teoreettisesta ongelmasta vaan ihan käytännön kannalta tärkeästä asiasta.
Harri
More information about the devel
mailing list