[voikko] Paikannimet

Harri Pitkänen hatapitk at iki.fi
Wed May 20 16:56:42 EEST 2015


On Wednesday 20 May 2015 11:12:12 Hannu Väisänen wrote:
> Joukahaisen sanastossa ovat jo erisnimet Lahti ja Varkaus, ongelmana on,
> miten ne saadaan erotettua vastaavista yleisnimistä Sukijassa. Se ei ole
> kovin vaikeaa vfst-morfologiassa.
> 
> Sukijassa voi jo käyttää vfst-morfologiaa, mutta haluamaasi tulostusta
> siitä ei saa vielä irti (koska kukaan ei ole vielä kaivannut sitä :-).
> Palaan asiaan.

Libvoikko-kirjasto hoitaa kyllä erisnimien ja yleisnimien erottelun 
riippumatta siitä, käytetäänkö Malaga- vai VFST-morfologiaa:

$ echo Lahden | voikkospell -m -d fi-x-malmor | grep BASEFORM
A(Lahden):1:BASEFORM=lahti
A(Lahden):2:BASEFORM=Lahti

$ echo Lahden | voikkospell -m -d fi-x-vfstd | grep BASEFORM
A(Lahden):1:BASEFORM=Lahti
A(Lahden):2:BASEFORM=lahti

Eli voikkospell-komennolla (osa libvoikkoa) tämä onnistuu.

Harri


More information about the voikko mailing list