[voikko-devel] tunnistumattomia sanoja

Harri Pitkänen hatapitk at cc.jyu.fi
Sat Nov 25 14:23:58 EET 2006


On Saturday 25 November 2006 12:03, Teemu Likonen wrote:
> Kuinka tällaiset pitkäaikais- tai alkuperäis-tyyliset tilanteet saadaan
> mukaan? Tapoja on varmaan useita mutta järkevimmät ehkä tässä: Voidaan
> luoda adjektiivi-substantiivit "aikainen" ja "peräinen" (tai
> mahdollisesti pelkkä "alkuperäinen"). Voidaan myös luoda
> etuliitteet "alkuperäis" ja "pitkäaikais".
>
> Olen itse asiassa jo tehnyt jonkin aikaa sitten
> etuliitteen "alkuperäis". Olisi kuitenkin hyvä keskustela, millä
> tavalla tämän tyylisiä yhdysosamuotoja jatkossa lisätään, etuliitteinä,
> <nainen>-substantiiveina, <nainen>-adjektiivi-substantiiveina vai
> muuttamalla yhdyssanasääntöjä joiltakin osin. Ehkä se riippuu
> tilanteesta, mutta koulukieliopin logiikka sinänsä ei mielestäni tarjoa
> tähän vastausta. Kysymys on nyt vain meidän toteutusta koskeva.

Minusta jotenkin vaikuttaisi, että voisi olla hyödyllistä hyväksyä 
inen-loppuisten adjektiivien käyttö sekä substantiivi- että 
adjektiiviyhdyssanojen määriteosana automaattisesti. Tämä olisi vaivattomin 
ratkaisu, enkä usko sen heikentävän oikoluvun laatua merkittävästi, koska 
noissa sanoissa on silti edelleen oltava vähintäänkin kirjainyhdistelmä "is" 
sanarajalla jolloin satunnaisten kirjoitusvirheiden hyväksyminen tällaisena 
yhdyssanana on aika epätodennäköistä.

> > vanhassakaupungissa
>
> Joissakin käsitteissä todella yhdyssanan määriteosana oleva _adjektiivi_
> taipuu myös sijoissa. Näinhän on tietysti numeraalien kanssa.
> Mitenkähän tämä pitäisi korjata? Esimerkiksi juhlapäivän "uusivuosi :
> uuteenvuoteen" tai sanan "omatunto : omallatunnolla" kohdalla jokainen
> taivutus on laitettu erikseen tiedostoon yhdyssanat.lex.

Tässä on kaksi vaihtoehtoa: joko lisätä nuo tiedostoon yhdyssanat.lex 
(työlästä) tai toteuttaa säännöstö noiden tunnistamiseen. Numeraaleille olen 
vastaavanlaisen logiikan viimeisen viikon aikana jo rakentanutkin, joten sen 
tekeminen muidenkin sanaluokan sanoille on ilman muuta mahdollista, joskaan 
ei ihan triviaalia.

> > alkeishiukkanen
>
> Näköjään alkeet-substantiivin <inen>-lipun avulla syntyy
> adjektiivijohdos "alkeinen". Se ei kuitenkaan muodosta
> alkeis-yhdysosamuotoa, koska johdos on pelkkä adjektiivi. Pitäisi joko
> luoda (adjektiivi-)substantiivi "alkeinen" tai lisätä
> etuliite "alkeis".

Tämäkin korjaantuisi automaattisesti tuon ylempänä ehdottamani uuden 
yhdyssanasäännön myötä.

Harri.

PS. Joukahaisen tietokannan päivitys on nyt tehty, eli sitä voi jälleen 
käyttää. Kertokaa kuitenkin, jos havaitsette ongelmia tai muuta epäilyttävää.



More information about the devel mailing list