[voikko-devel] tunnistumattomia sanoja
Harri Pitkänen
hatapitk at cc.jyu.fi
Sat Nov 25 14:23:58 EET 2006
On Saturday 25 November 2006 12:03, Teemu Likonen wrote:
> Kuinka tällaiset pitkäaikais- tai alkuperäis-tyyliset tilanteet saadaan
> mukaan? Tapoja on varmaan useita mutta järkevimmät ehkä tässä: Voidaan
> luoda adjektiivi-substantiivit "aikainen" ja "peräinen" (tai
> mahdollisesti pelkkä "alkuperäinen"). Voidaan myös luoda
> etuliitteet "alkuperäis" ja "pitkäaikais".
>
> Olen itse asiassa jo tehnyt jonkin aikaa sitten
> etuliitteen "alkuperäis". Olisi kuitenkin hyvä keskustela, millä
> tavalla tämän tyylisiä yhdysosamuotoja jatkossa lisätään, etuliitteinä,
> <nainen>-substantiiveina, <nainen>-adjektiivi-substantiiveina vai
> muuttamalla yhdyssanasääntöjä joiltakin osin. Ehkä se riippuu
> tilanteesta, mutta koulukieliopin logiikka sinänsä ei mielestäni tarjoa
> tähän vastausta. Kysymys on nyt vain meidän toteutusta koskeva.
Minusta jotenkin vaikuttaisi, että voisi olla hyödyllistä hyväksyä
inen-loppuisten adjektiivien käyttö sekä substantiivi- että
adjektiiviyhdyssanojen määriteosana automaattisesti. Tämä olisi vaivattomin
ratkaisu, enkä usko sen heikentävän oikoluvun laatua merkittävästi, koska
noissa sanoissa on silti edelleen oltava vähintäänkin kirjainyhdistelmä "is"
sanarajalla jolloin satunnaisten kirjoitusvirheiden hyväksyminen tällaisena
yhdyssanana on aika epätodennäköistä.
> > vanhassakaupungissa
>
> Joissakin käsitteissä todella yhdyssanan määriteosana oleva _adjektiivi_
> taipuu myös sijoissa. Näinhän on tietysti numeraalien kanssa.
> Mitenkähän tämä pitäisi korjata? Esimerkiksi juhlapäivän "uusivuosi :
> uuteenvuoteen" tai sanan "omatunto : omallatunnolla" kohdalla jokainen
> taivutus on laitettu erikseen tiedostoon yhdyssanat.lex.
Tässä on kaksi vaihtoehtoa: joko lisätä nuo tiedostoon yhdyssanat.lex
(työlästä) tai toteuttaa säännöstö noiden tunnistamiseen. Numeraaleille olen
vastaavanlaisen logiikan viimeisen viikon aikana jo rakentanutkin, joten sen
tekeminen muidenkin sanaluokan sanoille on ilman muuta mahdollista, joskaan
ei ihan triviaalia.
> > alkeishiukkanen
>
> Näköjään alkeet-substantiivin <inen>-lipun avulla syntyy
> adjektiivijohdos "alkeinen". Se ei kuitenkaan muodosta
> alkeis-yhdysosamuotoa, koska johdos on pelkkä adjektiivi. Pitäisi joko
> luoda (adjektiivi-)substantiivi "alkeinen" tai lisätä
> etuliite "alkeis".
Tämäkin korjaantuisi automaattisesti tuon ylempänä ehdottamani uuden
yhdyssanasäännön myötä.
Harri.
PS. Joukahaisen tietokannan päivitys on nyt tehty, eli sitä voi jälleen
käyttää. Kertokaa kuitenkin, jos havaitsette ongelmia tai muuta epäilyttävää.
More information about the devel
mailing list