[voikko] "Sosiaali- ja terveysministeri" (oli: Re: Tiedoksi Sukija-sovellus: Puheenvuorot.kansanmuisti.fi (ja hiukan sanoja))
Jukka K. Korpela
jkorpela at cs.tut.fi
Wed Nov 9 10:30:08 EET 2011
11/9/2011 7:36 AM, Hannu Väisänen kirjoitti:
> ma, 2011-11-07 kello 19:10 +0200, Tuomas Salo kirjoitti:
>
>> - Perusta-palvelun käyttämä sanoihinjakamiskoodi on melko simppeli,
>> eikä osaa käsitellä esim. "sosiaali- ja terveysministeri"-tapausta.
>> Hätäratkaisuna nämä tapaukset ositetaan kolmeksi sanaksi (sosiaali,
>> ja, terveysministeri), mikä tietysti on virheellistä mutta ehkä
>> parempi kuin ei mitään. Oikeinta olisi kai käsitellä tätä
>> jonkinlaisena kokonaisuutena (samoin kuin monia muita käsitteitä),
>> mutta sepä onkin aika paljon mutkikkaampi juttu.
>
> Tällaiset fraasit löytyvät helposti, kun tallennetaan tietokantaan sanan
> asema tiedostossa (tämä on tiedoston eka sana, tämä toinen, tämä kolmas,
> jne).
Fraasihaun kannalta tuo ehkä toimii – riippuu hakutoimintojen tekniikasta.
Mutta sana-analyysin kannalta kyse on myös siitä, että tällaisissa
ilmauksissa sana esiintyy yhdyssanamuodossa ortografisesti erillisenä
sanana. Suomen kielessä ei ole (ainakaan normienmukaisessa kielessä,
tuskin normaalissa yleiskielessäkään) sanaa ”sosiaali” erillisenä
sanana, mutta yhdyssanojen alkuosana se on varsin tavallinen. Puheena
olevassa tapauksessa se kuitenkin näyttää esiintyvän erillisenä.
Olisi virheellistä käsitellä tällaisessa ilmauksessa esiintyvää osaa
”sosiaali” normaalina sanana. Ainakin siihen pitäisi liittää tieto
siitä, että kyse on yhdyssanamuodosta. Toinen vaihtoehto on tulkita,
että yhdysmerkki edustaa yhdyssanan jälkiosaa (kuten se sääntöjen mukaan
edustaakin, käytännössä asia ei ole ihan yhtä selvä), joten ”sosiaali-”
olisikin lyhenteeseen verrattava ilmaus, joka edustaa sanaa
”sosiaaliministeri”.
Oikeinkirjoituksen tarkistuksen kannalta olisi varmaankin aiheellista,
että esimerkiksi sanaa ”sosiaali” ei hyväksytä erillisenä, siis silloin,
kun se esiintyy yksinään ilman perässä olevaa yhdysmerkkiä. Vastaavasti
olisi esimerkiksi seuraavat merkittävä virheellisiksi: hevos, yhteis,
kolmi, viher, housu, iki, kohtuu.
(”Yhdysmerkki” on tässä yleisilmaus, jonka pitäisi kattaa merkit
U+002D tavuviiva-miinusmerkki eli Ascii-yhdysmerkki, U+2010
[Unicode-]yhdysmerkki ja sitova yhdysmerkki U+2011.)
Suomen kielen yhdyssanamuodoista ei liene julkaistu tieteellistä
tutkimusta, ja Iso suomen kielioppikin kuvailee niitä varsin lyhyesti.
Joten viittaan vain omaan juttuuni:
http://www.cs.tut.fi/~jkorpela/suomi/kompos.html
Yucca
More information about the voikko
mailing list