[voikko] "Sosiaali- ja terveysministeri" (oli: Re: Tiedoksi Sukija-sovellus: Puheenvuorot.kansanmuisti.fi (ja hiukan sanoja))

Jukka K. Korpela jkorpela at cs.tut.fi
Wed Nov 9 10:30:08 EET 2011


11/9/2011 7:36 AM, Hannu Väisänen kirjoitti:

> ma, 2011-11-07 kello 19:10 +0200, Tuomas Salo kirjoitti:
>
>> - Perusta-palvelun käyttämä sanoihinjakamiskoodi on melko simppeli,
>> eikä osaa käsitellä esim. "sosiaali- ja terveysministeri"-tapausta.
>> Hätäratkaisuna nämä tapaukset ositetaan kolmeksi sanaksi (sosiaali,
>> ja, terveysministeri), mikä tietysti on virheellistä mutta ehkä
>> parempi kuin ei mitään. Oikeinta olisi kai käsitellä tätä
>> jonkinlaisena kokonaisuutena (samoin kuin monia muita käsitteitä),
>> mutta sepä onkin aika paljon mutkikkaampi juttu.
>
> Tällaiset fraasit löytyvät helposti, kun tallennetaan tietokantaan sanan
> asema tiedostossa (tämä on tiedoston eka sana, tämä toinen, tämä kolmas,
> jne).

Fraasihaun kannalta tuo ehkä toimii – riippuu hakutoimintojen tekniikasta.

Mutta sana-analyysin kannalta kyse on myös siitä, että tällaisissa 
ilmauksissa sana esiintyy yhdyssanamuodossa ortografisesti erillisenä 
sanana. Suomen kielessä ei ole (ainakaan normienmukaisessa kielessä, 
tuskin normaalissa yleiskielessäkään) sanaa ”sosiaali” erillisenä 
sanana, mutta yhdyssanojen alkuosana se on varsin tavallinen. Puheena 
olevassa tapauksessa se kuitenkin näyttää esiintyvän erillisenä.

Olisi virheellistä käsitellä tällaisessa ilmauksessa esiintyvää osaa 
”sosiaali” normaalina sanana. Ainakin siihen pitäisi liittää tieto 
siitä, että kyse on yhdyssanamuodosta. Toinen vaihtoehto on tulkita, 
että yhdysmerkki edustaa yhdyssanan jälkiosaa (kuten se sääntöjen mukaan 
edustaakin, käytännössä asia ei ole ihan yhtä selvä), joten ”sosiaali-” 
olisikin lyhenteeseen verrattava ilmaus, joka edustaa sanaa 
”sosiaaliministeri”.

Oikeinkirjoituksen tarkistuksen kannalta olisi varmaankin aiheellista, 
että esimerkiksi sanaa ”sosiaali” ei hyväksytä erillisenä, siis silloin, 
kun se esiintyy yksinään ilman perässä olevaa yhdysmerkkiä. Vastaavasti 
olisi esimerkiksi seuraavat merkittävä virheellisiksi: hevos, yhteis, 
kolmi, viher, housu, iki, kohtuu.

(”Yhdysmerkki” on tässä yleisilmaus, jonka pitäisi kattaa merkit
U+002D tavuviiva-miinusmerkki eli Ascii-yhdysmerkki, U+2010 
[Unicode-]yhdysmerkki ja sitova yhdysmerkki U+2011.)

Suomen kielen yhdyssanamuodoista ei liene julkaistu tieteellistä 
tutkimusta, ja Iso suomen kielioppikin kuvailee niitä varsin lyhyesti. 
Joten viittaan vain omaan juttuuni:
http://www.cs.tut.fi/~jkorpela/suomi/kompos.html

Yucca



More information about the voikko mailing list