[voikko-devel] Erisnimet, yhdyssanat ja -merkit

Harri Pitkänen hatapitk at cc.jyu.fi
Fri Sep 29 10:32:13 EEST 2006


On Friday 29 September 2006 09:00, Teemu Likonen wrote:
> Harri Pitkänen kirjoitti:
> > > Sinänsä järkevää, mutta syntyy ongelma yhdyssanojen kanssa. Voikko
> > > hyväksyy esimerkiksi yhdyssanan "Saarijärven-asunto" vain silloin,
> > > kun "Saarijärvi" on sanastossa nimenomaan paikannimenä. Jos se
> > > muodostuu yleisnimistä, tätä yhdysmerkin sisältävää sanaa ei ns.
> > > hyväksytä, ja ehdotukseksi tarjotaan
> > > yleisnimimuotoa "Saarijärvenasunto".
> > >
> > > Kuinka ratkaistaan? Saako paikannimiin laittaa yleisnimen näköisiä
> > > erisnimiä?
> >
> > Ilman muuta saa. Tuo kommentti taitaa olla peräisin Sukija-versiosta,
> > eikä ole missään mielessä pätevä Voikon tapauksessa juuri
> > kuvaamastasi syystä.
>
> Palautui taas mieleen selventävät yhdysmerkit. Onkohan tämä erisnimiasia
> mitenkään suhteessa niihin (?). Periaatteessa selventäviä yhdysmerkkejä
> on luvallista käyttää aina, kun on tarvetta. Voidaan esimerkiksi
> kirjoittaa "linja-auto-asema", vaikka jälkimmäinen yhdysmerkki yleensä
> jätetäänkin pois. Muoto "linja-autoasema" on sikäli jopa huonompi, että
> yhdysmerkki jakaa sanahahmon osiin "linja" ja "autoasema", vaikka
> jako "linja-auto" ja "asema" olisi merkityksen kannalta oikea
> hahmotustapa.
>
> Tämän pilkun (tai yhdysmerkin) viilauksen takana on myös ihan oikea
> kysymys. :) Onko selventävien yhdysmerkkien toteutusta mietitty?
> Voiko ja kannattaako sen toteutuksen liittää tähän edellä
> mainittuun "Saarijärven-asunto"-tyyliseen tilanteeseen, jossa
> yleisnimestä tehdäänkin erisnimi?
>
> Suomessa ja suomessa on tuhottomasti paikan- ja henkilöiden nimiä, jotka
> muodostuvat yleisnimistä. Jos ne saisi jotenkin automaattisesti
> tunnistumaan oikein näissä yhdysmerkkitilanteissa, niin olisipa
> sanaston keräämisen kannalta helpompaa. Versaalilla alkava sana
> voitaisiin ehkä tulkita mahdolliseksi erisnimeksi.
>
> Hyväksyttyjä muotoja olisivat siten
> esimerkiksi "kangasniemitapaus", "Kangasniemi-tapaus",
> "Kangas-Niemi-tapaus" (kaksiosainen nimi) ja ehkä "Kangas-niemitapaus"
> ja "Kangas-Niemi-Tapaus". Sen sijaan "Kangas-niemi-tapaus" ei kävisi,
> koska gemena-alkuiset sanat katsottaisiin yleisnimiksi ja yhdysmerkkiä
> ei tarvita väliin (ellei sitten tätäkin sallita "selventävä
> yhdysmerkki" -ajatuksella). Nyt Voikko vaatii, että sanastossa
> on "Kangas", "Kangasniemi" ja "Niemi" erisniminä.
>
> Teknisestä toteutuksesta en taaskaan valitettavasti tiedä mitään, eikä
> tämä välttämättä ole ehdotus mihinkään suuntaan. Voikko kuitenkin
> jättää tiukassa yhdysmerkkipolitiikassaan monet mahdolliset tilanteet
> ulkopuolelle.

Olen vastaillut oikeastaan näihin kaikkiin kysymyksiin jo toukokuussa, mutta 
kesän aikana on tullut lisää syitä miksi haluan edelleen pitää tämän tiukan 
linjan. Esimerkiksi suunniteltu sanojen suhteelliseen esiintymistiheyteen 
perustuva korjausehdotusten luokittelu ei toimi, jos erisnimet tuotetaan 
yleisnimistä automaattisesti. Mutta kaikki toukokuussa esittämäni perustelut 
pätevät myös yhä. Lisäksi epäilen, että käytännössä tarpeellinen määrä 
yleisnimistä muodostettuja erisnimiä saadaan lisäämällä sanastoon ehkä tuhat 
uutta sanaa, mikä ei ole kauhean paljon. Puuttuvat kunnat, suurimmat järvet, 
valtioiden nimet ja 500 yleisintä sukunimeä vievät jo aika pitkälle.

Selventävistä yhdysmerkeistä kirjoitin myös aikaisemmin. Tarkoituksenani on 
hyväksyä ne tapauksissa, joissa alkuosan kaksi viimeistä kirjainta ovat samat 
kuin jälkiosan kaksi ensimmäistä ("pop-opisto") ja joissa yhdyssanajako on 
epämääräinen ("syys-ilta", "nyky-isyys" yms.). Nämä ovat niitä tapauksia, 
joissa yhdysmerkin käyttö on erityisesti suositeltavaa.
(Tekninen huomio: ensimmäinen tapaus on mahdollista toteuttaa Suomi-malagassa, 
jälkimmäistä ei. Kuitenkin kun jälkimmäistä ryhdytään libvoikossa 
toteuttamaan, saadaan ensimmäinenkin tehtyä siellä jotakuinkin ilmaiseksi 
noin yhdellä tai kahdella lähdekoodirivillä, joten kannattanee siis tehdä 
koko homma libvoikon puolella.) En kyllä lupaa tälle mitään aikataulua.

Linja-auto-aseman tapaisia sanoja ei mielestäni tarvitse hyväksyä, koska 
tuollaisia käyttävät vain harvat kirjoittajat, ja he kyllä tietävät 
oikolukuohjelmaa paremmin, mikä on oikein ja mikä ei. Lisäksi noiden 
hyväksyminen rikkoisi mm. korjausehdotukset lähes käyttökelvottomaan kuntoon. 
Erillinen switch-asetus vapaammalle yhdyssanan muodostukselle voisi kyllä 
toimia, sillä ehdolla että se on oletuksena pois päältä, ja tehdään riittävän 
selväksi, että asetusta käyttävien ei kannata raportoida virheellisesti 
tunnistetuista sanoista tai korjausehdotusten järjettömyydestä.

Harri



More information about the devel mailing list