[voikko-devel] Erisnimet, yhdyssanat ja -merkit
Harri Pitkänen
hatapitk at cc.jyu.fi
Fri Sep 29 10:32:13 EEST 2006
On Friday 29 September 2006 09:00, Teemu Likonen wrote:
> Harri Pitkänen kirjoitti:
> > > Sinänsä järkevää, mutta syntyy ongelma yhdyssanojen kanssa. Voikko
> > > hyväksyy esimerkiksi yhdyssanan "Saarijärven-asunto" vain silloin,
> > > kun "Saarijärvi" on sanastossa nimenomaan paikannimenä. Jos se
> > > muodostuu yleisnimistä, tätä yhdysmerkin sisältävää sanaa ei ns.
> > > hyväksytä, ja ehdotukseksi tarjotaan
> > > yleisnimimuotoa "Saarijärvenasunto".
> > >
> > > Kuinka ratkaistaan? Saako paikannimiin laittaa yleisnimen näköisiä
> > > erisnimiä?
> >
> > Ilman muuta saa. Tuo kommentti taitaa olla peräisin Sukija-versiosta,
> > eikä ole missään mielessä pätevä Voikon tapauksessa juuri
> > kuvaamastasi syystä.
>
> Palautui taas mieleen selventävät yhdysmerkit. Onkohan tämä erisnimiasia
> mitenkään suhteessa niihin (?). Periaatteessa selventäviä yhdysmerkkejä
> on luvallista käyttää aina, kun on tarvetta. Voidaan esimerkiksi
> kirjoittaa "linja-auto-asema", vaikka jälkimmäinen yhdysmerkki yleensä
> jätetäänkin pois. Muoto "linja-autoasema" on sikäli jopa huonompi, että
> yhdysmerkki jakaa sanahahmon osiin "linja" ja "autoasema", vaikka
> jako "linja-auto" ja "asema" olisi merkityksen kannalta oikea
> hahmotustapa.
>
> Tämän pilkun (tai yhdysmerkin) viilauksen takana on myös ihan oikea
> kysymys. :) Onko selventävien yhdysmerkkien toteutusta mietitty?
> Voiko ja kannattaako sen toteutuksen liittää tähän edellä
> mainittuun "Saarijärven-asunto"-tyyliseen tilanteeseen, jossa
> yleisnimestä tehdäänkin erisnimi?
>
> Suomessa ja suomessa on tuhottomasti paikan- ja henkilöiden nimiä, jotka
> muodostuvat yleisnimistä. Jos ne saisi jotenkin automaattisesti
> tunnistumaan oikein näissä yhdysmerkkitilanteissa, niin olisipa
> sanaston keräämisen kannalta helpompaa. Versaalilla alkava sana
> voitaisiin ehkä tulkita mahdolliseksi erisnimeksi.
>
> Hyväksyttyjä muotoja olisivat siten
> esimerkiksi "kangasniemitapaus", "Kangasniemi-tapaus",
> "Kangas-Niemi-tapaus" (kaksiosainen nimi) ja ehkä "Kangas-niemitapaus"
> ja "Kangas-Niemi-Tapaus". Sen sijaan "Kangas-niemi-tapaus" ei kävisi,
> koska gemena-alkuiset sanat katsottaisiin yleisnimiksi ja yhdysmerkkiä
> ei tarvita väliin (ellei sitten tätäkin sallita "selventävä
> yhdysmerkki" -ajatuksella). Nyt Voikko vaatii, että sanastossa
> on "Kangas", "Kangasniemi" ja "Niemi" erisniminä.
>
> Teknisestä toteutuksesta en taaskaan valitettavasti tiedä mitään, eikä
> tämä välttämättä ole ehdotus mihinkään suuntaan. Voikko kuitenkin
> jättää tiukassa yhdysmerkkipolitiikassaan monet mahdolliset tilanteet
> ulkopuolelle.
Olen vastaillut oikeastaan näihin kaikkiin kysymyksiin jo toukokuussa, mutta
kesän aikana on tullut lisää syitä miksi haluan edelleen pitää tämän tiukan
linjan. Esimerkiksi suunniteltu sanojen suhteelliseen esiintymistiheyteen
perustuva korjausehdotusten luokittelu ei toimi, jos erisnimet tuotetaan
yleisnimistä automaattisesti. Mutta kaikki toukokuussa esittämäni perustelut
pätevät myös yhä. Lisäksi epäilen, että käytännössä tarpeellinen määrä
yleisnimistä muodostettuja erisnimiä saadaan lisäämällä sanastoon ehkä tuhat
uutta sanaa, mikä ei ole kauhean paljon. Puuttuvat kunnat, suurimmat järvet,
valtioiden nimet ja 500 yleisintä sukunimeä vievät jo aika pitkälle.
Selventävistä yhdysmerkeistä kirjoitin myös aikaisemmin. Tarkoituksenani on
hyväksyä ne tapauksissa, joissa alkuosan kaksi viimeistä kirjainta ovat samat
kuin jälkiosan kaksi ensimmäistä ("pop-opisto") ja joissa yhdyssanajako on
epämääräinen ("syys-ilta", "nyky-isyys" yms.). Nämä ovat niitä tapauksia,
joissa yhdysmerkin käyttö on erityisesti suositeltavaa.
(Tekninen huomio: ensimmäinen tapaus on mahdollista toteuttaa Suomi-malagassa,
jälkimmäistä ei. Kuitenkin kun jälkimmäistä ryhdytään libvoikossa
toteuttamaan, saadaan ensimmäinenkin tehtyä siellä jotakuinkin ilmaiseksi
noin yhdellä tai kahdella lähdekoodirivillä, joten kannattanee siis tehdä
koko homma libvoikon puolella.) En kyllä lupaa tälle mitään aikataulua.
Linja-auto-aseman tapaisia sanoja ei mielestäni tarvitse hyväksyä, koska
tuollaisia käyttävät vain harvat kirjoittajat, ja he kyllä tietävät
oikolukuohjelmaa paremmin, mikä on oikein ja mikä ei. Lisäksi noiden
hyväksyminen rikkoisi mm. korjausehdotukset lähes käyttökelvottomaan kuntoon.
Erillinen switch-asetus vapaammalle yhdyssanan muodostukselle voisi kyllä
toimia, sillä ehdolla että se on oletuksena pois päältä, ja tehdään riittävän
selväksi, että asetusta käyttävien ei kannata raportoida virheellisesti
tunnistetuista sanoista tai korjausehdotusten järjettömyydestä.
Harri
More information about the devel
mailing list