[hunspell-fi-devel] Sanoja webbisivuilta

Harri Pitkänen hatapitk at cc.jyu.fi
Wed Nov 30 23:05:16 EET 2005


On Wednesday 30 November 2005 00:38, Tuomo Koistinen wrote:
> Harri Pitkänen wrote:
> > tavuviivaa yhdyssanojen (esim. kuorma-auto) yhdysmerkkinä? Onko siis
> > n-dashin (vähän "tavallista" tavuviivaa pitempi merkki, mutta kuitenkin
> > lyhyempi kuin ajatusviiva) käyttö hyväksyttävää tuossa tarkoituksessa?
>
> Suomen kielessä tunnetaan vain yhdysmerkki (-) ja sitten se mm.
> ajatusviivana käytetty pidempi viiva, jota tosin ei esim. latin-1:ssä
> ole. Mitään välimuotoa ei tietääkseni ole. Onko jokin erityinen syy olla
> käyttämättä tuota tavallista yhdysmerkkiä eli lyhyintä viivaa (-)?

Ei ole mitään erityistä syytä. Ajattelin vaan, että László Németh on laittanut 
sekä yhdysmerkin, n-dashin että m-dashin unkarin kielessä niiden merkkien 
joukkoon, jotka voivat esiintyä missä kohtaa sanaa tahansa. Tuollainen ei 
kuulosta järkevältä suomen kielessä, ajattelin siksi vain varmistaa asian.
Mutta tänään huomasin, että OpenOffice on jo 1.1 -versiossa käsitellyt 
yhdysviivalliset yhdyssanat väärin, eli siis kokonaan erillisinä sanoina. 
Tämä on siis vanha bugi, jota kukaan vain ei nähtäväsit ollut aikaisemmin 
huomannut. Eli ei sen korjaaminenkaan ole sitten kovin kiireellinen asia, 
voin taas keskittyä paremmin tähän Hunspellin kehittelyyn :)

Asiaa selvitellessäni huomasin semmoisenkin jutun, että Soikossa on yksi 
puute, jonka me luultavasti voimme Hunspellin avulla korjata. Puute liittyy 
tavutukseen: otetaan esimerkiksi sanat "ruo'on" ja "Calais'n". Ensimmäisessä 
on tavuraja heittomerkin kohdalla, toisessa ei. Soikko ei anna tästä asiasta 
mitään informaatiota, ja siksipä Soikon avulla toteutettu tavutus ei voi 
koskaan turvallisesti tavuttaa sanaa heittomerkin kohdalta. Kuitenkin noihin 
sanoihin tulee heittomerkki aivan eri syystä, joten ei pitäisi olla edes 
vaikeaa toteuttaa tavutusta siten, että se selviää heittomerkeistäkin oikein. 
Tosin sitten on aivan toinen kysymys, miten tuo vieraskielinen nimi muuten 
tavutetaan, mutta siihen kai ei ole edes olemassa mitään yksikäsitteistä 
sääntöä.

Harri



More information about the devel mailing list