[voikko] Joukahaisen tarkistukset

Jukka K. Korpela jukkakk at gmail.com
Mon Apr 13 17:14:27 EEST 2020


la 11. huhtik. 2020 klo 9.40 Hannu Väisänen (pyrrhula.pyrrhula at meiliboxi.fi)
kirjoitti:

Joukahainen varoittaa, jos yrittää lisätä sanan, joka on jo
> tietokannassa. Ilmeisesti varoitusta ei tule, jos lisää kirjoitusasun,
> joka on jo omana sananaan tai lisää sanan, joka on jo jonkun muun
> sanan kirjoitusasuna.


Tässä pitäisi tietää, mikä on ”kirjoitusasujen” ajateltu ja todellinen
käyttö. Ilmeisesti Kirjoitusasu-kenttä on alkujaan otettu todella
kirjoitusasuvarianttien esittämiseksi. Ainakin asian dokumentaatio, joka on
merkitty luonnokseksi, antaa ymmärtää näin:
https://joukahainen.puimula.org/docs/kirjoitusasut.html
Vaihtelu piccolo ~ pikkolo voidaan ehkä kätevästi hoitaa näin, vaikka eri
kirjoitusasut ovat yleensä sanakirjoissa omina hakusanoinaan ja vaikka se
voi johtaa erinäisiin ongelmiin (ja Joukahaisessakin esim. gourmet ja
gurmee ovat eri sanoina) Saman kentän käyttö aivan toiseen tarkoitukseen,
morfeemirajojen osoittamiseen, vaikuttaa oudolta, mutta saattaa olla
(ollut) jokin hyvä peruste. Mutta tässä on ilmeisesti kyse vielä
kolmannesta tarkoituksesta, nimittäin yhdyssanojen tuomisesta sanastoon
ilman, että ne ovat omina tietueinaan.

Löysin nämä sanat.
>
> bilineaarinen
>

Tässä on kai käynyt niin, että kaksi ihmistä on lisännyt tämän sanan eri
tavoilla, toisaalta omana tietueenaan, toisaalta lineaarinen-sanan
Kirjoitusasu-kenttään. Se, aiheutuuko tästä ongelmia, riippuu kai siitä,
miten näitä kenttiä käytetään. Joka tapauksessa tämä tuntuu turhalta
redundanssilta: riittäisi, että sana on omana tietueenaan.

En tiedä, miten vaikeaa olisi lisätä tarkistus, joka huomaa tällaisen
redundanssin. En tiedä sitäkään, olisiko parempi ottaa nyt
Kirjoitusasu-kentissä määritellyt sanat omiksi hakusanoikseen.
Tietämättömyyttäni lisää, etten hahmota tarvetta ylipäänsä kertoa
esimerkiksi morfeemijäsennystä bi=lineaarinen (jonka
morfeemisuusluonnekin voidaan kyseenalaistaa). Onko syynä olennaisesti se,
että näin määritellään sanan ensisijainen jakokohta tavutusta varten?
(Minusta tässä sanassa ei edes ole niin; esimerkiksi bilineaari-nen on
parempi.)

Luulen, että muutkin tapaukset ovat syntyneet vahingossa ja että ajatuksena
on ollut, että sanan introdusoiminen vain toisen sanan
Kirjoitusasu-kentällä on toissijaista ja olisi poistettava, jos sana
lisätään omaksi tietueekseen.

Jukka

P.S. Morfeemirajan merkintä on sikäli ongelmallinen, että vahvan
morfeemirajan käyttö ilmeisesti pakottaa tavutuksen käsittelemään sanaa
yhdyssanana. Esimerkiksi demo=kratia aiheuttaa, että sanassa on
ensisijainen tavutuskohta tuossa ja muut määräytyvät yhdysosien rakenteen
mukaan. Tämä merkitsee, että tavutus demok-ratia ei ole mahdollinen, vaikka
tällainen on nykyisissä säännöissä selvästi sanottu: "Vierassanojen
tavutuksessa voi noudattaa joko vierassanan yhdysosien mukaista tavujakoa
tai suomen kielen mukaista tavutusta."
http://www.kielitoimistonohjepankki.fi/ohje/155
-------------- next part --------------
An HTML attachment was scrubbed...
URL: <http://lists.puimula.org/pipermail/voikko/attachments/20200413/2d866bea/attachment.html>


More information about the voikko mailing list