[hunspell-fi-devel] Muutamia lisähuomioita

Harri Pitkänen hatapitk at cc.jyu.fi
Mon May 15 22:50:05 EEST 2006


Isot/pienet kirjaimet
=====================

Testailin Soikon toimintaa lisää, ja se näyttää toimivan tässä kohtaa 
melkoisen yksinkertaisella tavalla: jos sanan ensimmäinen kirjain on iso, 
muiden kirjainten tasosta ei välitetä lainkaan. Periaatteessa tämän voisi 
toteuttaa Voikossakin niiden iloksi jotka sitä tarvitsevat.

TODO-lista
==========

Teemu mainitsi "voisi ehkä pohtia joskus lisää" -listan. Tällainen todellakin 
tarvitaan, ja niin että listalta löytyy kaikkien komponenttien tunnetut 
puutteet (nyt niitä pitää osata etsiä ainakin kolmesta eri paikasta) sekä 
ominaisuudet ja korjaukset joita ehkä toteutetaan myöhemmissä versioissa. 
Kokoan tämän listan ensi viikolla.

Rajatapaukset oikeinkirjoituksessa
==================================

Olisi hienoa jos pystyisimme kehittämään näille ratkaisun joka ei vaadi 
jatkuvaa kompromissien tekemistä. Tähän on parikin mahdollista ratkaisua. Jos 
esimerkiksi tarjoamme erikoisalojen sanastoja (kuten oli tarkoitus tehdä) 
niin samalla voimme tarjota mahdollisuuden hienosäätää oikolukua oman maun 
mukaiseksi. Ajatukseni on ollut, että Joukahaiseen voisi tehdä liittymän (ei 
kuulu ensi kesän suunnitelmiini, mutta olen sitä silti miettinyt) josta voisi 
helposti hakea itselleen mukautetun sanaston. Liittymä voisi olla html-lomake 
seuraavaan tyyliin:

    Valitse haluamasi erikoissanastot (valitse niin monta kuin haluat):
    | | lääketieteen erikoistermit
    | | kasvatustiede
    | | kielitiede
    | | teknillis-matemaattinen sanasto
    | | tietojenkäsittelyn erikoistermit ja lyhenteet
    ... yms.

    Mikä seuraavista kuvaa sinua parhaiten (valitse yksi):
    | | kirjoitan yksinkertaista kieltä / en vielä osaa suomea hyvin
    | | kirjoitan kuin virkamies / tiedemies
    | | olen toimittaja
    | | kirjoitan taiteellisesti / olen kirjailija

    Kirjakielen lisäksi kirjoitan (valitse niin monta kuin haluat):
    | | yleistä puhekieltä
    | | stadin slangia
    | | savon murretta
    | | irc-slangia

Sitten osan sanamuodostussäännöistä voisi tehdä ehdollisiksi siten, että niitä 
ei otettaisi mukaan kaikkiin kielityyppeihin. Esimerkiksi tuo aikaisemmin 
mainittu vapaa-yhdysmerkkien-käyttö voisi olla mukana kohdissa "kirjoitan 
kuin virkamies / tiedemies" ja "kirjoitan taiteellisesti / olen kirjailija". 
Mutta huonosti suomea osaavilla kannattaa soveltaa tarkempia sääntöjä 
silläkin uhalla että se hiukan rajaa pois joitakin sinänsä oikeita mutta 
poikkeuksellisia rakenteita. Itse asiassa Hunspellin kanssa meillä oli jo 
toteutettunakin kolme erilaista sanamuodostussääntöjen tasoa, tämä ei siis 
ole suinkaan mitenkään vaikea asia toteuttaa jos sen haluaa tehdä. Ja Hannu 
on jo rakennellutkin tukea tämäntyyppisille rajauksille esimerkiksi 
Latex-koodien kohdalla.

Toinen ratkaisu olisi luopua kokonaan mustavalkoisesta 
oikein/väärin -jaottelusta. Ainoastaan selvät virheet merkittäisiin 
oikoluvussa virheiksi ja muut jollakin toisella tavalla. Tällaista on 
OpenOfficeen ehdotettukin, ks.
http://www.openoffice.org/issues/show_bug.cgi?id=65341
(erityisesti kannattaa vilkaista liitteenä olevaa käyttöliittymämallia). Tuo 
ei ehkä sellaisenaan ole aivan optimaalinen siihen mitä me haluaisimme tehdä, 
mutta se on jo riittävän lähellä. Tästäkin oli jo syksyllä puhetta, Jori 
taisi silloin ehdottaa jotain tämän suuntaista. Tähän tarkoitukseen Malaga 
saattaa olla turhan rajoittunut, SFST:llä voisi päästä parempiin tuloksiin.

Harri



More information about the devel mailing list