[hunspell-fi-devel] Muutamia lisähuomioita
Harri Pitkänen
hatapitk at cc.jyu.fi
Mon May 15 22:50:05 EEST 2006
Isot/pienet kirjaimet
=====================
Testailin Soikon toimintaa lisää, ja se näyttää toimivan tässä kohtaa
melkoisen yksinkertaisella tavalla: jos sanan ensimmäinen kirjain on iso,
muiden kirjainten tasosta ei välitetä lainkaan. Periaatteessa tämän voisi
toteuttaa Voikossakin niiden iloksi jotka sitä tarvitsevat.
TODO-lista
==========
Teemu mainitsi "voisi ehkä pohtia joskus lisää" -listan. Tällainen todellakin
tarvitaan, ja niin että listalta löytyy kaikkien komponenttien tunnetut
puutteet (nyt niitä pitää osata etsiä ainakin kolmesta eri paikasta) sekä
ominaisuudet ja korjaukset joita ehkä toteutetaan myöhemmissä versioissa.
Kokoan tämän listan ensi viikolla.
Rajatapaukset oikeinkirjoituksessa
==================================
Olisi hienoa jos pystyisimme kehittämään näille ratkaisun joka ei vaadi
jatkuvaa kompromissien tekemistä. Tähän on parikin mahdollista ratkaisua. Jos
esimerkiksi tarjoamme erikoisalojen sanastoja (kuten oli tarkoitus tehdä)
niin samalla voimme tarjota mahdollisuuden hienosäätää oikolukua oman maun
mukaiseksi. Ajatukseni on ollut, että Joukahaiseen voisi tehdä liittymän (ei
kuulu ensi kesän suunnitelmiini, mutta olen sitä silti miettinyt) josta voisi
helposti hakea itselleen mukautetun sanaston. Liittymä voisi olla html-lomake
seuraavaan tyyliin:
Valitse haluamasi erikoissanastot (valitse niin monta kuin haluat):
| | lääketieteen erikoistermit
| | kasvatustiede
| | kielitiede
| | teknillis-matemaattinen sanasto
| | tietojenkäsittelyn erikoistermit ja lyhenteet
... yms.
Mikä seuraavista kuvaa sinua parhaiten (valitse yksi):
| | kirjoitan yksinkertaista kieltä / en vielä osaa suomea hyvin
| | kirjoitan kuin virkamies / tiedemies
| | olen toimittaja
| | kirjoitan taiteellisesti / olen kirjailija
Kirjakielen lisäksi kirjoitan (valitse niin monta kuin haluat):
| | yleistä puhekieltä
| | stadin slangia
| | savon murretta
| | irc-slangia
Sitten osan sanamuodostussäännöistä voisi tehdä ehdollisiksi siten, että niitä
ei otettaisi mukaan kaikkiin kielityyppeihin. Esimerkiksi tuo aikaisemmin
mainittu vapaa-yhdysmerkkien-käyttö voisi olla mukana kohdissa "kirjoitan
kuin virkamies / tiedemies" ja "kirjoitan taiteellisesti / olen kirjailija".
Mutta huonosti suomea osaavilla kannattaa soveltaa tarkempia sääntöjä
silläkin uhalla että se hiukan rajaa pois joitakin sinänsä oikeita mutta
poikkeuksellisia rakenteita. Itse asiassa Hunspellin kanssa meillä oli jo
toteutettunakin kolme erilaista sanamuodostussääntöjen tasoa, tämä ei siis
ole suinkaan mitenkään vaikea asia toteuttaa jos sen haluaa tehdä. Ja Hannu
on jo rakennellutkin tukea tämäntyyppisille rajauksille esimerkiksi
Latex-koodien kohdalla.
Toinen ratkaisu olisi luopua kokonaan mustavalkoisesta
oikein/väärin -jaottelusta. Ainoastaan selvät virheet merkittäisiin
oikoluvussa virheiksi ja muut jollakin toisella tavalla. Tällaista on
OpenOfficeen ehdotettukin, ks.
http://www.openoffice.org/issues/show_bug.cgi?id=65341
(erityisesti kannattaa vilkaista liitteenä olevaa käyttöliittymämallia). Tuo
ei ehkä sellaisenaan ole aivan optimaalinen siihen mitä me haluaisimme tehdä,
mutta se on jo riittävän lähellä. Tästäkin oli jo syksyllä puhetta, Jori
taisi silloin ehdottaa jotain tämän suuntaista. Tähän tarkoitukseen Malaga
saattaa olla turhan rajoittunut, SFST:llä voisi päästä parempiin tuloksiin.
Harri
More information about the devel
mailing list