[hunspell-fi-devel] Joukahaisen testiasennus

Harri Pitkänen hatapitk at cc.jyu.fi
Wed Jun 21 15:44:41 EEST 2006


Olen tänään asentanut Joukahaisen lokalisointi.org -palvelimelle, eikä mitään 
merkittäviä ongelmia tullut vastaan. Sovellus löytyy osoitteesta

http://joukahainen.lokalisointi.org

Alkuperäisen suunnitelman mukaisesti tietokanta sisältää tällä hetkellä vain 
nomineja eikä sitä voi www-liittymän kautta muokata. Sanastoon pääsee käsiksi 
joko aakkosellisen hakemiston tai suoran sanahaun kautta. Jokaisesta sanasta 
tietokannassa on sana- ja taivutusluokat sekä muutamia muita attribuutteja 
jotka on siirretty tietokantaan Suomi-Malagan sanastosta. Lisäksi useimpien 
sanojen täydellinen taivutus on nähtävillä sanan käsittelynäytön oikeassa 
yläkulmassa (vain luokittelun kannalta oleelliset taivutusmuodot ovat 
oletuksena näkyvissä, mutta kaikki muodot tulevat näkyville kun napsauttaa 
hiirellä otsikon vieressä olevaa [+] -merkkiä).

Tunnettuja vikoja:
- joidenkin sanojen taivutuksissa astevaihtelu menee väärin (siis
  taivutuspäätteissä a- ja ä-kirjaimet ovat väärin)
- joiltakin sanoilta ei taivutusmuotoja näytetä ollenkaan
- joiltakin sanoilta ei näytetä aivan kaikkia vaihtoehtoisia taivutusmuotoja
  (oleellisimmat kyllä näytetään)

Jos sovellusta testatessanne huomaatte muita ongelmia, kertokaa niistä. 
Erityisesti olen kiinnostunut siitä, kuinka hyvin sovellus toimii eri 
selaimissa, Internet Explorerin testaaminen olisi erityisesti hyödyllistä. 
Myös sellaisista tapauksista olisi hyvä kertoa, joissa taivutusmuotonäytössä 
on muita virheitä kuin edellä mainittuja. Esimerkkinä voitte katsoa 
sanaa "abortti". Tälle listataan genetiivin monikossa muodot "aborttien, 
aborteiden, aborteitten" joista kaksi viimeistä ovat väärin ja partitiivin 
monikossa "aborteita, abortteja" joista ensimmäinen on väärin. Väärät 
taivutukset voivat olla peräisin virheellisestä muunnoksesta tietokantaan 
siirrettäessä, virheistä omassa taivutuslistassani tai virheestä 
Suomi-Malagan luokituksessa. Abortti-sanan kohdalla virhe taitaa löytyä 
Suomi-Malagasta koska myös voikko näyttää hyväksyvän nuo virheelliset 
taivutusmuodot.

Loppukesästä tuota taivutusluokitusta voi oikolukea systemaattisemmin ja 
helpommin kuin nyt, mutta kyllä sitä nytkin voi jo alustavasti tehdä tuon 
nykyisen liittymän kautta. Tarkoitukseni on päivittää testisovellusta viikon 
tai kahden välein.

Taivutusluokituksesta sen verran, että se perustuu Hannun Suomi-Malagan 
sanaston jatko-kentästä otettuihin taivutusluokkiin, mutta kuitenkin niin 
että astevaihtelut on esitetty käyttäen samaa merkintää kuin 
Hunspell-fi -sanastossa viime syksynä käytettiin. Taivutusluokkajako ei ole 
vielä lopullinen, joten en ole sitä missään dokumentoinut. Siihen ei siis 
kannata vielä erityisemmin kiinnittää huomiota kunhan listatut taivutusmuodot 
vain näyttävät oikeilta.


En ole myöskään unohtanut Hannun julkaisemaa Suomi-Malagan 0.7-versiota, 
ryhdyn heti seuraavaksi tutkimaan sitä.

Harri



More information about the devel mailing list