[voikko-devel] joukahainen.lokalisointi.org päivitetty

Harri Pitkänen hatapitk at cc.jyu.fi
Sun Aug 20 13:38:05 EEST 2006


Päivitin tänä aamuna Joukahaisen testiasennuksen. Tämä asennus ei ole pelkkää 
testausta varten, joten listalle aikaisemmin postitettua kaikkien yhteistä 
käyttäjätunnusta ei enää voi käyttää.

- Jos olet pyytänyt ja saanut minulta henkilökohtaisen tunnuksen aikaisemmin, 
sen pitäisi toimia uudessa asennuksessa.
- Jos olet aikaisemmin kysynyt tunnuksia, mutta olemme päätyneet yhteisten tai 
testitunnusten käyttöön, olet toivon mukaan äskettäin saanut minulta 
sähköpostiviestin jossa on uusi, henkilökohtainen käyttäjätunnus.
- Jos olet käyttänyt listalle postitettua testitunnusta etkä kuulu kumpaankaan 
edellisistä ryhmistä, voit pyytää minua lisäämään itsellesi oman 
käyttäjätunnuksen.

Suurin osa tämän uuden asennuksen ominaisuuksista on edelleen vapaasti 
testattavissa. Tietokannan sisältöä ei vieläkään ole tarkoitus sellaisenaan 
säilyttää seuraavaan asennukseen.

Tässä asennuksessa on mukana 22662 sanaa, eli kaikki Suomi-malagan 
Voikko -version substantiivit, adjektiivit ja verbit SVN:stä muutaman päivän 
takaisen tilanteen mukaan. Osalla sanoista on tosin 
taivutusluokkana "poikkeava", mikä tarkoittaa sitä että Joukahainen ei osaa 
tulkita kyseisen sanan taivutusluokkaa Suomi-malagassa. Näitä poikkeavia 
sanoja on kuitenkin enää vain 2897 kappaletta, ja tarkoitukseni on saada 
näiden osuus pudotettua reilusti alle tuhanteen siihen mennessä kun 
Joukahainen otetaan täydessä laajuudessaan käyttöön. Lisäksi ainakin 
etuliitteet on tarkoitus ottaa mukaan Joukahaiseen.

Pelkän testailun lisäksi tällä asennuksella voi jo tehdä aivan todellistakin 
työtä. Taivutusluokituksen systemaattinen tarkastaminen, yksi Joukahaisen 
tärkeimmistä käyttötarkoituksista, on nyt sanastossa olevien ei-poikkeavien 
verbien osalta mahdollista. Jos haluat osallistua urakkaan, toimintaohje on 
seuraava:

- Kirjaudu sisään ja valitse linkki "Tehtävät" ja sen takaa "Verbien 
taivutusluokkien tarkistus".

- Selainikkunan vasempaan laitaan tulee lista linkkejä sanastossa oleviin 
verbeihin. Valitse niistä ensimmäinen. Oikeaan laitaan tulevat näkyviin 
verbin tiedot. Lue vihreässä laatikossa olevat taivutusmuodot läpi. Jos ne 
sinusta vaikuttavat olevan oikein, laita rasti vasemman laidan 
OK-sarakkeeseen ja siirry seuraavaan sanaan.

  * Jos taivutuksissa on mielestäsi jotain hämärää, valitse "Muokkaa
    lippuja...", laita rasti ruutuun "vaatii selvennystä" ja kirjoita
    kommenttilaatikkoon mikä mielestäsi on pielessä. Tässä ei tarvitse olla
    monisanainen, pelkkä virheellisen kuuloisen taivutusmuodon tai johdoksen
    mainitseminen riittää. Lopuksi paina nappia "Tallenna muutokset". Sitten
    voit jälleen laittaa rastin vasemman laidan "OK" -sarakkeeseen (OK
    tarkoittaa tässä siis sitä, että sana on tarkistettu, ei että siinä ei
    olisi virheitä).

- Kun olet saanut listatut sanat tarkistettua, paina "Tallenna tarkistetut". 
Saat automaattisesti uuden listan sanoja ja voit jatkaa hommaa niin pitkään 
kuin huvittaa. Jos et osaa arvioida jonkin sanan taivutuksia ollenkaan, voit 
jättää sen välistä (siis olla laittamatta rastia OK-sarakkeeseen). Tällöin 
sana tulee jossain vaiheessa uudelleen tarkistettavaksi, mahdollisesti eri 
henkilölle.

Joissakin taivutusmuodoissa saattaa esiintyä ongelmia vokaalisoinnun kanssa, 
eli siis a-ä, o-ö ja u-y -kirjainparien kirjaimet ovat vaihtuneet toisikseen. 
Tällaisia muutoksia ei tässä tapauksessa tarvitse pitää virheinä, kyse on 
tunnetusta ongelmasta jota en vielä ole ehtinyt korjaamaan. Poikkeava-luokan 
verbeille ei taivutuksia näytetä ollenkaan. Tämä on oikein, ja ne voi merkitä 
tarkistetuiksi suoraan. Sen sijaan jos taivutukset jäävät kokonaan näkymättä 
jollekin sanalle jolla on oikea taivutusluokka, ilmoita tästä suoraan tällä 
listalla. Pyrin korjaamaan tällaiset tapaukset mahdollisimman nopeasti.

Substantiivien ja adjektiivien taivutusluokkia voi periaatteessa tarkistella 
samaan tapaan jos haluaa. Näissä vihreän laatikon näyttämät tiedot eivät 
välttämättä ole oikein, eli jos ongelmia löytyy, kannattaa virheelliset 
muodot syöttää ensin Voikkoon ja varmistua, että todella sielläkin 
tunnistuvat. Prosessi on siis työläämpi, suosittelen pitäytymään toistaiseksi 
verbeissä.

Taivutusten tarkistamisen lisäksi myös uusien sanojen lisäämistä voi kokeilla. 
Jos onnistut lisäämään sanan niin, että sille tulee oikean näköiset 
taivutusmuodot vihreään laatikkoon, käy lisäämässä "vaatii 
selvennystä" -lippu ja laita kommenttiin että sana kävisi mielestäsi Voikkoon 
lisättäväksi. Testisanoja ja siansaksaa saa silti edelleen lisäillä jos 
haluaa testailla ohjelman toimintaa. Älkää kuitenkaan lisäilkö virheellisiä 
sanoja verbit-luokkaan, älkääkä turhaan lisätkö "vaatii selvennystä" -lippua, 
ettei ohjelman varsinainen käyttö häiriinny.

Yritän ensi viikon aikana lisäillä muutamia hyödyllisiä ominaisuuksia. Sanojen 
hakutoimintoa pitää ainakin parantaa, että on mahdollista saada listaus 
korjattaviksi tai lisättäviksi ehdotetuista sanoista. Lisäksi Reijon 
ehdottama erillinen toiminto taivutusluokkien testailuun sekä lista olemassa 
olevista taivutusluokista voisi helpottaa uuden sanan taivutusluokan 
valitsemista.

Siitä vaan kokeilemaan! Virheitä ei tarvitse pelätä, ja taivutusten 
tarkistamiseen voi käyttää täsmälleen niin vähän tai paljon aikaa kuin vaan 
haluaa. Sopii siis erinomaisesti korvikkeeksi pasianssin peluulle.

Harri



More information about the devel mailing list