[voikko] Vapaiden ohjelmien suomennosten oikoluku

Harri Pitkänen hatapitk at iki.fi
Sun Sep 9 22:04:57 EEST 2007


Osana OpenOffice.orgin suomennostyötä olen yrittänyt soveltaa Voikkoa 
suomenkielisissä käyttöliittymäteksteissä olevien kirjoitusvirheiden 
etsintään. Vaikka käyttämäni menetelmät ovat olleet melko karkeita, virheitä 
on löytynyt tällä tavalla suhteellisen vähällä vaivalla kymmenittäin. Olen 
korjannut useimmat löydetyistä virheistä OOo:n tulevaan versioon 2.3, ja 
jonkin verran lisää korjauksia tulee vielä versioon 2.3.1.

Koska tällä listalla on varmasti muitakin vapaiden ohjelmistojen suomentajia, 
voisi kenties olla hyödyllistä levittää tietoutta Voikon käytöstä tällaisessa 
puuhassa. Tein pienen kokeilun KDE:llä (jonka suomennoksiin en ole 
aikaisemmin tutustunut):

$ svn co svn://anonsvn.kde.org/home/kde/branches/stable/l10n/fi
$ cd fi
$ pofilter --kde --language=fi --test=spellcheck -imessages -ooutput

(pofilter löytyy ohjelmapaketista translate-toolkit ainakin Debianissa ja 
Ubuntussa. Lisäksi libenchant-voikko pitää olla asennettuna.)

Kun pofilter on saanut työnsä päätökseen (tovi menee odotellessa) niin uudessa 
alihakemistossa "output" löytyy joukko po-tiedostoja, joissa on 
automaattisesti kommentoituna mahdollisia kirjoitusvirheitä sisältäviä 
käännöksiä. Esimerkin vuoksi tiedoston kdebase/kate.po sisältö löytyy 
osoitteesta http://www.puimula.org/htp/kate.po

Tässä tapauksessa käytetty oikolukusanasto oli Voikon perussanaston 
kehitysversio. Luonnollisesti sitten kun käännöksiä alkaa vakavasti 
oikolukea, kannattaa lisätä atk-sanasto sekä atk-lyhenteet mukaan 
käytettävään oikolukusanastoon. Lisäksi omaa projektiaan varten voi koota 
listan projektiin liittyvistä nimistä ja lyhenteistä, jotka oikoluvussa saa 
ohittaa. Pofilter ei myöskään ymmärrä suomen kielen tapaa käyttää 
kaksoispistettä sanan osana. Jos tätä ei halua kiertää sorkkimalla pofilterin 
lähdekoodia, voi tavallisimmat taivutuspäätteet lisätä sellaisenaan 
projektikohtaiseen sanastoon. Mutta jos katsotte tuota kate-editorin 
suomennoksesta otettua näytettä, voi sieltä ilman mitään 
näistä "optimoinneista" löytää hyvin nopeasti korjaamisen arvoisia kohtia:

avoinnaoleviin -> avoinna oleviin
antamiiseen -> antamiseen
Allaolevat -> Alla olevat
levylläolevan -> levyllä olevan
uudelleenavattaessa -> [koko lause olisi hyvä muotoilla toisin]
edessäolevalla -> [tässäkin tarvitaan laajempaa kielenhuoltoa]
mekkeihin -> merkkeihin
uudelleenkäyttää -> käyttää samaa
Uudelleennimeä -> Nimeä uudelleen
otsikkossa -> otsikossa
väilehti -> välilehti
korvataksessi -> korvataksesi


Jos jotakuta kiinnostaa tällainen oikolukupuuha, niin voisin laittaa johonkin 
valmiiksi saataville sellaisen version Suomi-malagasta, jossa atk-sanasto 
sekä nuo taivutuspäätteet olisivat valmiina mukana. Projektikohtaisten 
sanastojen tekemiseen ei vielä ole helppoa apuvälinettä. Joukahaista voisi 
periaatteessa käyttää, mutta en haluaisi sinne edes atk-sanastoon lisättävän 
sellaista yksittäisten ohjelmien omaa sanastoa (yleensä nimistöä), jota ei 
lainkaan ole alalla muutoin käytössä. Yksi mahdollisuus olisi käyttää 
erillistä Joukahaisen asennusta ja laittaa sinne projektikohtaiset sanastot 
(liput "projekti: kde", "projekti: gnome", "projekti: openoffice.org" jne). 
Tähän ei ehkä kannata mennä ellei kiinnostusta ole merkittävän paljon.

Olisi periaatteessa myös mahdollista tehdä pofilter/Voikko-yhdistelmälle 
www-liittymä lokalisointi.orgin alle...

(Ja kyllä, laatu at lokalisointi.org olisi parempi paikka tälle keskustelulle, 
ehkä minunkin pitäisi liittyä kyseiselle listalle.)

Harri



More information about the voikko mailing list