[voikko] Vapaiden ohjelmien suomennosten oikoluku
Harri Pitkänen
hatapitk at iki.fi
Sun Sep 9 22:04:57 EEST 2007
Osana OpenOffice.orgin suomennostyötä olen yrittänyt soveltaa Voikkoa
suomenkielisissä käyttöliittymäteksteissä olevien kirjoitusvirheiden
etsintään. Vaikka käyttämäni menetelmät ovat olleet melko karkeita, virheitä
on löytynyt tällä tavalla suhteellisen vähällä vaivalla kymmenittäin. Olen
korjannut useimmat löydetyistä virheistä OOo:n tulevaan versioon 2.3, ja
jonkin verran lisää korjauksia tulee vielä versioon 2.3.1.
Koska tällä listalla on varmasti muitakin vapaiden ohjelmistojen suomentajia,
voisi kenties olla hyödyllistä levittää tietoutta Voikon käytöstä tällaisessa
puuhassa. Tein pienen kokeilun KDE:llä (jonka suomennoksiin en ole
aikaisemmin tutustunut):
$ svn co svn://anonsvn.kde.org/home/kde/branches/stable/l10n/fi
$ cd fi
$ pofilter --kde --language=fi --test=spellcheck -imessages -ooutput
(pofilter löytyy ohjelmapaketista translate-toolkit ainakin Debianissa ja
Ubuntussa. Lisäksi libenchant-voikko pitää olla asennettuna.)
Kun pofilter on saanut työnsä päätökseen (tovi menee odotellessa) niin uudessa
alihakemistossa "output" löytyy joukko po-tiedostoja, joissa on
automaattisesti kommentoituna mahdollisia kirjoitusvirheitä sisältäviä
käännöksiä. Esimerkin vuoksi tiedoston kdebase/kate.po sisältö löytyy
osoitteesta http://www.puimula.org/htp/kate.po
Tässä tapauksessa käytetty oikolukusanasto oli Voikon perussanaston
kehitysversio. Luonnollisesti sitten kun käännöksiä alkaa vakavasti
oikolukea, kannattaa lisätä atk-sanasto sekä atk-lyhenteet mukaan
käytettävään oikolukusanastoon. Lisäksi omaa projektiaan varten voi koota
listan projektiin liittyvistä nimistä ja lyhenteistä, jotka oikoluvussa saa
ohittaa. Pofilter ei myöskään ymmärrä suomen kielen tapaa käyttää
kaksoispistettä sanan osana. Jos tätä ei halua kiertää sorkkimalla pofilterin
lähdekoodia, voi tavallisimmat taivutuspäätteet lisätä sellaisenaan
projektikohtaiseen sanastoon. Mutta jos katsotte tuota kate-editorin
suomennoksesta otettua näytettä, voi sieltä ilman mitään
näistä "optimoinneista" löytää hyvin nopeasti korjaamisen arvoisia kohtia:
avoinnaoleviin -> avoinna oleviin
antamiiseen -> antamiseen
Allaolevat -> Alla olevat
levylläolevan -> levyllä olevan
uudelleenavattaessa -> [koko lause olisi hyvä muotoilla toisin]
edessäolevalla -> [tässäkin tarvitaan laajempaa kielenhuoltoa]
mekkeihin -> merkkeihin
uudelleenkäyttää -> käyttää samaa
Uudelleennimeä -> Nimeä uudelleen
otsikkossa -> otsikossa
väilehti -> välilehti
korvataksessi -> korvataksesi
Jos jotakuta kiinnostaa tällainen oikolukupuuha, niin voisin laittaa johonkin
valmiiksi saataville sellaisen version Suomi-malagasta, jossa atk-sanasto
sekä nuo taivutuspäätteet olisivat valmiina mukana. Projektikohtaisten
sanastojen tekemiseen ei vielä ole helppoa apuvälinettä. Joukahaista voisi
periaatteessa käyttää, mutta en haluaisi sinne edes atk-sanastoon lisättävän
sellaista yksittäisten ohjelmien omaa sanastoa (yleensä nimistöä), jota ei
lainkaan ole alalla muutoin käytössä. Yksi mahdollisuus olisi käyttää
erillistä Joukahaisen asennusta ja laittaa sinne projektikohtaiset sanastot
(liput "projekti: kde", "projekti: gnome", "projekti: openoffice.org" jne).
Tähän ei ehkä kannata mennä ellei kiinnostusta ole merkittävän paljon.
Olisi periaatteessa myös mahdollista tehdä pofilter/Voikko-yhdistelmälle
www-liittymä lokalisointi.orgin alle...
(Ja kyllä, laatu at lokalisointi.org olisi parempi paikka tälle keskustelulle,
ehkä minunkin pitäisi liittyä kyseiselle listalle.)
Harri
More information about the voikko
mailing list