[voikko-devel] Sanaston XML-formaatti kommentoitavaksi
Reijo Tomperi
reijo.tomperi at pp2.inet.fi
Sun Feb 25 16:44:55 EET 2007
Harri Pitkänen wrote:
> DTD-tiedosto ja käyttöesimerkki löytyvät täältä:
>
> http://voikko.svn.sourceforge.net/viewvc/voikko/trunk/data/words/
Ensialkuun huomautan, että en ole projektiin läheskään niin paljon
osallistunut kuin muut, enkä siksi ymmärrä kaikkia päätöksiä, joten
suhtautukaa kommentteihini kriittisesti.
- Miksi id on alfanumeerinen, eikä pelkkä numero? Jos mitään erityistä
syytä ei ole, niin mielestäni id olisi parempi pitää pelkkänä numerona.
- Olisiko lippujen nimissä esim. "atk", "lääketiede" parempi käyttää
englantia? Sinällään tämä projekti on aika tiukasti sidottu suomeen,
joten en näe mitenkään välttämättömänä tätä. Todennäköisesti se loisi
myös monimutkaisuutta muutosrajapintoihin. Etuna olisi tietty se, että
formaattia voisi silloin käyttää kansainvälisemmin, jos sellaiselle
tarvetta joskus tulee. Mikä pitkällä tähtäimellä voisi olla eduksi kun
eri ohjelmat voisivat puhua samalla kielellä. Mutta kuten sanoin, se
todennäköisesti loisi vain turhaan monimutkaisuutta.
- xml-tiedostoja luettaessa ärsyttävin piirre on se, että arvoja on
piilotettu monen kerroksen taakse. Tuossa nyt ei ole kuin korkeintaan
yksi ylimääräinen kerros, mikä ei todellakaan ole lähelläkään pahimpia
formaatteja mitä olen nähnyt. Mutta pitäisikö silti purkaa tuosta yhdet
kerrokset pois. Jolloin esim.:
<derivation>
<flag>ei_lainen</flag>
<flag>ei_mainen</flag>
</derivation>
Muuttuisi muotoon:
<derivation>ei_lainen</derivation>
<derivation>ei_mainen</derivation>
En tiedä miten pahasti tämä sotii xml:n pyhimpiä tarkoituksia vastaan,
mutta omien kokemuksieni mukaan jälkimmäinen on helpompi lukea, koska
joka tapauksessa tuolla derivation haarassa joutuu looppaamaan vain
kaikki tietynnimiset läpi. Joten vähemmällä vaivalla sen tekee suoraan
juuressa. Tuo alkuperäinen malli on tietysti paljon tyylikkäämmän
näköinen ihmisen silmin.
Eli nämä vain tällaisia ohikulkijan huuteluita. Ei tarvitse välittää,
mutta halusin kommentoida kuitenkin jos näistä jotain apua olisi ;)
More information about the devel
mailing list