[voikko-devel] Sanaston XML-formaatti kommentoitavaksi

Reijo Tomperi reijo.tomperi at pp2.inet.fi
Sun Feb 25 16:44:55 EET 2007


Harri Pitkänen wrote:
> DTD-tiedosto ja käyttöesimerkki löytyvät täältä:
> 
> http://voikko.svn.sourceforge.net/viewvc/voikko/trunk/data/words/

Ensialkuun huomautan, että en ole projektiin läheskään niin paljon 
osallistunut kuin muut, enkä siksi ymmärrä kaikkia päätöksiä, joten 
suhtautukaa kommentteihini kriittisesti.

- Miksi id on alfanumeerinen, eikä pelkkä numero? Jos mitään erityistä 
syytä ei ole, niin mielestäni id olisi parempi pitää pelkkänä numerona.
- Olisiko lippujen nimissä esim. "atk", "lääketiede" parempi käyttää 
englantia? Sinällään tämä projekti on aika tiukasti sidottu suomeen, 
joten en näe mitenkään välttämättömänä tätä. Todennäköisesti se loisi 
myös monimutkaisuutta muutosrajapintoihin. Etuna olisi tietty se, että 
formaattia voisi silloin käyttää kansainvälisemmin, jos sellaiselle 
tarvetta joskus tulee. Mikä pitkällä tähtäimellä voisi olla eduksi kun 
eri ohjelmat voisivat puhua samalla kielellä. Mutta kuten sanoin, se 
todennäköisesti loisi vain turhaan monimutkaisuutta.
- xml-tiedostoja luettaessa ärsyttävin piirre on se, että arvoja on 
piilotettu monen kerroksen taakse. Tuossa nyt ei ole kuin korkeintaan 
yksi ylimääräinen kerros, mikä ei todellakaan ole lähelläkään pahimpia 
formaatteja mitä olen nähnyt. Mutta pitäisikö silti purkaa tuosta yhdet 
kerrokset pois. Jolloin esim.:

<derivation>
   <flag>ei_lainen</flag>
   <flag>ei_mainen</flag>
</derivation>

Muuttuisi muotoon:

<derivation>ei_lainen</derivation>
<derivation>ei_mainen</derivation>

En tiedä miten pahasti tämä sotii xml:n pyhimpiä tarkoituksia vastaan, 
mutta omien kokemuksieni mukaan jälkimmäinen on helpompi lukea, koska 
joka tapauksessa tuolla derivation haarassa joutuu looppaamaan vain 
kaikki tietynnimiset läpi. Joten vähemmällä vaivalla sen tekee suoraan 
juuressa. Tuo alkuperäinen malli on tietysti paljon tyylikkäämmän 
näköinen ihmisen silmin.

Eli nämä vain tällaisia ohikulkijan huuteluita. Ei tarvitse välittää, 
mutta halusin kommentoida kuitenkin jos näistä jotain apua olisi ;)



More information about the devel mailing list