[voikko-devel] Ehdotus txt-tiedostojen uudeksi formaatiksi

Hannu Väisänen hvaisane at joyx.joensuu.fi
Thu Nov 30 08:09:57 EET 2006


On Tue, Nov 28, 2006 at 08:12:43PM +0200, Harri Pitkänen wrote:
> Tuo ehdottamasi systeemi kyllä toimii, mutta pikkuisen sitä voisi vielä 
> parannella. Ensinnäkin numerokoodien sijaan olisi parempi käyttää sanallisia 
> symboleita, siis vanhahkot_muodot, vanhat_muodot, ei_voikko yms. Toinen asia 
> on se, että laajennettavuus pitää jotenkin huomioida.
> 
> Tiedostomuodon pitäisi siis olla sellainen, että siihen on mahdollista jälkeen 
> päin helposti lisätä uusia kenttiä. Nyt ongelmana on se, 
> että .txt-tiedostoissa sekä rivit että sarakkeet on jo varattu muuhun 
> käyttöön. Ehdottaisin siis, että rinnakkaisia taivutusmuotoja ei laitettaisi 
> koskaan samalla riville, vaan jokainen muoto omalle rivilleen. Tällöin 
> txt-tiedoissa olisi varattuna enää kaksi ensimmäistä saraketta, ja kolmanteen 
> (ja seuraaviin) sarakkeeseen voisi laittaa jotain muuta. Esimerkiksi juuri 
> noita rajoittavia merkintöjä kuten vanhat_muodot, ei_voikko tms.

Miten olisi näin:

Nykyinen:

ulko_olento_llA    or+i+lla   or+ii+lla   or+ihi+lla*
ulkoeronto_ltA     or+i+lta   or+ii+lta   or+ihi+lta*


Uusi:

ulko_olento_llA
                   or+i+lla
                   or+ii+lla
                   or+ihi+lla ei_voikko

ulkoeronto_ltA
                   or+i+lta
                   or+ii+lta
                   or+ihi+lta ei_voikko

Siis:

Tietueet erotetaan toisistaan tyhjällä rivillä. Tyhjä rivi on rivi,
jossa ei ole edes välilyöntejä.

Tietueen ensimmäinen rivi on taivutusmuodon nimi, ja seuraavat rivit
ovat taivutuksen eri vaihtoehtoja.

Rivien 2, 3, jne ensimmäinen sarake on taivutusmuoto ja seuraavat sarakkeet,
joita voi olla nolla tai enemmän, ovat taivutusmuotoon liittyviä lippuja.

Kaikkien yhteen taivutusmuotoon liittyvien lippujen pitää olla samalla
rivillä.

Rivien alussa ja sarakkeiden välissä voi olla tyhjeitä luettavuuden
parantamiseksi.


Tuollaista formattia olisi vielä helppo jäsentää Perlillä.



More information about the devel mailing list