[voikko-devel] Ehdotus txt-tiedostojen uudeksi formaatiksi

Harri Pitkänen hatapitk at iki.fi
Thu Nov 30 19:50:37 EET 2006


On Thursday 30 November 2006 08:09, Hannu Väisänen wrote:
> On Tue, Nov 28, 2006 at 08:12:43PM +0200, Harri Pitkänen wrote:
> > Tuo ehdottamasi systeemi kyllä toimii, mutta pikkuisen sitä voisi vielä
> > parannella. Ensinnäkin numerokoodien sijaan olisi parempi käyttää
> > sanallisia symboleita, siis vanhahkot_muodot, vanhat_muodot, ei_voikko
> > yms. Toinen asia on se, että laajennettavuus pitää jotenkin huomioida.
> >
> > Tiedostomuodon pitäisi siis olla sellainen, että siihen on mahdollista
> > jälkeen päin helposti lisätä uusia kenttiä. Nyt ongelmana on se,
> > että .txt-tiedostoissa sekä rivit että sarakkeet on jo varattu muuhun
> > käyttöön. Ehdottaisin siis, että rinnakkaisia taivutusmuotoja ei
> > laitettaisi koskaan samalla riville, vaan jokainen muoto omalle
> > rivilleen. Tällöin txt-tiedoissa olisi varattuna enää kaksi ensimmäistä
> > saraketta, ja kolmanteen (ja seuraaviin) sarakkeeseen voisi laittaa
> > jotain muuta. Esimerkiksi juuri noita rajoittavia merkintöjä kuten
> > vanhat_muodot, ei_voikko tms.
>
> Miten olisi näin:
>
> Nykyinen:
>
> ulko_olento_llA    or+i+lla   or+ii+lla   or+ihi+lla*
> ulkoeronto_ltA     or+i+lta   or+ii+lta   or+ihi+lta*
>
>
> Uusi:
>
> ulko_olento_llA
>                    or+i+lla
>                    or+ii+lla
>                    or+ihi+lla ei_voikko
>
> ulkoeronto_ltA
>                    or+i+lta
>                    or+ii+lta
>                    or+ihi+lta ei_voikko
>
> Siis:
>
> Tietueet erotetaan toisistaan tyhjällä rivillä. Tyhjä rivi on rivi,
> jossa ei ole edes välilyöntejä.
>
> Tietueen ensimmäinen rivi on taivutusmuodon nimi, ja seuraavat rivit
> ovat taivutuksen eri vaihtoehtoja.
>
> Rivien 2, 3, jne ensimmäinen sarake on taivutusmuoto ja seuraavat
> sarakkeet, joita voi olla nolla tai enemmän, ovat taivutusmuotoon liittyviä
> lippuja.
>
> Kaikkien yhteen taivutusmuotoon liittyvien lippujen pitää olla samalla
> rivillä.
>
> Rivien alussa ja sarakkeiden välissä voi olla tyhjeitä luettavuuden
> parantamiseksi.
>
>
> Tuollaista formattia olisi vielä helppo jäsentää Perlillä.


Tämä varmaan toimisi ihan hyvin. Kannatetaan.

Harri



More information about the devel mailing list