[hunspell-fi-devel] Anagrammeja
Harri Pitkänen
hatapitk at cc.jyu.fi
Tue May 23 10:31:19 EEST 2006
On Tuesday 23 May 2006 06:56, Hannu Väisänen wrote:
> On Mon, May 22, 2006 at 10:59:10PM +0300, Teemu Likonen wrote:
> > Löysinpä melkoisen anagrammitapauksen: sanasta "voihkaisi" Voikko löytää
> > 484 erilaista versiota.
>
> Auts!
>
> > (Samalla tuli huomattua, että "shiia" hyväksytään muttei "šiiaa". Samoin
> > muissa hattu-s:llisissä sanoissa.)
>
> Tämä johtuu siitä, että aloitin sanaston kokoamisen ennen kuin minun
> koneella sai kirjoitettua hattu-s:n, siis ennen ISO-8859-15
> -merkistöä. Sama ongelma on myös hattu-z:ssa. Mitä näille sanoille
> pitäisi tehdä? Hyväksyä š ja sh (ja mahdollisesti myös s) ja ž ja zh
> (ja z)?
Voi olla parempi, että vielä ei tehdä näille yhtään mitään eli tyydytään zh ja
sh -muotoihin. Jos niitä nyt aletaan kopioimaan sanastossa, niin tarvitaan
mekanismi jolla suomi-malagassa voitaisiin merkitä tietyt sanat jonkin toisen
sanan rinnakkaisiksi kirjoitusasuiksi. Tämä on oleellista sitä varten, ettei
sanojen muita tietoja (taivutusluokka, käyttö yhdyssanoissa, alakohtainen
luokittelu yms.) tarvitse kopioida moneen paikkaan ja manuaalisesti huolehtia
että muutokset tulee aina tehtyä kaikkiin muotoihin eikä vain yhteen tai
muutamaan niistä.
Joukahaiseen on joka tapauksessa tulossa tuki rinnakkaisille kirjoitusasuille,
ja tämän pitäisi aikatauluni mukaan olla valmis heinäkuussa. Tuolloin nämä
šiia-muodot ja muut saadaan lisättyä sanastoon helposti ja sanaston ylläpidon
ja semantiikan kannalta järkevällä tavalla ilman kopiointia.
Harri
More information about the devel
mailing list