[hunspell-fi-devel] Anagrammeja

Harri Pitkänen hatapitk at cc.jyu.fi
Tue May 23 10:31:19 EEST 2006


On Tuesday 23 May 2006 06:56, Hannu Väisänen wrote:
> On Mon, May 22, 2006 at 10:59:10PM +0300, Teemu Likonen wrote:
> > Löysinpä melkoisen anagrammitapauksen: sanasta "voihkaisi" Voikko löytää
> > 484 erilaista versiota.
>
> Auts!
>
> > (Samalla tuli huomattua, että "shiia" hyväksytään muttei "šiiaa". Samoin
> > muissa hattu-s:llisissä sanoissa.)
>
> Tämä johtuu siitä, että aloitin sanaston kokoamisen ennen kuin minun
> koneella sai kirjoitettua hattu-s:n, siis ennen ISO-8859-15
> -merkistöä. Sama ongelma on myös hattu-z:ssa. Mitä näille sanoille
> pitäisi tehdä? Hyväksyä š ja sh (ja mahdollisesti myös s) ja ž ja zh
> (ja z)?

Voi olla parempi, että vielä ei tehdä näille yhtään mitään eli tyydytään zh ja 
sh -muotoihin. Jos niitä nyt aletaan kopioimaan sanastossa, niin tarvitaan 
mekanismi jolla suomi-malagassa voitaisiin merkitä tietyt sanat jonkin toisen 
sanan rinnakkaisiksi kirjoitusasuiksi. Tämä on oleellista sitä varten, ettei 
sanojen muita tietoja (taivutusluokka, käyttö yhdyssanoissa, alakohtainen 
luokittelu yms.) tarvitse kopioida moneen paikkaan ja manuaalisesti huolehtia 
että muutokset tulee aina tehtyä kaikkiin muotoihin eikä vain yhteen tai 
muutamaan niistä.

Joukahaiseen on joka tapauksessa tulossa tuki rinnakkaisille kirjoitusasuille, 
ja tämän pitäisi aikatauluni mukaan olla valmis heinäkuussa. Tuolloin nämä 
šiia-muodot ja muut saadaan lisättyä sanastoon helposti ja sanaston ylläpidon 
ja semantiikan kannalta järkevällä tavalla ilman kopiointia.

Harri



More information about the devel mailing list