[voikko] Voinko käyttää Voikkoa sanojen ohjelmalliseen "kasaamiseen"

Mika Vilpas mika.vilpas at gmail.com
Sun May 6 23:14:21 EEST 2018


Moi,

kiitoksia ohjeista. Hienoa, että asia herättää kiinnostusta ja keskustelua.

Testasin tuota fomaa sen verran, että sain nuo samat rimpsut näkymään.
Työkalua tuntemattomana en oikein osaa sanoa tuosta juuta enkä jaata, mutta
tuo sanaston rakennus sai minut miettimään.

Mieleeni juolahti muutamia teknisiä kysymyksiä lisää:

1. Sanaston formaatti yllätti. Ilmeisesti tuo aiemmalla loitsulla
generoituva all.att -tiedosto on jokin foma-työkalun oma formaatti?
En oikein osaa lukea sitä, joten "sanojen rakentajan" luonti tällä tasolla
vaatinee minulta huomattavan paljon paneutumista.

2. Mikä on foma-puolen rooli Voikossa?
Arvaukseni: tarkoitus on sillä analysoida oikoluettava sana, ja tarkistaa,
että se tunnistuu oikein kirjoitetuksi Suomen kielen sanaksi.
Mutta tulevatko Voikon yhdyssanatarkistukset ja kirjoitusasun
parannusehdotukset myöskin tätä kautta? Yritän siis kysyä, että onko se
koko softan "aivot", ja kuinka paljon logiikkaa on rakennettu muilla
teknologioilla sen päälle.

3. Käyttääkö Voikko jossain kohden tampio-ohjelmointikielen tapaista
selkokielistä sanalistaa?
Esimerkki löytyy täältä,
https://github.com/fergusq/tampio/tree/master/voikko (sanat.txt, mutta
latautuu selaimella melko hitaasti pituutensa takia ilmeisesti). Omaa
ohjelmaani varten tarvitsisin selkokielisen listan sanoista ja
mahdollisesti jotain niihin liittyvää metatietoa (esim. sanaluokka ja
taipuvuustietoja). Saakohan näitä jostain kaivettua?

4. Onko Voikon kehityksessä jossain vaiheessa mietitty mahdollisuutta,
jossa käyttäjä voisi lisätä Voikon ymmärryksen piiriin uuden sanan
taivutuksineen?
Yksi tarpeeni stenotyypin kanssa on, että käyttäjä voi lisätä lennosta
mukaan omia sanojaan tai ilmauksiaan (esim. sointu K-U voisi jonkin
käyttäjän mielestä olla "klonttu"), joita pitäisi pystyä taivuttamaan aivan
kuten mitä tahansa muitakin sanoja.

Tuollainen tampiossa käytetty viittausalgoritmi (jos ymmärsin sen oikein)
toimisi varmasti omiinkin tarpeisiini hyvin - käyttäjä voisi sanaa
lisätessään ilmoittaa sanaluokan, ja sanoa, että "klonttu" taipuu samalla
tavalla kuin sana "tonttu".

Mielellään kuulisin, jos tämä idea herättäisi jotain ajatuksia.

...

Tehdessäni projektilleni vaatimusmäärittelyä (
https://github.com/sp3ctum/plover-finnish ) törmäsin muuten oikofix.com -
softaan. Loistava työkalu!
En ole näet itse mikään kielentutkija, minkä vuoksi näin peruskoulupohjalla
Suomen kieliopin mallintaminen alkoi nopeasti tökkiä, mutta tuolta on
onneksi voinut tarkistaa monia kysymyksiä.

5. toukokuuta 2018 klo 13.13 Teemu Kanstrén <tkanstren at gmail.com> kirjoitti:

> voiko voikolle antaa tuon helsinki ja saada kaikki muodot ulos? ei sanoja
> niin hirveästi ole. muistiin kaikki ja map/dict ?
>
> On Sat, May 5, 2018, 12:46 Hannu Väisänen <pyrrhula.pyrrhula at meiliboxi.fi>
> wrote:
>
>>
>> Mika Vilpas kirjoitti 02.05.2018 klo 23:25:
>> > 1. Voinko tehdä ohjelmallisesti kutsuja jollekin Voikon osalle tyyliin
>> > "antaisitko tämän sanan monikkomuodon: koira" -> vastaus: "koirat"?
>>
>> Voikon ajaminen takaperin, niin sanoakseni, kiinnostaa minuakin
>> sukututkimukseen liittyen. Nykyään, jos sukitutkimusohjelmasta tulostaa
>> jotain, saa aikaan esim. tällaista:
>>
>> Matti Virtanen syntyi Helsinki 1.1.1900, kuoli Tampere 1.1.2000.
>>
>> Tulostuksen pitäisi olla Helsingissä ja Tampereella.
>> _______________________________________________
>> voikko mailing list
>> voikko at lists.puimula.org
>> https://lists.puimula.org/listinfo/voikko
>>
>
> _______________________________________________
> voikko mailing list
> voikko at lists.puimula.org
> https://lists.puimula.org/listinfo/voikko
>
>
-------------- next part --------------
An HTML attachment was scrubbed...
URL: <http://lists.puimula.org/pipermail/voikko/attachments/20180506/cfc4ec6e/attachment.html>


More information about the voikko mailing list