[voikko] Voinko käyttää Voikkoa sanojen ohjelmalliseen "kasaamiseen"

Mika Vilpas mika.vilpas at gmail.com
Wed May 2 23:25:52 EEST 2018


Hei,

ensinnäkin valtava hatunnosto Voikko-projektin parissa toimineille.
Mielestäni tämä on malliesimerkki avoimen lähdekoodin projekteista.

Menen suoraan asiaan: tavoitteenani on suunnitella koneellinen
pikakirjoitusjärjestelmä Suomen kielelle. Olen viime kuukausina opiskellut
englanninkielisiä vastaavia toteutuksia, ja todennut, että suomalaista
vastaavaa ei liene olemassa.

Koska tämä kirjoitustapa on Suomessa (ilmeisesti) aika tuntematon ilmiö,
suonette anteeksi, että kirjoitan muutaman virkkeen verran siitä, mistä
siinä on kysymys. Taustatarina on siis pitkä, mutta viestin lopussa on
Voikkoa ja siihen liittyviä projekteja koskevia kysymyksiä, joihin
toivoisin saavani vastauksia.

Yhdysvalloissa ja Briteissä tämä tunnetaan nimellä stenography, ja sitä
käytetään oikeussaleissa istunnon tapahtumien kirjaamiseen, sekä
tv-lähetysten live-tekstitykseen. Lähteideni mukaan tavallisen keskustelun
nopeus on (Englannin kielellä) 200-240 sanaa minuutissa, minkä vuoksi
yleisen näppäimistön käyttö ei mitenkään riitä tämän kirjaamiseen
(näppäimistö jää 100-150 sanaan minuutissa).

Stenografiassa käytetään erityistä stenotype-nimistä kirjoitinlaitetta,
joka muistuttaa muuten näppäimistöä, paitsi että siinä on paljon vähemmän
näppäimiä. Laitetta käytetään painamalla näppäimiä samaan aikaan alas,
hieman kuin soittaisi sointuja pianon koskettimilla. Tietokoneella oleva
ohjelmisto tunnistaa painetut "soinnut", hakee sanastostaan oikean sointua
vastaavan sanan, ja tulostaa sen kirjoittajan ruudulle.

Suomenkieliseen järjestelmään olen kaavaillut alustavasti sellaista
rakennetta, että käyttäjä voisi kirjoittaa sanoja esimerkiksi näiden
esimerkkien mukaan:

(esimerkkien muoto on jokin kirjoittimen kirjainyhdistelmä (sointu), sen
jälkeen / -merkki tarkoittaa seuraavaa painallusta (sointua))

KOIR
(Käyttäjä on painanut soinnussa neljä näppäintä samaan aikaan alas,
näytölle tulostuu sana "Koira". Tarkoitus on siis kirjoittaa tai tavuttaa
sanavartalo)

KOIR / -T
"Koirat" (T-painike muuttaa edellisen sanan monikkomuotoon)

KOIR / -N
"Koiran" (N-painike lisää genetiivin)

KOIR / -NT
"Koirien" (monikon genetiivi)

KOIR / -L
"Koiralla" (L-painike muuttaa edellisen sanan nominatiivista adessiiviksi)

KOIR / -LT
"Koirilla" (monikon adessiivi)



Tässä Voikkoa koskevia teknisiä kysymyksiä asian tiimoilta:

1. Voinko tehdä ohjelmallisesti kutsuja jollekin Voikon osalle tyyliin
"antaisitko tämän sanan monikkomuodon: koira" -> vastaus: "koirat"? Oma
ohjelmani luonnollisesti pitäisi huolta, että pyydetään järkeviä asioita.
2. (liittyen kysymykseen 1) Onko mahdollista luoda yhdyssanoja? Esimerkiksi
"noita-akka" viivan kera.
3. Toimiakseen stenotyyppimoottori tarvitsee käytetyn kielen sanaston.
Voinko hyödyntää Voikon käyttämiä sanastoja? Kuinka sen lisensointi
soveltuu tällaiseen tarkoitukseen? Oman ohjelmistoni aion julkaista
vapaalla lähdekoodilla ja ilmaiseksi, mikä on käsittääkseni lähellä myös
Voikko-projektin mallia.

Viesti on melko perusteellinen, mutta halusin kertoa hieman taustoja ja
motivaatiota keskustelun pohjaksi.

Mikäli innostustani riittää, voisin nähdä myös itse kirjoittavani em.
ominaisuuksia johonkin Voikon osiin mahdollisuuksien mukaan.


Kiitos kärsivällisyydestänne!
-------------- next part --------------
An HTML attachment was scrubbed...
URL: <http://lists.puimula.org/pipermail/voikko/attachments/20180502/c2b11965/attachment.html>


More information about the voikko mailing list