[voikko] voikko Digest, Vol 120, Issue 1
Eero Hauskamaa
eero.hauskamaa at gmail.com
Fri May 4 10:53:34 EEST 2018
Hei
Kiitos yhteydenotostasi. Projektisi vaikuttaa kiinnostavalta avaukselta, myös näin satunnaisesti voikon sanastojen parissa puuhastelleesta listalaisesta. Jätän täten voikon teknisen kommentoinnin pidempään mukana olleille jäsenille, mutta jos haluat saada vastauksia laajemmin puheteknologioiden puolelta niin ainakin allekirjoittanut on käytettävissä. Vuosien ajan puheteknologiaa seuranneelle näkövammaiselle puhesynteesin tekemät väärät tulkinnat ovat tuttu juttu. Toisin sanoen jos pienelle kielialueelle halutaan toimiva oikoluku tai muu vastaava järjestelmä niin omat toteutukset ovat lähes välttämättömiä.
Ps voin tarvittaessa vastailla myös listan ulkopuolelta. Puhesynteesien nykykehityksestä käydään näkövammaisten keskuudessa ajoittain melko kipakkaa keskustelua.
T. Eero hauskamaa
n
> voikko-request at lists.puimula.oi 3.5.2018 kello 12.00:
>
> Send voikko mailing list submissions to
> voikko at lists.puimula.org
>
> To subscribe or unsubscribe via the World Wide Web, visit
> https://lists.puimula.org/listinfo/voikko
> or, via email, send a message with subject or body 'help' to
> voikko-request at lists.puimula.org
>
> You can reach the person managing the list at
> voikko-owner at lists.puimula.org
>
> When replying, please edit your Subject line so it is more specific
> than "Re: Contents of voikko digest..."
>
>
> Today's Topics:
>
> 1. Voinko käyttää Voikkoa sanojen ohjelmalliseen
> "kasaamiseen" (Mika Vilpas)
>
>
> ----------------------------------------------------------------------
>
> Message: 1
> Date: Wed, 2 May 2018 23:25:52 +0300
> From: Mika Vilpas <mika.vilpas at gmail.com>
> To: voikko at lists.puimula.org
> Subject: [voikko] Voinko käyttää Voikkoa sanojen ohjelmalliseen
> "kasaamiseen"
> Message-ID:
> <CADNKeCsAogsKVwKTt7=HfQRKdgjTNMud5CeX44oED47cOqLEcg at mail.gmail.com>
> Content-Type: text/plain; charset="utf-8"
>
> Hei,
>
> ensinnäkin valtava hatunnosto Voikko-projektin parissa toimineille.
> Mielestäni tämä on malliesimerkki avoimen lähdekoodin projekteista.
>
> Menen suoraan asiaan: tavoitteenani on suunnitella koneellinen
> pikakirjoitusjärjestelmä Suomen kielelle. Olen viime kuukausina opiskellut
> englanninkielisiä vastaavia toteutuksia, ja todennut, että suomalaista
> vastaavaa ei liene olemassa.
>
> Koska tämä kirjoitustapa on Suomessa (ilmeisesti) aika tuntematon ilmiö,
> suonette anteeksi, että kirjoitan muutaman virkkeen verran siitä, mistä
> siinä on kysymys. Taustatarina on siis pitkä, mutta viestin lopussa on
> Voikkoa ja siihen liittyviä projekteja koskevia kysymyksiä, joihin
> toivoisin saavani vastauksia.
>
> Yhdysvalloissa ja Briteissä tämä tunnetaan nimellä stenography, ja sitä
> käytetään oikeussaleissa istunnon tapahtumien kirjaamiseen, sekä
> tv-lähetysten live-tekstitykseen. Lähteideni mukaan tavallisen keskustelun
> nopeus on (Englannin kielellä) 200-240 sanaa minuutissa, minkä vuoksi
> yleisen näppäimistön käyttö ei mitenkään riitä tämän kirjaamiseen
> (näppäimistö jää 100-150 sanaan minuutissa).
>
> Stenografiassa käytetään erityistä stenotype-nimistä kirjoitinlaitetta,
> joka muistuttaa muuten näppäimistöä, paitsi että siinä on paljon vähemmän
> näppäimiä. Laitetta käytetään painamalla näppäimiä samaan aikaan alas,
> hieman kuin soittaisi sointuja pianon koskettimilla. Tietokoneella oleva
> ohjelmisto tunnistaa painetut "soinnut", hakee sanastostaan oikean sointua
> vastaavan sanan, ja tulostaa sen kirjoittajan ruudulle.
>
> Suomenkieliseen järjestelmään olen kaavaillut alustavasti sellaista
> rakennetta, että käyttäjä voisi kirjoittaa sanoja esimerkiksi näiden
> esimerkkien mukaan:
>
> (esimerkkien muoto on jokin kirjoittimen kirjainyhdistelmä (sointu), sen
> jälkeen / -merkki tarkoittaa seuraavaa painallusta (sointua))
>
> KOIR
> (Käyttäjä on painanut soinnussa neljä näppäintä samaan aikaan alas,
> näytölle tulostuu sana "Koira". Tarkoitus on siis kirjoittaa tai tavuttaa
> sanavartalo)
>
> KOIR / -T
> "Koirat" (T-painike muuttaa edellisen sanan monikkomuotoon)
>
> KOIR / -N
> "Koiran" (N-painike lisää genetiivin)
>
> KOIR / -NT
> "Koirien" (monikon genetiivi)
>
> KOIR / -L
> "Koiralla" (L-painike muuttaa edellisen sanan nominatiivista adessiiviksi)
>
> KOIR / -LT
> "Koirilla" (monikon adessiivi)
>
>
>
> Tässä Voikkoa koskevia teknisiä kysymyksiä asian tiimoilta:
>
> 1. Voinko tehdä ohjelmallisesti kutsuja jollekin Voikon osalle tyyliin
> "antaisitko tämän sanan monikkomuodon: koira" -> vastaus: "koirat"? Oma
> ohjelmani luonnollisesti pitäisi huolta, että pyydetään järkeviä asioita.
> 2. (liittyen kysymykseen 1) Onko mahdollista luoda yhdyssanoja? Esimerkiksi
> "noita-akka" viivan kera.
> 3. Toimiakseen stenotyyppimoottori tarvitsee käytetyn kielen sanaston.
> Voinko hyödyntää Voikon käyttämiä sanastoja? Kuinka sen lisensointi
> soveltuu tällaiseen tarkoitukseen? Oman ohjelmistoni aion julkaista
> vapaalla lähdekoodilla ja ilmaiseksi, mikä on käsittääkseni lähellä myös
> Voikko-projektin mallia.
>
> Viesti on melko perusteellinen, mutta halusin kertoa hieman taustoja ja
> motivaatiota keskustelun pohjaksi.
>
> Mikäli innostustani riittää, voisin nähdä myös itse kirjoittavani em.
> ominaisuuksia johonkin Voikon osiin mahdollisuuksien mukaan.
>
>
> Kiitos kärsivällisyydestänne!
> -------------- next part --------------
> An HTML attachment was scrubbed...
> URL: <http://lists.puimula.org/pipermail/voikko/attachments/20180502/c2b11965/attachment-0001.html>
>
> ------------------------------
>
> Subject: Digest Footer
>
> _______________________________________________
> voikko mailing list
> voikko at lists.puimula.org
> https://lists.puimula.org/listinfo/voikko
>
>
> ------------------------------
>
> End of voikko Digest, Vol 120, Issue 1
> **************************************
More information about the voikko
mailing list