[voikko] Toivomus Webvoikko Html teksti

Jukka K. Korpela jkorpela at cs.tut.fi
Mon Apr 6 01:01:25 EEST 2015


2015-04-05, 23:17, k-veikko kirjoitti:

> Itse tuotan vähäiset html-tekstini käyttäen markdown'ia. Koska olen
> ulkoasun suhteen melkoinen friikki, käytän myös tasattua (justified)
> tekstiä.  Voikko on oivallinen tavuttaja!

Aivan. Oivallinen, mutta ei täydellinen.

> Voikkohyphenate'n -s optio ilmeisesti hyväksyy vain yhden merkin. Miten
> saan tavutuskohdan merkittyä useammalla merkillä? Tässä tapauksessa
> ­ (siis: &-s-h-y-;).

Miksi et merkitsisi sitä sillä merkillä, jota ­ HTML:ssä tarkoittaa, 
siis U+00AD SOFT HYPHEN? Entiteetti/merkkiviittaus ­ on tarkoitettu 
tilanteisiin, joissa merkkiä itseään ei voi kirjoittaa, eikä sellaisia 
tilanteita juuri pitäisi olla nykymaailmassa. Toki pehmeän tavuviivan 
kirjoittaminen voi vaatia jotain erikoista, mutta se riippuu 
käyttöympäristöstä.

> Toisekseen haluaisin jättää sanaan sisältyvän tavuviivan kohdan
> tavuttamatta:
> Nyt: voikkohyphenate -s* tavuttaa keto-orvokki -> ke*to*-or*vok*ki
> Haluaisin tavutuksen: keto-orvokki -> ke*to-or*vok*ki

En ymmärrä miksi. Normaalistihan yhdysmerkin kohdalta tavuttaminen on 
paras mahdollinen tavutuskohta, paitsi joskus sisäkkäisissä 
yhdyssanoissa. Mutta jos todella haluat sitä, niin merkkien tasolla 
oikea merkki on U+2011 NON-BREAKING HYPHEN. Tällöin on kuitenkin 
otettava huomioon, että a) käytettävä taitto-ohjelma ei ehkä ymmärrä 
sitä, b) se ei välttämättä sisälly käytössä olevaan fonttiin ja c) jos 
sisältyy, sen ulkoasu voi olla erilainen kuin ns. tavallisen yhdysmerkin 
eli U+002D HYPHEN-MINUS (joka voi olla sama tai eri merkki kuin se, jota 
taitto-ohjelma käyttää tavutuksessa generoituvana tavuviivana).

> Sitten asiaan. Feature request.
> -------------------------------
>
> Sivulle
> http://joukahainen.puimula.org/webvoikko/hyphenate
>
> Haluaisin vielä kolmannen option näiden lisäksi:
>
> Merkitse tavurajat
>      yhdysmerkillä
>      vaihtuvalla taustavärillä
>
> kolmas vaihtoehto:
>      Tasattu (justified) html teksti

Tuo tuntuu oudolta, koska tavuttimen asiana ei pitäisi olla puuttua 
tasaukseen saati sitten ylemmän protokollatason (kuten HTML:n) asioihin.

> Tässä jäi vielä ongelmaksi miten http-alkuiset yms. merkkijonot jätetään
> kokonaan tavuttamatta.

Sekin on ylemmän protokollatason asia. HTML:n <nobr> (epästandardi, 
mutta selainten universaalisti tukema) tai CSS:n white-space: nowrap 
hoitanee tuon siinäkin tapauksessa, että tavutin lisää merkkijonoon 
pehmeitä tavuviivoja. Sorry, tästä en ole ihan varma enkä jaksa nyt 
(toipilaana) tarkistaa.

> Netissä nähtyä
> --------------
>
> http://softhyphen.com/hyphenate
> on aika hyvä. En tiedä mitä algoritmia tuo käyttää.

Todennäköisesti aika huonoa. Kokeilepa, mitä mieltä se on sanasta ”maanosa”.

Yucca




More information about the voikko mailing list