[voikko] Tilastoja
Harri Pitkänen
hatapitk at iki.fi
Sat Jan 17 12:28:20 EET 2009
On Thursday 15 January 2009, Teemu Likonen wrote:
> $ git shortlog -ns -- ./suomimalaga/
>
> 488 Harri Pitkänen
> 444 Teemu Likonen
> 136 Hannu Väisänen
Näissä luvuissa ovat siis mukana myös Joukahaisesta tuodut sanastopäivitykset.
Koska sanastoa muuttanut henkilö ei useinkaan ole sama kuin se, joka vei
muutokset versionhallintaan, poimin hiukan lisää mielenkiintoista tietoa
suoraan Joukahaisesta tältä aamulta.
Ensimmäisenä uusien sanatietueiden lisäykset ensin tekijöittäin, sitten
vuosittain. Vaikka kaikki Joukahaisen käyttäjät tämän tietävätkin, niin
muistutan muuta yleisöä siitä, että yksittäinen sanatietue Joukahaisessa voi
sisältää useita "sanakirjasanoja", joten nämä luvut aliarvioivat rankasti
todellisten lisättyjen sanojen määrää:
joukahainen=> select u.uname, u.firstname, u.lastname, count(*) as uudet_sanat
joukahainen-> from word w, appuser u
joukahainen-> where w.cuser = u.uid
joukahainen-> group by u.uname, u.firstname, u.lastname
joukahainen-> order by uudet_sanat desc;
uname | firstname | lastname | uudet_sanat
-----------------+-----------+-----------+-------------
malagaconverter | | | 22845
hatapitk | Harri | Pitkänen | 2154
jeangel | Hannu | Väisänen | 2094
tlikonen | Teemu | Likonen | 1790
kanttu | Tero | Kuparinen | 773
rtomperi | Reijo | Tomperi | 10
ikantonen | Ilpo | Kantonen | 5
(7 rows)
joukahainen=> select extract(year from ctime) as vuosi, count(*) as
uudet_sanat
joukahainen-> from word
joukahainen-> group by vuosi
joukahainen-> order by vuosi;
vuosi | uudet_sanat
-------+-------------
2006 | 24143
2007 | 3077
2008 | 2308
2009 | 143
(4 rows)
Sitten muutokset sanatietueisiin. Nämä luvut kuvaavat käytännössä
yksittäisiä "Tallenna"-painikkeen painalluksia, eli tapahtumia, joissa yhtä
tai useampaa sanan attribuuttia on muutettu ja/tai sanan muutoshistoriaan on
lisätty kommentti.
joukahainen=> select u.uname, u.firstname, u.lastname, count(*) as muutokset
joukahainen-> from event e, appuser u
joukahainen-> where e.euser = u.uid
joukahainen-> group by u.uname, u.firstname, u.lastname
joukahainen-> order by muutokset desc;
uname | firstname | lastname | muutokset
-----------------+-----------+-----------+-----------
tlikonen | Teemu | Likonen | 10207
hatapitk | Harri | Pitkänen | 5920
jeangel | Hannu | Väisänen | 4537
kanttu | Tero | Kuparinen | 1436
rtomperi | Reijo | Tomperi | 10
ikantonen | Ilpo | Kantonen | 1
malagaconverter | | | 1
(7 rows)
joukahainen=> select extract(year from etime) as vuosi, count(*) as muutokset
joukahainen-> from event
joukahainen-> group by vuosi
joukahainen-> order by vuosi;
vuosi | muutokset
-------+-----------
2006 | 5325
2007 | 12000
2008 | 4479
2009 | 308
(4 rows)
Jos joku näistä tilastoista innostuneena haluaa ryhtyä metsästämään itselleen
mainetta ja kunniaa, niin se kyllä onnistuu. Tarjolla on helppojakin
tehtäviä, joihin ei tarvita syvällistä ymmärtämistä Voikon ja Joukahaisen
toiminnasta, mutta joissa pääsee tekemään muutoksia moniin tietueisiin ja
siten kilpailemaan kärkisijoista näissä tilastoissa :) Perussanaston sanojen
lisääminen ja sanojen luokitteleminen ovat sen sijaan sellaisia tehtäviä,
joihin on jonkin verran perehdyttävä ennen kuin niitä voi ryhtyä
menestyksekkäästi tekemään.
Harri
More information about the voikko
mailing list