[voikko] Tilastoja

Harri Pitkänen hatapitk at iki.fi
Sat Jan 17 12:28:20 EET 2009


On Thursday 15 January 2009, Teemu Likonen wrote:
> $ git shortlog -ns -- ./suomimalaga/
>
>    488  Harri Pitkänen
>    444  Teemu Likonen
>    136  Hannu Väisänen

Näissä luvuissa ovat siis mukana myös Joukahaisesta tuodut sanastopäivitykset. 
Koska sanastoa muuttanut henkilö ei useinkaan ole sama kuin se, joka vei 
muutokset versionhallintaan, poimin hiukan lisää mielenkiintoista tietoa 
suoraan Joukahaisesta tältä aamulta.


Ensimmäisenä uusien sanatietueiden lisäykset ensin tekijöittäin, sitten 
vuosittain. Vaikka kaikki Joukahaisen käyttäjät tämän tietävätkin, niin 
muistutan muuta yleisöä siitä, että yksittäinen sanatietue Joukahaisessa voi 
sisältää useita "sanakirjasanoja", joten nämä luvut aliarvioivat rankasti 
todellisten lisättyjen sanojen määrää:

joukahainen=> select u.uname, u.firstname, u.lastname, count(*) as uudet_sanat
joukahainen-> from word w, appuser u
joukahainen-> where w.cuser = u.uid
joukahainen-> group by u.uname, u.firstname, u.lastname
joukahainen-> order by uudet_sanat desc;
      uname      | firstname | lastname  | uudet_sanat
-----------------+-----------+-----------+-------------
 malagaconverter |           |           |       22845
 hatapitk        | Harri     | Pitkänen  |        2154
 jeangel         | Hannu     | Väisänen  |        2094
 tlikonen        | Teemu     | Likonen   |        1790
 kanttu          | Tero      | Kuparinen |         773
 rtomperi        | Reijo     | Tomperi   |          10
 ikantonen       | Ilpo      | Kantonen  |           5
(7 rows)

joukahainen=> select extract(year from ctime) as vuosi, count(*) as 
uudet_sanat
joukahainen-> from word
joukahainen-> group by vuosi
joukahainen-> order by vuosi;
 vuosi | uudet_sanat
-------+-------------
  2006 |       24143
  2007 |        3077
  2008 |        2308
  2009 |         143
(4 rows)


Sitten muutokset sanatietueisiin. Nämä luvut kuvaavat käytännössä 
yksittäisiä "Tallenna"-painikkeen painalluksia, eli tapahtumia, joissa yhtä 
tai useampaa sanan attribuuttia on muutettu ja/tai sanan muutoshistoriaan on 
lisätty kommentti.

joukahainen=> select u.uname, u.firstname, u.lastname, count(*) as muutokset
joukahainen-> from event e, appuser u
joukahainen-> where e.euser = u.uid
joukahainen-> group by u.uname, u.firstname, u.lastname
joukahainen-> order by muutokset desc;
      uname      | firstname | lastname  | muutokset
-----------------+-----------+-----------+-----------
 tlikonen        | Teemu     | Likonen   |     10207
 hatapitk        | Harri     | Pitkänen  |      5920
 jeangel         | Hannu     | Väisänen  |      4537
 kanttu          | Tero      | Kuparinen |      1436
 rtomperi        | Reijo     | Tomperi   |        10
 ikantonen       | Ilpo      | Kantonen  |         1
 malagaconverter |           |           |         1
(7 rows)

joukahainen=> select extract(year from etime) as vuosi, count(*) as muutokset
joukahainen-> from event
joukahainen-> group by vuosi
joukahainen-> order by vuosi;
 vuosi | muutokset
-------+-----------
  2006 |      5325
  2007 |     12000
  2008 |      4479
  2009 |       308
(4 rows)


Jos joku näistä tilastoista innostuneena haluaa ryhtyä metsästämään itselleen 
mainetta ja kunniaa, niin se kyllä onnistuu. Tarjolla on helppojakin 
tehtäviä, joihin ei tarvita syvällistä ymmärtämistä Voikon ja Joukahaisen 
toiminnasta, mutta joissa pääsee tekemään muutoksia moniin tietueisiin ja 
siten kilpailemaan kärkisijoista näissä tilastoissa :) Perussanaston sanojen 
lisääminen ja sanojen luokitteleminen ovat sen sijaan sellaisia tehtäviä, 
joihin on jonkin verran perehdyttävä ennen kuin niitä voi ryhtyä 
menestyksekkäästi tekemään.

Harri



More information about the voikko mailing list