[voikko] tokens-funktion nopeus
Hannu Väisänen
hannu.vaisanen at uef.fi
Sat Jan 9 12:45:55 EET 2016
Harri kirjoitti:
> Nyt tuo toimii kuten pitääkin, 5 miljoonan merkin teksti meni läpi noin 10
> sekunnissa.
Minun testi antaa eri tuloksen.
718483 merkin tiedosto vie noin 7 minuuttia.
Size 718483
Sat Jan 09 12:19:59 EET 2016
Sat Jan 09 12:26:48 EET 2016
Koodia:
private static StringBuilder sb = new StringBuilder();
private final static char[] buffer = new char[8192];
private static void fillBuffer (Reader input) throws IOException
{
int len;
sb.setLength (0);
while ((len = input.read (buffer)) > 0) {
sb.append (buffer, 0, len);
}
}
fillBuffer (reader);
final String STRING = sb.toString();
System.out.println ("Size " + STRING.length());
System.out.println ((new Date()));
List<Token> list = voikko.tokens (STRING);
System.out.println ((new Date()));
More information about the voikko
mailing list