Test konvertorů kódování češtiny

Na následujících řádkách je porovnáno celkem 110 převodníků kódování české diakritiky pro operační systémy DOS, Windows 3.1, Windows 95, Windows NT a Linux (nebo Unix).
Testoval jsem konvertory, které můžete najít na Internetu, na CD-ROM přílohách časopisu CHIP a na BBS Infima.

Při testování jsem se zaměřil na několik vlastností, které mě připadaly na programech tohoto typu nejdůležitější. Za základní parametr považuji rychlost zpracování souboru, počet podporovaných kódování diakritiky a kvalitu převodu textu (výsledek významově co nejvíce odpovídá originálu).

Jako další rys je zahrnut typ ovládání programu. Program ovládaný pomocí parametrů se snadno používá při dávkovém zpracování nebo z jiného programu. A pro ruční převod souboru je zase vhodnější vybírat příkazy z menu.

Celkem 22 programů dokonce zrychluje práci automatickou detekcí vstupního kódování. Programu stačí pouze sdělit do jakého kódu se má text převést a program vše ostatní včetně rozpoznání zdrojového kódu a překódování vykoná sám.

Testování programů probíhalo na PC s procesorem Pentium 133 MHz, 256 KB L2 cache, 48 MB RAM pod operačním systémem Windows 95. Na pozadí neběžela žádná aplikace kromě ovladačů sítě. Každý program jsem čtyřikrát spustil na celé obrazovce a měřil potřebný čas k převodu textového souboru o velikosti 633226 Bytů z kódování PC Latin 2 do KeybCS2. Při prvním běhu se naplnila disková cache a z dalších tří časů jsem vypočetl průměrnou dobu konverze. Tím se vyloučilo zpomalování programu diskovými operacemi, protože soubor se nenačítal přímo z disku, ale z diskové mezipaměti.

Přehled novinek

23. 1. 2019
Tentokrát jen jedna zajímavá novinka s velkým potenciálem, kterou už nejde přesně porovnat s ostatními – EuroConvertor Pavla Šrubaře.
3. 9. 2004
4 novinky: AnyCZ 3.5, CS, Convertor 0.99b, Konvertor 1.6
aktualizace: CE Konvertor 3.2 (rychlejší), cstocs 3.5, Text Encoding Convertor 3.0 (rychlejší), WinDia 1.0 (release), WinKonve 2.52
8. 10. 2002
12 novinek: BCKCZ, CodePage 1.1, Convert 2.00, CSCNV, CvFile, CZW, Che, Kod_cz 1.14, Konvert 1.11, Konverze 2.2, Konverze češtin 1.09.3, MultiCod 1.2
aktualizace: CopyCZ 2.0, cstocs 3.3, CZKonverze 3.5, Enca 0.10.3, Kodovani 2.02, Konvert 2.2, Konvertor 2001.10.31, konWert 3.01, Převod 1.04, WinDIA 1.0b8

Abecední seznam testovaných konvertorů

A – B – C
AnyCZ 3.5, BCKCZ, CCC 1.0, CCF 1.2, CE Konvertor 3.2, Ceske hacky, CESKONV, Cestina 1.0, Co 1.01.02, CodeConv 2.7, CodePage 1.1, con2 2.00, Con-Text 0.2, CONVCZ, Convert 2.00, Convert 2.2, Convert 2.20, Convertor 0.99b, Convertor 1.5, CONVX, CopyCZ 2.0, CP1250, CS, CS konvertor, CS_Conv, CS2CS 2.92, CS2CZ 1.1, CSCNV, CSCNV 1.0, CSCONV 1.0, CsToCs 1.0, cstocs 3.5, CsToCs2, CvFile, CZ Converter 1.0, CZCODE 1.1, CZCONV 1.01, CZConvert 1.0, CZKonv 3.0, CZKonverze 3.5, CZW, CZX 2.0, Češtin, Čeština 1.1
D – E – F – G – CH – J – K
Dia 1.7, Enca 0.10.3, Encoding Analyzer, EuroConvertor**, File Converter, FILT 1.0, GNU Recode 3.4, Che, JUK 1.0alfa, KAMLAT 3.2, Kod_cz 1.14, Kodovani 1.2, Kodovani 2.02, KONVCS 1.2, Konvert, Konvert 1.0, Konvert 1.00b, Konvert 1.11, Konvert 2.05, Konvert 2.2, Konvert 2.5, Konvert 3.0.05, Konvertor 1.2, Konvertor 1.6, Konvertor 1999.02.18, Konvertor 2001.10.31, Konverze 1.0, Konverze 2.0, Konverze 2.2, Konverze 3.1.4.67, Konverze češtin 1.09.3, konWert 3.01, KTXT
L – M – N – O
La2Win 1.0, LKW 98.08, LKW32 2001.11, LKWIN 98.08, Micro Convert, Mlátička 5.0, Motal conv 2000, Motal konverze, MultiCod 1.2, Networ konverze, NTCPConv 1.0.1, OKKONV 2.01
P – S – T – U – W
Prekoder 3.4, Prekodér32 4.0, Prevod-MR, Prevod-JV, Prevod 2.0, Prevod 3.1, PrevodCZ 2.1, Převod 1.04, SKCONV, SuperCS 7.01, Text converter 2.4.1, Text Encoding Convertor 3.0, Tran 2.03, Tran 2.04, Trans-ASCII, Trans 1.0/95, UniConvd, Win2Kam 1.1, WinDIA 1.0, WinKonve 2.52, Wkontext 1.09

Výkon nejrychlejších konvertorů (v KB/s)

1. Převod 1.04 10571*
2. CCF 1.2 7595*
3. CopyCZ 2.0 6987*
4. Dia 1.7 6680*
5. CodePage 1.1 6362*
6. Tran 2.03 6141*
7. WinDIA 1.0 6063*
8. File Converter 6061*
9. Konvert 2.2 5975*
10. CS_Conv 5950*
11. Konvertor 2001.10.31 5622*
12. FILT 1.0 5410*
13. Konvert 2.5 5349*
14. Wkontext 1.09 5153*
15. Kodovani 2.02 4987*
16. CZCODE 1.1 4923*
17. Prevod 2.0 4888*
18. Co 1.01.02 4847*
19. T.E.C. 3.0 4757*
20. Enca 0.10.3 4417*

* rychlost převodu v KB/s (kilobajt za sekundu)

Ostatní konvertory

  1. Konverze 2.2 (4355 KB/s)
  2. Tran 2.04 (4335 KB/s)
  3. Prevod-MR (4102 KB/s)
  4. CCC 1.0 (4029 KB/s)
  5. CZX 2.0 (3740 KB/s)
  6. Kodovani 1.2 (3638 KB/s)
  7. SUPERCS 7.01 (3160 KB/s)
  8. OKKONV 2.01 (3068 KB/s)
  9. CONVX (2968 KB/s)
  10. Čeština 1.1 (2845 KB/s)
  11. Networ konverze (2711 KB/s)
  12. CZKonverze 3.5 (2474 KB/s)
  13. Kod_cz 1.14 (2295 KB/s)
  14. CZCONV 1.01 (2273 KB/s)
  15. UniConvd (2146 KB/s)
  16. Češtin (1932 KB/s)
  17. NTCPConv 1.0.1 (1865 KB/s)
  18. Konvertor 1999.02.18 (1698 KB/s)
  19. CS (1607 KB/s)
  20. Konvertor 1.6 (1586 KB/s)
  21. CZ Converter 1.0 (1518 KB/s)
  22. CP1250 (1449 KB/s)
  23. CZKonv 3.0 (1445 KB/s)
  24. GNU Recode 3.4 (1258 KB/s)
  25. CE Konvertor 3.2 (1085 KB/s)
  26. con2 2.00 (1037 KB/s)
  27. CONVCZ (1029 KB/s)
  28. CodeConv 2.7 (1026 KB/s)
  29. KTXT (1000 KB/s)
  30. CSCNV (942 KB/s)
  31. Text converter 2.4.1 (812 KB/s)
  32. CZConvert 1.0 (736 KB/s)
  33. konWert 3.01 (699 KB/s)
  34. Prekodér32 4.0 (638 KB/s)
  35. La2Win 1.0 (578 KB/s)
  36. SKCONV (576 KB/s)
  37. CS konvertor (538 KB/s)
  38. CsToCS 1.0 (523 KB/s)
  39. Convert 2.20 (491 KB/s)
  40. Konverze 2.0 (456 KB/s)
  41. Cestina 1.0 (452 KB/s)
  42. Konvert (447 KB/s)
  43. CESKONV (388 KB/s)
  44. Konverze češtin 1.09.3 (377 KB/s)
  45. Prevod-JV (373 KB/s)
  1. Mlátička 5.0 (366 KB/s)
  2. CvFile (366 KB/s)
  3. Trans 1.0/95 (351 KB/s)
  4. Che (346 KB/s)
  5. Prekoder 3.4 (334 KB/s)
  6. Convert 2.00 (315 KB/s)
  7. Win2Kam 1.1 (257 KB/s)
  8. CS2CS 2.92 (252 KB/s)
  9. LKWIN 98.08 (238 KB/s)
  10. Konvert 2.05 (230 KB/s)
  11. CS2CZ 1.1 (221 KB/s)
  12. cstocs 3.5 (220 KB/s)
  13. Ceske hacky (204 KB/s)
  14. Prevod 3.1 (192 KB/s)
  15. KONVCS 1.2 (188 KB/s)
  16. Convertor 0.99b (185 KB/s)
  17. Con-Text 0.2 (167 KB/s)
  18. Trans-ASCII (165 KB/s)
  19. JUK 1.0 alfa (161 KB/s)
  20. KAMLAT 3.2 (147 KB/s)
  21. BCKCZ (145 KB/s)
  22. CSCONV 1.0 (113 KB/s)
  23. Konvert 3.0.05 (97 KB/s)
  24. Konvert 1.11 (64,6 KB/s)
  25. Konvert 1.0 (58,3 KB/s)
  26. AnyCZ 3.5 (54 KB/s)
  27. Encoding Analyzer (43,7 KB/s)
  28. CSCNV 1.0 (24,5 KB/s)
  29. CsToCs2 (18,4 KB/s)
  30. WinKonve 2.52 (14,7 KB/s)
  31. Convertor 1.5 (13,7 KB/s)
  32. MultiCod 1.2 (13 KB/s)
  33. Konverze 1.0 (12,8 KB/s)
  34. Konverze 3.1.4.67 (10,1 KB/s)
  35. Micro Convert (9,25 KB/s)
  36. Konvertor 1.2 (9,2 KB/s)
  37. Motal konverze (8,95 KB/s)
  38. Konvert 1.00b (4,5 KB/s)
  39. LKW 98.08 (4,1 KB/s)
  40. CZW (3,57 KB/s)
  41. LKW32 2001.11 (1,85 KB/s)
  42. Motal conv 2000 (0,73 KB/s)
  43. Convert 2.2
  44. PrevodCZ 2.1
  45. EuroConvertor (1500–2000 KB/s**)

Konverze více malých souborů

Čtrnáct nejrychlejších konvertorů, podporujících převod více souborů najednou, prošlo dalším výkonnostním testem. K testování bylo použito 600 souborů o celkové velikosti 6,4 MB, které byly převáděny z kódování cp1250 do KeybCS2. Jednou se zapnutým výpisem informací na obrazovku a podruhé s potlačeným (jak můžete vidět v tabulce, časy se podstatně liší). K testování posloužil PC s procesorem Pentium II 400 MHz, 128 MB SDRAM a OS Windows 95.

Oproti prvnímu testu se pořadí značně promíchalo. Při zmenšování velikosti a při rostoucím počtu souborů se převod zpomaluje, protože je nutno provádět stále více operací vyhledání, otevření a uzavření souboru – vlastní konverze kódování diakritiky trvá jen zlomek času. Na testovacím počítači je potřeba 1,4 ms pro vyhledání, otevření a uzavření jednoho souboru, což je při počtu 600 souborů celková ztráta 1,68 s. Výpočet: 2*600*1,4 ms = 1680 ms = 1,68 s [pozn.: 600 vstupních a 600 výstupních souborů]. Testované programy jsou proto mnohem pomalejší než v prvním testu.

                        se zobr.  bez zobr.
                          [s]       [s]
 1. Tran 2.04              -        1,16*
 2. Tran 2.03              -        1,66*
 3. Dia 1.7               3,13      1,81
 4. Převod 1.02           3,33      1,98
 5. Networ konverze       3,73      2,09
 6. OKKONV 2.01           7,94      2,54
 7. Češtin                2,60       -
 8. Konvertor 2000.09.28  3,38       -
 9. Kodovani 1.5           -        4,07
10. NTCPConv              5,58      4,48
11. UniConvd              6,09      4,85
12. File Converter        7,62      6,68
13. CZKonv 3.0           11,47      8,32
14. Konvert 2.1         176,00       -

*Pozn.: Tran vytvoří jeden velký výstupní soubor

Rychlost konvertorů se zapnutou autodetekcí kódování češtiny:

                   se zobr.  bez zobr.
                     [s]       [s]
1. Dia 1.7           3,68       -
2. Převod 1.02       3,80      2,07
3. OKKONV 2.01       8,10      2,66
4. Tran 2.04         4,02*      -
5. Tran 2.03         5,71*      -
6. Networ konverze  16,05     14,88
7. Konvert 2.1     132,00       -

*Pozn.: Tran vytvoří jeden velký výstupní soubor

Program Konvert 2.1 byl kupodivu se zapnutou autodetekcí rychlejší než bez ní. Nejpomalejší autodetekce je u programu Networ konverze (12,3 sec).