Test skanerów płaskich Umaxa: Astra 4600 i 4900 Autor: NimnuL | Data: 29/04/04
|
|
OCR (Optical Character Recognition)
Oprogramowanie ściśle powiązane ze skanerami. Służy do rozpoznawania i zamieniania tekstu z postaci bitowej (zeskanowanej) na postać tradycyjną, tekstową. Dzięki temu można dokonywać pełnej edycji na skanowanych dokumentach.
Podczas tekstu napotkałem na mały problem. Okazało się, że musiałem odinstalować kompletnie poprzedni skaner (Plustek OpticPro U16B). Fine Reader 5 Sprint nie znajdował bowiem innych skanerów. W systemie zainstalowane mogło być tylko jedno urządzenie. W liście skanerów w programie widoczny był tylko jeden skaner. Dopiero przeinstalowanie oprogramowania OCR usunęło ten mankament.
Poniższe testy OCR wykonałem przy użyciu skanera Astra 4600 (wyniki z Astra 4900 były identyczne) oraz oprogramowania ABBYY FineReader 5.0 Sprint.
Produkt firmy ABBYY sprawuje się znakomicie. Nie od parady nazywany jest najlepszym w swojej dziedzinie. Jak można się przekonać, popełnione błędy są nieliczne.
Rozpoznawanie tabeli:
(kliknij, aby powiększyć)
Daje bardzo dobry wynik nawet podczas skanowania z rozdzielczością 200dpi:
(kliknij, aby powiększyć)
Jednak optymalne rezultaty otrzymuje się w rozdzielczości 300dpi i taką radzę ustawiać jako minimalną.
(kliknij, aby powiększyć)
Litery zaznaczone kolorem błękitnym oznaczają brak pewności co do ich poprawnego rozpoznania przez program. W efekcie okazało się, że znakomita większość była prawidłowa a faktycznych błędów było bardzo niewiele.
A tak to wygląda po imporcie do Excela: ściągnij plik .zip.
Tekst na czarnym tle również został prawidłowo rozpoznany:
(kliknij, aby powiększyć)
Tekst w kolumnach (patrz: OCR text.doc) również nie sprawił problemu oprogramowaniu.
(kliknij, aby powiększyć)
|