Aplikacje OCR: rozpoznawanie tekstu, listy, programistów, masa programu, funkcje wykonywalne, funkcje, funkcje i opinie użytkowników.

Papier jako główny nośnik informacji stopniowo traci na znaczeniu. Zamiast dokumentów papierowych, jeśli to możliwe, użyj ich wersji elektronicznej. Ale jak przetłumaczyć elektroniczne archiwa do istniejących archiwów? Aby rozwiązać ten problem, stworzono specjalne programy rozpoznające tekst.

Jakie są programy OCR i jak one działają

Te produkty oprogramowania wykorzystujące technologię ORC (optyczne rozpoznawanie znaków) lub ICR (rozpoznawanie znaków). W języku rosyjskim skróty te są tłumaczone jako "optyczne" lub "inteligentne rozpoznawanie znaków". Programy korzystające z OCR działają w ten sposób. Zdjęcie z tekstem otrzymanym ze skanera jest podzielone na wiele fragmentów. Dla każdego z nich program tworzy kilka założeń. Sprawdzając i porównując je ze standardami, każdy fragment daje oszacowanie odpowiadające stopniowi koincydencji. Wybierając największy z nich program "widzi" symbol i wyświetla go w polu wbudowanego edytora tekstu.


IRC działa w ten sam sposób, ale do obsługi znaków używa się sztucznych sieci neuronowych. Główną zaletą tej metody jest zwartość programów i ciągła nauka. Pozwala to na sprawne rozpoznawanie słów pisanych przez człowieka wielkimi literami. Ale ta technologia nie jest w stanie "odczytać" tekstu odręcznego. Dla każdego z istniejących systemów operacyjnych są to własneAplikacje OCR. Najbardziej popularnym systemem Windows jest:
  • ABBYY FineReader;
  • OmniPage;
  • Readiris;
  • Program Samsung Scan OCR;
  • Oprócz oprogramowania komputerowego istnieje wiele internetowych usług rozpoznawania tekstu. Wśród nich najbardziej znane to: FineReader Online, OnlineOCR, FreeOCR.


    ABBYY FineReader 14

    To oprogramowanie zostało opracowane przez krajową firmę ABBYY i jest jednym z najlepszych wśród aplikacji wykorzystujących OCR. Podstawą programu jest oryginalny silnik o nazwie Finereader Engine. Zapewnia następujące funkcje:
  • Szybkie rozpoznawanie drukowanego tekstu z dokładnością większą niż 98%. Niecierpliwość na jakość oryginalnego obrazu. Umożliwia to identyczne rozpoznawanie tekstu zdjęć wykonanych za pomocą skanera lub aparatu fotograficznego.
  • Technologia ADRT pozwala rozpoznać nie tylko tekst, ale także jego formatowanie: czcionkę, wcięcia, akapity, kolumny.
  • Możliwość wielowątkowego przetwarzania obrazu. Pozwala to na użycie wszystkich rdzeni procesora (maksymalnie 4) w celu przyspieszenia procesu rozpoznawania.
  • Obsługuje ponad 190 języków, w tym w alfabecie innym niż łaciński lub cyrylicą (japoński, chiński, arabski).
  • Wbudowany edytor tekstu pozwala sprawdzić wynik rozpoznania lub go edytować.
  • Interakcja z pakietem Office. Umożliwia eksportowanie rozpoznanego tekstu w programie Microsoft Word i Exel w celu dalszego przetwarzania.
  • Zdolność do studiowania programu. Ta funkcja pozwala nauczyć program "odczytywać" określone znaki literowe. Na przykład niestandardowa czcionka lub litery napisane ręką.
  • Praca z PDF. FineReader rozpoznaje tekst, który typ pliku i „szyć” kilka zeskanowanych obrazów w formacie PDF lub PDF /A
  • Główną wadą tego programu jest cena. Niekończąca się licencja na wersję podstawową będzie kosztować 7 tysięcy rubli. Wersje "Biznes" i "Przedsiębiorstwo" - odpowiednio w 12 i 39 tysiącach rubli. Jeśli chcesz korzystać z programu tylko w domu, można pobrać z torrentami trackera łamanego 11 th i 12 th wersji produktu.
    Wymagania:
  • 32 Processor - instrukcja lub 64-bitowy, z 1 GHz i obsługuje zestaw SSE 2. (Intel Celeron M i lepszy, AMD Athlon 64 i lepsze).
  • RAM: 1 GB. Jeśli procesor ma więcej niż 1 jądro, to za każde dodatkowe 512 MB jest wymagane.
  • filmu: te, które o rozdzielczości 1024 x 800.
  • , dysk twardy: 3 GB montażu i eksploatacji.
  • Skaner: obsługuje sterowniki TWAIN i WIA.
  • System operacyjny: Windows 788110.
  • Opinia o FineReader 14

    Mówią o FineReader pozytywny, podkreślając zalety zdolności produktu do rozpoznawania tekstu ze złych egzemplarzach papierowych, wygodny i prosty interfejs oraz dużą szybkością przetwarzanie obrazu. Wśród problemów, które pojawiają się podczas korzystania z programu OCR, niektórzy mówią niewłaściwie menedżer nick obraz pracy. Na przykład: Niewystarczająca praca w celu dostosowania jasności zeskanowanego obrazu.

    OmniPage 18

    Główny konkurent firmy FineReader na rosyjskim rynku programów ORC. Na funkcjonalność jest bardzo podobna do przeciwnika, ale ma kilka różnic:
  • Możliwość uruchomieniaproces skanowania i rozpoznawania za pomocą przycisków skanera.
  • Wsparcie dla czterordzeniowych procesorów. Pozwala to skrócić czas rozpoznawania i konwertować wiele obrazów naraz.
  • Utworzenie biblioteki cyfrowej bukrydera (Kindle e książki.
  • Automatyczne wykrywanie niektórych języków.
  • ,
    Wśród wad programu można zauważyć małą prędkość, porównywalną do 10 wersji FineReader oraz koszt kopii licencji - $ 150.
    Wymagania systemowe:
  • Procesor: x32 lub x64-bit, 1 GHz, Intel Pentium i lepszy, AMD Athlon i lepszy.
  • RAM: 512 MB.
  • Karta graficzna: dowolna, obsługuje rozdzielczość 1024 x 800 i głębię kolorów 16 bitów.
  • ​​
  • Dysk twardy: 11 GB na instalację wszystkich komponentów i 100 MB do pracy.
  • Skaner: obsługuje sterowniki TWAIN, WIA i ISIS.
  • System operacyjny: Windows XP SP3 Vista SP2 x32 /x6478.
  • Opinia o OmniPage

    mówią o niej wstręt, ponieważ problem jest we wszystkich częściach programu, począwszy od piękna, ale niezrozumiałe interfejs, a kończąc na złych informacji tła. Produkt nie jest przystosowany do pracy w WinXP. Może być zmuszony do pracy, ale będzie musiał spędzić trochę czasu. OmniPage ma problemy z rozpoznawaniem. Na przykład: z łatwością rozpoznaje zwykły czarny tekst na kartce papieru z rysunkami, tabelami, uzyskanymi ze skanera. Podczas korzystania z obrazów z aparatu lub telefonu komórkowego dokładność rozpoznawania spada do 70%, co jest bardzo niewygodne w przypadku przetwarzania dużych dokumentów.

    Również 18wersja może się nie uruchomić z powodu błędów w kodzie. Aby rozwiązać ten problem, musisz zainstalować poprawkę 1801.

    Czytaj Iris Pro 17

    Czytaj Iris to program OCR, który przy mniejszej ilości pieniędzy (8000 vs. 12000) może dopasować funkcjonalność i wydajność do wersji FineReader. Wersja profesjonalna ma następujące funkcje:
  • Praca w pełnym wymiarze z PDFem: rozpoznawanie, tworzenie plików dla baz danych, kompresja i głos nad tekstem.
  • Obsługa 140 języków.
  • Rozpoznawanie tabel papierowych i tekstów z możliwością eksportu do Exel i Word.
  • Uzyskiwanie obrazów z dowolnego modelu skanera.
  • Istnieje również wersja korporacyjna, która pozwala chronić pliki PDF ze znakami wodnymi i obsługiwać dokumenty dłuższe niż 50 stron. Wymagania systemowe:
  • Procesor: x86 lub x64 z 1 GHz lub szybszy.
  • RAM: 1 GB.
  • Film: każdy, który obsługuje rozdzielczość 1024 x 800.
  • Dysk twardy: 400 MB dla instalacji.
  • Skaner: obsługuje sterowniki TWAIN, WIA.
  • System operacyjny: Windows 7810 x32 /x64.
  • Opinia o Readiris

    Mówią o tym programie rozpoznawania OCR tekstu jako dobry i szybki PDF to Word Converter z wieloma problemami:
  • Zaawansowany interfejs, w którym początkujący nie jest łatwe do zrozumienia.
  • Automatycznie skanuj dokument po zmianie obszaru skanowania.
  • Złe wsparcie techniczne.
  • Czasami program nie jest aktywowana w wyniku błędów w kodzie programu.
  • Program Samsung Scan OCR - Co to za program?

    Jest to darmowe oprogramowanie, które jest dostarczane wraz z urządzeniem wielofunkcyjnymUrządzenia "3 w 1" (drukarka, skaner, kopiarka) firmy "Samsung". Został opracowany we współpracy z Iris, stworzony ReadIris Pro, zoptymalizowany do pracy z urządzeniem MFP producenta. Z oryginalnego "Czytnika", Samsung Scan ORC ma interfejs, przyciętą funkcjonalność i rozmiar - zajmuje 40 MB na twardym dysku.

    Usługi online

    Są alternatywą dla aplikatorów stacjonarnych wymagających intensywnego korzystania z zasobów. Na przykład OCR to FineReader. Właściwości systemów podobnych projektów pozwalają na rozpoznawanie tekstu z obrazów znacznie szybciej niż na samodzielnym komputerze. Wśród usług związanych z otrzymywaniem tekstu ze zdjęć można wyróżnić trzy z najwygodniejszych: FineReaderOnline, FreeOCR, OnlineOCR.
    Pierwszym z nich jest bezpośredni rozwój stacjonarnej wersji produktu. Po rejestracji nowy użytkownik otrzymuje 10 darmowych stron do przetworzenia i 5 każdego miesiąca. Możesz anulować to ograniczenie, kupując roczną subskrypcję dla 3200550017800 rubli za 20005000 i 10 000 stron, odpowiednio. Jeśli użytkownik ma licencję na program FineReader 14, musi tylko zarejestrować i aktywować go w celu korzystania z wersji online. W takim przypadku otrzyma liczbę stron odpowiadającą typowi zakupionej licencji: Standard (2000), Biznes (5000) lub Przedsiębiorstwo (10 000).
    Usługa onlineOCR.com umożliwia konwersję 15 obrazów /godzinę (ograniczenia dla niezarejestrowanych użytkowników) na tekst i zapisanie ich jako pliki .docx, .xlsx lub .txt. Po zarejestrowaniu staje się dostępna:
  • Zapisywanie .pdf .doc, .xlx, .rtf.
  • Konwertuj wielostronicowe pliki PDF.
  • Liczba stronwzrasta do 50.
  • Jeśli strony nie wystarczą, można je kupić w ilości 50-50000 sztuk.
    Projekt FreeOCR.com różni się od poprzednich pełnych wolnych i bez ograniczeń dotyczących liczby stron przetworzonych. OCR-maszyna strona, która wspiera rosyjski, ukraiński, turecki, wietnamski, a wszystkie języki europejskie - łącznie 29. Jedyną wadą tego portalu jest praca tylko z grafiką, które są ładowane kolejno, jak przetwarzanie kolejka nie jest przewidziana twórców. Wyświetla rozpoznane informacje bez formatowania w formacie TXT.

    Opinia o internetowych-OCR-usług

    Te miejsca są potrzebne w przypadkach, gdy pobranie i zainstalowanie kompletnego programu orków wykonalne. Na przykład, aby wstawić do streszczenia kilka tomów cytatów z książki lub czasopisma. Wśród wad konwencjonalnych pojedynczych miejsc bezpłatne (FineReader) i słabej funkcjonalności (FreeOCR, OnlineOCR). Podsumowując, możemy powiedzieć, że program rozpoznawania OCR tekstu z obrazem lub plików PDF stworzony wiele, aw artykule są tylko najbardziej znanych. Dlatego programy OCR dla skanera każdy użytkownik będzie mógł wybrać się zgodnie z wymaganiami i budżetem. Lub skorzystaj z jednej z wielu bezpłatnych usług OCR.

    Powiązane publikacje