Symfonia. Biznes gotowy na zmiany

Czym jest technologia OCR i dlaczego jest ona ważna dla biur rachunkowych?

Karol Flaziński

Karol Flaziński

Długość czytania:

21 marca 2022

Czym jest technologia OCR i dlaczego jest ona ważna dla biur rachunkowych?

 

OCR (ang. optical character recognition) to nazwa określająca oprogramowanie do rozpoznawania znaków zapisanych w formie obrazu.

 

Funkcjonalność ta jest szczególnie ważna w obszarach digitalizacji dokumentów, wyszukiwania kontekstowego w dużych zbiorach treści, jak i automatyzacji obiegu informacji w różnego rodzaju procesach biznesowych.

 

Technologia OCR w ostatnich dwóch dekadach uległa dynamicznemu rozwojowi. Obecnie nie polega ona jedynie na rozpoznawaniu pojedynczych znaków budujących tekst, ale całych wyrazów czy bloków tekstu, jak również rozpoznawania odręcznego pisma.

W oprogramowaniu OCR stosuje się rozwiązania oparte na sztucznej inteligencji czy uczeniu maszynowym, pozwalające ciągle poszerzać możliwości automatycznej konwersji tekstu zapisanego w formie obrazu na tekst w wersji elektronicznej. Dobrym przykładem jest tu możliwość stosowania mniej dokładnych obrazów i skanów, zawierających różnego rodzaju zniekształcenia (tzw. szumy), co w praktyce pozwala wykorzystać zdjęcia wykonane na smartfonie, a sam proces OCR może być wykonany przez aplikację mobilną. Inny przykład rozwoju technologii to możliwość odczytu zapisanego tekstu ze zdjęć zrobionych przy różnych odchyleniach od rzutu prostopadłego do wydruku. To wszystko powoduje, że OCR szybko upowszechnia się w praktyce biznesowej.

 

Powszechne i masowe zastosowanie OCR

Jednym z masowych zastosowań OCR jest pozyskiwanie cyfrowej wersji tekstów dostępnych jedynie w postaci analogowej (wydruki, rękopisy, maszynopisy i inne dokumenty). Jest to istota realizowanego od lat procesu digitalizacji zbiorów muzealnych, bibliotek i różnego rodzaju archiwów. Na technologii OCR bazują także usługi monitorowania mediów, polegające na codziennym, stałym wyszukiwaniu kontekstowym zadanych słów i fraz w treściach publikowanych w gazetach i czasopismach.

 

OCR w procesach biznesowych

W biznesie OCR pełni ważną rolę ze względu na potencjalne korzyści. A są nimi oszczędność czasu, redukcja kosztów, wyeliminowanie ludzkich błędów oraz automatyzacja i przyspieszenie obiegu informacji.

Symfonia Obieg Dokumentów - zmiana jakościowa w dziale księgowym

Technologia jest szczególnie przydatna tam, gdzie przetwarzane są różnego rodzaju dokumenty – drukowane lub w wersji elektronicznej – zawierające dane, które powinny w zunifikowanej formie znaleźć się w systemach informatycznych. Dobrym przykładem jest biuro rachunkowe, do którego każdego miesiąca trafiają od klientów tysiące dokumentów – faktur, korekt czy wyciągów bankowych. Dokumenty te pochodzą od niemniejszej liczby podmiotów, a więc mają też różną postać i formę, od zwykłych pdf-ów, przez papierowe wydruki z różnych systemów informatycznych, po odręcznie wypisane rachunki i faktury.

OCR pozwala zautomatyzować zapisane w tych dokumentach dane i przenieść je do systemu finansowo-księgowego, zachowując logikę rozłożenia poszczególnych informacji. W praktyce oznacza to, że pracownicy biura rachunkowego nie muszą przepisywać treści otrzymanych dokumentów do systemu, oszczędzając w ten sposób duże ilości czasu i redukując koszty zatrudnienia.

Podobne korzyści uzyska każda firma, która na większą skalę przetwarza różnego rodzaju formularze, ankiety i inne dokumenty powstające w terenie, których treść na dalszych etapach musi zostać przetworzona przez system informatyczny.

Jak przyspieszyć pracę z dokumentami klienta w biurze rachunkowym?

Nieco historii OCR

Mogłoby się wydawać, że automatyczne identyfikowanie znaków zapisanych w obrazie jest stosunkowo młodą technologią, powstałą w czasie intensywnego rozwoju komputerów i skanerów. Tymczasem pierwsze prace badawcze i wdrożeniowe realizowano na tym polu już ponad 100 lat temu, kiedy jeszcze nikt o komputerach nie słyszał! Irlandzki fizyk i wynalazca, Edmund Fournier d’Albe w roku 1912 r. opatentował urządzenie o nazwie optofon (oryg. optophone) projektowane z myślą o osobach niewidomych.

Optofon wykorzystywał specyficzne właściwości optyczne i elektromagnetyczne selenu. Specjalne detektory tego urządzenia skanowały różnice w jasności i kontraście w kolejnych liniach wydrukowanego tekstu i pozyskany w ten sposób obraz zamieniały na sekwencje różnego rodzaju dźwięków. Nie były to jednak dźwięki choćby zbliżone do ludzkiej mowy, a więc do zrozumienia odczytanego tekstu potrzeba było wielkiej wprawy operatora.

Ponieważ w owym czasie nie było jeszcze możliwe konwertowanie powstałych w ten sposób tonów na dźwięki identyfikowane jako język mówiony, optofon nie miał szans znaleźć szerszego zastosowania w społeczeństwie. Faktem jest jednak, że już na początku XX wieku powstała pierwsza technologia OCR!

Z problemem właściwej konwersji odczytanych z tekstu danych na dźwięki zbliżone do ludzkiej mowy uporał się amerykański naukowiec, Ray Kurzweil, który uchodzi za pioniera w dziedzinie technologii OCR. Ray Kurzweil dokonał przełomowych odkryć na tym polu w drugiej połowie lat 70-tych XX w. a więc w czasie wciąż poprzedzającym okres upowszechniania komputerów w użytku biznesowym i domowym.

Jak przyspieszyć proces przekazywania PIT-11 pracownikom?

Przeglądaj tematy tego artykułu:

0 komentarzy

Wyślij komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *

Powiązane kategorie

Finanse
międzynarodowe

Finanse
na co dzień

Planowanie
biznesowe

Słownik Symfonii

Prowadzenie firmy może być pełne wyzwań, a jednym z nich jest fachowy żargon, który trzeba rozumieć. Nasz słownik wyjaśnia pojęcia w prostych słowach – od A do Z.
Wyświetl słownik