Długość czytania:
Czym jest technologia OCR i dlaczego jest ona ważna dla biur rachunkowych?
OCR (ang. optical character recognition) to nazwa określająca oprogramowanie do rozpoznawania znaków zapisanych w formie obrazu.
Funkcjonalność ta jest szczególnie ważna w obszarach digitalizacji dokumentów, wyszukiwania kontekstowego w dużych zbiorach treści, jak i automatyzacji obiegu informacji w różnego rodzaju procesach biznesowych.
Technologia OCR w ostatnich dwóch dekadach uległa dynamicznemu rozwojowi. Obecnie nie polega ona jedynie na rozpoznawaniu pojedynczych znaków budujących tekst, ale całych wyrazów czy bloków tekstu, jak również rozpoznawania odręcznego pisma.
W oprogramowaniu OCR stosuje się rozwiązania oparte na sztucznej inteligencji czy uczeniu maszynowym, pozwalające ciągle poszerzać możliwości automatycznej konwersji tekstu zapisanego w formie obrazu na tekst w wersji elektronicznej. Dobrym przykładem jest tu możliwość stosowania mniej dokładnych obrazów i skanów, zawierających różnego rodzaju zniekształcenia (tzw. szumy), co w praktyce pozwala wykorzystać zdjęcia wykonane na smartfonie, a sam proces OCR może być wykonany przez aplikację mobilną. Inny przykład rozwoju technologii to możliwość odczytu zapisanego tekstu ze zdjęć zrobionych przy różnych odchyleniach od rzutu prostopadłego do wydruku. To wszystko powoduje, że OCR szybko upowszechnia się w praktyce biznesowej.
Powszechne i masowe zastosowanie OCR
Jednym z masowych zastosowań OCR jest pozyskiwanie cyfrowej wersji tekstów dostępnych jedynie w postaci analogowej (wydruki, rękopisy, maszynopisy i inne dokumenty). Jest to istota realizowanego od lat procesu digitalizacji zbiorów muzealnych, bibliotek i różnego rodzaju archiwów. Na technologii OCR bazują także usługi monitorowania mediów, polegające na codziennym, stałym wyszukiwaniu kontekstowym zadanych słów i fraz w treściach publikowanych w gazetach i czasopismach.
OCR w procesach biznesowych
W biznesie OCR pełni ważną rolę ze względu na potencjalne korzyści. A są nimi oszczędność czasu, redukcja kosztów, wyeliminowanie ludzkich błędów oraz automatyzacja i przyspieszenie obiegu informacji.
Symfonia Obieg Dokumentów - zmiana jakościowa w dziale księgowym
Wypełnij poniższy formularz, aby uzyskać dostęp do nagrania webinarium.
Technologia jest szczególnie przydatna tam, gdzie przetwarzane są różnego rodzaju dokumenty – drukowane lub w wersji elektronicznej – zawierające dane, które powinny w zunifikowanej formie znaleźć się w systemach informatycznych. Dobrym przykładem jest biuro rachunkowe, do którego każdego miesiąca trafiają od klientów tysiące dokumentów – faktur, korekt czy wyciągów bankowych. Dokumenty te pochodzą od niemniejszej liczby podmiotów, a więc mają też różną postać i formę, od zwykłych pdf-ów, przez papierowe wydruki z różnych systemów informatycznych, po odręcznie wypisane rachunki i faktury.
OCR pozwala zautomatyzować zapisane w tych dokumentach dane i przenieść je do systemu finansowo-księgowego, zachowując logikę rozłożenia poszczególnych informacji. W praktyce oznacza to, że pracownicy biura rachunkowego nie muszą przepisywać treści otrzymanych dokumentów do systemu, oszczędzając w ten sposób duże ilości czasu i redukując koszty zatrudnienia.
Podobne korzyści uzyska każda firma, która na większą skalę przetwarza różnego rodzaju formularze, ankiety i inne dokumenty powstające w terenie, których treść na dalszych etapach musi zostać przetworzona przez system informatyczny.
Jak przyspieszyć pracę z dokumentami klienta w biurze rachunkowym?
Wypełnij poniższy formularz, aby uzyskać dostęp do nagrania webinarium.
Nieco historii OCR
Mogłoby się wydawać, że automatyczne identyfikowanie znaków zapisanych w obrazie jest stosunkowo młodą technologią, powstałą w czasie intensywnego rozwoju komputerów i skanerów. Tymczasem pierwsze prace badawcze i wdrożeniowe realizowano na tym polu już ponad 100 lat temu, kiedy jeszcze nikt o komputerach nie słyszał! Irlandzki fizyk i wynalazca, Edmund Fournier d’Albe w roku 1912 r. opatentował urządzenie o nazwie optofon (oryg. optophone) projektowane z myślą o osobach niewidomych.
Optofon wykorzystywał specyficzne właściwości optyczne i elektromagnetyczne selenu. Specjalne detektory tego urządzenia skanowały różnice w jasności i kontraście w kolejnych liniach wydrukowanego tekstu i pozyskany w ten sposób obraz zamieniały na sekwencje różnego rodzaju dźwięków. Nie były to jednak dźwięki choćby zbliżone do ludzkiej mowy, a więc do zrozumienia odczytanego tekstu potrzeba było wielkiej wprawy operatora.
Ponieważ w owym czasie nie było jeszcze możliwe konwertowanie powstałych w ten sposób tonów na dźwięki identyfikowane jako język mówiony, optofon nie miał szans znaleźć szerszego zastosowania w społeczeństwie. Faktem jest jednak, że już na początku XX wieku powstała pierwsza technologia OCR!
Z problemem właściwej konwersji odczytanych z tekstu danych na dźwięki zbliżone do ludzkiej mowy uporał się amerykański naukowiec, Ray Kurzweil, który uchodzi za pioniera w dziedzinie technologii OCR. Ray Kurzweil dokonał przełomowych odkryć na tym polu w drugiej połowie lat 70-tych XX w. a więc w czasie wciąż poprzedzającym okres upowszechniania komputerów w użytku biznesowym i domowym.
Jak przyspieszyć proces przekazywania PIT-11 pracownikom?
Wypełnij poniższy formularz, aby uzyskać dostęp do nagrania webinarium.
Przeglądaj tematy tego artykułu:
Rekomendowany kolejny artykuł:
0 komentarzy