Od linii produkcyjnej do inteligentnej instytucji – cz. 1

Zarys historii automatyzacji opartej na rozumieniu języka naturalnego

Termin automatyzacja pojawił się po raz pierwszy w branży motoryzacyjnej. Za jego twórcę uważa się D. S. Hardera, głównego inżyniera fabryki Forda. Pojęcie automatyzacji odzwierciedlało zupełnie nowy kierunek rozwoju przemysłu. Uwidocznił się on w latach '40 ubiegłego stulecia. Wykorzystywanie urządzeń służących do kontrolowania i sterowania mechanicznymi liniami produkcyjnymi było wtedy rewolucyjną zmianą.

Dziś istnienie automatycznych linii produkcyjnych jest już oczywistością. Jednak jaki związek ma produkcja samochodów Forda z automatyczną obsługą korespondencji elektronicznej? Jest to w istocie pytanie o rozwój automatyzacji. O ścieżkę prowadzącą od sterowania fabrycznymi procesami do powstania inteligentnych systemów automatyzacji opartej na rozumieniu języka naturalnego.

Założeniem naszego artykułu jest wprowadzenie Cię w tę historię przez objaśnienie pojawiających się w niej pojęć. Z wpisu dowiesz się również, czym są i w jaki sposób są ze sobą powiązane technologie umożliwiające współczesną automatyzację przetwarzania dokumentów.

Dowiesz się między innymi:

● Jakie technologie kryją się pod skrótami
→ BPM
→ OCR
→ AI
→ DL i ML
● W jaki sposób tworzą one zręby automatyzacji przetwarzania dokumentów opartej na rozumieniu języka naturalnego (NLP)
● Czym jest NLP
● Czym jest automatyzacja kognitywna (CA)
● Czym jest inteligentne przetwarzanie dokumentów (IDP)
● Czym jest zrobotyzowana automatyzacja procesów (RPA, RPA II)
● W jaki sposób najnowocześniejsze technologie automatyzacji opartej na rozumieniu dokumentów wpisują się w systemy całościowej automatyzacji procesów biznesowych w dużych firmach i instytucjach

Od przekładni do przyimka

Automatyzacja procesów fascynowała pasjonatów techniki znacznie wcześniej niż powstało samo słowo. Od prawie 5000 lat na całym świecie podejmowano próby naśladowania istniejących procesów za pomocą mechanicznych wynalazków. Jednak prawdziwy przełom w tym zakresie dokonał się dzięki cyfrowej rewolucji. Dzięki rozwojowi technologii dźwignie, przekładnie i elektrycznie zasilane przyciski zostały zastąpione przez zależności i struktury logiczne.

Zakres możliwej automatyzacji poszerzył się znacząco. Automatyzacja została zaprzęgnięta również do pracy z dokumentami sporządzonymi w języku naturalnym. Jak więc przebiegał rozwój technologii, który doprowadził do tego momentu? Początkiem drogi do automatyzacji opartej na rozumieniu języka naturalnego były dwie, pierwotnie niezwiązane ze sobą technologie: BPM oraz OCR.

BPM

Business Process Management, czyli zarządzanie procesami biznesowymi j. Należy mu się honorowa wzmianka w historii procesów automatyzacji. Obejmuje bowiem różne metody modelowania, narzędzia implementacji  i optymalizacji procesów biznesowych,  których rezultatem jest najczęściej implementacja procesu biznesowego, w postaci aplikacji  zapewniającej powtarzalność, możliwość analizy i kontroli kroków procesu, a w konsekwencji – optymalizację.

 

OCR

Drugim krokiem milowym w stronę pogłębionej automatyzacji procesów biznesowych był wynalazek OCR, optycznego rozpoznawania tekstu. Jak powstała ta przełomowa technologia?

Za pierwszy prototyp maszyny służącej do optycznego rozpoznawania tekstu uważany jest aparat stworzony w 1914 roku przez Emanuela Goldberga. Służył do konwertowania drukowanego tekstu na standardowy kod telegraficzny. W 1976 roku system rozpoznawania tekstu został z powodzeniem zastosowany – w połączeniu z syntezatorem mowy – do stworzenia „maszyny czytającej”. OCR Ray’a Kurzweila został zaprojektowany jako narzędzie umożliwiające czytanie osobom niewidzącym i niedowidzącym. 

W latach ’70 XX wieku obie technologie rozwijały się niezależnie od siebie. I nic nie zapowiadało jeszcze, że sposoby myślenia leżące u ich podstaw doprowadzą do powstania dzisiejszych technologii. Czyli rozwiązań takich jak inteligentne przetwarzanie dokumentów (IDP), automatyzacja kognitywna (CA), czy przetwarzanie języka naturalnego (NLP).

W 2021 roku OCR, choć nie jest już nowością, wciąż stanowi niezbędną podstawę najbardziej zaawansowanych sposobów przetwarzania dokumentów. Zawsze bowiem pierwszym krokiem w kierunku ich prawidłowej obróbki jest poprawne OCR – odczytanie danych wejściowych.

Wielowątkowa historia

Na ścieżce prowadzącej do automatyzacji przetwarzania języka naturalnego spiętrzyło się wiele problemów związanych z samą naturą języka. Gdyby streścić te problemy w jednym zdaniu, można powiedzieć, że nie wystarczy znajomość reguł, żeby skutecznie posługiwać się językiem. Innymi słowy, przetwarzania języka naturalnego i tworzonych w nim tekstów nie da się prosto opisać za pomocą schematu.

Przez cały XX wiek językoznawcy i filozofowie prowadzili badania nad naturą języka. Oraz nad tym, czym różni się on od języków formalnych. Wyodrębnili wiele interesujących zagadnień, które można podzielić na dwie grupy.

1. Problemy z pierwszej grupy dotyczą kwestii związanych z naturą znaczenia, złożoności, kontekstowości i wieloznaczności języka.

2. Natomiast druga grupa problemów dotyczy uczenia się. Ponieważ język naturalny jest żywy, zmienny oraz nie istnieją uniwersalne reguły opisujące sposoby tworzenia poprawnych wypowiedzi, czy prowadzenia sensownej konwersacji.

Z powodu tych trudności rozwój technologii nie jest ani równomierny, ani linearny i dzieje się w wielu wątkach,  w których wynalazcy próbują rozwiązywać problemy związane z rozumieniem języka wychodząc od różnych założeń i stosując różnorodne techniki, między innymi takie jak opisane dalej.

data_women1-stripe1 data_women1-stripe1

AI

Sztuczna inteligencja to pojęcie, którego po raz pierwszy użył John McCarthy w 1956. To właśnie AI, Artificial Intelligence, jest podstawą systemów tworzonych do pełnienia wybranych funkcji ludzkiego umysłu i zmysłów, które nie poddają się algorytmizacji. Należą do nich między innymi rozpoznawanie pisma oraz mowy.

Jednym z kluczowych aspektów sztucznej inteligencji, niezbędnym do przetwarzania języka naturalnego, jest zdolność uczenia się.

ML

Machine Learning (ML) czyli uczenie maszynowe, to dziedzina budowania algorytmów sztucznej inteligencji. Idea ich działania polega na zdobywaniu wiedzy przez komputer tak jak robi to człowiek. Algorytmy “uczyą się” popełniając błędy – korygując je “nabierają doświadczenia”. Z tego powodu do rozwijania maszynowej wiedzy potrzebny jest  ekspozycja systemu na duże ilości danych, z których może czerpać niezbędne informacje.

 DL 

Deep Learning (DL) to jedna z gałęzi uczenia maszynowego. Polega ona na tworzeniu bardzo złożonych sztucznych sieci neuronowych symulujących działanie ludzkiego mózgu Dzięki temu uczenie głębokie (DL) znajduje zastosowanie przy przetwarzaniu języka naturalnego i obrazu.

Jednym z najbardziej spektakularnych osiągnięć w tej dziedzinie było opracowanie maszynowego rozpoznawania mowy. Jest ono dziś powszechnie używane do zamiany mowy na tekst (systemy speech-to-text). DL zawdzięczamy również coraz doskonalsze automatyczne translatory. Tłumaczą one nie tylko poszczególne słowa i frazy, ale coraz trafniej tłumaczą także złożone teksty, przekładając kontekstowo całe zdania i akapity.

Dalszy ciąg historii automatyzacji przedstawimy w kolejnym wpisie.
Możesz go przeczytać tutaj.

Kontakt

Podaj poprawny adres e-mail

Wpisz wiadomość

Zaznacz zgodę

Dziękujemy za wysłanie e-maila!

Wysyłam e-mail...

Błąd wysyłania e-maila!