Zastosowanie Big Data w administracji publicznej

Maciej Farbaniec
Pojęcie Big Data utożsamia się z danymi o znacznym wolumenie. Mogą pochodzić z serwisów społecznościowych, z wielu czujników urządzeń, mogą to być dane transakcyjne. Korzyści jakie może przynieść ich analiza są niewspółmierne do zastosowanych środków, a takich właśnie środków dostarczają rozwiązania z kategorii Big Data.
Big data w administracji publicznej

Pojęcie Big Data utożsamia się z danymi o znacznym wolumenie. Mogą pochodzić z serwisów społecznościowych, z wielu czujników urządzeń, mogą to być  dane transakcyjne. Charakteryzuje je różnorodność (np. dane ustrukturyzowane pochodzące z baz danych, czy nieustrukturyzowane jak pliki audio) i zmienność (szybko ulegające zmianie - problem szybkiego przetwarzania). Mogą to być tera-, a nawet petabajty danych. Korzyści jakie może przynieść ich analiza są niewspółmierne do zastosowanych środków, a takich właśnie środków dostarczają rozwiązania z kategorii Big Data. Narzędzia te ułatwiają podejmowanie trafniejszych decyzji oraz odkrywanie nowych możliwości związanych z lepszą optymalizacją procesów.

Big data w GUS? Recepta na szybko dostępne dane

Niezbędnym elementem dobrze funkcjonującego państwa jest statystyka publiczna, a głównym organem przetwarzającym gromadzone tego typu dane jest Główny Urząd Statystyczny.
Cechą charakterystyczną danych wykorzystywanych przez administrację publiczną jest w znacznym stopniu ponadprzeciętnie duży wolumen. Można to zaobserwować np. w statystyce publicznej, czy w dziedzinie rejestrów publicznych. Dotychczasowa technologia do czasu pojawienia się narzędzi Big Data ograniczała użycie tych danych w analizie, wnioskowaniu i podejmowaniu właściwych decyzji.  Niestety przetwarzania danych przez GUS nie można określić mianem Big Data, gdyż analizy publikowane przez urząd charakteryzują się znacznym opóźnieniem w stosunku do okresu, którego dotyczą. Zastosowanie narzędzi Big Data umożliwiłoby znaczne usprawnienie czasu publikacji, trafności, a więc umożliwiłoby władzy podejmowanie trafniejszych decyzji i szybsze reagowanie na zachodzący zmiany w państwie.

Rejestry publiczne z narzędziami Big Data

Z pojęciem statystyki publicznej pośrednio i bezpośrednio zazwyczaj wiążą się również rejestry publiczne, które prowadzone są w Polsce przez różnego rodzaju organizacje administracji publicznej, takie jak GUS, ZUS czy Ministerstwo Zdrowia i organy im podległe. Rejestry te przechowują zazwyczaj informacje o obywatelach, rzeczach i usługach. Służą do realizacji zadań publicznych, do których zobowiązują je  odpowiednie przepisy prawa.

Zdecydowana większość tych rejestrów jest przechowywana w formie elektronicznej, ustrukturyzowanej, jednak niewielka część nadal jest przechowywana wyłącznie w formie papierowej. Przez to ich przetwarzanie jest znacznie utrudnione obecnie. Do największych rejestrów elektronicznych należy zdecydowanie Powszechny Elektroniczny System Ewidencji Ludności (w skrócie PESEL). Głównym źródłem danych systemu PESEL są urzędy gminne i wojewódzkie. Innymi rejestrami publicznymi są również Krajowy Rejestr Urzędowy Podmiotów Gospodarki Narodowej (w skrócie REGON), czy Krajowy Rejestr Sądowy (KRS). Rejestry te również można byłoby uznać za spełniające kryterium Big Data ze względu na dużą wielkość zbiorów. Jednak dotychczasowy sposób przetwarzania i struktura baz relacyjnych wyklucza je z tego pojęcia. Mają bardziej charakter przetwarzania transakcyjnego i wsadowego i nie służą do analiz bardziej zaawansowanych.

Big data a dane strukturalne

Praktyczne zastosowanie technologii Big Data w rejestrach publicznych jest wskazane. Nie tylko umożliwiłaby ona analizę poszczególnych rejestrów, ale przede wszystkim połączenie ich, całościową analizę i wyciąganie wniosków na podstawie danych z wielu źródeł jednocześnie. Big Data rozwiązałaby również problem przetwarzania danych niestrukturalnych. Na przykład istniejące rejestry z dziedziny usług medycznych, takie jak rejestr zakładów opieki medycznej, rejestr lekarzy czy aptek muszą komunikować się z rejestrami, takimi jak PESEL czy Krajowy Rejestr Urzędowy Podziału Terytorialnego Kraju (w skrócie TERYT). Zbytni podział tych systemów, braku spójności i komunikacji pomiędzy nimi prowadzi do braku efektywnego działania całej służby zdrowia, a w efekcie jakości oferowanych przez nią usług.


Narzędzia Big Data mogą też wpłynąć na poprawę w obszarze:
    • monitorowania danych w celu wcześniejszego wykrywania potencjalnych zagrożeń epidemiologicznych,
    • wykrywania nadużyć w systemie podatkowym, wspomaganie zarządzania transportem (planowanie sieci dróg, sterowanie ruchem),
    • udoskonalenia funkcjonowania systemu edukacji
    • bezpieczeństwa publicznego poprzez analizę zachowań obywateli w Internecie, oraz analizę nagrań z kamer systemu monitoringu miejskiego,
    • lepszego prognozowanie pogody i przeciwdziałania z wyprzedzeniem klęskom żywiołowym,
    • analizy zmieniającego się zapotrzebowania na pracowników i  przeciwdziałaniu bezrobociu na rynku pracy.


Intensywny rozwój Big Data najbardziej widoczny jest w komercyjnych zastosowaniach, gdzie postęp technologiczny jest szybko implementowany i generuje zyski dla inwestorów. Administracja publiczna jest obszarem, gdzie szerokie wdrożenie technologii Big Data przyniesie wymierne skutki polepszając efektywność i jakość jej działania, a także pozwoli zredukować koszty, tak ważne dla każdego podatnika. Finalnie przełoży się na komfort życia społeczeństwa.