0

Weryfikacja w EZD przez raporty. Cz. 1 – Jak przygotować dane?

We wcześniejszym wpisie i w wystąpieniu na X zjeździe IFAR zarysowałem sposoby wykorzystania raportów z EZD do weryfikacji postępowania z dokumentacją przez koordynatora czynności kancelaryjnych i archiwistę. To była bardziej teoria i pokazanie możliwości jakie niosą raporty. Przejdźmy do praktyki – postaram się pokazać krok po kroku jak możemy dokonać analizy danych z systemu EZD. Na początek jak przygotować dane do analizy.

Na co dzień korzystam z MS Office Excela wersja 2007, dlatego wszelkie opcje programu i zrzuty z programu będą odnosiły się do tej wersji.

Pierwszym krokiem jest pozyskanie danych z systemu EZD czy to w postaci raportu, czy wyników wyszukiwani. Istotnym jest aby system pozwalał na eksport danych w formacie nadającym się do dalszego przetwarzania. A więc nie PDF a plik xls lub csv. W tamtym roku prosiłem kilka urzędów, które używają systemu EZD, o pewne dane z systemu i przypuszczam po odpowiedziach, że część z nich miała problem z pozyskaniem danych w interesującym mnie formacie. Coś co wydawało mi się oczywistością, że systemy EZD standartowo dysponują takimi możliwościami okazało się nie takie oczywiste.

Posiadając już dane w formacie csv korzystamy z opcji import w programie Excela. Importujemy przez opcję „Z tekstu”.

Po wskazaniu pliku zapisanym na naszym dysku, wczytujemy plik i pojawia nam się pierwsze okno narzędzia do importu „Kreator importu tekstu”.

Jeżeli zamiast polskich liter pojawiły się krzaczki musimy ustawić poprawne kodowanie.

W polu „pochodzenie pliku” ustawiamy format kodowania – często będzie to „UTF-8”. Ponieważ nasze dane maja różną długość pozostawiamy ustawienie domyślne, że dane będą rozdzielane przez znak.

W moim przypadku jest to średnik. Zaznaczam więc opcję „Inny” i wpisujemy w pole obok znak średnika.

Trzeci ekran kreatora importu służy do zaznaczenia, które dane importujemy i jaki mają one format.

Przy datach zaznaczyć właściwy format daty w moim przykładzie jest to układ dzień-miesiąc-rok (DMR). Przy większości pozostałych kolumn możemy pozostawić format domyślny „ogólne”, ponieważ ustawienie to automatycznie konwertuje wartości numeryczne na liczby a inne wartości na tekst. Kończymy naciskając przycisk „Zakończ”.

W osobnych kolumnach otrzymujemy rozdzielone dane.

Przed analizą zawsze rozdzielam znak sprawy na poszczególne elementy. W instrukcji kancelaryjnej z 2011 roku rygorystycznie określono sposób budowy i kolejność poszczególnych elementów znaku sprawy. Ułatwi to nam sprawę.

Kolumnę zawierającą znaki spraw kopiuję na koniec naszej tabeli. Kopiuję nie przenoszę, ponieważ chcę nadal zachować znak sprawy, który dla naszych danych jest unikalnym identyfikatorem. Co wykorzystamy na dalszych etapach naszej weryfikacji.

Do rozdzielenia danych tej kolumny wykorzystujemy funkcję „Dane/Tekst jako kolumny”.

Pojawia się podobny kreator konwersji tekstu na kolumny do kreatora importu tekstu. Na początku musimy wskazać, że tekst będziemy dzielić przy wykorzystaniu znaku.

Wskazujemy ten znak. Oczywiście jest to kropka, bo taki znak używany jest do rozdzielania poszczególnych elementów znaku sprawy.

Następnie musimy poprawnie zaznaczyć format danych poszczególnych kolumn. W większości kolumn możemy pozostawić format domyślny „ogólny”, we wszystkich poza tą, która zawiera symbole klasyfikacyjne. Przy tej kolumnie musimy zaznaczyć, ze są to dane tekstowe. Inaczej program zinterpretuje symbole zaczynające się od 0 jako wartości liczbowe i „obetnie” 0 początkowe i zamiast np. „021” będziemy mieli symbol „21”.

Jak możemy zauważyć dwie pierwsze kolumny zawierają dane jednorodne tzn. pierwsza oznaczenie komórki organizacyjnej, druga symbol klasyfikacyjny z jednolitego rzeczowego wykazu akt. Kolejne trzy zawierają dane wymieszane: numery spraw, rok założenia sprawy i numery grup wydzielonych spraw (podteczki).

Musimy ujednolicić te dane. Po kolumnie zawierającej symbol jrwa dodajemy kolumnę „znak teczki lub podteczki”. Filtrujemy dane wg ostatniej kolumny zawierającej rok wszczęcia sprawy w przypadku podteczki (kolumna J), zaznaczając w filtrze te komórki które zwierają dane o roku – w naszym przykładzie „2016”.

W kolumnie „znak teczki lub podteczki” wpisujemy formułę łączenia tekstu – łącząc dane z trzech kolumn zawierających oznaczenie komórki organizacyjnej (kolumna E), symbol z jrwa (kolumna F) i nr wydzielonej grupy spraw (kolumna H). Formuła w naszej tabeli przybiera postać ZŁĄCZ.TEKSTY(E3;”.”;F3;”.”;H3), gdzie jako znak rozdzielający ponownie zastosowaliśmy kropkę.

Podobnie postępujemy tworząc znak teczki. W kolumnie J ostatnie tym razem filtrujemy dane zaznaczając komórki nie zwierających dane, a więc są to te wiersze tabeli odnoszące się do spraw nie zakładanych w podteczkach. Formuła jest też w tym przypadku skrócona do danych z dwóch kolumn E i F – ZŁĄCZ.TEKSTY(E3;”.”;F3;). Jednocześnie dane o roku wszczęcia sprawy kopiujemy z kolumny „I” i przenosimy dom kolumny „J” tak by w ostatniej kolumnie były kompletne dane o roku rejestracji danej sprawy.

Tak przygotowane dane posłużą nam do analizy istotnych w systemach  EZD meta danych tj. tytułów spraw i znaków spraw. Ale o tym napiszę w kolejnych notatkach na blogu.

Zapisz

Zapisz

Paweł

Dodaj komentarz

Twój adres email nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *

Witryna wykorzystuje Akismet, aby ograniczyć spam. Dowiedz się więcej jak przetwarzane są dane komentarzy.