Przeszłość ożyje w chmurach

Krzysztof Błażejewski 8 maja 2015

Wykonano 1 800 000 skanów. Teraz są opracowywane i przygotowywane do ekspozycji. Od czerwca w księgi metrykalne mieszkańców Kujawsko-Pomorskiego z lat 1874-1907/10 będzie mógł zajrzeć każdy, i to przez Internet.

Bolesław Rassalski: - Wszystkie skany są gromadzone na czterech macierzach cloudowych, tworzących prywatną chmurę informatyczną, rozmieszczoną w trzech miejscach - w dwóch w Bydgoszczy i Toruniu

Dwa i pół roku temu podczas rozmów przedstawicieli Urzędu Marszałkowskiego naszego województwa i Naczelnej Dyrekcji Archiwów Państwowych zrodził się pomysł przeprowadzenia eksperymentu w ramach Regionalnego Programu Operacyjnego. Pomysł wyjścia naprzeciw trendom poszukiwań genealogicznych. W jaki sposób? Poprzez zeskanowanie części danych metrykalnych, znajdujących się w zasobach archiwalnych regionu i udostępnienie ich wszystkim zainteresowanym w Internecie.



U źródeł tego pomysłu legł fakt, że na terenach zaboru pruskiego, a zatem na większości ziem Kujaw i Pomorza, od 1874 roku działały urzędy stanu cywilnego, które prowadziły staranne i rzetelne zapisy urodzin, zaślubin i zgonów. Te dokumenty zachowały się w całości i to one w ostatnich latach były najczęściej wykorzystywane przez osoby poszukujące w archiwach swoich korzeni.

Stąd był już tylko krok do decyzji o połączeniu sił obydwu archiwów państwowych w regionie - w Bydgoszczy i Toruniu wraz z ich oddziałami w Inowrocławiu i Włocławku - a następnie digitalizacji akt metrykalnych z terenu województwa.

- Wniosek został zaakceptowany pod koniec 2013 roku - mówi Bolesław Rassalski, informatyk z bydgoskiego archiwum, koordynator projektu. - Przeżyliśmy wówczas stan zbliżony do euforii, ale gdy weszliśmy do tego lasu, żeby zaplanować wszystko w najdrobniejszych szczegółach, euforia szybko zniknęła, zastąpiła ją żmudna praca w poszukiwaniu odpowiednich rozwiązań.

Ostatecznie zdecydowano, że skanowane będą szeroko rozumiane źródła genealogiczne. Poza aktami urzędów stanu cywilnego - pewna liczba ksiąg meldunkowych oraz parafialnych akt metrykalnych. Jednym z wyzwań było zmierzenie się z innymi zasadami prowadzenia ksiąg metrykalnych pod zaborem rosyjskim (południowo-wschodnia część regionu). Tam role urzędników stanu cywilnego pełnili księża, powstawały wyłącznie księgi parafialne, których drugi egzemplarz przekazywany był do właściwego sądu.

Akcja skanowania dokumentów z dwóch kujawsko-pomorskich archiwów i ich oddziałów rozpoczęła się 1 października 2014 roku w budynku archiwum w Bydgoszczy.

- Akta bydgoskie skanowano na zmianę z aktami z Torunia, Włocławka i Inowrocławia. Niemal co dwa tygodnie docierał do nas specjalny transport, dostarczający dokumentację z tych miast - mówi dyrektor bydgoskiego archiwum, Eugeniusz Borodij. - Akta wkładano do specjalnych, plombowanych pudeł, które pod ochroną uzbrojonego strażnika i pracownika archiwum jechały do Bydgoszczy. Tu, po rozpakowaniu, następował proces przygotowania dokumentacji do skanowania.

W dużej sali wystawowej na parterze Archiwum Państwowego w Bydgoszczy w oczy rzucają się stosy teczek z aktami, poszytów ksiąg i różnego rodzaju archiwalia.

Na zielono i czerwono


- To już końcówka - uśmiecha się Eliza Rymer, pracownica archiwum. - Teraz zostałam już sama, ale dzień w dzień pracowało tu wiele osób. W sumie przez te pokoje przewinęło się około 13 tysięcy ksiąg, które były przez zespół segregowane według urzędów stanu cywilnego. Następnie numerowaliśmy stronice i oznaczaliśmy je kolorowymi kartkami, przygotowując do skanowania. Zielona kartka oznaczała początek digitalizacji, czerwona - jej koniec. Chodziło o to, żeby nie skanować pustych stron.

Jak się okazało, nie wszystkie księgi metrykalne nadawały się do zeskanowania - w niektórych przypadkach trzeba je było wymieniać na wtóropisy. Osobną kwestią była konieczność doprowadzenia poszczególnych stron dokumentów do jak najlepszego stanu poprzez... prasowanie zgniecionych kartek, podklejanie specjalną taśmą konserwatorską, usuwanie innych jeszcze wad, łącznie z odkurzaniem, aby niewidoczny pyłek nie uszkodził powłok skanerów. Dotyczyło to około tysiąca jednostek.

Po tym przygotowaniu dokumentacja przeznaczona do digitalizacji wędrowała na drugie piętro, gdzie pracownicy archiwum przekazywali ją do skanowania.

Na ponad pół roku jedna z sal archiwalnych zamieniła się w „skanerownię”. Udało się tam ulokować siedem stanowisk. Od siódmej rano do godz. 21 trwało tam wielkie skanowanie.

750 skanów na osobę


- Akta urzędów stanu cywilnego były generalnie w dobrym stanie, nie było z ich digitalizacją problemów. Z księgami parafialnymi było różnie - ocenia Wojciech Giersz, koordynator i serwisant firmy skanującej dokumenty. - Digitalizację każdej księgi rozpoczynaliśmy dwoma testami: kolorów i wyrazistości, po których można było odpowiednio ustawić nasze urządzenia. Przyjęliśmy normę wykonania przez jedną osobę 750 skanów podczas jednej zmiany, co daje 1500 stron dokumentów, ponieważ utrwalamy wszystko na formacie nieco większym niż A2. Skanery okazały się być bardzo dobre, praktycznie nie trzeba było niczego poprawiać.

Poza siedmioma skanerami w głównym pomieszczeniu, dwa kolejne ustawione zostały w sąsiednim pokoju, a na parterze gotów był dodatkowo największy ze skanerów, specjalnie przystosowany do dokumentów formatu A1. Posłużył do digitalizacji ledwie paru procent całej dokumentacji, umożliwiając idealne zeskanowanie kart o najrozmaitszych wymiarach i będących w różnym stanie - nawet bardzo pogiętego dokumentu.

170 mega na jeden skan


Wraz z końcem kwietnia tego roku proces cyfryzacji został zakończony.

- Najpierw założyliśmy, że zeskanujemy posiadane dokumenty do 1904 roku - wspomina dyrektor Borodij. - Potem poszerzyliśmy zakres do 1907 roku, a finalnie udało się w niektórych przypadkach sięgnąć nawet 1910 roku w zależności od tego, jak zszyte były poszczególne księgi w urzędach.

W ten sposób powstało w wersji cyfrowej 3 600 000 stron z danymi metrykalnymi. Gdzie one teraz są?
- W obróbce - wyjaśnia Bolesław Rassalski. - Jeden skan ma średnio 170 MB. Dziennie powstawało do 20 tysięcy takich skanów. Wszystko to jest gromadzone na czterech macierzach cloudowych, tworzących prywatną chmurę informatyczną rozmieszczoną w trzech miejscach - dwóch w Bydgoszczy i w Toruniu.

Razem nasze urządzenia mogą pomieścić 540 terabajtów danych. Jeśli urządzenie w jednej z lokalizacji przestanie działać, cały system będzie i tak normalnie pracował. Biorąc pod uwagę liczbę wykonanych skanów i ich zgromadzenie w jednym miejscu - było to prawdziwe wyzwanie. Zgromadzenie takiej liczby skanerów w jednym miejscu, tzw. farma, to pierwsze, według naszej wiedzy, tego typu rozwiązanie w Polsce.

Jak obiecują archiwiści, ich dzieło ma być dostępne w Internecie dla wszystkich zainteresowanych już po 2 czerwca na portalu genealogiawarchiwach.pl. Czy wówczas „zagrzeją się” łącza za sprawą poszukujących swoich korzeni? Czas pokaże. W każdym razie wszystkich, którzy oczekują, że archiwiści wykonali już za nich całą robotę, trzeba rozczarować. W sieci będą tylko nazwy i daty ksiąg oraz miejsca ich powstania. Kolejne dokumenty trzeba będzie przeglądać i odczytywać samemu.

Projekt z przyszłością


- Każdy użytkownik portalu będzie mógł opisywać przeglądane przez siebie skany. Będziemy sprawdzać poprawność odczytu i wprowadzania danych, będziemy też uzupełniali dane własnymi odczytami, z czasem można liczyć na powstanie osobowych indeksów - dodaje Bolesław Rassalski.

Obecność danych w sieci zakładana wymogami unijnymi to pięć lat. Czy po tym czasie portal zostanie zlikwidowany?

- To niemożliwe. Zbyt wielkie pieniądze zostały wyłożone na ten projekt - twierdzi Eugeniusz Borodij. - Mam nadzieję, że będzie wprost przeciwnie, że portal będzie rozbudowywany. Będziemy wzbogacać go o inne dokumenty dotyczące ewidencji ludności, np. księgi i kartoteki meldunkowe, ewentualnie poszerzać tematycznie.

Dodaj swój komentarz najciekawsze najstarsze najnowsze

  1. 29-09-2015 20:40

    Oceniono 4 razy 2 2

    - mr: 29-09-2015 Mój pierwszy raz na serwerze. Całkowita porażka. Tyle lat to już trwa |widać po wpisach w necie| Pozdrawiam

    Odpowiedz

  2. 22-07-2015 12:11

    Oceniono 3 razy 2 1

    - Kuba: Niestety portal, który miał byc uruchomiony od 1 lipca na dzień dzisiejszy (22 lipca) działa bardzo wadliwie. Skany wyświetlają się losowo, a niektóre nie wyświetlają się w ogóle. W niektórych przypadkach czas na załadowanie całej księgi wynosi kilkanaście minut, więc wygląda na to że serwery są za bardzo obciążone. Mam nadzieję, że błędy oprogramowania zostaną usuniete i portal zacznie wreszcie działać poprawnie. Wszyscy na to czekamy!

    Odpowiedz