Jak wykonć indeksację -pytania wolontariuszy

marksp
Site Admin
Site Admin
Posty: 494
Rejestracja: 27 marca 2018, 11:51 - wt

Jak wykonć indeksację -pytania wolontariuszy

Post autor: marksp » 10 grudnia 2009, 15:43 - czw

Pytania wolontariuszy dotyczące indeksacji ksiąg metrykalnych.
Sposoby formatowania komórek Excela,kolumny używane dla różnych wersji(roczne,pełne)
i podobne zagadnienia.

marksp
Site Admin
Site Admin
Posty: 494
Rejestracja: 27 marca 2018, 11:51 - wt

Re: Jak wykonć indeksację -pytania wolontariuszy

Post autor: marksp » 31 stycznia 2010, 14:11 - ndz

Dla wolontariuszy przygotowane arkusze spisowe(indeksacyjne) z par.Św.Jana (katedra):

Zgony zakres:1826-1908 wpisana cz.1886-1923 (weryfikacja w trakcie po OCR)
Urodzenia zakres 1826-1908 poz do wpisania 64.755 cz. uzupełniona
Małżeństwa: zakres 1826-1916 częściowo wpisane (w trakcie weryfikacji po OCR).

Szczegóły na forum specjalnym dla wolontariuszy.

marksp
Site Admin
Site Admin
Posty: 494
Rejestracja: 27 marca 2018, 11:51 - wt

Re: Jak wykonć indeksację -pytania wolontariuszy

Post autor: marksp » 04 lutego 2010, 15:28 - czw

do powyższego postu Uwaga!

dotyczy zgonów z zakresu 1886-1900
Wykonany OCR z dostępnych kiedyś plików w formacie pdf (podobno był też inny OCR) z sumariuszy, nie jest tożsamy z numerami metryk z tego zakresu zamieszczonymi w http://metryki.genealodzy.pl/metryki.php .

dla przykładu rok 1898
Mazurkiewicz Jan (213)-sumariusz nr 199 metryki zamieszczony skan
itp.

Trzeba zwrócić uwagę czy da się (jest opłacalne) poprawianie i weryfikacja po OCR-sumariusza jeśli numeracja aktów nie jest identyczna z zamieszczonymi skanami.(być może istnieje inna wersja sumariusza z powyższego zakresu).

Nie sprawdzałem wszystkich roczników czy sumariusz jest tożsamy z numeracją (faktyczna)
innej wersji sumariusza np USC a nie kościelnego.

Dobrym rozwiązaniem byłoby podawanie źródła z którego robione są indeksy (kościelne,USC),gdyż w tym przypadku jest to bardzo istota różnica "Nr aktu",ale jest to kolejna kolumna-dodatkowa wpływająca na obciążenie bazy(szybkość wyszukiwania ,kryteria itp).W parafiach posiadających "podwójne dokumenty" jest to konieczne ,aby niedoświadczeni poszukiwacze ,zwracając się o wydanie kopii aktu nie podawali Nr aktu "kościelnego" jako tożsamego z Nr aktu "USC" i odwrotnie.


Dobrym przykładem są indeksy zgonów z zakresu 1860-85.Są to indeksy wykonane przez p.
Alinę Dąbkowską (może to nick) .Brakuje tam co prawda ponad 700 imion(nie licząc nie wpisywania podwójnych imion) i ok 140 nr aktów. ale przy takiej ilości wykonanych indeksów (prawie 16 tys.) to braki można uznać za znikome.Być może są to niezawinione braki ,a błędne wyświetlenie niektórych rekordów w genetece.Częstą przyczyną takiego braku wyświetlania uzupełnionego rekordu jest brak sformatowania komórek poprzez sporządzającego indeks (wyczyszczenie-leading and trailing white-space ) jaki potem przez
wstawiającego rekordy do bazy.Nie sprawdzałem ilości zdublowanych numerów aktów tj.
jednemu numerowi aktu zdarza się czasami przypisanie 2-ch,3-ch różnych Nazwisk w tym samym roczniku.Sytuacja taka zdarza się bardzo często przy wykonywaniu indeksów z sumariuszy.
Policzona ilość indeksów (rekordów) dla danego rocznika zgadza się np.100 ,ale w tym jest 5 razy ten sam numer aktu , a brakuje nr 15, 23,56 ,75,86 itd.

Każdy może spróbować własnych sił i wykonując praktycznie indeksy nauczy się unikania i popełniania błędów-pomyłek nabywając przy tym doświadczenia na przyszłość.

marksp
Site Admin
Site Admin
Posty: 494
Rejestracja: 27 marca 2018, 11:51 - wt

Re: Jak wykonć indeksację -pytania wolontariuszy

Post autor: marksp » 05 lutego 2010, 11:02 - pt

Prośba o potraktowanie tego postu jako materiału szkoleniowego dla wolontariuszy wykonujących indeksacje po raz pierwszy lub mających małą praktykę w tym zakresie.
Należy cieszyć się z każdego wolontariusza i być mu wdzięcznym za chęć poświęcenia własnego czasu,aby zrobić coś dla innych.Nie wolno traktować tego w formie krytyki lub zarzutów adresowanych do autora.Oby wszystkim nam udało się popełnić jak najmniejszą liczbę błędów.Gdybyśmy (gdybanie) mieli system takiej wielostopniowej weryfikacji jak posiadają niektóre kraje i taką ilość wolontariuszy chętną do pracy to...

Geneza powstawania błędów w trakcie wykonywania indeksacji jest w dużym stopniu uzależniona od praktyki i doświadczenia indeksującego.Tej praktyki nabywa się z czasem i ilością zindeksowanych metryk.

Ponieważ nie wszystkie skany są dostępne na portalch nie można mieć skali porównawczej jakości i staranności wykonania tej pracy.Wiele zależy również od sposobu wyświetlania zindeksowanych zasobów w bazie danych. Wolontariusz zrobił to super porządnie i starannie a wyniki wyświetlania są różne od tego co posiada np. w orginalnym arkuszu Excela z np.powodów wcześniej wymienionych.

Dla zobrazowania nieścisłości podaję przykład z powyższej indeksacji tylko na przykładzie jednego rocznika:Zgony 1860

Ilość rekordów ....665 ... na portalu 669 skanów (ostatni nr metryki )

braki rekordów 21,228,275,354,382,489,490,540,566,615,623,630,641,647,661

duble 128:Ulczyńska Marcjanna,Zajdlewska Anna
duble 272:Krasuska Marianna,Dzięgielewski Edward
duble 339:Bączyńska Antonina,Lakner Julia,Słomiński
duble 340:Chyczewska,Morantowicz
duble 344:Dębski Józef,Tomczyk
duble 405:Bednowski Ryszard,Skorubska Bronisława
duble 467:Ciepły Adam,Lewy Jan
duble 480:Hofman Marianna,Kozioł
duble 486:Breza Eustachi,Zaleski Władysław
duble 548:Pyschyng Marianna,Zdrodowska Eufrozyna
duble 582:Bątkowiak Teodor,Mędrzycki Kazimierz
duble 614:Frankiensztejn Elżbieta,Kaniewska Marianna,Owszyński Tomasz,
duble 621:Hipsch Antoni,Zieliński Walery

Jest wiele metod na wyeliminowanie tych błędów.Każda z nich wymaga jednak dużej cierpliwości i wielokrotnego sprawdzania wykonanej pracy pod różnym kątem.To zabiera mnóstwo czasu i nie zawsze po wykonaniu indeksów starcza go na dokładne sprawdzenie.Brak innych pomagających zweryfikować z wielkim mozołem wpisanych danych przez jednego tylko wolontariusza powoduje że efekt końcowy czasami odbiega od naszych oczekiwań i zamierzeń.

Nie popełniają błędów jedynie Ci którzy nic nie robią, oczekując gotowych i bezbłędnych indeksów od innych,a w przypadku zawinionej lub niezawinionej pomyłki wolontariusza
potrafią jedynie krytykować i mieć pretensje.

marksp
Site Admin
Site Admin
Posty: 494
Rejestracja: 27 marca 2018, 11:51 - wt

Re: Jak wykonć indeksację -pytania wolontariuszy

Post autor: marksp » 07 lutego 2010, 10:37 - ndz

Zasada logiczności do indeksacji zdarzeń typu zgony

Aby uniknąć pomyłek podczas indeksowania należy :

a.)zapoznać się z ilością wszystkich metryk i automatycznie ponumerować LP.
b. jeśli już w samej księdze występuje dubel 2-gi numeru oznaczyć np 112a
c.jeśli w księdze nr ominięty -adnotacja brak zapisu w poz.112
d. dla osób Nieznanego Nazwiska (topielcy i inne bez identyfikacji) Nazwisko NN-kobieta ,-dziecko,-mężczyzna ...(dziecko) Imiona = bezimienna ,bezimienny
e.) martwo narodzone dzieci j.w + Nazwisko
f.Jeśli występuje (Voto lub vel) zapisujemy przy nazwisku
g. dla indeksów pełnych dodatkowa kolumna (rodowe) zd.

Co przesyłamy do baz typu indeksy roczne:
a.)tylko osoby zidentyfikowane z Nazwiska wraz z numerem aktu
.pomijamy NN i brak zapisu - unikając zaśmiecania bazy zapisami bezużytecznymi w poszukiwaniach (są one użyteczne przy opracowaniach i statystykach)

b. baza zindeksowana (u siebie jest inna bo zawiera wszystkie akta i kolejność)

Różnica jest taka ,że mamy sprawdzone wszystkie akta i unikamy pominięcia aktu lub
przypisywania Nr Aktu do 3-ch różnych Nazwisk ,a to jest istotą rzeczy dla poszukujących z indeksów rocznych --ważny rocznik ,Nazwisko ,Nr Aktu

Spisując z sumariuszy (alfabetyczne) po wpisaniu nr aktu - posortować w/g kolejności metryk LP. Dla dużych parafii do 10 tys zdarzeń rocznie lp. 4 pozycyjne 0001,0002 ...9999 itd.(format komórki w kolumnie tekstowe-od lewej do prawej)
Klick sortuj A-Z na tej kolumnie spowoduje ustawienie w/g numeracji kolejnych.
Tak sprawdzony arkusz (nic nie brakuje, ani nie ma zdublowanych -ewentualnie poprawić i uzupełnić) można ponownie ustawić alfabetycznie (Nazwiska). Ustawianie w/g Nazwiska nie ma znaczenia przy bazach składających się z wielu roczników i późniejszym wyszukiwaniu Nazwiska np.w przedziale lat 1860-1885.(to tylko łatwość wyszukania ale w danym roczniku).

Ps.Dla wolontariuszy na forum (specjalnym) dostępny materiał poglądowy (do pobrania) zweryfikowane zgony z przedziału 1860-65. Weryfikacja tylko pod kątem ilości ominiętych
i zduplikowanych rekordów.(Pogrubiona czcionka - wstawione nowe rekordy w stosunku do orginału).

marksp
Site Admin
Site Admin
Posty: 494
Rejestracja: 27 marca 2018, 11:51 - wt

Re: Jak wykonć indeksację -pytania wolontariuszy

Post autor: marksp » 08 lutego 2010, 07:10 - pn

Dla porównania i samodzielnej weryfikacji kolejny rok 1866.Każdy może sprawdzić i potraktować jako
praktyczne szkolenie.Zawartość bazy z zawartością umieszczonych metryk.

marksp
Site Admin
Site Admin
Posty: 494
Rejestracja: 27 marca 2018, 11:51 - wt

Re: Jak wykonć indeksację -pytania wolontariuszy

Post autor: marksp » 09 lutego 2010, 14:53 - wt

Dla zaawansowanych indeksujących mały teścik do rozwiązania (zaznaczam początkujący
i z małym doświadczeniem nie poradzą sobie z tym teścikiem) .
Każdy może siebie sprawdzić ,czy może się zaliczać do zaawansowanych indeksujących.
Nie sprawdzana weryfikacja Nazwisk ,chodzi o ułożenie w/g kolejności metryk.


Nagroda dla rozwiązujących - dowiedzą się nazwiska trojaczków i własna satysfakcja.
Rozwiązanie testu jest dostępne na forum (specjalnym) dla wolontariuszy.-do
sprawdzenia poprawnej kolejności.
Mnie udało się to z z brakiem 6 Nazwisk (ustawienie ze znakiem zapytania) i brakiem
1-ej pozycji.

To są zgony z św.Jana Rok 1871r.
załącznik z Geneteki.Sprawdzenie w/g skanów zamieszczonych na portalu genealodzy.
Dla ułatwienia podam ze ma być 526 rekordów.

marksp
Site Admin
Site Admin
Posty: 494
Rejestracja: 27 marca 2018, 11:51 - wt

Re: Jak wykonć indeksację -pytania wolontariuszy

Post autor: marksp » 11 lutego 2010, 00:04 - czw

Zgony z Św.Jan zakres 1860-1885 po weryfikacji dubli i braków (bez weryfikacji poprawności nazwisk) dostępne dla wolontariuszy (Forum specjalne dla odpowiedniej rangi).
W arkuszach zaznaczone braki skanów lub pomyłek w numeracji skanów.Opis przy załączonym pliku.

marksp
Site Admin
Site Admin
Posty: 494
Rejestracja: 27 marca 2018, 11:51 - wt

Re: Jak wykonć indeksację -pytania wolontariuszy

Post autor: marksp » 11 lutego 2010, 19:05 - czw

Zgony ze św Jana zakres 1886-1910
Zapisy po OCR .Arkusze ustawione w/g kolejności roczników i numerów aktów (odpowiedni zapis w kolumnie Nr aktu) do swobodnego poprawnego sortowania za pomocą funkcji dostępnej w Excelu.Wtajemniczeni w niuanse excelowe znają problem sortowania liczb (var).
Wyrywkowe sprawdzenie w rocznikach zgadza się ze skanami.Do weryfikacji poprawność zapisu nazwisk.

Skoroszyt(Arkusze roczników) dostępny będzie na specjalnym forum dla wolontariuszy.

marksp
Site Admin
Site Admin
Posty: 494
Rejestracja: 27 marca 2018, 11:51 - wt

Re: Jak wykonć indeksację -pytania wolontariuszy

Post autor: marksp » 14 lutego 2010, 15:29 - ndz

Zgony ze Św.Jana --rocznik 1847 (brak skorowidza do metryk)
Indeksy dostępne dla wolontariuszy na forum spec.

Z 543 rekordów --brak jest 10 Nazwisk (brak skanu lub urwany).Kolejność metryk prawidłowa.
Nazwiska zweryfikowane.

ODPOWIEDZ