Jak wykonć indeksację -pytania wolontariuszy
Jak wykonć indeksację -pytania wolontariuszy
Pytania wolontariuszy dotyczące indeksacji ksiąg metrykalnych.
Sposoby formatowania komórek Excela,kolumny używane dla różnych wersji(roczne,pełne)
i podobne zagadnienia.
Sposoby formatowania komórek Excela,kolumny używane dla różnych wersji(roczne,pełne)
i podobne zagadnienia.
Re: Jak wykonć indeksację -pytania wolontariuszy
Dla wolontariuszy przygotowane arkusze spisowe(indeksacyjne) z par.Św.Jana (katedra):
Zgony zakres:1826-1908 wpisana cz.1886-1923 (weryfikacja w trakcie po OCR)
Urodzenia zakres 1826-1908 poz do wpisania 64.755 cz. uzupełniona
Małżeństwa: zakres 1826-1916 częściowo wpisane (w trakcie weryfikacji po OCR).
Szczegóły na forum specjalnym dla wolontariuszy.
Zgony zakres:1826-1908 wpisana cz.1886-1923 (weryfikacja w trakcie po OCR)
Urodzenia zakres 1826-1908 poz do wpisania 64.755 cz. uzupełniona
Małżeństwa: zakres 1826-1916 częściowo wpisane (w trakcie weryfikacji po OCR).
Szczegóły na forum specjalnym dla wolontariuszy.
Re: Jak wykonć indeksację -pytania wolontariuszy
do powyższego postu Uwaga!
dotyczy zgonów z zakresu 1886-1900
Wykonany OCR z dostępnych kiedyś plików w formacie pdf (podobno był też inny OCR) z sumariuszy, nie jest tożsamy z numerami metryk z tego zakresu zamieszczonymi w http://metryki.genealodzy.pl/metryki.php .
dla przykładu rok 1898
Mazurkiewicz Jan (213)-sumariusz nr 199 metryki zamieszczony skan
itp.
Trzeba zwrócić uwagę czy da się (jest opłacalne) poprawianie i weryfikacja po OCR-sumariusza jeśli numeracja aktów nie jest identyczna z zamieszczonymi skanami.(być może istnieje inna wersja sumariusza z powyższego zakresu).
Nie sprawdzałem wszystkich roczników czy sumariusz jest tożsamy z numeracją (faktyczna)
innej wersji sumariusza np USC a nie kościelnego.
Dobrym rozwiązaniem byłoby podawanie źródła z którego robione są indeksy (kościelne,USC),gdyż w tym przypadku jest to bardzo istota różnica "Nr aktu",ale jest to kolejna kolumna-dodatkowa wpływająca na obciążenie bazy(szybkość wyszukiwania ,kryteria itp).W parafiach posiadających "podwójne dokumenty" jest to konieczne ,aby niedoświadczeni poszukiwacze ,zwracając się o wydanie kopii aktu nie podawali Nr aktu "kościelnego" jako tożsamego z Nr aktu "USC" i odwrotnie.
Dobrym przykładem są indeksy zgonów z zakresu 1860-85.Są to indeksy wykonane przez p.
Alinę Dąbkowską (może to nick) .Brakuje tam co prawda ponad 700 imion(nie licząc nie wpisywania podwójnych imion) i ok 140 nr aktów. ale przy takiej ilości wykonanych indeksów (prawie 16 tys.) to braki można uznać za znikome.Być może są to niezawinione braki ,a błędne wyświetlenie niektórych rekordów w genetece.Częstą przyczyną takiego braku wyświetlania uzupełnionego rekordu jest brak sformatowania komórek poprzez sporządzającego indeks (wyczyszczenie-leading and trailing white-space ) jaki potem przez
wstawiającego rekordy do bazy.Nie sprawdzałem ilości zdublowanych numerów aktów tj.
jednemu numerowi aktu zdarza się czasami przypisanie 2-ch,3-ch różnych Nazwisk w tym samym roczniku.Sytuacja taka zdarza się bardzo często przy wykonywaniu indeksów z sumariuszy.
Policzona ilość indeksów (rekordów) dla danego rocznika zgadza się np.100 ,ale w tym jest 5 razy ten sam numer aktu , a brakuje nr 15, 23,56 ,75,86 itd.
Każdy może spróbować własnych sił i wykonując praktycznie indeksy nauczy się unikania i popełniania błędów-pomyłek nabywając przy tym doświadczenia na przyszłość.
dotyczy zgonów z zakresu 1886-1900
Wykonany OCR z dostępnych kiedyś plików w formacie pdf (podobno był też inny OCR) z sumariuszy, nie jest tożsamy z numerami metryk z tego zakresu zamieszczonymi w http://metryki.genealodzy.pl/metryki.php .
dla przykładu rok 1898
Mazurkiewicz Jan (213)-sumariusz nr 199 metryki zamieszczony skan
itp.
Trzeba zwrócić uwagę czy da się (jest opłacalne) poprawianie i weryfikacja po OCR-sumariusza jeśli numeracja aktów nie jest identyczna z zamieszczonymi skanami.(być może istnieje inna wersja sumariusza z powyższego zakresu).
Nie sprawdzałem wszystkich roczników czy sumariusz jest tożsamy z numeracją (faktyczna)
innej wersji sumariusza np USC a nie kościelnego.
Dobrym rozwiązaniem byłoby podawanie źródła z którego robione są indeksy (kościelne,USC),gdyż w tym przypadku jest to bardzo istota różnica "Nr aktu",ale jest to kolejna kolumna-dodatkowa wpływająca na obciążenie bazy(szybkość wyszukiwania ,kryteria itp).W parafiach posiadających "podwójne dokumenty" jest to konieczne ,aby niedoświadczeni poszukiwacze ,zwracając się o wydanie kopii aktu nie podawali Nr aktu "kościelnego" jako tożsamego z Nr aktu "USC" i odwrotnie.
Dobrym przykładem są indeksy zgonów z zakresu 1860-85.Są to indeksy wykonane przez p.
Alinę Dąbkowską (może to nick) .Brakuje tam co prawda ponad 700 imion(nie licząc nie wpisywania podwójnych imion) i ok 140 nr aktów. ale przy takiej ilości wykonanych indeksów (prawie 16 tys.) to braki można uznać za znikome.Być może są to niezawinione braki ,a błędne wyświetlenie niektórych rekordów w genetece.Częstą przyczyną takiego braku wyświetlania uzupełnionego rekordu jest brak sformatowania komórek poprzez sporządzającego indeks (wyczyszczenie-leading and trailing white-space ) jaki potem przez
wstawiającego rekordy do bazy.Nie sprawdzałem ilości zdublowanych numerów aktów tj.
jednemu numerowi aktu zdarza się czasami przypisanie 2-ch,3-ch różnych Nazwisk w tym samym roczniku.Sytuacja taka zdarza się bardzo często przy wykonywaniu indeksów z sumariuszy.
Policzona ilość indeksów (rekordów) dla danego rocznika zgadza się np.100 ,ale w tym jest 5 razy ten sam numer aktu , a brakuje nr 15, 23,56 ,75,86 itd.
Każdy może spróbować własnych sił i wykonując praktycznie indeksy nauczy się unikania i popełniania błędów-pomyłek nabywając przy tym doświadczenia na przyszłość.
Re: Jak wykonć indeksację -pytania wolontariuszy
Prośba o potraktowanie tego postu jako materiału szkoleniowego dla wolontariuszy wykonujących indeksacje po raz pierwszy lub mających małą praktykę w tym zakresie.
Należy cieszyć się z każdego wolontariusza i być mu wdzięcznym za chęć poświęcenia własnego czasu,aby zrobić coś dla innych.Nie wolno traktować tego w formie krytyki lub zarzutów adresowanych do autora.Oby wszystkim nam udało się popełnić jak najmniejszą liczbę błędów.Gdybyśmy (gdybanie) mieli system takiej wielostopniowej weryfikacji jak posiadają niektóre kraje i taką ilość wolontariuszy chętną do pracy to...
Geneza powstawania błędów w trakcie wykonywania indeksacji jest w dużym stopniu uzależniona od praktyki i doświadczenia indeksującego.Tej praktyki nabywa się z czasem i ilością zindeksowanych metryk.
Ponieważ nie wszystkie skany są dostępne na portalch nie można mieć skali porównawczej jakości i staranności wykonania tej pracy.Wiele zależy również od sposobu wyświetlania zindeksowanych zasobów w bazie danych. Wolontariusz zrobił to super porządnie i starannie a wyniki wyświetlania są różne od tego co posiada np. w orginalnym arkuszu Excela z np.powodów wcześniej wymienionych.
Dla zobrazowania nieścisłości podaję przykład z powyższej indeksacji tylko na przykładzie jednego rocznika:Zgony 1860
Ilość rekordów ....665 ... na portalu 669 skanów (ostatni nr metryki )
braki rekordów 21,228,275,354,382,489,490,540,566,615,623,630,641,647,661
duble 128:Ulczyńska Marcjanna,Zajdlewska Anna
duble 272:Krasuska Marianna,Dzięgielewski Edward
duble 339:Bączyńska Antonina,Lakner Julia,Słomiński
duble 340:Chyczewska,Morantowicz
duble 344:Dębski Józef,Tomczyk
duble 405:Bednowski Ryszard,Skorubska Bronisława
duble 467:Ciepły Adam,Lewy Jan
duble 480:Hofman Marianna,Kozioł
duble 486:Breza Eustachi,Zaleski Władysław
duble 548:Pyschyng Marianna,Zdrodowska Eufrozyna
duble 582:Bątkowiak Teodor,Mędrzycki Kazimierz
duble 614:Frankiensztejn Elżbieta,Kaniewska Marianna,Owszyński Tomasz,
duble 621:Hipsch Antoni,Zieliński Walery
Jest wiele metod na wyeliminowanie tych błędów.Każda z nich wymaga jednak dużej cierpliwości i wielokrotnego sprawdzania wykonanej pracy pod różnym kątem.To zabiera mnóstwo czasu i nie zawsze po wykonaniu indeksów starcza go na dokładne sprawdzenie.Brak innych pomagających zweryfikować z wielkim mozołem wpisanych danych przez jednego tylko wolontariusza powoduje że efekt końcowy czasami odbiega od naszych oczekiwań i zamierzeń.
Nie popełniają błędów jedynie Ci którzy nic nie robią, oczekując gotowych i bezbłędnych indeksów od innych,a w przypadku zawinionej lub niezawinionej pomyłki wolontariusza
potrafią jedynie krytykować i mieć pretensje.
Należy cieszyć się z każdego wolontariusza i być mu wdzięcznym za chęć poświęcenia własnego czasu,aby zrobić coś dla innych.Nie wolno traktować tego w formie krytyki lub zarzutów adresowanych do autora.Oby wszystkim nam udało się popełnić jak najmniejszą liczbę błędów.Gdybyśmy (gdybanie) mieli system takiej wielostopniowej weryfikacji jak posiadają niektóre kraje i taką ilość wolontariuszy chętną do pracy to...
Geneza powstawania błędów w trakcie wykonywania indeksacji jest w dużym stopniu uzależniona od praktyki i doświadczenia indeksującego.Tej praktyki nabywa się z czasem i ilością zindeksowanych metryk.
Ponieważ nie wszystkie skany są dostępne na portalch nie można mieć skali porównawczej jakości i staranności wykonania tej pracy.Wiele zależy również od sposobu wyświetlania zindeksowanych zasobów w bazie danych. Wolontariusz zrobił to super porządnie i starannie a wyniki wyświetlania są różne od tego co posiada np. w orginalnym arkuszu Excela z np.powodów wcześniej wymienionych.
Dla zobrazowania nieścisłości podaję przykład z powyższej indeksacji tylko na przykładzie jednego rocznika:Zgony 1860
Ilość rekordów ....665 ... na portalu 669 skanów (ostatni nr metryki )
braki rekordów 21,228,275,354,382,489,490,540,566,615,623,630,641,647,661
duble 128:Ulczyńska Marcjanna,Zajdlewska Anna
duble 272:Krasuska Marianna,Dzięgielewski Edward
duble 339:Bączyńska Antonina,Lakner Julia,Słomiński
duble 340:Chyczewska,Morantowicz
duble 344:Dębski Józef,Tomczyk
duble 405:Bednowski Ryszard,Skorubska Bronisława
duble 467:Ciepły Adam,Lewy Jan
duble 480:Hofman Marianna,Kozioł
duble 486:Breza Eustachi,Zaleski Władysław
duble 548:Pyschyng Marianna,Zdrodowska Eufrozyna
duble 582:Bątkowiak Teodor,Mędrzycki Kazimierz
duble 614:Frankiensztejn Elżbieta,Kaniewska Marianna,Owszyński Tomasz,
duble 621:Hipsch Antoni,Zieliński Walery
Jest wiele metod na wyeliminowanie tych błędów.Każda z nich wymaga jednak dużej cierpliwości i wielokrotnego sprawdzania wykonanej pracy pod różnym kątem.To zabiera mnóstwo czasu i nie zawsze po wykonaniu indeksów starcza go na dokładne sprawdzenie.Brak innych pomagających zweryfikować z wielkim mozołem wpisanych danych przez jednego tylko wolontariusza powoduje że efekt końcowy czasami odbiega od naszych oczekiwań i zamierzeń.
Nie popełniają błędów jedynie Ci którzy nic nie robią, oczekując gotowych i bezbłędnych indeksów od innych,a w przypadku zawinionej lub niezawinionej pomyłki wolontariusza
potrafią jedynie krytykować i mieć pretensje.
Re: Jak wykonć indeksację -pytania wolontariuszy
Zasada logiczności do indeksacji zdarzeń typu zgony
Aby uniknąć pomyłek podczas indeksowania należy :
a.)zapoznać się z ilością wszystkich metryk i automatycznie ponumerować LP.
b. jeśli już w samej księdze występuje dubel 2-gi numeru oznaczyć np 112a
c.jeśli w księdze nr ominięty -adnotacja brak zapisu w poz.112
d. dla osób Nieznanego Nazwiska (topielcy i inne bez identyfikacji) Nazwisko NN-kobieta ,-dziecko,-mężczyzna ...(dziecko) Imiona = bezimienna ,bezimienny
e.) martwo narodzone dzieci j.w + Nazwisko
f.Jeśli występuje (Voto lub vel) zapisujemy przy nazwisku
g. dla indeksów pełnych dodatkowa kolumna (rodowe) zd.
Co przesyłamy do baz typu indeksy roczne:
a.)tylko osoby zidentyfikowane z Nazwiska wraz z numerem aktu
.pomijamy NN i brak zapisu - unikając zaśmiecania bazy zapisami bezużytecznymi w poszukiwaniach (są one użyteczne przy opracowaniach i statystykach)
b. baza zindeksowana (u siebie jest inna bo zawiera wszystkie akta i kolejność)
Różnica jest taka ,że mamy sprawdzone wszystkie akta i unikamy pominięcia aktu lub
przypisywania Nr Aktu do 3-ch różnych Nazwisk ,a to jest istotą rzeczy dla poszukujących z indeksów rocznych --ważny rocznik ,Nazwisko ,Nr Aktu
Spisując z sumariuszy (alfabetyczne) po wpisaniu nr aktu - posortować w/g kolejności metryk LP. Dla dużych parafii do 10 tys zdarzeń rocznie lp. 4 pozycyjne 0001,0002 ...9999 itd.(format komórki w kolumnie tekstowe-od lewej do prawej)
Klick sortuj A-Z na tej kolumnie spowoduje ustawienie w/g numeracji kolejnych.
Tak sprawdzony arkusz (nic nie brakuje, ani nie ma zdublowanych -ewentualnie poprawić i uzupełnić) można ponownie ustawić alfabetycznie (Nazwiska). Ustawianie w/g Nazwiska nie ma znaczenia przy bazach składających się z wielu roczników i późniejszym wyszukiwaniu Nazwiska np.w przedziale lat 1860-1885.(to tylko łatwość wyszukania ale w danym roczniku).
Ps.Dla wolontariuszy na forum (specjalnym) dostępny materiał poglądowy (do pobrania) zweryfikowane zgony z przedziału 1860-65. Weryfikacja tylko pod kątem ilości ominiętych
i zduplikowanych rekordów.(Pogrubiona czcionka - wstawione nowe rekordy w stosunku do orginału).
Aby uniknąć pomyłek podczas indeksowania należy :
a.)zapoznać się z ilością wszystkich metryk i automatycznie ponumerować LP.
b. jeśli już w samej księdze występuje dubel 2-gi numeru oznaczyć np 112a
c.jeśli w księdze nr ominięty -adnotacja brak zapisu w poz.112
d. dla osób Nieznanego Nazwiska (topielcy i inne bez identyfikacji) Nazwisko NN-kobieta ,-dziecko,-mężczyzna ...(dziecko) Imiona = bezimienna ,bezimienny
e.) martwo narodzone dzieci j.w + Nazwisko
f.Jeśli występuje (Voto lub vel) zapisujemy przy nazwisku
g. dla indeksów pełnych dodatkowa kolumna (rodowe) zd.
Co przesyłamy do baz typu indeksy roczne:
a.)tylko osoby zidentyfikowane z Nazwiska wraz z numerem aktu
.pomijamy NN i brak zapisu - unikając zaśmiecania bazy zapisami bezużytecznymi w poszukiwaniach (są one użyteczne przy opracowaniach i statystykach)
b. baza zindeksowana (u siebie jest inna bo zawiera wszystkie akta i kolejność)
Różnica jest taka ,że mamy sprawdzone wszystkie akta i unikamy pominięcia aktu lub
przypisywania Nr Aktu do 3-ch różnych Nazwisk ,a to jest istotą rzeczy dla poszukujących z indeksów rocznych --ważny rocznik ,Nazwisko ,Nr Aktu
Spisując z sumariuszy (alfabetyczne) po wpisaniu nr aktu - posortować w/g kolejności metryk LP. Dla dużych parafii do 10 tys zdarzeń rocznie lp. 4 pozycyjne 0001,0002 ...9999 itd.(format komórki w kolumnie tekstowe-od lewej do prawej)
Klick sortuj A-Z na tej kolumnie spowoduje ustawienie w/g numeracji kolejnych.
Tak sprawdzony arkusz (nic nie brakuje, ani nie ma zdublowanych -ewentualnie poprawić i uzupełnić) można ponownie ustawić alfabetycznie (Nazwiska). Ustawianie w/g Nazwiska nie ma znaczenia przy bazach składających się z wielu roczników i późniejszym wyszukiwaniu Nazwiska np.w przedziale lat 1860-1885.(to tylko łatwość wyszukania ale w danym roczniku).
Ps.Dla wolontariuszy na forum (specjalnym) dostępny materiał poglądowy (do pobrania) zweryfikowane zgony z przedziału 1860-65. Weryfikacja tylko pod kątem ilości ominiętych
i zduplikowanych rekordów.(Pogrubiona czcionka - wstawione nowe rekordy w stosunku do orginału).
Re: Jak wykonć indeksację -pytania wolontariuszy
Dla porównania i samodzielnej weryfikacji kolejny rok 1866.Każdy może sprawdzić i potraktować jako
praktyczne szkolenie.Zawartość bazy z zawartością umieszczonych metryk.
praktyczne szkolenie.Zawartość bazy z zawartością umieszczonych metryk.
Re: Jak wykonć indeksację -pytania wolontariuszy
Dla zaawansowanych indeksujących mały teścik do rozwiązania (zaznaczam początkujący
i z małym doświadczeniem nie poradzą sobie z tym teścikiem) .
Każdy może siebie sprawdzić ,czy może się zaliczać do zaawansowanych indeksujących.
Nie sprawdzana weryfikacja Nazwisk ,chodzi o ułożenie w/g kolejności metryk.
Nagroda dla rozwiązujących - dowiedzą się nazwiska trojaczków i własna satysfakcja.
Rozwiązanie testu jest dostępne na forum (specjalnym) dla wolontariuszy.-do
sprawdzenia poprawnej kolejności.
Mnie udało się to z z brakiem 6 Nazwisk (ustawienie ze znakiem zapytania) i brakiem
1-ej pozycji.
To są zgony z św.Jana Rok 1871r.
załącznik z Geneteki.Sprawdzenie w/g skanów zamieszczonych na portalu genealodzy.
Dla ułatwienia podam ze ma być 526 rekordów.
i z małym doświadczeniem nie poradzą sobie z tym teścikiem) .
Każdy może siebie sprawdzić ,czy może się zaliczać do zaawansowanych indeksujących.
Nie sprawdzana weryfikacja Nazwisk ,chodzi o ułożenie w/g kolejności metryk.
Nagroda dla rozwiązujących - dowiedzą się nazwiska trojaczków i własna satysfakcja.
Rozwiązanie testu jest dostępne na forum (specjalnym) dla wolontariuszy.-do
sprawdzenia poprawnej kolejności.
Mnie udało się to z z brakiem 6 Nazwisk (ustawienie ze znakiem zapytania) i brakiem
1-ej pozycji.
To są zgony z św.Jana Rok 1871r.
załącznik z Geneteki.Sprawdzenie w/g skanów zamieszczonych na portalu genealodzy.
Dla ułatwienia podam ze ma być 526 rekordów.
Re: Jak wykonć indeksację -pytania wolontariuszy
Zgony z Św.Jan zakres 1860-1885 po weryfikacji dubli i braków (bez weryfikacji poprawności nazwisk) dostępne dla wolontariuszy (Forum specjalne dla odpowiedniej rangi).
W arkuszach zaznaczone braki skanów lub pomyłek w numeracji skanów.Opis przy załączonym pliku.
W arkuszach zaznaczone braki skanów lub pomyłek w numeracji skanów.Opis przy załączonym pliku.
Re: Jak wykonć indeksację -pytania wolontariuszy
Zgony ze św Jana zakres 1886-1910
Zapisy po OCR .Arkusze ustawione w/g kolejności roczników i numerów aktów (odpowiedni zapis w kolumnie Nr aktu) do swobodnego poprawnego sortowania za pomocą funkcji dostępnej w Excelu.Wtajemniczeni w niuanse excelowe znają problem sortowania liczb (var).
Wyrywkowe sprawdzenie w rocznikach zgadza się ze skanami.Do weryfikacji poprawność zapisu nazwisk.
Skoroszyt(Arkusze roczników) dostępny będzie na specjalnym forum dla wolontariuszy.
Zapisy po OCR .Arkusze ustawione w/g kolejności roczników i numerów aktów (odpowiedni zapis w kolumnie Nr aktu) do swobodnego poprawnego sortowania za pomocą funkcji dostępnej w Excelu.Wtajemniczeni w niuanse excelowe znają problem sortowania liczb (var).
Wyrywkowe sprawdzenie w rocznikach zgadza się ze skanami.Do weryfikacji poprawność zapisu nazwisk.
Skoroszyt(Arkusze roczników) dostępny będzie na specjalnym forum dla wolontariuszy.
Re: Jak wykonć indeksację -pytania wolontariuszy
Zgony ze Św.Jana --rocznik 1847 (brak skorowidza do metryk)
Indeksy dostępne dla wolontariuszy na forum spec.
Z 543 rekordów --brak jest 10 Nazwisk (brak skanu lub urwany).Kolejność metryk prawidłowa.
Nazwiska zweryfikowane.
Indeksy dostępne dla wolontariuszy na forum spec.
Z 543 rekordów --brak jest 10 Nazwisk (brak skanu lub urwany).Kolejność metryk prawidłowa.
Nazwiska zweryfikowane.