100-letni Gedcom-Indeksacja parafii

marksp
Site Admin
Site Admin
Posty: 494
Rejestracja: 27 marca 2018, 11:51 - wt

100-letni Gedcom-Indeksacja parafii

Post autor: marksp » 24 stycznia 2016, 10:13 - ndz

Indeksacyjny GEDcom dla całej parafii dla danego zdarzenia

1.Przygotowanie kolumny Sex (dla wszystkich osób nie tylko dla nazwisk Nowo-zaślubionych)

Znaczące różnice dla standardowo indeksujących np zdarzenie (Małżeństwo -cały rocznik) ,czyli data,miejsce,nazwiska małżonków
,nazwiska rodziców,nr aktu itd. (na myśli arkusz Excela) jest uzupełnienie nie wymagające znaczącej ilości czasu o kolumny wymagane
dla Gedcom tj np Kolumna płeć (SEX) .Każda osoba (Indyviduals)musi ją posiadać (ważne dla weryfikacji używanej przez programy genealogiczne).
Dostawienie tej kolumny i uzupełnienie to są sekundy.


2.Kolumny Nazwisko Ojca dla Nowo-zaślubionych

Dodatkowym elementem dla rodziców tych nowo zaślubionych( czyli ich dzieci) jest
dodanie Kolumny Nazwisko Ojca (standardowo jest podane tylko Imię ojca). Wykonuje się to poprzez skopiowanie nazwiska nowo-zaślubionego.
Dla kobiet Typowe -ska zamieniane przy nazwisku Ojca na -ski (trochę więcej czasu na zamianę nazwisk kończących się na "a" np Marianna Czapla ,
a ojciec przy standardowej zamianie miałby końcówkę "i" czyli Antoni Czapli zamiast Antoni Czapla). Należy zwrócić uwagę na nowo-zaślubionych których ojcowie są nieznani i noszą nazwisko matki lub nazwisko nadane na chrzcie.(Szybki filtr auto i uzupełnienie na NN),(Nazwisko ojca będzie miało postać NN NN w interpretacji graficznej i tekstowej) ,ale Nazwisko "młodej" i "młodego" będzie nazwiskiem matki lub nazwiskiem nadanym (w postaci graficznej 2 x kwadraciki z NN ,czyli nieznani rodzice) i 2 kwadraciki z nazwiskami obojga małżonków

Nazwiska matki (czyli rodowe matki) przy pełnej indeksacji są podawane (uwaga na NN -też uzupełnić j.w)

3.Kolumna ilość małżeństw dla Nowo-zaślubionych

Ważnym elementem jest przygotowanie w arkuszu, kolumny dla oznaczenia ilości zawartych małżeństw (m1,m2,m3 ... ż1,ż2,ż3....). (potem używanie auto filtra) dla wyłapania osób (multi-małżeńskich czyli tych z 2,3,4 itd)

Przy multi małżeństwach ilość powiązań wzrasta (ilość kwadracików)

4.arkusz excela dla m1 dla ż1 i arkusze eksporty dla tych rekordów

Zaczynamy od najprostszej wersji czyli nazwiska z m1 (czyli kobieta posiadająca tylko 1-go męża) (auto filtr) skopiowanie i przeniesienie do nowego arkusza (pamiętać należy) o ilości rekordów ( Max pojemność arkusza z formułą). Jeśli mamy arkusz eksportu z formułą na 50 tys lini-rowsy to maksymalna ilość rekordów do skopiowania (rowsów) musimy podzielić przez 4 czyli 12.500 (jeśli ilość rekordów w całej bazie parafialnej małżeństw z np 100 lat wynosi 20 tys rekordów to trzeba podzielić arkusze eksportu na np nazwa arkusza i pliku ged m1part1 lub ż1 czyli mężczyzna posiadający tylko 1-ną żonę (to forma do wyboru) czy robimy po lini męskiej czy po kądzieli .Dla m1 czy ż1 dane będą takie same
w eksporcie do pliku ged.

Różnice są dla multi-małżeństw .W większości przypadków dla mężczyzn nowo-zaślubionych (podani rodzice nowo-zaślubionego po raz n-ty) posiadają formę np. s.Mateusza i Marianny(brak rodowego),a nazwisko ojca jest nazwiskiem nowo-zaślubionego.Nagminnie występuje sformułowanie (wdowiec,rozwiedziony itp)
bez podania poprzedniej żony (nazwiska i imię ) bądź podane jest tylko imię poprzedniej żony.Często występuje przypadek kiedy poprzednia żona była również w związku-multi, czyli kawaler żeni się z wdową .Zapis graficzny będzie wówczas wyglądał :on i jego rodzice (3 kwadraciki) + żona i jej rodzice (3 kwadraciki) oraz dodatkowo linia łącząca ją z kwadracikiem byłego męża (w indeksacji rodzice byłego męża nie są podawani). Łącznie 7
kwadracików dla tego małżeństwa.

Im więcej małżeństw zawartych tych więcej opisów np 3x wdowa (3 nazwiska pop. mężów + własne rodowe + nazwiska jej rodziców) po raz 4-ty zwiera
małżeństwo z potrójnym wdowcem,który również po raz 4-ty zawiera małżeństwo. (więcej kwadracików w grafice)

Ustawienia dla arkusza tymczasowego przed wstawieniem go do arkusza eksportowego do pliku gedcom.

Przykład męski dla przypadku ż1 (małżeństwa)

Kol A -Nr Indi
Kol B -Nazwisko
Kol C -Imię
Kol D -pusta (Nick)
Kol E -Sex(płeć) czyli zapis M lub F
Kol F -Nr Indi Ojca
Kol G -Nr Indi Matki
Kol H -Nr Indi Małżonka
Kol I,J (puste nie używane w standardowej indeksacji ,czyli data i miejsce urodzenia )
Kol K -data ślubu
Kol L -miejsce ślubu (przypadek indeksacji -parafia)
Kol M.N (puste) data śmierci i miejsce -nie używane przy indeksacji dla małżeństw
Kol O ( puste) tu można podać link do foto skanu aktu
Kol P Note - tu podany Nr Aktu małżeństwa dla jasności pr aktu należy poprzedzić rocznikiem np.1850_0012

- dla nazwiska małżonka

Nadajemy nr IDI (kol A) czyli (szybka numeracja zaznaczonych cell) np 1 -1000 (format center .context)

Kol E szybki fill w zaznaczonych celach Litery M (dla mężczyzny) od 1-1000 w tej kolumnie (format center .context)

-zostawiamy sobie rząd przerwy (dla oddzielenia)

z przygotowanego arkusza (tymczasowego) przenosimy nazwiska i imiona męża do Kol B i C (powinno być ich tyle samo czyli 1000)

w kolumnie A (szybka numeracja jak wyżej od 1001 -2000) -są to Indi -męża
w kol E -wstawiamy mężowi M ,żonie F (od 1001-2000) (szybki fill)

- zostawiamy pusty rząd dla oddzielenia

z przygotowanego arkusza (tymczasowego) przenosimy nazwiska i imiona Matki
W kol A szybki fill 2001-3000) -są to Indi -matki

Kolumna E (2001 -3000) szybki Fill F -bo matka to kobieta

- zostawiamy pusty rząd dla oddzielenia

z przygotowanego arkusza (tymczasowego) przenosimy nazwiska i imiona ojca

W kol A szybki fill (3001-4000) -są to Indi -ojca

Kolumna E (3001 -4000) szybki Fill M -bo to ojciec mężczyzna

---------Na tym zakończymy uzupełnianie kol "A-E"

Kolejny krok łączenie małżonków zarówno nowożeńców jaki ich rodziców w pary (dotyczy Kol "H")

Z kolumny A (mężczyzna lub kobieta -nowo-zaślubieni) Nr Indi 1-1000 kopiujemy do
Kol "H" czyli od 1001 -2000 jeden małżonek ma w "A" 1 a drugi w "H" 1001

to samo dla drugiego małżonka i wyglądać to będzie "A" 1001 a w "H" 1

-teraz rodzice łączenie ich w małżeństwo

Indi Ojca z kol "A" przenosiny(kopiujemy) do kol "H" matki

czyli 3001-4000 tj matka w "A" 2001 a w "H" 3001
to samo dla ojca tj ojciec w "A" 3001 a w "H" 2001

czyli małżeństwa rodziców i nowożeńców połączone


-kolejny krok dot kol G (dotyczy dodawania rodziców nowo-zaślubionemu)

Nowo-zaślubionemu dodajemy Indi matki

Nowo-zaślubiony 1-1000 a w kol G indi matki 2001-300 tj "A" 1 a w "G" 2001

-Kolejny krok dodajemy Indi ojca nowo-zaślubionemu kol "F"

Nowo-zaślubiony 1-1000 a w kol "F" indi ojca 3001-4000 tj "A" 1 a w "F" 3001

-Uwaga tylko nowo-zaślubiony posiada wypełnione wszystkie KOL "F-H" (w zakresie 1000) Rodzice nowo-zaślubionych w przedziale kol "F-H"
mają wypełnioną jedynie "H" gdyż w indeksacji nie występują rodzice rodziców (tylko indywidualne drzewo rodzinne).

-dodawanie daty ślubu dotyczy tylko nowożeńca (w indeksacji) nie dotyczy rodziców (tylko w drzewach rodzinnych)

Kol "K"
Datę ślubu kopiujemy w Kol "K" dla obydwu nowo-zaślubionych w przedziale 1-1000 i dla drugiego 1001-2000

Kol "L" -parafia ślubu (indeksacja)


Kol "O" Nr Aktu kopiujemy dla obydwu nowo-zaślubionych w przedziale 1-1000 i dla drugiego 1001-2000

Po zakończeniu uzupełniania likwidujemy cały rows pusty aby w Kolumnie "A" były kolejne ID (nie przesunąć lini).

To jest zakończenie przygotowania arkusza tymczasowego przed wklejeniem go w arkusz eksportowy (dodatkowe kolumny Q-V)

Po eksporcie otrzymujemy gotowy plik ged dla małżeństwo-singli (kawaler+ panna)

Multi w następnej instrukcji

marksp
Site Admin
Site Admin
Posty: 494
Rejestracja: 27 marca 2018, 11:51 - wt

Re: 100-letni Gedcom-Indeksacja parafii

Post autor: marksp » 29 lutego 2016, 12:47 - pn

Tips and Trick

Fleksy typu VSFlexgrid(7,8) nie posiadają funkcji (lub skomplikowane procedury) sortowania
danych podobne do tych używanych w skoroszytach Excela typu ranga.

Przed zliczaniem ilości rodzin przykład wzięty z macra
"wrks2.Range("A" & wrks2row0 & ":E" & j + 1).Sort Key1:=wrks2.Range("A" & wrks2row0)"

sortuje oddzielnie 2 zakresy kolumn A do E i F-H. (Excel)

Sortowanie takie należy wykonać i we flexie.(nie we wszystkich można )TwoDimArray.
Można prościej oszukać flexa stosując dla 1 zakresu 1 "grd.Sort = flexSortNumericAscending"

a drugi zakres skopiować do flexa temp (3 kolumny zapisywane w programie
kolejno :family 1 do np 1000 ) -prosta funkcja przepisania 3 wybranych kolumn
które nie wymagają sortowania. Po wykonaniu programowego sortowania zakresu 1 -jeszcze przed krokiem
zliczania rodzin należy ponownie przepisać z tempa te 3 kolumny do flexa zliczającego
(programowe sortowanie w/g kolumny A zmienia również zawartość F-H). Dla prawidłowego zapisu
do eksportowanego pliku GED musi być 1 zakres posortowany a drugi jak w orginale zapisu)
(debug step by step zapisu pliku przed sortowaniem we Flexsie nr2)

Dla pewności można dodać funkcję czyszczenia pustych rowsów (już po wykonaniu połączenia
tych 2 zakresów) ,ale tuż przed wykonaniem ostatecznego zliczania ilości rodzin.

marksp
Site Admin
Site Admin
Posty: 494
Rejestracja: 27 marca 2018, 11:51 - wt

Re: 100-letni Gedcom-Indeksacja parafii

Post autor: marksp » 08 kwietnia 2016, 08:45 - pt

Dla bazy danych opisywanym na forum (29.948 wyznaczających IDI)

Baza przeniesiona do XLS-a (np z sql) .
-system zapisu = nr aktu w roczniku np(1826)tj.

0001 Saykowski Aleksander =nieparzysty
0001 Mierzejewska Joanna =parzysty
-kolejność rocznikami (chronologia)
wszystkie pozostałe kolumny w Randze zostaną posortowane w/g priorytetu sortowania

W kolumnie 1.IDI szybka numeracja cel

Kolumna Nazwisko i Imię połączona za pomocą "_"

Wyznaczenie duplikatów nazwisko+imię (ASP utilities)
poprzez Color (jeden kolor np.czerwony) (w menu Ranga)

Następnie w menu Ranga (sortowanie zaawansowane) wybrać cell-kolor (ale zaznaczyć mark wszystkie kolumny -bez nagłówka)
i wyznaczyć kolumnę która ma priorytet sortowania *w moim przypadku kol."E") (cała Ranga tj 29.948)
(powstanie na czerwono 4377 rekordow).

Tworzymy nowy sheet2 (insert):

Skopiować wszystkie kolumny z sheet1 z Rangi (co czerwone to limit) do sheet2 (Łącznie z nagłówkami kolumn,auto-format szerokości kolumn)

Następnie w sheet2 ponownie (te 4377) zaznaczyć i z RANGA wybrać sortowanie tym razem
nie jako Kolor lecz "Value" dla kolumny "E" (wcześniej można odznaczyć kolor czerwony na auto jako pattern-no color)

Po sortowaniu "Value" uzyskamy alfabetycznie Nazwisko+ Imię
(uwaga cała ranga czyli wszystkie kolumny ,aby nie posortować jedynie kol "E" a pozostałe pozostałyby bez zmian tworząc kaszankę w bazie)

Po tym etapie można uzupełniać np.brakujące dane rodziców Xxxx posługując się w pierwotnej
bazie (zasadniczej) nr IDI z Kol nr 1 równoważnej z z kol nr1 IDI bazy pomocniczej.
Uzupełnianie następuje w bazie zasadniczej.

marksp
Site Admin
Site Admin
Posty: 494
Rejestracja: 27 marca 2018, 11:51 - wt

Re: 100-letni Gedcom-Indeksacja parafii

Post autor: marksp » 13 czerwca 2016, 01:36 - pn

Przygotowanie zestawu wdów/rozwiedzionych dla danej parafii (przykład Św.Andrzej Warszawa)

z zestawu małżeństw (przedział 1826-1900) tu: 31.400 rekordów (z tego połowa to rekordy dla KOBIET-małżonek)
stosować filtr M/F dla wyodrębnienia -F.

zastosowany wzór nazwiska dla owdowionych/rozwiedzionych to np. Kowalska zd.Malinowska Joanna

krok 1: dla wdów x1 (czyli następny mąż to m2-aktualny akt) poszukiwany mąż to m1 czyli Kowalski Xxxx

należy oddzielić wszystkie rekordy (filtr) "*.zd." powstanie lista Kobiet powtórnie zawierających małżeństwo.

krok 2 zamieniamy jako nazwisko podstawowe oddzielamy zapisy "zd." .Powstanie "Malinowska_Joanna" a w następnej
kolumnie (Tabeli-dla różnych systemów baz) Kowalski (jako nazwisko byłego męża) -tu trzeba pamiętać o zachowaniu
IDI dla bazy całościowej małżeństw w tej parafii ponieważ przygotowana lista jest tylko niewielką częscią (wzorzec)

Po przepuszczeniu przez np 13 parafii warszawskich (małżeństwa) program sprawdza Kolumnę (tabelę) -porównanie
czy znajduje się zestawienie Malinowska_Joanna i Kowalski Jan "Jan" jest imieniem poprzedniego małżonka.

Zdarzają się przypadki że takie zestawienie znajduje się w 3 parafiach (ten najprostszy układ bez rodziców)
Program zapisuje Imię i parafię np. Jan-ALX.Maciej-Krzyż,Ignacy-Nawiedz (najprostszy okazuje się najlepszy ze względu na błędy zapisowe imon rodziców i np rodowego choć 100% to ta sama osoba.

Dla porównania dokładnego już wykonaniu ręcznym potrzebna jest weryfikacja rocznika -nie może być tak ze małżeństwo z m2 jest 1856, a z m1 1858

krok 3 po zweryfikowani zapisów w liście wdów wstawiany zapisy zweryfikowanych imion byłych małżonków (jako tabela wzorca (kolumna) =IDI ) .Dopisanie następuje w tabeli brakującego imienia byłego małżonka z dopiskiem "Do" dopisane parafia obca a w tabeli uwagi np. [[00153]] - należy podać źródło informacji podlegające weryfikacji przez innych.

Dla opracowujących całe parafie (zakresy min 2 pokolenia, tj min np 50 lat) w zakresie małżeństw nie obca będzie konieczność przygotowania kilku szablonów np w Excelu jako pomocnicze np:

wyodrębniające Kobiety ,kobiety multi-małż , z brakującymi imionami męskimi do dopisania itd
Tagi typu SEX(tabela) =F ,Tagi z IDI-DF kobiety o tych samych nazwiskach i imionach ,Tagi dla kobiet multi-mał wymagających uzupełnienia imienia małżonka (aby np.tworzyć listy tych do uzupełniania) i cała masa szczegółów
które pozwalają na tworzenie różnych plików temp przy pracy na otwartym pliku bazy danych ,wymagających uzupełnienia rekordu docelowego o potrzebne dane z innych baz (np. innych baz parafii warszawskich).
Tu należy zwrócić uwagę że w pozostałych bazach też mamy nieuzupełnione dane np rodziców ,brak wyróżnika płci,stanu cywilnego itd.

To samo dotyczy SEX-M (Mężczyźni w związku małżeńskim)

Prosta wyszukiwarka tylko po Nazwisku jest zupełnie nieprzydatna w miarę zwiększania się ilości rekordów, szczególnie przy bardzo popularnych nazwiskach.Uzyskanie np. 100.000 wyników zgodnych z wpisanym wzorcem wiele nam nie pomoże. (szczególnie do metryk pisanych w języku nieznanym poszukującemu ,lub bardzo nieczytelnym akcie).

Dopisek praktyczny
Postawiony warunek dla zaawansowanych wolontariuszy ma swoje odniesienie właśnie do operacji wykonywanych na bazach danych.Istnieje wiele programów użytecznych lecz przygotowanych dl systemów (np.Windows) 32-bitowych i strukturze x86 .JET 4.0 praktycznie nie funkcjonuje w systemach x64 .Stosowanie niektórych programów wymaga dual-boota, aby przerzucać się do systemów operacyjnych x32 i x64.Próba wymuszenia na systemie 64-bit zgodności działania programu w systemie 32-bit kończy się niepowodzeniem.Potrzebne jest ciągłe nowelizowanie programów pomocniczych ,które po takich upgradach tracą niektóre swoje pierwotne funkcje i stają się już nie tak bardzo funkcjonalne jak w orginale -przewidziane dla odpowiedniej platformy.


Bardziej szczegółowe odpowiedzi po konkretnych pytaniach dotyczących techniki dopisywania danych do istniejącej bazy danych.,oraz przystosowywania bazy z możliwością adaptacji do formatu gedcom (który ma również swoje wymagani).

ODPOWIEDZ