breaking_news Neuigkeiten
breaking_news

2. Februar 2024

Heute wurden ein größeres Update eingespielt. Zum einen wurde weiter an der Verbesserung der Vornamenerkennung gearbeitet und es konnte die Anzahl der Einträge ohne erkannten Vornamen reduziert werden. Aktuell haben ca. 2% der Einträge keinen erkannten Vornamen. Dies liegt oft an Fehlern im Scan und eine automatische Erkennung ist dann schwierig. Die verbliebenen Fälle gehe ich daher nach und nach manuell durch. Das ist auch nötig, da manchmal die Erkennung, was überhaupt ein Eintrag ist, fehlerhaft sein kann. Dies liegt zum Teil auch an Satzfehlern. Bei folgendem Beispiel gibt es zwar einen Spiegelstrich als ob ein neuer Eintrag beginnt, der Inhalt gehört aber zum vorherigen Eintrag:

navigate_next
navigate_before

Beim nächsten Beispiel handelt es sich um einen Eintrag mit einem neuen Familiennamen, aber es wurde fälschlich ein Spiegelstrich gesetzt als ob der Eintrag zum vorherigen Familiennamen gehört und Jurkowitz der Vorname ist:

navigate_next
navigate_before

Auf vielen Seiten ist aber auch einfach die Scanqualität sehr schlecht:

navigate_next
navigate_before

Neben den Vornamens-Verbesserungen wurden die Einträge mit den Familiennamen, die mit den Buchstaben H, I und J beginnen, hinzugefügt. Das sind rund 88.000 neue Einträge. Insgesamt sind nun 316.058 Personeneinträge online (bei 44.729 verschiedenen Familiennamen).

breaking_news

30. Dezember 2023

Zum Abschluss des Jahres nochmal ein Update. Diesmal sind die Einträge des Familiennamens G hinzugekommen (50.000 neue Einträge). Auch für einige schon vorhandene Einträge konnte die Qualität weiter verbessert werden (diesmal vor allem im Bereich der Vornamen). Insgesamt sind inzwischen 227.694 Personeneinträge online (bei 34.222 verschiedenen Familiennamen).

breaking_news

13. Dezember 2023

Heute wurden weitere Updates eingespielt. Es konnten alle Einträge deren Familienname mit E und F beginnt hinzugefügt werden (50.000 neue Einträge), sodass nun insgesamt 177.325 Personeneinträge online sind (mit 26.524 verschiedenen Familiennamen).

breaking_news

16. November 2023

Heute wurden weitere Updates eingespielt. Aktuell werden Firmeneinträge noch nicht weiter auf Namen analysiert (das ist für die Zukunft geplant), trotzdem kann man sich beim Durchklicken durch das Adressbuch natürlich auch diese Einträge anschauen. Daher wurde die Anzeige dieser Einträge auf dieser Seite und die Berechnung dieser Einträge verbessert. Zusätzlich konnten alle Einträge deren Familienname mit D beginnt hinzugefügt werden (25.000 neue Einträge), sodass nun insgesamt 127.861 Personeneinträge online sind (mit 20.599 verschiedenen Familiennamen).

breaking_news

24. Oktober 2023

Heute wurde das erste Update eingespielt. Zum einen konnte die Qualität der ersten Einträge nochmal ein wenig erhöht werden, zum anderen kamen 23.000 weitere Einträge hinzu. Somit sind nun alle Personen mit den Familiennamen-Anfangsbuchstaben A bis C online, insgesamt 102.803 Personeneinträge (15.400 verschiedene Familiennamen).

breaking_news

6. Oktober 2023

Es ist soweit: Die erste Version ist online gestellt!
Noch sind nur wenige Daten des Berliner Adressbuchs von 1919 verfügbar (79.690 Personeneinträge; Anfangsbuchstaben A-Br), aber ich möchte nicht warten, bis alle Daten fertig sind.
Die Qualität der Adressbuch-Scans ist leider sehr schlecht. Eine vollautomatische Ermittlung der Familiennamen ist zu fehleranfällig, um sie ohne Prüfung online zu stellen. Der begrenzende Faktor ist daher derzeit die manuelle Prüfung aller Familiennamen (aktuell schon 10.600 verschiedene Namen). Dieser Prozess muss hoffentlich nur für ein Adressbuch komplett manuell gemacht werden, für kommende Adressbücher können diese Daten zum Abgleich genutzt werden. Insgesamt hat das Berliner Adressbuch von 1919 schätzungsweise 820.000 Einträge.