[PostNAS Suite] Anforderung mehrere Importe in einem Schema zu unterscheiden und Projekt-Bereiche mehrfach zu importieren

Jürgen E. Fischer jef at norbit.de
Mi Jun 5 08:52:17 PDT 2024


Moin Astrid,

On Wed, 05. Jun 2024 at 08:21:14 +0200, Astrid Emde (WhereGroup) via NAS wrote:
> Hintergrund: Es sollen Planungen für unterschiedliche, kleine Gebiete
> (bundesweit) erfolgen. Dabei wird immer nur ein kleiner Bereich betrachtet.
> Zu diesem Bereich werden im Abstand von einigen Monaten neue ALKIS-Daten
> angefordert (nicht via Fortführung, sondern komplett) und ebenfalls
> importiert. Die alten Stände sollen dabei erhalten bleiben. Die Stände
> sollen via Zeit-/Datumsstempel oder ID unterscheidbar sein. So können
> Änderungen verfolgt werden.
> 
> Das bisherige NorGIS ALKIS Import bietet bisher nicht die Möglichkeit, dies
> umzusetzen, weil doppelte gml_ids-ignoriert werden oder zu Fehlern führen.

Jedes Objekt hat ohnehin schon seine Lebensdauer mit beginnt und endet.  Bei
den aktuellen Objekten ist nur noch das Ende offen.  Das "endet" bekommte man
normalerweise mit Replace oder Update bei Fortführungen.  Mehrere Versionen
eines Objekts mit gleichem gml_id ohne "endet" sollte es normalerweise nicht
geben.

Und Objekte mit dem gleichen "gml_id" und dem gleichen "beginnt" sollten
identisch sein.  Und nur die führen zu Fehlermeldungen.

Der Fehlermeldung dazu kann man allerdings mit "Duplikate ignorieren" aus dem
Wege gehen.  Identische Objekte sind somit erstmal kein Problem.

Das dient aber eigentlich nur dazu es zu ermöglichen unabhängige
Einzellieferungen gleicher Aktualität importieren zu können.  Darin gibt
es normalerweise auch doppelte Datensätze, selbst wenn sich die Bereiche nicht
räumlich überschneiden (AX_Bundesland, Gemeinde, Personen uvam.).

Hat man allerdings verschiedene Aktualitäten, kann es dazu kommen, dass man
mehrere Versionen des gleichen Objekts (gml_id) mit unterschiedlichen Ständen
(beginnt) hat, die aber alle noch kein "endet" haben und demnach alle aktuell
scheinen.

Dem könnte man auch noch aus dem Weg gehen, indem man das "endet" der
"älternen" auf das "beginnt" des Nachfolgers setzt.  Dann hat man zwar
möglicherweise nicht die richtige Lebendauer (weil einem Zwischenstände
fehlen), aber zumindest nicht mehr mehrere aktuelle.

Was man allerdings schlecht in den Griff bekommt, ist, wenn Objekte durch andere
Objekte ersetzt werden (etwa weil Flurstücke aufgeteilt oder zusammengelegt
werden).  Dann gibt es keinen Konflikt, den man mit gml_id und beginnt/endet
greifen und lösen kann.   Für Flurstücke könnte man immerhin noch nach
räumlichen Überschneidungen suchen und damit feststellen, was nun aktuell ist.
Es gibt aber auch Objekte ohne eigenen räumlichen Bezug oder solche bei denen
eine Überschneidung kein Hinweis auf einen Fehler ist.

Bundesweit gibt es auch noch das Problem der unterschiedlichen
Koordinatensysteme (EPSG:25832 vs EPSG:25833).

Was soll denn mit den in einem Schema gesammelten Daten passieren/möglich sein?


Jürgen

-- 
Jürgen E. Fischer
Dipl.-Inf. (FH)           norBIT GmbH               Tel. +49-4931-918175-31
Software Engineer         Rheinstraße 13            Fax. +49-4931-918175-50
Geschäftsführer           D-26506 Norden              https://www.norbit.de
-------------- nächster Teil --------------
Ein Dateianhang mit Binärdaten wurde abgetrennt...
Dateiname   : signature.asc
Dateityp    : application/pgp-signature
Dateigröße  : 833 bytes
Beschreibung: nicht verfügbar
URL         : <http://lists.osgeo.org/pipermail/nas/attachments/20240605/4298bc8e/attachment.sig>


Mehr Informationen über die Mailingliste NAS