Eines der wichtigsten Ziele, die wir hier bei Wiwald verfolgen ist die Einhaltung, und wo nötig auch die Definition von Standards, denen alle angebotenen Produkte folgen. Je homogener die Struktur unterschiedlicher Datensätze ist und je mehr sich der Anwender auf die Einheitlichkeit der Daten selbst verlassen kann, um so größer ist der Nutzen der sich aus Ihnen ziehen lässt. Erst diese Einheitlichkeit ermöglicht es, weiterführende Bibliotheken und Anwendungen zu entwickeln, die auf den bei uns angebotenen Daten basieren.

Strukturelle Standards

Bei allen angebotenen Formaten auf unserer Plattform stellen wir die Validität der Datensätze sicher und forcieren eine einheitliche Struktur. Als Nutzer kann man sich so beispielsweise sicher sein, dass ein JSON von Wiwald immer ein valides JSON ist, das ein SQL für die gewählte Datenbank ausführbar ist und das alle Daten auch wirklich UTF-8 codiert sind.

Während es unser Ziel ist alle Formate so einheitlich wie möglich anzubieten, sind wir uns natürlich auch der Tatsache bewusst, dass je nach Anwendungsfall unterschiedliche Struktur-Parameter Sinn machen. So lässt sich zum Beispiel beim CSV-Format das Trennzeichen und das Escape-Zeichen auswählen oder entscheiden ob die Titelzeile enthalten sein soll oder nicht.

Auch wenn es seltsam klingen  mag, wir wollen so wenige Varianten eines Datensatzes anbieten, wie möglich. Denn je einheitlicher der Datensatz von unseren Kunden genutzt wird um so leichter lässt sich seine Qualität erhöhen denn dann kann mehr Zeit in die Daten selbst investiert werden.

Format-Standards

Eines der größten Probleme, die Entwickler und Daten-Ingenieure aktuell mit Datensätzen haben, ist deren teils massive Inkonsistenz. Spalten mit Postleitzahlen enthalten plötzlich Text, Datumswerte sind in jeder Zeile anders formatiert, Leerwerte werden nicht einheitlich genutzt und so weiter und so weiter. So trivial viele dieser Probleme auch sein mögen, deren Behebung ist eintönig, oft nur manuell zu lösen und kostet viel Zeit. Das können schnell 60-70 Prozent dessen sein, was man für die Implementierung eines eigentlich einfachen Features oder die Auswertung in Excel vorgesehen hat.

Diese Probleme vermeiden wir bei Wiwald indem wir Datenstandards forcieren. Eine Enumeration enthält nur erlaubte Werte, eine Datumsspalte sicher nur Datumswerte (oder Leerwerte) usw. Auch hier bieten wir natürlich nützliche Parameter an, wie zum Beispiel eine Auswahl des Datumsformats,

 

Auch Standards sind nicht für die Ewigkeit

Es spricht viel dafür, einheitliche Standards für Datensätze zu definieren und sie strikt einzuhalten. Doch auch uns bei Wiwald ist bewusst, dass Standards nur Momentaufnahmen sind, die später kommenden Erkenntnissen oder Entwicklungen nicht ausreichend gerecht werden können. Daher arbeiten wir kontinuierlich daran, Standards weiterzuentwickeln und die Optionen zu bieten, die für unsere Kunden die größte Relevanz haben. Wir halten es allerdings für sinnvoll unsere Standards nur durch gewichtige Argumente und nach sorgfältiger Prüfung anzupassen, damit unsere Nutzer Investitionen und Innovationen in ihr Produkt stecken können und nicht in die Pflege sich ständig ändernder Abhängigkeiten.


Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.