Semi-strukturierten Daten

Hansjürgen Lerch Juli 26, 2016 S 2 0
FONT SIZE:
fontsize_dec
fontsize_inc

Semi-strukturierten Daten ist eine Form der strukturierten Daten, die nicht mit den formalen Aufbau von Datenmodellen mit relationalen Datenbanken oder anderen Formen der Datentabellen zugeordnet nicht entspricht, aber dennoch enthält Tags oder andere Marker, um semantische Elemente zu trennen und durchzusetzen Hierarchien von Datensätzen und Feldern innerhalb der Daten. Deshalb ist es auch als selbstbeschreibende Struktur bekannt.

In den semi-strukturierten Daten können die zu derselben Klasse gehören Entitäten verschiedene Attribute haben, auch wenn sie zusammen gruppiert, und die Attribute 'bestellen ist nicht wichtig.

Semi-strukturierten Daten wird zunehmend auftretenden seit dem Aufkommen des Internets, wo Volltext-Dokumenten und Datenbanken sind nicht die einzigen Formen der Daten mehr und unterschiedliche Anwendungen benötigen ein Medium für den Austausch von Informationen. In objektorientierten Datenbanken, findet man oft semi-strukturierten Daten.

Arten von Semi-strukturierte Daten

XML

XML andere Markup-Sprachen, E-Mail und EDI sind alle Formen von semi-strukturierten Daten. OEM wurde vor XML als Mittel der Selbst-Beschreibung einer Datenstruktur erstellt. XML wurde von Web-Services, die entwickelt unter Verwendung von SOAP-Prinzipien werden popularisiert worden.

Einige Arten von hier als "semi-strukturierten", insbesondere XML, beschriebenen Daten haben den Eindruck, dass sie unfähig sind, strukturelle Strenge gleichzeitig funktionaler Ebene als relationale Tabellen und Zeilen. In der Tat hat die Aussicht auf XML als von Natur aus semi-strukturierten seine Verwendung für eine immer größere Auswahl an datenorientierter Anwendungen behindert. Auch Dokumente, die normalerweise der als Inbegriff der semi-Struktur kann mit praktisch derselben Strenge wie Datenbank-Schema entworfen werden gedacht, durch das XML-Schema durchgesetzt und von den kommerziellen und kundenspezifische Software-Programmen weiterverarbeitet, ohne dabei ihre Verwendbarkeit durch menschliche Leser.

In Anbetracht dieser Tatsache kann XML als das "flexible Struktur", geeignet für Menschen orientierte Strömung und Hierarchie sowie hoch rigorosen Elementstruktur und Datentypisierung bezeichnet.

Das Konzept von XML als "Menschen lesbare", jedoch nur so weit getrieben werden. Einige Implementierungen / Dialekte XML, wie die XML-Darstellung der Inhalte eines Microsoft Word-Dokument, wie in Office 2007 und höhere Versionen implementiert, nutzen Dutzende oder sogar Hunderte von verschiedenen Arten von Tags, die einen bestimmten Problembereich zu reflektieren - im Falle von Word , Formatierung an der Zeichen- und Absatz und Dokumentebene, Definitionen von Designs, Einbeziehung von Zitaten usw. -, die in miteinander in komplexer Weise verschachtelt sind. Das Verständnis sogar einen Teil eines solchen XML-Dokument lesen, geschweige denn zu kontrollieren Fehler in seiner Struktur, ist unmöglich ohne einem sehr tiefen Stand Verständnis der spezifischen XML-Implementierung, zusammen mit Hilfe von Software, die das XML-Schema, das verwendet worden ist, versteht. Ein solcher Text nicht "Menschen verständliche" nicht mehr als ein Buch in Swahili geschrieben würde zu einem amerikanischen oder westeuropäische, die kein Wort dieser Sprache kennt sein: die Tags sind Symbole, die sinnlos, eine Person, die nicht mit der Domäne sind.

JSON

JSON oder JavaScript Object Notation, ist ein offener Standard-Format, das für Menschen lesbaren Text verwendet, um Datenobjekte aus Attribut-Wert-Paaren übertragen. Es wird vor allem als Alternative zu XML verwendet, um Daten zwischen einem Server und Web-Anwendung zu übertragen. JSON wurde von Web-Services entwickelt Verwendung REST Prinzipien popularisiert worden.

Es gibt eine neue Generation von Datenbanken wie MongoDB und Couchbase, die Daten nativ im JSON-Format zu speichern, die Nutzung der Vorteile von semi-strukturierten Datenarchitektur.

Vor-und Nachteile der Verwendung eines halbstrukturierten Datenformat

Pros

  • Programmierer anhalt Objekte aus ihrer Anwendung auf eine Datenbank brauchen nicht zu objektrelationalen Impedanzfehlanpassung zu kümmern, sondern kann oft Objekte serialisiert werden über eine leichtgewichtige Bibliothek.
  • Unterstützung für verschachtelte oder hierarchische Daten oft vereinfacht die Datenmodelle, die komplexen Beziehungen zwischen den Entitäten.
  • Unterstützung für Listen von Objekten vereinfacht die Datenmodelle durch die Vermeidung von messy Übersetzungen Listen in einem relationalen Datenmodell.

Cons

  • Die traditionellen relationalen Datenmodell verfügt über eine beliebte und fertige Abfragesprache SQL.
  • Anfällig für "garbage in, garbage out"; durch Entfernen Stützen aus dem Datenmodell, gibt es weniger Vorder dachte, die notwendig ist, um eine Datenanwendung zu betreiben.
  Like 0   Dislike 0
Nächster Artikel Philip S. Van Cise
Bemerkungen (0)
Keine Kommentare

Fügen Sie einen Kommentar

smile smile smile smile smile smile smile smile
smile smile smile smile smile smile smile smile
smile smile smile smile smile smile smile smile
smile smile smile smile
Zeichen übrig: 3000
captcha