Well-formed XML

Nr. Gravatar

Warum eine Stelle auf der "Formatierung" richtig ein Dokument XML? Datenfluss in einem typischen Parser

Denn manchmal ist es gut, diese Details, vor allem nicht verletzt werden, wenn Sie gefunden haben, gehen Sie zu den Parser und anders .. Nutzung

Ein XML-Dokument ist gut genannten gebildet (und wird dann von einem Parser analysiert), wenn:

"

  • Nicht-leere Elemente sind sowohl durch einen Start-Tag und ein End-Tag begrenzt.
  • Leere Elemente können mit einem empty-Element (selbstschließend markiert werden) tag, wie <IAmEmpty /> Dies entspricht <IAmEmpty></IAmEmpty>
  • Alle Attributwerte sind entweder mit single-quoted ( ') oder doppelte ( ") zitiert. Einfache Anführungszeichen in der Nähe eines einzigen Angebots und doppelten Anführungszeichen in der Nähe ein doppeltes Anführungszeichen.
  • Tags können verschachtelt werden, sondern müssen sich nicht überlappen. Jede nicht-root-Element muss komplett in ein anderes Element enthalten sein.
  • Das Dokument erklärt Entspricht die Zeichen-Codierung. Die Kodierung erklärt werden können oder extern implizit, wie in "Content-Type"-Header, wenn ein Dokument über HTTP, oder intern transportiert wird, mit expliziten Markup ganz am Anfang des Dokuments. Wenn keine solche Erklärung existiert, eine Unicode-Codierung wird davon ausgegangen, wie durch einen Unicode-Byte Order Mark vor dem ersten Zeichen des Dokuments definiert. Wenn die Marke nicht vorhanden ist, UTF-8-Kodierung wird angenommen.
  • Element-Namen wird zwischen Groß-und Kleinschreibung.

"

(Aus Wikipedia)

Natürlich, wenn Sie ein XML-Dokument zu lesen und zu jedem Parser gebildet, entweder SAX oder Sun, erhalten Sie eine Fehlermeldung. Um dies zu ändern können Sie:

  1. Einführung in Escape-Sequenzen für die Elemente,
  2. Bearbeiten Sie das Dokument (oder erstellen Sie eine neue) Strukturen richtig.

Meines Wissens gibt es keine anderen Alternativen (wenn Sie segnalatemele, die immer zur Hand) und korrekt strukturierten Dokumenten interpretieren sollte nicht unbedingt von einem der 2-Lösungen weiterzugeben.

Eine Frage quält mich (auf übertrieben ..), sondern eine JSP-Seite, dass die Tags enthalten können, wie

<% = Variabile_di_tipo_string>

wie wird analysiert? Es wird eine der beiden oben genannten Methoden verwendet werden so umgeschrieben, oder ein Parser, der nicht im Eigentum der guten Formatierung erforderlich ist? Vielleicht haben Sie ein Parser-Generator von Grammatiken (JavaCC und ähnliche ..).. verwendet

Na ja im Moment ist nicht mein Hauptproblem :)

Sehr bald werde ich über XSLT .. stay tuned!

Popularity: 19% [?]

Tags:


leave a response , or trackback from your own site. Sie können alle Antworten auf diesen Eintrag durch den RSS 2.0 Feed verfolgen. Sie können ein Antwort, oder einen Trackback auf deiner Seite hinterlassen.

AddThis Social Bookmark Button

Diese Website benutzt IntenseDebate comments, aber sie sind derzeit nicht Denn entweder Ihr Browser unterstützt kein JavaScript, oder sie wurde nicht geladen schnell genug geladen wird.

Lassen Sie eine Antwort