Home

Projekte

Notizen

Bücherregal

Mitwirkende

Notizen /

Ein paar Tipps zur Verarbeitung von XML

Wenn man mit einer Programmiersprache XML verarbeitet, sollte man sich ein paar Kleinigkeiten vor Augen halten, diese sollen hier gesammelt werden.

Wenn man einen Parser der entsprechenden Programmiersprache verwendet, ist es normal, dass er Kommentare nicht einfach ignoriert, sondern auch diese zurück liefert. Normalerweise kann man zu jedem Knoten, den man vom Parser bekommt, den Typ abfragen, es gibt (explizit vorgesehen) den Typ "XML_COMMENT_NODE" (so heißt der Typ in PHP 5, in anderen Sprachen vermutlich anders, aber das Prinzip bleibt genau gleich).

Es gibt zwei Notationen in XML für Knoten, die leer sind (also keine Kindknoten enthalten, evtl. jedoch Attribute): <nodename attibname="attribvalue"></nodename> und <nodename attibname="attribvalue" /> Beide Schreibweisen sind genau gleichwertig, wenn man also das geparste Dokument wieder in eine XML-Datei ausgeben lässt, kann der Parser nach belieben eine der Schreibweisen wählen, auch wenn in der XML-Datei, die ursprünglich geparst wurde, die andere Schreibweise verwendet wurde.

In XML müssen (im Gegensatz zu HTML) alle Knoten, die geöffnet werden, auch wieder geschlossen werden, wobei beide Schreibweisen von oben gültig sind, also wäre dies beides richtig: <nodename attibname="attribvalue"></nodename> und <nodename attibname="attribvalue" /> aber nicht <nodename attibname="attribvalue"> (wenn der Node nicht später wieder korrekt geschlossen wird). Alleinstehende Knoten (wie z.B. <br> in HTML) sind nicht OK.

Tags: XML

Letzte Änderung am 04.10.2006 22:24 Uhr