XML bem formado

Não Gravatar

Porque um post sobre a formatação de "corrigir um documento XML? Fluxo de dados em um analisador típico

Porque às vezes é bom ter encontrado esses detalhes, especialmente para não se machucar quando você vai usar o interpretador e as diferentes ..

Um documento XML é chamado de bem-formado (e, em seguida, é analisada por um analisador) se:

"

  • Elementos não vazios são delimitados por dois começam um tag e um fim-tag.
  • Os elementos vazios podem ser marcadas com um auto-elemento vazio (fechamento) de marca, como <IAmEmpty /> Isto é igual a <IAmEmpty></IAmEmpty>
  • Todos os valores de atributo são cotados com qualquer simples ( ') ou duplas ( ") aspas. As aspas simples fechar uma aspas simples e aspas duplas fechar uma aspas duplas.
  • Tags podem ser aninhadas, mas não deve sobrepor-se. Cada elemento não-raiz deve estar totalmente contido em outro elemento.
  • O documento declaradas estão em conformidade com a sua codificação de caracteres. A codificação pode ser declarada ou implícita externamente, como em "Content-Type" cabeçalhos quando um documento é transportado via HTTP, ou internamente, através de marcação explícita no início do documento. Quando essa declaração não existe, uma codificação Unicode é assumido, tal como definido por um byte Unicode Order Mark antes do primeiro caractere do documento. Se a marca não existe, UTF-8 codificação é assumido.
  • Nomes de elemento são maiúsculas e minúsculas.

"

(From Wikipedia)

Obviamente, se você quiser ler um documento XML bem formado para qualquer analisador, quer SAX ou Sun, você recebe um erro. Para remediar esta situação, você pode:

  1. Apresentando sequências de escape para os elementos,
  2. Editar o documento (ou criar uma nova) estruturas corretamente.

Que eu saiba não há outras alternativas (se você tiver segnalatemele que sempre acessível) e interpretar corretamente os documentos estruturados não deve necessariamente passar de uma das 2 soluções.

Uma pergunta me assombra (exagerados em ..), mas uma página JSP que podem conter marcas como

<% = Variabile_di_tipo_string>

como será analisado? Ele irá utilizar um dos dois métodos acima será reescrito ou um analisador que não exige a posse de formatação bom? Talvez você tenha usado um gerador de analisador de gramáticas (JavaCC e similares ..)..

Oh, bem no momento não é o meu principal problema :)

Muito em breve vou falar sobre XSLT .. fique atento!

Popularity: 19% [?]

Palavras-chave:


leave a response , or trackback from your own site. Você pode acompanhar quaisquer respostas a esta entrada através do RSS 2.0 feed. Você pode deixar uma resposta, ou trackback de seu próprio site.

AddThis Social Bookmark Button

Este site utiliza comentários IntenseDebate, mas eles não estão atualmente carregado porque o seu browser não suporta JavaScript, ou eles não carregar suficientemente rápido.

Deixe uma Resposta