BrowserTools
Publicidad
Inicio / Validadores / Validador y formateador de XML

Validador y formateador de XML

Valida y formatea XML en tu navegador usando el DOMParser.

Cargando Validador y formateador de XML… Si no ocurre nada, activa JavaScript.

XML (eXtensible Markup Language) es un formato basado en texto para almacenar y transportar datos estructurados. Desarrollado por el grupo de trabajo XML del W3C y publicado por primera vez como recomendación en 1998, XML se diseñó para ser a la vez legible por humanos y analizable por máquinas, autodescriptivo y extensible, lo que significa que los desarrolladores podían definir sus propias etiquetas y estructuras de documento en lugar de limitarse a un vocabulario fijo. XML surgió directamente de SGML (Standard Generalised Markup Language), el complejo estándar ISO usado para la documentación técnica, pero eliminó la mayor parte de la complejidad de SGML para producir algo que pudiera implementarse en un fin de semana.

Ejemplos

Entrada <note><to>Ada</to></note>
Salida Well-formed
Entrada <note><to>Ada</note>
Salida Not well-formed · unclosed <note>

Cada etiqueta de apertura necesita una etiqueta de cierre correspondiente, correctamente anidada.

Preguntas frecuentes

¿Se envía mi XML a un servidor?
No. El análisis y el formateo ocurren enteramente en tu navegador usando la API DOMParser integrada, que forma parte de la plataforma web y se ejecuta localmente en tu dispositivo. Tu contenido XML nunca se transmite por la red, lo que hace que esta herramienta sea segura para archivos de configuración confidenciales, esquemas internos o formatos de datos propietarios.
¿Cuál es la diferencia entre XML bien formado y XML válido?
Un documento XML bien formado sigue las reglas básicas de sintaxis de la especificación XML: tiene un único elemento raíz, todas las etiquetas están correctamente anidadas y cerradas, los valores de los atributos van entre comillas y los caracteres reservados se escapan con referencias de entidad. Un documento XML válido además se ajusta a un esquema declarado, un DTD (Document Type Definition) o XSD (XML Schema Definition), que restringe qué elementos y atributos se permiten y en qué orden. Esta herramienta comprueba solo la buena formación.
¿Cuándo necesitaría validar XML en la práctica?
Los escenarios comunes incluyen depurar solicitudes y respuestas de servicios web SOAP, inspeccionar archivos de construcción de Maven o Gradle, examinar archivos de recursos de Android, revisar el marcado de fuentes RSS/Atom, comprobar archivos de imagen SVG, formatear configuraciones de beans de Spring Framework y validar mensajes HL7 o FHIR en integraciones sanitarias. Siempre que una herramienta o biblioteca informe de un error de análisis de XML, pegar el contenido aquí revela rápidamente la línea problemática.
¿En qué se diferencia XML de HTML?
HTML está diseñado para ser resistente a los errores; los navegadores renderizan una página incluso con etiquetas sin cerrar, comillas que faltan y elementos superpuestos, aplicando reglas complejas de recuperación de errores. XML es estricto: un solo error de sintaxis hace que todo el documento sea inválido y no debe procesarse más allá. HTML usa un vocabulario fijo de elementos definido por la especificación HTML; XML permite cualquier nombre de etiqueta definido por el autor del documento o por su esquema rector.
¿Valida esta herramienta contra un esquema XSD o DTD?
Actualmente no. Esta herramienta comprueba solo la buena formación de XML, la sintaxis correcta, usando el DOMParser del navegador. La validación de esquema contra XSD (XML Schema Definition) o DTD (Document Type Definition) es una operación más compleja que requiere un validador especializado. Para la validación XSD, herramientas de línea de comandos como xmllint (libxml2) o validadores XSD en línea que acepten tanto el esquema como el documento son más adecuados.
¿Cuál es el tamaño máximo de XML que puedo validar?
No hay un límite fijo, pero la memoria disponible del navegador y el rendimiento del DOMParser imponen restricciones prácticas. Los documentos de hasta unos pocos megabytes se analizan y formatean en milisegundos. Los archivos XML muy grandes, de cientos de megabytes, como las exportaciones de bases de datos o las respuestas SOAP grandes, pueden hacer que la pestaña del navegador se vuelva lenta o no responda. Para el procesamiento de XML a gran escala, herramientas de línea de comandos como xmllint o Saxon son más apropiadas.
¿Funciona la herramienta con espacios de nombres XML?
Sí. El DOMParser admite plenamente los espacios de nombres XML tal como los define la especificación Namespaces in XML. Los prefijos de espacio de nombres (xmlns:ns="...") y los espacios de nombres predeterminados (xmlns="...") se analizan y se conservan en la salida formateada. Los elementos y atributos con espacio de nombres se muestran con sus prefijos intactos.
¿Puedo usar esta herramienta para formatear archivos SVG?
Sí. Los archivos SVG (Scalable Vector Graphics) son documentos XML bien formados y pueden validarse y formatearse con esta herramienta. Pegar un SVG y formatearlo es una forma rápida de inspeccionar su estructura, comprobar rutas mal formadas o revisar los metadatos incrustados. Ten en cuenta que el formateador vuelve a serializar el XML, lo que puede cambiar el orden de los atributos (aunque esto no afecta al renderizado).
¿Qué son las entidades XML y necesito escapar caracteres en mi contenido?
XML define cinco referencias de entidad predefinidas para los caracteres que tienen un significado especial en la sintaxis XML: &amp;amp; para &, &amp;lt; para <, &amp;gt; para >, &amp;apos; para ' y &amp;quot; para ". Estas deben usarse siempre que el carácter literal aparezca en el contenido de texto de un elemento o en los valores de los atributos. Usar un & o un < sin procesar dentro del contenido causará un error de buena formación. En las secciones CDATA (envueltas en <![CDATA[...]]>) el contenido se trata como texto literal y no hace falta ningún escape.
¿Cuál es un error común que hace que el XML sea inválido?
El error más frecuente es usar un ampersand sin escapar (&) en el contenido de texto, por ejemplo en una URL como href="https://example.com/page?a=1&b=2", donde & debe escribirse como &amp;. Otros errores comunes incluyen etiquetas autocerradas escritas sin la barra final (<br> en lugar de <br />), discrepancias en las mayúsculas y minúsculas de las etiquetas (<Item> cerrada como </item>) y la falta de comillas alrededor de los valores de los atributos. A diferencia de los analizadores de HTML, los analizadores de XML se negarán a continuar tras cualquiera de estos errores.

Acerca de Validador y formateador de XML

A pesar del ascenso de JSON hasta dominar las API web, XML sigue profundamente integrado en el software empresarial y de sistemas. Los servicios web SOAP, muy usados en banca, sanidad (HL7 FHIR) y sistemas gubernamentales, transmiten mensajes XML. Los documentos de Microsoft Office (.docx, .xlsx) son archivos ZIP de archivos XML. Los archivos de diseño de Android y los descriptores de proyecto de Maven son XML. Las fuentes RSS y Atom son XML. Las imágenes SVG son XML. Los sistemas de configuración como Spring Framework, Hibernate y los archivos de construcción de Ant usan XML extensamente. Cualquier desarrollador que trabaje con integraciones heredadas, sistemas empresariales o formatos de documento se encontrará con XML con regularidad.

Esta herramienta valida y formatea XML enteramente dentro de tu navegador usando la API DOMParser integrada del navegador, el mismo motor que renderiza las páginas HTML. Analiza tu entrada e informa del primer error de buena formación con el número de línea y de columna para que puedas localizar los problemas al instante. El XML válido se vuelve a serializar con una sangría coherente para producir una salida limpia y legible. Como todo el procesamiento ocurre localmente, tus documentos XML, que pueden contener esquemas propietarios, credenciales en archivos de configuración o datos comerciales sensibles, nunca se suben a ningún servidor.

XML es más estricto que HTML en aspectos importantes que confunden a quienes son nuevos en el formato. Cada elemento debe cerrarse correctamente (a diferencia de HTML, que tolera etiquetas sin cerrar). Los valores de los atributos deben ir siempre entre comillas. El documento debe tener exactamente un elemento raíz. Las cinco referencias de entidad predefinidas (&amp;, &lt;, &gt;, &apos;, &quot;) deben usarse para los caracteres literales correspondientes dentro del texto y los valores de los atributos. XML también distingue entre mayúsculas y minúsculas: <Tag> y <tag> son elementos distintos. La buena formación (sintaxis correcta) es un concepto separado de la validez (conformidad con un esquema como XSD o DTD), y esta herramienta comprueba solo la primera.

XML y la búsqueda de un formato de documento universal

XML surgió de un esfuerzo de una década por domar SGML (Standard Generalised Markup Language), un estándar ISO potente pero enormemente complejo diseñado originalmente para la documentación técnica en el Departamento de Defensa de Estados Unidos. SGML era tan intrincado que solo un software especializado podía procesarlo. En 1996, un grupo de trabajo del W3C dirigido por Jon Bosak se propuso crear un 10 % simplificado de SGML que cubriera el 90 % de los casos de uso, y hacerlo en una forma que pudiera implementarse en un fin de semana en lugar de en años. XML 1.0 se convirtió en recomendación del W3C el 10 de febrero de 1998.

Finales de los años 90 y principios de los 2000 fueron el apogeo del entusiasmo por XML. Los tecnólogos imaginaban XML como el pegamento universal de internet: documentos, datos, configuración, mensajería e incluso la programación serían todos XML. Los servicios web usarían envoltorios SOAP (Simple Object Access Protocol) de XML. Las aplicaciones describirían sus interfaces en WSDL (Web Services Description Language), un dialecto XML en sí mismo. El 'impuesto de los corchetes angulares', la verbosidad de la sintaxis XML, se veía como un precio que valía la pena pagar por la interoperabilidad universal.

La reacción llegó con el ascenso de JSON a mediados de los años 2000. La compacidad de JSON y su mapeo directo a objetos de JavaScript lo hicieron drásticamente más simple para los casos de uso de las API web, y desplazó rápidamente a XML en ese ámbito. Sin embargo, XML nunca desapareció. Sigue siendo el formato dominante en la integración empresarial, los formatos de documento (ODF, OOXML), los sistemas de configuración y dondequiera que los esquemas, los espacios de nombres y la capacidad de mezclar documento y datos sean genuinamente valiosos. El lenguaje de transformación XSLT y el lenguaje de consulta XPath del W3C, ambos basados en XML, no tienen equivalentes reales en JSON para las tareas de transformación de documentos complejas.

Publicidad
Publicidad
Publicidad