Saltearse al contenido

Limpiadores y acciones de limpieza

Hay dos tipos de limpiezas que se pueden hacer, una sobre el texto XML antes de que se intente cargar como objetos DOM, y la otra una vez que se pudo cargar el contenido como objetos DOM.

Limpiezas sobre el texto XML

Estos limpiadores deben ejecutarse antes de intentar leer el contenido XML y están hechos para prevenir que el objeto documento XML no se pueda crear.

RemoveNonXmlStrings

Elimina todo contenido antes del primer caracter < y posterior al último >.

SplitXmlDeclarationFromDocument

Separa por un LF ("\n") la declaración XML <?xml version="1.0"?> del cuerpo XML.

AppendXmlDeclaration

Agrega <?xml version="1.0"?> al inicio del archivo si no existe, es muy útil porque las herramientas de detección de MIME no reconocen un archivo XML si no trae la cabecera.

XmlNsSchemaLocation

Elimina un error frecuentemente encontrado en los CFDI emitidos por el SAT donde dice xmlns:schemaLocation en lugar de xsi:schemaLocation. En caso de que existan ambos, el único que se mantiene es xsi:schemaLocation.

Limpiezas sobre el documento XML (Document)

Estas limpiezas se realizan sobre el documento XML.

RemoveAddenda

Remueve cualquier nodo de tipo Addenda en el espacio de nombres http://www.sat.gob.mx/cfd/3.

RemoveIncompleteSchemaLocations

Actúa sobre cada uno de los xsi:schemaLocations.

Lee el contenido e intenta interpretar el espacio de nombres y la ubicación del esquema de validación. Para considerar que es un esquema de validación verifica que termine con .xsd (insensible a mayúsculas o minusculas). Si encuentra un espacio de nombres sin esquema lo omite. Si encuentra un esquema sin espacio de nombres lo omite.

RemoveNonSatNamespacesNodes

Verifica todas las definiciones de espacios de nombres y si no pertenece a un espacio de nombres con la URI http://www.sat.gob.mx/** entonces elimina los nodos y atributos relacionados.

RemoveNonSatSchemaLocations

Actúa sobre cada uno de los xsi:schemaLocations.

Verifica las definiciones de espacios de nombres y elimina todos los pares donde el espacio de nombres que no correspondan a la URI http://www.sat.gob.mx/**.

RemoveUnusedNamespaces

Remueve todas las declaraciones de espacios de nombres (junto con su prefijo) que no estén en uso.

RenameElementAddPrefix

Agrega el prefijo al nodo que no lo tiene por estar utilizando la definición simple xmlns. Además, elimina los namespace superfluos y las definiciones xmlns redundantes.

Ejemplo de CFDI sucio:

<cfdi:Comprobante xmlns="http://www.sat.gob.mx/cfd/4" xmlns:cfdi="http://www.sat.gob.mx/cfd/4">
<Emisor xmlns="http://www.sat.gob.mx/cfd/4" />
<cfdi:Receptor xmlns:cfdi="http://www.sat.gob.mx/cfd/4" />
</cfdi:Comprobante>

Ejemplo de CFDI limpio:

<cfdi:Comprobante xmlns:cfdi="http://www.sat.gob.mx/cfd/4">
<cfdi:Emisor />
<cfdi:Receptor />
</cfdi:Comprobante>

MoveNamespaceDeclarationToRoot

Mueve todas las declaraciones de espacios de nombres al nodo raíz.

Por lo regular el SAT pide en la documentación técnica que los espacios de nombres se definan en el nodo raíz, sin embargo, es frecuente que se definan en el nodo que los implementa.

Hay casos extremos de CFDI que siguen las reglas de XML, pero que no siguen las reglas de CFDI y generan prefijos que se superponen. En este caso, se moverán solamente los espacios de nombres que no se superponen, por ejemplo:

<?xml version="1.0" encoding="utf-8" ?>
<cfdi:Comprobante xmlns:cfdi="http://www.sat.gob.mx/cfd/3">
<cfdi:Complemento>
<cfdi:Otro xmlns:cfdi="http://www.sat.gob.mx/otro" />
<tfd:TimbreFiscalDigital xmlns:tfd="http://www.sat.gob.mx/TimbreFiscalDigital" />
</cfdi:Complemento>
</cfdi:Comprobante>

Genera el siguiente resultado:

<?xml version="1.0" encoding="utf-8" ?>
<cfdi:Comprobante xmlns:cfdi="http://www.sat.gob.mx/cfd/3" xmlns:tfd="http://www.sat.gob.mx/TimbreFiscalDigital">
<cfdi:Complemento>
<cfdi:Otro xmlns:cfdi="http://www.sat.gob.mx/otro" />
<tfd:TimbreFiscalDigital />
</cfdi:Complemento>
</cfdi:Comprobante>

Ante un caso como el anterior, no se están siguiendo las reglas establecidas en el Anexo 20 y en el complemento. Es mejor que siempre considere ese caso como un CFDI inválido, aun cuando se haya firmado, y solicite la sustitución por un CFDI que sí contenga los prefijos de los espacios de nombres correctos.

MoveSchemaLocationsToRoot

Mueve todas las declaraciones de ubicaciones de archivos de esquema al nodo principal.

Por lo regular el SAT pide en la documentación técnica que las ubicaciones de archivos de esquema se definan en el nodo principal, sin embargo, es frecuente que se definan en el nodo que los implementa.

SetKnownSchemaLocations

Verifica que las ubicaciones de los esquemas de espacios de nombres conocidos sean exactamente las direcciones conocidas, en caso de no serlo las modifican.

Anteriormente, el SAT permitía que las ubicaciones de los esquemas de espacios de nombres estuvieran escritos sin sensibilidad a mayúsculas o minúsculas, incluso tenía varias ubicaciones para obtener estos archivos. Sin embargo, recientemente ha eliminado la tolerancia a estas ubicaciones y solo permite las definiciones oficiales.

Este limpiador tiene la información de espacio de nombres, versión a la que aplica y ubicación conocida con base en el proyecto phpcfdi/sat-ns-registry.

En caso de que no se encuentre la ruta conocida para un espacio de nombres entonces no aplicará ninguna corrección y dejará el valor tal como estaba.

CollapseComplemento

Este limpiador se crea para solventar la inconsistencia en la documentación del SAT.

Por un lado, en el Anexo 20 de CFDI 3.3, el SAT exige que exista uno y solamente un nodo cfdi:Complemento. Sin embargo, en el archivo de validación XSD permite que existan más de uno.

Con esta limpieza, se deja un solo cfdi:Complemento con todos los complementos en él.