¿Qué campos reconoce el IDR en una factura PDF?

Qué campos reconoce el IDR en una factura PDF: estándar, Professional y referencias configurables.

El IDR (Intelligent Document Recogniser) reconoce automáticamente los datos principales de una factura PDF y los convierte en campos estructurados en la e-factura. Los campos reconocidos dependen de su suscripción y de la configuración.

Campos reconocidos de forma estándar

En cada conversión de PDF se reconocen automáticamente los siguientes campos:

CampoDetalleProveedorNombre, dirección, número de registro mercantil, número de IVA. El proveedor se identifica mediante la base de datos de partes de eConnect (Purple Pages), no según lo que figure en el PDF.CompradorNombre y dirección según constan en la factura. Se incluyen en una extensión XML, no como identificación principal.Número de facturaNúmero único de la facturaFecha de facturaFecha de la facturaFecha de vencimientoPlazo de pago (si consta)ImportesSubtotal, importe de IVA e importe totalTipo de IVAPorcentaje y categoría (estándar, inversión del sujeto pasivo, exento)IBANCuenta bancaria del proveedorReferencia de pagoReferencia estructurada (si existe)DivisaDivisa de la factura
Número de factura reconocido incorrectamente por formato de proveedor

Con algunos formatos de proveedor, el IDR puede capturar un campo diferente al número de factura, por ejemplo un ID de transacción en lugar del número de factura real. Un ejemplo conocido son las facturas de Meta (Facebook), donde el número de factura aparece en la parte inferior de una página posterior del PDF y el ID de transacción se reconoce de forma más prominente.

Esto puede mejorarse para el formato de proveedor en cuestión. El reconocimiento del número de factura no es configurable por el cliente, pero se optimiza internamente por un miembro del equipo de soporte mediante detección de valores atípicos, regex y sugerencias por proveedor o formato. No se requiere ningún cambio en la hoja de ruta; se trata de una optimización dirigida de la funcionalidad existente. Informe de este caso al soporte — con base en el informe, el equipo añade una sugerencia específica del proveedor para que las futuras facturas de ese formato reciban el número de factura correcto.

Campos Professional

Con la suscripción Professional se reconocen campos adicionales:

CampoDetalleNúmero de pedidoLa referencia más utilizada. El IDR reconoce este campo automáticamente.Número de contratoReferencia del contrato subyacenteNúmero de proyectoReferencia del proyectoBuyer referenceCampo de referencia del receptor, configurable por número de registro mercantil, OIN o IVAIBAN cuenta GReconocimiento de números de cuenta G (identificables por la serie «099»)Referencias de pago estructuradasOGM belga, número KID noruego, código QR suizo
Reconocimiento de fechas por país

El IDR reconoce fechas en facturas PDF y las convierte al formato de fecha UBL estándar (YYYY-MM-DD). Como las notaciones de fecha varían según el país, el IDR determina, según el país del proveedor, cómo interpretar las fechas ambiguas:

  • Estados Unidos: MDY (mes-día-año). La fecha 03/11 se interpreta como el 11 de marzo.
  • Todos los demás países: DMY (día-mes-año). La fecha 03/11 se interpreta como el 3 de noviembre.

Si la detección automática del país no basta, se puede añadir por proveedor una indicación específica sobre el formato de fecha mediante el mecanismo de hints.

Tip: las fechas interpretadas de forma incorrecta (por ejemplo 03/11 como 11 de marzo en lugar del 3 de noviembre) casi siempre son un tema de reconocimiento, no de la plataforma. La plataforma muestra siempre la fecha tal como figura en el UBL.

Validación IBAN

Con la suscripción Professional, el IBAN reconocido se compara con el verification store: una base de datos de IBAN validados manualmente con anterioridad por proveedor. Si el IBAN de la factura difiere de lo verificado antes, se señala. Esto ayuda a detectar facturas falsas o datos bancarios modificados.

Nota: según la norma europea EN16931, el IBAN en una factura sirve principalmente para identificar al proveedor, no como instrucción de pago. Un IBAN modificado debe validarse siempre primero en los datos maestros de su sistema financiero antes de pagar.

Referencias configurables (a medida)

Además de las referencias estándar (número de pedido, número de contrato, número de proyecto), se pueden configurar otras referencias de forma específica por proveedor, por ejemplo códigos presupuestarios, códigos de responsable de presupuesto o referencias internas. Es un trabajo a medida que se configura por tarjeta de franjas.

El reconocimiento de referencias configurables utiliza un mecanismo de tres capas:

  1. Regex: validación de formato para garantizar que la referencia extraída coincide exactamente con el formato esperado
  2. Outlier detection: detección estadística de valores poco probables
  3. Hints: datos de entrenamiento generados automáticamente a partir de correcciones del equipo QC

Tip: el número de pedido es la referencia más utilizada y la indican la mayoría de proveedores en la factura. Si un proveedor no puede rellenar un campo de referencia concreto en su software, poco sirve exigirlo. En ese caso use el número de pedido como referencia principal.

Obligación de referencia y rechazo (EN16931)

Según la norma europea EN16931, una referencia (buyer reference) es obligatoria en una factura electrónica; suele ser un número de pedido u otra referencia del destinatario. Un remitente puede colocar un valor incorrecto en este campo.

eConnect no rechaza una factura por la referencia de forma predeterminada. Una factura solo incumple las reglas básicas de la norma europea si no hay ninguna referencia en absoluto. Si una factura es rechazada por una referencia desconocida o incorrecta depende de la configuración del destinatario: en una configuración específica del destinatario, una factura puede rechazarse si la referencia es desconocida. Por lo tanto, esto es una propiedad de la configuración receptora, no del procesamiento estándar de eConnect.

Consejo: si deseas rechazar facturas por referencias faltantes o desconocidas, configura esto a través de RBE (Rule Based Enrichment) en el endpoint receptor.

Número de factura faltante: número sustituto (-NOTFOUND)

El número de factura (campo UBL cbc:ID, BT-1) es obligatorio en EN 16931, UBL BIS Billing 3.0 y NLCIUS para facturas regulares. Sin embargo, el IDR procesa un flujo de documentos mixto: facturas regulares, notas de crédito, gastos y recibos. Los recibos caen bajo el régimen de factura simplificada (transacciones hasta aproximadamente 100 € IVA incluido), para el que la administración fiscal no establece el número de factura como requisito legal. Rechazar por un número de factura faltante excluiría todos los recibos y gastos del procesamiento.

Por ello, la pipeline IDR genera automáticamente un número sustituto cuando no se puede extraer ningún número de factura del documento durante el reconocimiento. El campo cbc:ID (BT-1) se rellena con la estructura:

YYYYMMDDHHmmss-NOTFOUND

La marca de tiempo es el momento del procesamiento por la pipeline IDR, no la fecha en el documento. Ejemplo: 20240315143022-NOTFOUND.

Capturar el número sustituto

El filtrado es posible en dos niveles:

  1. RBE (Rule Based Enrichment): configura una regla que comprueba si BT-1 (cbc:ID) termina en -NOTFOUND. En base a esto, el documento puede retenerse para revisión manual, redirigirse a una bandeja de entrada separada, o rechazarse automáticamente.
  2. Sistemas propios (ERP/software contable): una búsqueda directa de cadena o expresión regular en -NOTFOUND en el campo cbc:ID es suficiente.
Líneas de factura (reconocimiento de líneas)

Con el reconocimiento de líneas también se reconocen las líneas individuales de la factura: descripción, precio unitario, cantidad, importe de línea y campos de referencia por línea. Es una función independiente que puede activar usted mismo en Mi Entorno.


¿Quiere saber cómo funciona el reconocimiento a nivel técnico? Lea ¿Cómo funciona Scan & Reconocimiento (IDR/OCR)?.

Ver sus tareas de conversión

Artículos relacionados