¿Cómo funciona Scan & Reconocimiento (IDR/OCR)?

La tecnología detrás del reconocimiento automático de PDF: OCR, IA y sistema de autoaprendizaje para facturas y pedidos.

El Intelligent Document Recogniser (IDR) es la tecnología propia de eConnect que convierte documentos PDF, imágenes y recibos en documentos electrónicos validados. El sistema procesa el 100 % de todos los documentos presentados y mejora continuamente con el uso.

Además de facturas, el IDR también puede reconocer y convertir pedidos de compra (purchase orders). Esta funcionalidad utiliza las mismas tres capas tecnológicas que el reconocimiento de facturas. El reconocimiento de pedidos está actualmente disponible en versión beta y se encuentra en desarrollo activo.

Tres capas, un solo resultado. El IDR combina reconocimiento de texto OCR, interpretación LLM e interpretación propia de documentos en un sistema de autoaprendizaje preciso que reconoce correctamente más del 98 % de todos los campos esenciales.

Tres capas tecnológicas

El IDR combina tres capas que trabajan conjuntamente para reconocer y procesar documentos:

Capa OCR: El primer paso es el reconocimiento puro de texto mediante OCR. Esta capa lee el texto del documento, independientemente del idioma (más de 200 idiomas admitidos) o del formato.

Capa LLM: Un Large Language Model ayuda a interpretar el texto reconocido. El modelo comprende el contexto de la información y asiste en la asignación del texto a los elementos de factura correctos.

Interpretación del documento: Este es el núcleo del IDR y tecnología completamente propia de eConnect. Esta capa determina el significado del documento, qué campos son relevantes, cómo deben estructurarse los datos y si todo es coherente. La inteligencia que reside aquí, incluido el sistema de autoaprendizaje, las reglas de validación y el bucle de retroalimentación, es lo que distingue a eConnect.

El OCR y el LLM son servicios commoditizados. El verdadero valor reside en la capa de interpretación y validación que eConnect construye y gestiona por sí misma.

El siguiente diagrama muestra cómo una factura PDF se procesa a través de las tres capas del IDR hasta convertirse en una e-factura validada.

¿Qué reconoce el sistema?

El IDR reconoce automáticamente todos los elementos relevantes de la factura:

  • Proveedor y comprador (nombre, dirección, registro mercantil, número de IVA)
  • Número y fecha de factura
  • Importes (subtotal, IVA, total)
  • Datos de pago (IBAN, referencia de pago)
  • Números de pedido y referencias (con el abonnement Professional)
  • Líneas de factura con descripción, cantidad, precio unitario e importe por línea (reconocimiento de líneas)
Reconocimiento de líneas

Desde julio de 2024, el IDR también ofrece reconocimiento de líneas: el desglose de las líneas de factura PDF en líneas de transacción individuales. Por línea se reconocen la descripción, el precio, la cantidad, el importe por línea y los campos de referencia.

Por defecto, el 80 % de las líneas de factura se reconocen automáticamente. El 20 % restante vuelve al procesamiento estándar, donde se utiliza el subtotal por tipo de IVA. Se aplica la garantía "No Lines No Pay": solo paga por las líneas que se hayan reconocido correctamente.

Opcionalmente puede activar la validación de líneas. El equipo de validación de eConnect verifica entonces las líneas que no se han reconocido automáticamente, lo que le garantiza un reconocimiento del 100 % a nivel de líneas de factura.

El sistema de autoaprendizaje

El IDR mejora a medida que se procesan más facturas. Esto funciona mediante un bucle de retroalimentación:

  • Con cada factura procesada, el sistema compara los valores reconocidos con los patrones almacenados previamente del mismo proveedor.
  • Si el IDR no tiene suficiente certeza, la factura se envía al equipo Quality Control para verificación manual.
  • Cada corrección del equipo QC se retroalimenta como "hint" en el sistema, entrenando la IA para futuros reconocimientos.
  • Los comentarios de los clientes también se integran: los errores notificados se analizan, se incorporan a los procedimientos de prueba y se previenen de forma estructural.

El resultado es un sistema en mejora continua. Un error que ocurre una vez no persiste: se resuelve y el sistema aprende de ello.

Precisión y garantía de procesamiento

El IDR obtiene puntuaciones elevadas en precisión:

  • En los campos esenciales (número de factura, fecha, importes): > 98 % de precisión (respaldado por auditorías periódicas)
  • Garantía SLA: 99 % de documentos procesados en un plazo de 8 horas laborables

La arquitectura previene errores estructurales al validar cada valor reconocido contra otra fuente (interna o externa al documento). En caso de duda, el documento se dirige al equipo QC, lo que constituye una capa de seguridad adicional.

Tiempos de procesamiento

El tiempo de procesamiento puro para documentos procesados automáticamente es de 5 a 30 segundos de media. El plazo total incluido el tiempo de espera en cola es de aproximadamente 3,5 minutos de media. Con la opción de prioridad (disponible para abonnements superiores), los documentos reciben un tratamiento prioritario.

Referencias de pago estructuradas

El IDR también reconoce referencias de pago específicas por país:

  • OGM belga (comunicación estructurada): el formato +++XXX/XXXX/XXXXX+++ con validación de checksum integrada
  • Número KID noruego: referencia de pago estructurada para facturas noruegas
  • Código QR suizo: datos de pago extraídos del código QR en facturas suizas

Estos reconocimientos forman parte de la versión Professional del IDR.


¿Desea experimentar cómo funciona el IDR? Envíe una factura de prueba y consulte el resultado en su Bandeja de entrada.

Envíe su primera factura

Artículos relacionados