De technologie achter automatische PDF-herkenning: OCR, AI en het zelflerend systeem voor facturen en inkooporders.
De Intelligent Document Recogniser (IDR) is de eigen technologie van eConnect die PDF-documenten, afbeeldingen en bonnetjes omzet naar gevalideerde elektronische documenten. Dit is de motor achter Scan & Herken. Het systeem verwerkt 100% van alle ingediende documenten en wordt steeds beter door gebruik.
Naast facturen kan de IDR ook inkooporders (purchase orders) herkennen en omzetten. Deze functionaliteit maakt gebruik van dezelfde drie technologielagen als de factuurherkenning. Orderherkenning is momenteel beschikbaar als bèta en wordt actief doorontwikkeld.
Drie lagen, één resultaat. De IDR combineert OCR-tekstherkenning, LLM-interpretatie en eigen documentinterpretatie tot een nauwkeurig, zelflerend systeem dat meer dan 98% van alle kernvelden correct herkent.
De IDR combineert drie lagen die samenwerken om documenten te herkennen en te verwerken:
OCR-laag: De eerste stap is pure tekstherkenning. Deze laag leest de tekst op het document, ongeacht de taal (meer dan 200 talen worden ondersteund) of het formaat.
LLM-laag: Een Large Language Model helpt bij het interpreteren van de herkende tekst. Het model begrijpt de context van de informatie en ondersteunt bij het toewijzen van tekst aan de juiste factuurelementen.
Documentinterpretatie: Dit is de kern van de IDR en volledig eigen technologie van eConnect. Deze laag bepaalt wat het document betekent, welke velden relevant zijn, hoe de data gestructureerd moet worden en of alles klopt. De intelligentie die hier zit, inclusief het zelflerend systeem, de validatieregels en de feedbackloop, is het onderscheidende vermogen van eConnect.
De OCR en het LLM zijn commodity-diensten. De echte waarde zit in de interpretatie- en validatielaag die eConnect zelf bouwt en beheert.
Het onderstaande diagram laat zien hoe een PDF-factuur door de drie lagen van de IDR wordt verwerkt tot een gevalideerde e-factuur.
De IDR herkent automatisch alle relevante factuurelementen:
Sinds juli 2024 biedt de IDR ook regelherkenning: het opsplitsen van PDF-factuurregels naar individuele transactieregels. Per regel worden omschrijving, prijs, hoeveelheid, regelbedrag en referentievelden herkend.
Standaard wordt 80% van de factuurregels automatisch herkend. De overige 20% valt terug naar de standaardverwerking, waarbij het subtotaal per BTW-tarief wordt gebruikt. Hierbij geldt de "No Lines No Pay"-garantie: je betaalt alleen voor regels die daadwerkelijk succesvol zijn herkend.
Optioneel kun je regelvalidatie activeren. Daarbij controleert het eConnect-validatieteam de regels die niet automatisch zijn herkend, zodat je een 100%-garantie krijgt op factuurherkenning op regelniveau.
De IDR wordt beter naarmate er meer facturen worden verwerkt. Dit werkt via een feedbackloop:
Het resultaat is een systeem dat continu verbetert. Een fout die één keer voorkomt, blijft niet bestaan, het wordt opgelost en het systeem leert ervan.
De IDR scoort hoog op nauwkeurigheid:
De architectuur voorkomt structurele fouten doordat elke herkende waarde wordt gevalideerd tegen een andere bron (document-intern of extern). Bij twijfel wordt het document naar het QC-team gerouteerd, wat een extra veiligheidslaag biedt.
De pure verwerkingstijd voor automatisch verwerkte documenten bedraagt gemiddeld 20 tot 30 seconden. De totale doorlooptijd inclusief wachttijd in de queue is gemiddeld circa 3,5 minuten. Met de prioriteitsoptie (beschikbaar bij hogere abonnementen) worden documenten voorrang gegeven.
De IDR herkent ook landspecifieke betaalkenmerken:
+++XXX/XXXX/XXXXX+++ met ingebouwde checksumvalidatieDeze herkenning is onderdeel van de Professional-versie van de IDR.
Op de kernvelden (factuurnummer, datum en bedragen) scoort de IDR hoger dan 98% nauwkeurigheid, onderbouwd door periodieke steekproeven. In de meest recente steekproef scoorde de automatische verwerking 100% juist. Bij twijfel wordt het document doorgestuurd naar het Quality Control-team voor handmatige verificatie.
Als de IDR niet zeker genoeg is over de herkenning, gaat de conversietaak naar het Quality Control-team van eConnect. Zij controleren het document handmatig en corrigeren eventuele fouten. Elke correctie wordt als trainingsdata teruggevoerd naar het systeem, zodat vergelijkbare facturen in de toekomst wél automatisch worden verwerkt.
Ja, de IDR is een zelflerend systeem. Bij elke verwerkte factuur worden patronen opgebouwd per leverancier. Correcties door het QC-team en klantfeedback worden als hints teruggevoerd naar het systeem. Hoe meer facturen van een leverancier zijn verwerkt, hoe beter en sneller de herkenning wordt.
Wil je zelf ervaren hoe de IDR werkt? Stuur een testfactuur in en bekijk het resultaat in je Postvak IN.
Stuur je eerste factuur in