Hoe werkt Scan & Herken (IDR/OCR)?

De technologie achter automatische PDF-herkenning: OCR, AI en het zelflerend systeem voor facturen en inkooporders.

De Intelligent Document Recogniser (IDR) is de eigen technologie van eConnect die PDF-documenten, afbeeldingen en bonnetjes omzet naar gevalideerde elektronische documenten. Dit is de motor achter Scan & Herken. Het systeem verwerkt 100% van alle ingediende documenten en wordt steeds beter door gebruik.

Naast facturen kan de IDR ook inkooporders (purchase orders) herkennen en omzetten. Deze functionaliteit maakt gebruik van dezelfde drie technologielagen als de factuurherkenning. Orderherkenning is momenteel beschikbaar als bèta en wordt actief doorontwikkeld.

Drie lagen, één resultaat. De IDR combineert OCR-tekstherkenning, LLM-interpretatie en eigen documentinterpretatie tot een nauwkeurig, zelflerend systeem dat meer dan 98% van alle kernvelden correct herkent.

Drie technologielagen

De IDR combineert drie lagen die samenwerken om documenten te herkennen en te verwerken:

OCR-laag: De eerste stap is pure tekstherkenning. Deze laag leest de tekst op het document, ongeacht de taal (meer dan 200 talen worden ondersteund) of het formaat.

LLM-laag: Een Large Language Model helpt bij het interpreteren van de herkende tekst. Het model begrijpt de context van de informatie en ondersteunt bij het toewijzen van tekst aan de juiste factuurelementen.

Documentinterpretatie: Dit is de kern van de IDR en volledig eigen technologie van eConnect. Deze laag bepaalt wat het document betekent, welke velden relevant zijn, hoe de data gestructureerd moet worden en of alles klopt. De intelligentie die hier zit, inclusief het zelflerend systeem, de validatieregels en de feedbackloop, is het onderscheidende vermogen van eConnect.

De OCR en het LLM zijn commodity-diensten. De echte waarde zit in de interpretatie- en validatielaag die eConnect zelf bouwt en beheert.

Het onderstaande diagram laat zien hoe een PDF-factuur door de drie lagen van de IDR wordt verwerkt tot een gevalideerde e-factuur.

Wat wordt er herkend?

De IDR herkent automatisch alle relevante factuurelementen:

  • Leverancier en afnemer (naam, adres, KvK, BTW-nummer)
  • Factuurnummer en factuurdatum
  • Bedragen (subtotaal, BTW, totaal)
  • Betalingsgegevens (IBAN, betalingskenmerk)
  • Ordernummers en referenties (bij Professional-abonnement)
  • Factuurregels met omschrijving, aantal, stuksprijs en regelbedrag (regelherkenning)
Regelherkenning

Sinds juli 2024 biedt de IDR ook regelherkenning: het opsplitsen van PDF-factuurregels naar individuele transactieregels. Per regel worden omschrijving, prijs, hoeveelheid, regelbedrag en referentievelden herkend.

Standaard wordt 80% van de factuurregels automatisch herkend. De overige 20% valt terug naar de standaardverwerking, waarbij het subtotaal per BTW-tarief wordt gebruikt. Hierbij geldt de "No Lines No Pay"-garantie: je betaalt alleen voor regels die daadwerkelijk succesvol zijn herkend.

Optioneel kun je regelvalidatie activeren. Daarbij controleert het eConnect-validatieteam de regels die niet automatisch zijn herkend, zodat je een 100%-garantie krijgt op factuurherkenning op regelniveau.

Het zelflerend systeem

De IDR wordt beter naarmate er meer facturen worden verwerkt. Dit werkt via een feedbackloop:

  • Bij elke verwerkte factuur vergelijkt het systeem de herkende waarden met eerder opgeslagen patronen van dezelfde leverancier.
  • Als de IDR niet zeker genoeg is, gaat de factuur naar het Quality Control-team voor handmatige verificatie.
  • Elke correctie door het QC-team wordt als "hint" teruggevoerd naar het systeem, waarmee de AI voor toekomstige herkenning wordt getraind.
  • Ook klantfeedback wordt verwerkt: gemelde fouten worden geanalyseerd, opgenomen in testprocedures en structureel voorkomen.

Het resultaat is een systeem dat continu verbetert. Een fout die één keer voorkomt, blijft niet bestaan, het wordt opgelost en het systeem leert ervan.

Nauwkeurigheid en verwerkingsgarantie

De IDR scoort hoog op nauwkeurigheid:

  • Op de kernvelden (factuurnummer, datum, bedragen): > 98% juist, onderbouwd door periodieke steekproeven
  • SLA-garantie: 99% van documenten verwerkt binnen 8 werkuren

De architectuur voorkomt structurele fouten doordat elke herkende waarde wordt gevalideerd tegen een andere bron (document-intern of extern). Bij twijfel wordt het document naar het QC-team gerouteerd, wat een extra veiligheidslaag biedt.

Verwerkingstijden

De pure verwerkingstijd voor automatisch verwerkte documenten bedraagt gemiddeld 20 tot 30 seconden. De totale doorlooptijd inclusief wachttijd in de queue is gemiddeld circa 3,5 minuten. Met de prioriteitsoptie (beschikbaar bij hogere abonnementen) worden documenten voorrang gegeven.

Gestructureerde betaalkenmerken

De IDR herkent ook landspecifieke betaalkenmerken:

  • Belgisch OGM (gestructureerde mededeling): het formaat +++XXX/XXXX/XXXXX+++ met ingebouwde checksumvalidatie
  • Noors KID-nummer: gestructureerd betaalkenmerk voor Noorse facturen
  • Zwitserse QR-code: betaalgegevens uit de QR-code op Zwitserse facturen

Deze herkenning is onderdeel van de Professional-versie van de IDR.

Veelgestelde vragen
Hoe nauwkeurig is de automatische herkenning van de IDR?

Op de kernvelden (factuurnummer, datum en bedragen) scoort de IDR hoger dan 98% nauwkeurigheid, onderbouwd door periodieke steekproeven. In de meest recente steekproef scoorde de automatische verwerking 100% juist. Bij twijfel wordt het document doorgestuurd naar het Quality Control-team voor handmatige verificatie.

Wat als een factuur niet automatisch herkend kan worden?

Als de IDR niet zeker genoeg is over de herkenning, gaat de conversietaak naar het Quality Control-team van eConnect. Zij controleren het document handmatig en corrigeren eventuele fouten. Elke correctie wordt als trainingsdata teruggevoerd naar het systeem, zodat vergelijkbare facturen in de toekomst wél automatisch worden verwerkt.

Wordt de herkenning beter naarmate er meer facturen worden verwerkt?

Ja, de IDR is een zelflerend systeem. Bij elke verwerkte factuur worden patronen opgebouwd per leverancier. Correcties door het QC-team en klantfeedback worden als hints teruggevoerd naar het systeem. Hoe meer facturen van een leverancier zijn verwerkt, hoe beter en sneller de herkenning wordt.


Wil je zelf ervaren hoe de IDR werkt? Stuur een testfactuur in en bekijk het resultaat in je Postvak IN.

Stuur je eerste factuur in

Gerelateerd