Documentclassificatie: hoe het systeem bepaalt wat een factuur is

Hoe de Detect API bepaalt of een document een factuur is en hoe de classificatie werkt.

Wanneer je een e-mail met bijlagen instuurt, moet het systeem voor elke bijlage bepalen wat voor type document het is. Is het een factuur, een pakbon, een herinnering of een logo? Dit gebeurt via de Detect API, een volledig eigen classificatietechnologie van eConnect.

Hoe werkt de classificatie?

De Detect API analyseert elk document in twee stappen:

  1. Visuele analyse: van elk document wordt een visuele fingerprint gemaakt (vectortemplate-matching). Deze wordt vergeleken met bekende documenttemplates om het type te herkennen op basis van de layout.
  2. Tekstanalyse: bovenop de visuele herkenning worden tekstuele controles uitgevoerd via OCR. Op basis van de combinatie van visuele kenmerken en tekst wordt een classificatiebeslissing genomen.

De classificatie is volledig automatisch. De Detect API is eigen technologie van eConnect, geen externe classificatieservice.

Welke documenttypen worden onderscheiden?

Het systeem onderscheidt de volgende categorieën:

CategorieWat er mee gebeurtFactuurWordt verwerkt door de IDR → e-factuurInkooporderWordt verwerkt door de IDR → e-order (bèta)Proforma-factuurWordt standaard afgekeurd. Wil je dat een proforma toch wordt verwerkt? Wijzig het woord "proforma" op de PDF naar "factuur" voordat je instuurt.Bonnetje/kassabonWordt verwerkt door de IDR → e-factuur (met dummywaarden)PakbonWordt als bijlage bij de factuur geplaatstLogoWordt gefilterd (afbeelding uit e-mailhandtekening)LoonstrookWordt niet verwerktHerinnering/betaalverzoekWordt niet verwerktBelastingdocumentWordt niet verwerktAlgemene voorwaardenWordt als bijlage geplaatstBijlage/specificatieWordt als bijlage bij de factuur geplaatstOnbekendWordt beoordeeld door het kwaliteitsteam
Classificatie en afkeuring

Een belangrijk onderscheid: de Detect API classificeert documenten, maar keurt ze niet zelf af. De daadwerkelijke afkeuring van een conversietaak is altijd een handmatige actie van het kwaliteitsteam. Een document kan correct worden geclassificeerd als "geen factuur" en vervolgens door het team worden beoordeeld voordat het wordt afgekeurd.

Classificatiefouten melden

Als een factuur onterecht als ander documenttype wordt geclassificeerd (bijvoorbeeld als proforma-factuur), kun je dit melden bij support. Het eConnect-team kan de classificatie verbeteren, zodat vergelijkbare documenten in de toekomst correct worden herkend.

Per-afzender classificatiecorrecties zijn niet mogelijk: de classificatie werkt generiek over alle afzenders. Wel kan het classificatiemodel worden uitgebreid om specifieke benamingen te herkennen (bijvoorbeeld als een leverancier "betaalverzoek" schrijft maar het document een factuur is).

Veelgestelde vragen
Wat als mijn factuur onterecht als ander documenttype wordt geclassificeerd?

Meld dit bij support zodat het classificatiemodel kan worden verbeterd. De classificatie werkt generiek over alle afzenders, maar het model kan worden uitgebreid om specifieke benamingen te herkennen. De daadwerkelijke afkeuring is altijd een handmatige actie van het kwaliteitsteam, niet van de Detect API zelf.

Herkent het systeem automatisch bijlagen bij facturen?

Ja, documenten zoals pakbonnen, specificaties en algemene voorwaarden die in dezelfde e-mail als een factuur worden meegestuurd, worden automatisch als bijlage bij die factuur geplaatst. Het systeem classificeert elk document apart en bepaalt op basis daarvan of het een factuur of bijlage is.

Kan ik de classificatie per leverancier aanpassen?

Per-afzender classificatiecorrecties zijn niet mogelijk, omdat de classificatie generiek werkt. Het classificatiemodel kan echter wel worden uitgebreid om specifieke benamingen beter te herkennen, bijvoorbeeld als een leverancier "betaalverzoek" schrijft terwijl het document een factuur is. Meld dit bij support.


Wil je weten welke documenttypen niet worden verwerkt en waarom? Lees Welke documenten verwerkt eConnect niet?.

Bekijk wat we niet verwerken

Gerelateerd