Textextraktion ur PDF-filer t.ex. tingsrätternas domar
Extrahera text ur PDF-filer
Vi kan extrahera text ur PDF-filer med hjälp av skräddarsydda script och bygga upp innehåll till en databas på det viset. Detta är ett mer kraftfullt och mer flexibelt alternativ än att använda ett OCR program med avancerade funktioner. Det är dessutom snabbare!
Extraktionsområden kan sättas med hjälp av exakta koordinater, eller med hjälp av koordinater relativt keywords, eller relativt ”regular expressions” (sökmönster). Det finns även möjlighet att söka keywords med fuzzy-matchning (dvs något tecken får vara fel)!
Vanliga uppgifter kan vara flexibel inhämtning av orgnummer och/eller personnummer, datum, ordernummer eller liknande.
Det kan t. ex. gälla myndighetshandlingar som domslut, kontoutdrag osv, handlingar från Bolagsverket, Skatteverket etc.
Domar från tingsrätter - extraktion av tilltalade och målsägande ur tingsrätternas domar
Vi har omfattande erfarenhet av att jobba med särskilt domar från alla tingsrätter! Vi kan extrahera tilltalad och målsägande, deras personnummer där det förekommer, målnummer och domstolsnamn osv ur alla domar som publiceras som pdf-filer från landets domstolar. Snabbt och till rimligt pris!
Med 100% specialanpassat script så går det oftast att få ut exakt det ni vill ha!