Skanning | Kontakt

scanning Skriptoriet OCR scanning
Knutstorpsvägen 2
268 77 Kågeröd

VD & konsult Niclas Wallin
Mob: 070-722 81 48
E-post: niclas@skriptoriet.se

Scanning - OCR tolkning - servicebyrå

Skanning och OCR-inläsning av studentadresser utskrivna från LADOK-systemet, UHR (Universitets- och högskolerådet), CSN, adresser till aktieägare från Euroclear, adresser till skogsägare från Skogsstyrelsen, politiker från Valmyndigheten, hundregistret vid Jordbruksverket etc. Enkätskanning, formulärskanning, Textextraktion ur PDFer m.m.

OCR-skanning av adressregister

Vi skannar framför allt svenska, norska och danska adresslistor. I tjänsten för adressregister ingår bl.a.:

  • Kontroll av namn mot personnamndatabaser baserade på folkbokföringen
  • Kontroll av gatunamn mot gatunamndatabas från Posten
  • Kontroll av fältlängd och tecken i postnummerfältet
  • Kontroll av Postort mot postortdatabas från Posten
  • Validering och rättning av personnummer och organisationsnummer
  • Borttagning av dupletter och/eller jämförelser mot ert register som tillval!

Leverans i Excelark, Accessdatabas eller tabbavgränsad textfil.

OCR-skanning av strukturerade och semi-strukturerade listor

Vi konverterar flerradiga poster till enradiga fältindelade poster. Det kan t.ex. handla om medlemsregister från en tryckt matrikel. Det kan även handla om lägenhetsregister, åtalsregister eller vilken datautskrift som helst som har ett hyfsat regelbundet utseende.

OCR-skanning av epostadresser

Denna tjänst inkluderar omfattande efterbearbetning och kvalitetskontroller för att få så korrekta epostadresser som möjligt!

Efter OCR-inläsning kontrolleras alla epostadresser genom en tjänst som simulerar sändning av adresserna. De adresser som visar sig inte fungera kontrollerar vi sedan extra noga efter OCR-fel.

Skanning och tolkning av enkäter

Vi och vår tryckeripartner tar hand om allt arbete kring enkäter. I Skriptoriets skanningtjänst för datainsamling från enkäter ingår bl.a. följande:
  • Prepressavdelning hos vår tryckeripartner som anpassar enkätens utseende efter våra regler
  • Tryck, kuvertering, utskick, svarsposthantering, bortskärning av häftade ryggar m.m. genom vår tryckeripartner
  • Gratis uppdatering av adressregister inför påminnelseutskick
  • Kvalitetssäkrad skanning: dynamiskt tröskelvärde, sekvens- och riktningskontroll
  • Extremt lågt bortfall pga av skanningfel!
  • Även skanning av A3 möjlig. T.ex. 4 stycken A4 sidor tryckta på 1 vikt A3 blad
  • Noggrann verifiering av handifyllda data (ICR-fält) som datum, ålder, längd etc.
  • Datafiler i formaten Excel- och SPSS ingår alltid. Txt-fil som gratis tillval.
  • Datafil i excelformat har klickbar direktlänk till motsvarande skannad PDF i varje rad
  • Rapporter: Felkoder per variabel, ej ifyllda enkäter, värden per variabel
  • Öppna svar fås även sammanslagna i en lång PDF-fil per sidnr, sökbar på enkätID
  • En av våra stora kundfördelar är att fullständiga bilduppsättningar i såväl TIFF- som PDF-format alltid medföljer utan extra kostnad!
  • Krypterad leverans via Dropbox
  • Lägsta priserna i Sverige
  • Mycket tydliga offerter och inga överraskningar på fakturan!
  • Mycket snabba leveranser
  • Engagerad support per telefon eller vid datorn med TeamViewer

Se vidare under länken: "Skanning av enkäter" ovan till höger!

Tolkning med flexibel datafångstteknik

OCR-tolkning av vissa data utförs med hjälp av flexibla regler istället för fast formulärteknik! Vi använder oss bl.a. av programvaran ABBYY FlexiCapture. En databas med motsvarande datafält fylls med en datapost per formulär eller dokument! Tolkningen kan även göras på en vanlig PDF (som ej innehåller en bild), men som då bearbetas som bild av programvaran när tolkningen utförs!

Programmatisk textextraktion ur PDFer

Vi kan extrahera textområden ur PDFer programmatiskt och bygga en databas på det viset. Det kan t. ex. gälla myndighetshandlingar, som domslut. Extraktionsområden kan sättas med hjälp av exakta koordinater, eller med hjälp av koordinater relativt keywords, eller relativt "regular expressions" (sökmönster).

Omdöpning av PDFer med OCR-tolkad eller extraherad textdata

Denna tjänst innebär som typexempel att några olika data OCR-tolkas och hämtas med flexibel datafångstteknik (alternativt extraheras ett litet textområde programmatiskt ur en textPDF) från vanligtvis första sidan av en flersidig PDF och att denna fångade data efter kontroller och bearbetning sedan används för att döpa om den ursprungliga PDF-filen.

Skanning till PDFer med löpande numrering

Denna tjänst innebär skanning utan OCR. Slutprodukten består av bilder lagrade i något av formaten PDF eller TIFF. De är numrerade med löpnummer i skanningordning, 0001.PDF, 0002.PDF osv. En vanlig variant av detta är att scanna till en multipage PDF per flersidigt dokument med hjälp av separationsblad. Skanning till flersidiga PDFer med automatisk dokumentbrytning passar bra t.ex. vid due diligence, revisionsdokumentationer m.m.

Skanning med manuell indexering

Denna tjänst innebär skanning och manuell indexering av ett antal fördefinierade fält. Passar ofta bäst för äldre dokument med svårtolkad maskinskriven text eller med viss handskriven information som måste fångas.

OCR till PDF

Skanning och/eller OCR-tolkning till PDFer med osynlig tolkad text under bild. Passar bra för exempelvis OCR-tolkning av TIFF-bilder eller PDF-bilder för att skapa ett arkiv som är sökbart i fulltext.

OCR till Word

OCR av böcker och dokumenttexter till redigerbar Word-fil. Teckenverifiering ingår.