Skanning | Nyheter

2018-07-20 Antagna studenter åt Jusek!

2018-06-18 Enkät om polisers arbetsmiljö åt Umeå universitet

2018-05-03 Ca 69000 politiska kandidater inlästa åt Expressen!

2018-04-26 Skanning & OCR-läsning av 5000 sid lantmäteridata åt Valueguard

2018-02-28 Läkare/sjuksköterskor åt NextMedia

2018-02-02 Valda politiker från Valmyndigheten

2017-11-27 Skanning av markupplåtelseavtal till PDF-filer i färg

2017-11-10 Ny extremdator med Intels 18-kärniga CORE i9 7980xe processor!

2017-10-25 OCR av 1800 sid aktieägaradresser

2017-08-28 OCR skanning av kyrkopolitiker åt Expressen!

2017-07-24 Verket för högskoleservice åt Jusek!

2017-07-07 Skanning & OCR-läsning av lantmäteridata åt Valueguard

2017-06-30 Enkät om hemlöshet i 2 varianter åt Socialstyrelsen

2017-04-09 OCR-konvertering av ca 14730 valda politiker åt Expressen

2017-02-03 Skanning och OCR-inläsning av 800.000 dataposter hundägardata

2016-12-14 Skanning och OCR-inläsning av 250.000 läkare och sjuksköterskor

2016-11-27 Enkät på asylboenden åt Expressen

2016-10-05 Intels 10-core-processor

2016-06-07 >130.000 sidor fastighetsdata

2016-04-12 4700 sid Ladok åt Jusek

2016-03-31 Enkät åt Röda korsets högskola

2016-03-11 Enkät "Hälsa i Västerbotten"

2015-12-01 OCR av 2500 sid Euroclear

2015-08-28 Script för bearbetning av dagboksblad i PDF-format från tingsrätterna, hovrätterna och högsta domstolen åt Nyhetsbyrån SIREN

2015-03-19 ca 20,000 hundägaradresser åt Postnord

2015-01-30 OCR av 140,000 sjuksköterskor

Skanning | Kontakt

scanning Skriptoriet OCR scanning
Knutstorpsvägen 2
268 77 Kågeröd

VD & operatör Niclas Wallin
Tel: 0418-800 01
Mob: 070-722 81 48
E-post: niclas@skriptoriet.se

Scanningtjänster - OCR tolkning - servicebyrå

Skanning och OCR-inläsning av studentadresser utskrivna från LADOK-systemet, UHR (Universitets- och högskolerådet), CSN, adresser till aktieägare från Euroclear, adresser till skogsägare från Skogsstyrelsen, politiker från Valmyndigheten, hundregistret vid Jordbruksverket etc. Enkätskanning, formulärskanning, Textextraktion ur PDFer m.m.

OCR-skanning av adressregister

Vi skannar framför allt svenska, norska och danska adresslistor. I tjänsten för adressregister ingår bl.a.:

  • Kontroll av namn mot personnamndatabaser baserade på folkbokföringen
  • Kontroll av gatunamn mot gatunamndatabas från Posten
  • Kontroll av fältlängd och tecken i postnummerfältet
  • Kontroll av Postort mot postortdatabas från Posten
  • Validering och rättning av personnummer och organisationsnummer
  • Borttagning av dupletter och/eller jämförelser mot ert register som tillval!

Leverans i Excelark, Accessdatabas eller tabbavgränsad textfil.

OCR-skanning av strukturerade och semi-strukturerade listor

Vi konverterar flerradiga poster till enradiga fältindelade poster. Det kan t.ex. handla om medlemsregister från en tryckt matrikel. Det kan även handla om lägenhetsregister, åtalsregister eller vilken datautskrift som helst som har ett hyfsat regelbundet utseende.

OCR-skanning av epostadresser

Denna tjänst inkluderar omfattande efterbearbetning och kvalitetskontroller för att få så korrekta epostadresser som möjligt!

Efter OCR-inläsning kontrolleras alla epostadresser genom en tjänst som simulerar sändning av adresserna. De adresser som visar sig inte fungera kontrollerar vi sedan extra noga efter OCR-fel.

Skanning och tolkning av enkäter

Vi och vår tryckeripartner tar hand om allt arbete kring enkäter. I Skriptoriets skanningtjänst för datainsamling från enkäter ingår bl.a. följande:
  • Prepressavdelning hos vår tryckeripartner som anpassar enkätens utseende efter våra regler
  • Tryck, kuvertering, utskick, svarsposthantering, bortskärning av häftade ryggar m.m. genom vår tryckeripartner
  • Gratis uppdatering av adressregister inför påminnelseutskick
  • Kvalitetssäkrad skanning: dynamiskt tröskelvärde, sekvens- och riktningskontroll
  • Extremt lågt bortfall pga av skanningfel!
  • Även skanning av A3 möjlig. T.ex. 4 stycken A4 sidor tryckta på 1 vikt A3 blad
  • Noggrann verifiering av handifyllda data (ICR-fält) som datum, ålder, längd etc.
  • Datafiler i formaten Excel- och SPSS ingår alltid. Txt-fil som gratis tillval.
  • Datafil i excelformat har klickbar direktlänk till motsvarande skannad PDF i varje rad
  • Rapporter: Felkoder per variabel, ej ifyllda enkäter, värden per variabel
  • Öppna svar fås även sammanslagna i en lång PDF-fil per sidnr, sökbar på enkätID
  • En av våra stora kundfördelar är att fullständiga bilduppsättningar i såväl TIFF- som PDF-format alltid medföljer utan extra kostnad!
  • Krypterad leverans via Dropbox
  • Lägsta priserna i Sverige
  • Mycket tydliga offerter och inga överraskningar på fakturan!
  • Mycket snabba leveranser
  • Engagerad support per telefon eller vid datorn med TeamViewer

Se vidare under länken: "Skanning av enkäter" ovan till höger!

Tolkning med flexibel datafångstteknik

OCR-tolkning av vissa data utförs med hjälp av flexibla regler istället för fast formulärteknik! Vi använder oss bl.a. av programvaran ABBYY FlexiCapture. En databas med motsvarande datafält fylls med en datapost per formulär eller dokument! Tolkningen kan även göras på en vanlig PDF (som ej innehåller en bild), men som då bearbetas som bild av programvaran när tolkningen utförs!

Programmatisk textextraktion ur PDFer

Vi kan extrahera textområden ur PDFer programmatiskt och bygga en databas på det viset. Det kan t. ex. gälla myndighetshandlingar, som domslut. Extraktionsområden kan sättas med hjälp av exakta koordinater, eller med hjälp av koordinater relativt keywords, eller relativt "regular expressions" (sökmönster).

Omdöpning av PDFer med OCR-tolkad eller extraherad textdata

Denna tjänst innebär som typexempel att några olika data OCR-tolkas och hämtas med flexibel datafångstteknik (alternativt extraheras ett litet textområde programmatiskt ur en textPDF) från vanligtvis första sidan av en flersidig PDF och att denna fångade data efter kontroller och bearbetning sedan används för att döpa om den ursprungliga PDF-filen.

Skanning till PDFer med löpande numrering

Denna tjänst innebär skanning utan OCR. Slutprodukten består av bilder lagrade i något av formaten PDF eller TIFF. De är numrerade med löpnummer i skanningordning, 0001.PDF, 0002.PDF osv. En vanlig variant av detta är att scanna till en multipage PDF per flersidigt dokument med hjälp av separationsblad. Skanning till flersidiga PDFer med automatisk dokumentbrytning passar bra t.ex. vid due diligence, revisionsdokumentationer m.m.

Skanning med manuell indexering

Denna tjänst innebär skanning och manuell indexering av ett antal fördefinierade fält. Passar ofta bäst för äldre dokument med svårtolkad maskinskriven text eller med viss handskriven information som måste fångas.

OCR till PDF

Skanning och/eller OCR-tolkning till PDFer med osynlig tolkad text under bild. Passar bra för exempelvis OCR-tolkning av TIFF-bilder eller PDF-bilder för att skapa ett arkiv som är sökbart i fulltext.

OCR till Word

OCR av böcker och dokumenttexter till redigerbar Word-fil. Teckenverifiering ingår.