Bokscanning - scanna in bok - OCR skanning till Pdf / Word
|
|
|
Skanna in bok till sökbar PDF eller Word.docx med verifierade tecken och verifierad stavning
OCR-skanning av bok till Word.docx
Vi styckar normalt boken - eller så använder vi en overhead skanner för bokskanning upp till A1(+)-format - och skannar bokens sidor och OCR-konverterar till en rå-text, dvs en redigerbar sidbruten text med verifierade tecken och verifierad stavning, men utan typografisk redigering.
Vi är starka inom krävande texter med inslag av utländska språk och tecken. Det är en anledning varför bokförlag gärna nyttjar våra tjänster!
Vi har med våran bokdigitaliseringstjänst assisterat t. ex. Brombergs Bokförlag, Bokförlaget Bakhåll, Bokförlaget Daidalos, Bookmark förlag, Fri Tanke Förlag, Bookhouse Publishing, Lindelöws bokförlag, Mondial Förlag, Åbergs stilus et forma m.fl.
Ny sättning av inlaga för tryckning eller ebok
Ni kan sedan arbeta vidare med texten om det är en Word-fil ni beställt! Antingen sätter ni inlagan själv, eller så anlitar ni en extern bokformgivare! Vi kan rekommendera en bokformgivare vi brukar samarbeta med om ni så önskar! Han kan sätta en inlaga, göra nytt omslag, eller skapa en ebok i epub-format.
Scanning av bok eller häfte till bild-PDF med OCR-tolkat textlager (osynligt under bilden) för sökning
Det finns två huvudalternativ: Antingen använder vi overheadskanner för hela boken upp till A1(+)-format, eller så "slaktar" vi boken/häftet och använder automatiskt arkmatad scanner. (Pga av att det är mer effektivt och billigare för kunden). Pärmarna eller omslagen skannar vi alltid först i en overheadscanner i de fall vi slaktar boken. Vi skannar in i 600 dpi för att få bra ocr-resultat, och därefter nedsamplar vi filen till 300 dpi eller lägre för att minska filstorleken medan det fina ocr-resultatet behålls!! Vi OCR-tolkar med bästa programvaran; antingen (1) batch-OCR utan att rätta osäkra tecken, eller (2) med rättning av osäkra tecken och ord. Vi beskär till sist sidorna elektroniskt med ett par mm vid behov för snyggt utseende, eller så kan vi fylla i med färg för att täcka över skanninglinjer i kanterna.
Vi kan även räta upp sidor och textrader, och snygga till marginaler i ett särskilt bildförbättringsprogram för jobb där ni beställt extra hög kvalitet i utseendet! Om vi skannar till svartvitt, så kan vi även centrera textsatsytan! När vi skannar till svartvitt så filtrerar vi bort små svarta fläckar, och vi retuscherar även manuellt bort lite större fläckar.
Normalt får ni alltid i leveransen en (eller flera) bild-PDF i 300dpi med minimala kvalitetsförluster. Ni väljer om det ska vara i svartvitt, gråskala eller färg. Gråskala ger betydligt mindre filer än färg och är ofta att föredra av den anledningen! Allra minst filer får man med svartvita (bitonala) filer! Men om det finns illustrationer i texten brukar man vilja ha minst gråskala för att återgivningen ska bli acceptabel!
Detta är ett utdrag på 13 sidor ur en museumkatalog. En provdigitalisering. Jag har skannat främre omslagen i färg 600dpi med Zeutschel overheadskanner. Sedan har jag skannat inlagan i 600 dpi färg på Inotec 6x1 scanner. Jag har efterbearbetat sidbildernas kanter i ett separat program för efterbearbetning. Allra sist, så har jag ocr-tolkat och sparat till pdf-format.
OCR rå-text med verifierade tecken och verifierad stavning från PDF-fil
Från vissa PDF-filer kan vi extrahera innehållet direkt och omvandla till Word-fil. I de fall det inte är möjligt, så tolkas PDF-filens sidor som bilder med OCR-teknik som ovan.
Endast bilder i PDF-, TIFF-, eller PNG-format för reproduktionstryckning
Vill ni istället bara ha en bild-PDF av boken, eller TIFF-bilder, utan möjlighet till redigering, så kan vi så klart göra det också! Vi kan skanna i färg, gråskala eller svartvitt upp till 600 dpi optisk upplösning. 600 dpi brukar räcka för reproduktionstryckning!
Vi kan för det mesta även centrera satsytan om ni vill ha den extra tjänsten!
Exempel på overheadskannade bilder
Renskärning av boksidor