implemented '-s detectspace' functionality
[swftools.git] / lib / pdf / InfoOutputDev.cc
index 627ab0a..affad69 100644 (file)
 #include "GfxState.h"
 #include "../log.h"
 #include <math.h>
+#include <assert.h>
+
+int config_addspace = 1;
+int config_fontquality = 10;
+int config_bigchar = 0;
 
 InfoOutputDev::InfoOutputDev(XRef*xref) 
 {
     num_links = 0;
-    num_images = 0;
+    num_jpeg_images = 0;
+    num_ppm_images = 0;
+    num_textfields = 0;
     num_fonts = 0;
     num_polygons= 0;
-    fonts = 0;
     currentfont = 0;
     currentglyph = 0;
     id2font = new GHash(1);
@@ -53,8 +59,9 @@ void FontInfo::grow(int size)
        this->num_glyphs = size;
     }
 }
-FontInfo::FontInfo()
+FontInfo::FontInfo(char*id)
 {
+    this->id = strdup(id);
     this->charid2glyph = 0;
     this->seen = 0;
     this->num_glyphs = 0;
@@ -64,9 +71,11 @@ FontInfo::FontInfo()
     this->lastx = 0;
     this->lasty = 0;
     this->gfxfont = 0;
+    this->space_char = -1;
 }
 FontInfo::~FontInfo()
 {
+    if(this->id) {free(this->id);this->id=0;}
     this->font = 0;
     if(this->charid2glyph) {
        free(this->charid2glyph);
@@ -81,47 +90,46 @@ FontInfo::~FontInfo()
        }
     }
     free(glyphs);glyphs=0;
+    if(this->gfxfont)
+        gfxfont_free(this->gfxfont);
 }
-GBool InfoOutputDev::upsideDown() {return gTrue;}
-GBool InfoOutputDev::useDrawChar() {return gTrue;}
-GBool InfoOutputDev::interpretType3Chars() {return gTrue;}
-GBool InfoOutputDev::useTilingPatternFill() {return gTrue;}
 
-void InfoOutputDev::startPage(int pageNum, GfxState *state, double crop_x1, double crop_y1, double crop_x2, double crop_y2)
-{
-    double x1,y1,x2,y2;
-    state->transform(crop_x1,crop_y1,&x1,&y1);
-    state->transform(crop_x2,crop_y2,&x2,&y2);
-    if(x2<x1) {double x3=x1;x1=x2;x2=x3;}
-    if(y2<y1) {double y3=y1;y1=y2;y2=y3;}
-    this->x1 = (int)x1;
-    this->y1 = (int)y1;
-    this->x2 = (int)x2;
-    this->y2 = (int)y2;
-    msg("<verbose> Generating info structure for page %d", pageNum);
-}
-void InfoOutputDev::endPage()
+static int findSpace(gfxfont_t*font)
 {
+    int first_space = -1;
+    int t;
+    for(t=0;t<font->num_glyphs;t++) {
+       gfxglyph_t*g = &font->glyphs[t];
+       if(GLYPH_IS_SPACE(g)) {
+           if(g->unicode == 32) return t;
+           if(first_space<0)
+               first_space = t;
+       }
+    }
+    if(GLYPH_IS_SPACE(&font->glyphs[32])) {
+       return 32;
+    }
+    return first_space;
 }
-void InfoOutputDev::drawLink(Link *link, Catalog *catalog) 
+
+static int addSpace(gfxfont_t*font)
 {
-    num_links++;
+    font->num_glyphs++;
+    font->glyphs = (gfxglyph_t*)realloc(font->glyphs, sizeof(gfxglyph_t)*font->num_glyphs);
+    gfxglyph_t*g = &font->glyphs[font->num_glyphs-1];
+    memset(g, 0, sizeof(*g));
+    g->unicode = 32;
+    //g->advance = font->ascent;
+    g->advance = fabs(font->ascent - font->descent)*2 / 3;
+    if(font->max_unicode > 32)
+       font->unicode2glyph[32] = font->num_glyphs-1;
+#if 0
+    g->line = gfxline_makerectangle(0, -font->ascent, g->advance, font->descent);
+#endif
+    return font->num_glyphs-1;
 }
-   
-/* there's not yet a way to set this */
-int config_fontquality = 10;
-int config_bigchar = 0;
-
-/*  } else if(!strcmp(key,"fontquality")) {
-        this->config_fontquality = atof(value);
-       if(this->config_fontquality<=1)
-           this->config_fontquality=1;
-    } else if(!strcmp(key,"bigchar")) {
-        this->config_bigchar = atoi(value);
-    }
- */
 
-gfxfont_t* InfoOutputDev::createGfxFont(GfxFont*xpdffont, FontInfo*src)
+static gfxfont_t* createGfxFont(FontInfo*src)
 {
     gfxfont_t*font = (gfxfont_t*)malloc(sizeof(gfxfont_t));
     memset(font, 0, sizeof(gfxfont_t));
@@ -205,10 +213,63 @@ gfxfont_t* InfoOutputDev::createGfxFont(GfxFont*xpdffont, FontInfo*src)
        }
 
     }
-    msg("<trace> %d glyphs.", t, font->num_glyphs);
     return font;
 }
 
+
+gfxfont_t* FontInfo::getGfxFont()
+{
+    if(!this->gfxfont) {
+        this->gfxfont = createGfxFont(this);
+        this->gfxfont->id = strdup(this->id);
+       this->space_char = findSpace(this->gfxfont);
+       if(this->space_char>=0) {
+           msg("<debug> Font %s has space char %d (unicode=%d)", 
+                   this->id, this->space_char, 
+                   this->gfxfont->glyphs[this->space_char].unicode);
+       } else if(config_addspace) {
+           this->space_char = addSpace(this->gfxfont);
+           msg("<debug> Appending space char to font %s, position %d", this->gfxfont->id, this->space_char);
+       }
+    }
+    return this->gfxfont;
+}
+
+GBool InfoOutputDev::upsideDown() {return gTrue;}
+GBool InfoOutputDev::useDrawChar() {return gTrue;}
+GBool InfoOutputDev::interpretType3Chars() {return gTrue;}
+GBool InfoOutputDev::useTilingPatternFill() {return gTrue;}
+
+void InfoOutputDev::startPage(int pageNum, GfxState *state, double crop_x1, double crop_y1, double crop_x2, double crop_y2)
+{
+    double x1,y1,x2,y2;
+    state->transform(crop_x1,crop_y1,&x1,&y1);
+    state->transform(crop_x2,crop_y2,&x2,&y2);
+    if(x2<x1) {double x3=x1;x1=x2;x2=x3;}
+    if(y2<y1) {double y3=y1;y1=y2;y2=y3;}
+    this->x1 = (int)x1;
+    this->y1 = (int)y1;
+    this->x2 = (int)x2;
+    this->y2 = (int)y2;
+    msg("<verbose> Generating info structure for page %d", pageNum);
+}
+void InfoOutputDev::endPage()
+{
+}
+void InfoOutputDev::drawLink(Link *link, Catalog *catalog) 
+{
+    num_links++;
+}
+   
+/*  } else if(!strcmp(key,"fontquality")) {
+        this->config_fontquality = atof(value);
+       if(this->config_fontquality<=1)
+           this->config_fontquality=1;
+    } else if(!strcmp(key,"bigchar")) {
+        this->config_bigchar = atoi(value);
+    }
+ */
+
 double InfoOutputDev::getMaximumFontSize(char*id)
 {
     FontInfo*info = (FontInfo*)id2font->lookup(id);
@@ -255,7 +316,7 @@ void InfoOutputDev::updateFont(GfxState *state)
 
     currentfont = (FontInfo*)id2font->lookup(id);
     if(!currentfont) {
-       currentfont = new FontInfo;
+       currentfont = new FontInfo(id);
        currentfont->font = font;
        currentfont->max_size = 0;
        GString* idStr = new GString(id);
@@ -276,10 +337,6 @@ void InfoOutputDev::updateFont(GfxState *state)
         currentfont->ascender = currentfont->descender = 0;
     }
 
-    currentfont->gfxfont = this->createGfxFont(font, currentfont);
-    currentfont->gfxfont->id = strdup(id);
-    fonts = gfxfontlist_addfont(fonts, currentfont->gfxfont);
-
     free(id);
 }
 
@@ -316,6 +373,9 @@ void InfoOutputDev::drawChar(GfxState *state, double x, double y,
     if(currentfont && currentfont->max_size < len) {
        currentfont->max_size = len;
     }
+    
+    num_textfields++;
+
     currentfont->grow(code+1);
     GlyphInfo*g = currentfont->glyphs[code];
     if(!g) {
@@ -326,7 +386,7 @@ void InfoOutputDev::drawChar(GfxState *state, double x, double y,
        g->advance = currentfont->splash_font->last_advance;
        g->unicode = 0;
     }
-    if(uLen && (u[0]>=32 && u[0]<g->unicode || !g->unicode)) {
+    if(uLen && ((u[0]>=32 && u[0]<g->unicode) || !g->unicode)) {
        g->unicode = u[0];
     }
     if(currentfont->lastchar>=0 && currentfont->lasty == y) {
@@ -352,7 +412,7 @@ GBool InfoOutputDev::beginType3Char(GfxState *state, double x, double y, double
     char*id = getFontID(font);
     currentfont = (FontInfo*)id2font->lookup(id);
     if(!currentfont) {
-       currentfont = new FontInfo;
+       currentfont = new FontInfo(id);
        currentfont->font = font;
        GString* idStr = new GString(id);
        id2font->add(idStr, (void*)currentfont);
@@ -409,14 +469,16 @@ void InfoOutputDev::drawImageMask(GfxState *state, Object *ref, Stream *str,
                           int width, int height, GBool invert,
                           GBool inlineImg) 
 {
-    num_images++;
+    if(str->getKind()==strDCT) num_jpeg_images++; else num_ppm_images++;
+
     OutputDev::drawImageMask(state,ref,str,width,height,invert,inlineImg);
 }
 void InfoOutputDev::drawImage(GfxState *state, Object *ref, Stream *str,
                       int width, int height, GfxImageColorMap *colorMap,
                       int *maskColors, GBool inlineImg)
 {
-    num_images++;
+    if(str->getKind()==strDCT) num_jpeg_images++; else num_ppm_images++;
+
     OutputDev::drawImage(state,ref,str,width,height,colorMap,maskColors,inlineImg);
 }
 void InfoOutputDev::drawMaskedImage(GfxState *state, Object *ref, Stream *str,
@@ -426,6 +488,8 @@ void InfoOutputDev::drawMaskedImage(GfxState *state, Object *ref, Stream *str,
                                int maskWidth, int maskHeight,
                                GBool maskInvert) 
 {
+    if(str->getKind()==strDCT) num_jpeg_images++; else num_ppm_images++;
+
     OutputDev::drawMaskedImage(state,ref,str,width,height,colorMap,maskStr,maskWidth,maskHeight,maskInvert);
 }
 
@@ -436,5 +500,18 @@ void InfoOutputDev::drawSoftMaskedImage(GfxState *state, Object *ref, Stream *st
                                    int maskWidth, int maskHeight,
                                    GfxImageColorMap *maskColorMap) 
 {
+    if(str->getKind()==strDCT) num_jpeg_images++; else num_ppm_images++;
+
     OutputDev::drawSoftMaskedImage(state,ref,str,width,height,colorMap,maskStr,maskWidth,maskHeight,maskColorMap);
 }
+    
+void InfoOutputDev::dumpfonts(gfxdevice_t*dev)
+{
+    GHashIter*i;
+    GString*key;
+    FontInfo*font;
+    id2font->startIter(&i);
+    while(id2font->getNext(&i, &key, (void**)&font)) {
+        dev->addfont(dev, font->getGfxFont());
+    }
+}