fixed mem leaks
[swftools.git] / lib / pdf / pdf.cc
1 #include <stdio.h>
2 #include <string.h>
3 #include "../gfxdevice.h"
4 #include "../gfxsource.h"
5 #include "../devices/rescale.h"
6 #include "../log.h"
7 #include "config.h"
8 #include "GlobalParams.h"
9 #include "InfoOutputDev.h"
10 #include "GFXOutputDev.h"
11 #include "FullBitmapOutputDev.h"
12 #include "BitmapOutputDev.h"
13 #include "../mem.h"
14 #include "pdf.h"
15 #define NO_ARGPARSER
16 #include "../args.h"
17
18 static double zoom = 72; /* xpdf: 86 */
19 static int zoomtowidth = 0;
20 static int multiply = 1;
21 static char* global_page_range = 0;
22
23 static int globalparams_count=0;
24
25 typedef struct _pdf_page_info
26 {
27     int xMin, yMin, xMax, yMax;
28     int width,height;
29     int number_of_images;
30     int number_of_links;
31     int number_of_fonts;
32     char has_info;
33 } pdf_page_info_t;
34
35 typedef struct _pdf_doc_internal
36 {
37     char config_bitmap_optimizing;
38     char config_full_bitmap_optimizing;
39     char config_print;
40     gfxparams_t* parameters;
41
42     int protect;
43     int nocopy;
44     int noprint;
45     
46     PDFDoc*doc;
47     Object docinfo;
48     InfoOutputDev*info;
49
50     pdf_page_info_t*pages;
51     char*filename;
52
53     /* page map */
54     int*pagemap;
55     int pagemap_size;
56     int pagemap_pos;
57
58     gfxsource_t*parent;
59 } pdf_doc_internal_t;
60
61 typedef struct _pdf_page_internal
62 {
63 } pdf_page_internal_t;
64
65 typedef struct _dev_output_internal
66 {
67     CommonOutputDev*outputDev;
68 } dev_output_internal_t;
69
70
71 typedef struct _gfxsource_internal
72 {
73     gfxparams_t* parameters;
74 } gfxsource_internal_t;
75
76
77 static const char* dirseparator()
78 {
79 #ifdef WIN32
80     return "\\";
81 #else
82     return "/";
83 #endif
84 }
85
86 void pdfpage_destroy(gfxpage_t*pdf_page)
87 {
88     pdf_page_internal_t*i= (pdf_page_internal_t*)pdf_page->internal;
89     free(pdf_page->internal);pdf_page->internal = 0;
90     free(pdf_page);pdf_page=0;
91 }
92
93 static void render2(gfxpage_t*page, gfxdevice_t*dev, int x,int y, int x1,int y1,int x2,int y2)
94 {
95     pdf_doc_internal_t*pi = (pdf_doc_internal_t*)page->parent->internal;
96     gfxsource_internal_t*i = (gfxsource_internal_t*)pi->parent->internal;
97
98     if(!pi->config_print && pi->nocopy) {msg("<fatal> PDF disallows copying");exit(0);}
99     if(pi->config_print && pi->noprint) {msg("<fatal> PDF disallows printing");exit(0);}
100
101     CommonOutputDev*outputDev = 0;
102     if(pi->config_full_bitmap_optimizing) {
103         FullBitmapOutputDev*d = new FullBitmapOutputDev(pi->info, pi->doc);
104         outputDev = (CommonOutputDev*)d;
105     } else if(pi->config_bitmap_optimizing) {
106         BitmapOutputDev*d = new BitmapOutputDev(pi->info, pi->doc);
107         outputDev = (CommonOutputDev*)d;
108     } else {
109         GFXOutputDev*d = new GFXOutputDev(pi->info, pi->doc);
110         outputDev = (CommonOutputDev*)d;
111     }
112     /* pass global parameters to PDF driver*/
113     gfxparam_t*p = i->parameters->params;
114     while(p) {
115         outputDev->setParameter(p->key, p->value);
116         p = p->next;
117     }
118     p = pi->parameters->params;
119     while(p) {
120         outputDev->setParameter(p->key, p->value);
121         p = p->next;
122     }
123
124     outputDev->setPageMap(pi->pagemap, pi->pagemap_pos);
125     outputDev->setMove(x,y);
126     outputDev->setClip(x1,y1,x2,y2);
127
128     gfxdevice_t* middev=0;
129     if(multiply>1) {
130         middev = (gfxdevice_t*)malloc(sizeof(gfxdevice_t));
131         gfxdevice_rescale_init(middev, 0x00000000, 0, 0, 1.0 / multiply);
132         gfxdevice_rescale_setdevice(middev, dev);
133         middev->setparameter(middev, "protect", "1");
134         dev = middev;
135     } 
136         
137     if(!pi) {
138         msg("<fatal> pdf_page_render: Parent PDF this page belongs to doesn't exist yet/anymore");
139         return;
140     }
141
142     if(!pi->pages[page->nr-1].has_info) {
143         msg("<fatal> pdf_page_render: page %d was previously set as not-to-render via the \"pages\" option", page->nr);
144         return;
145     }
146
147     if(pi->protect) {
148         dev->setparameter(dev, "protect", "1");
149     }
150
151     outputDev->setDevice(dev);
152     pi->doc->displayPage((OutputDev*)outputDev, page->nr, zoom*multiply, zoom*multiply, /*rotate*/0, true, true, pi->config_print);
153     pi->doc->processLinks((OutputDev*)outputDev, page->nr);
154     outputDev->finishPage();
155     outputDev->setDevice(0);
156     delete outputDev;
157
158     if(middev) {
159         gfxdevice_rescale_setdevice(middev, 0x00000000);
160         middev->finish(middev);
161     }
162
163 }
164
165     
166 void pdfpage_render(gfxpage_t*page, gfxdevice_t*output)
167 {
168     pdf_doc_internal_t*pi = (pdf_doc_internal_t*)page->parent->internal;
169     render2(page, output, 0,0, 0,0,0,0);
170 }
171
172 void pdfpage_rendersection(gfxpage_t*page, gfxdevice_t*output, gfxcoord_t x, gfxcoord_t y, gfxcoord_t _x1, gfxcoord_t _y1, gfxcoord_t _x2, gfxcoord_t _y2)
173 {
174     pdf_doc_internal_t*pi = (pdf_doc_internal_t*)page->parent->internal;
175
176     int x1=(int)_x1,y1=(int)_y1,x2=(int)_x2,y2=(int)_y2;
177     if((x1|y1|x2|y2)==0) x2++;
178
179     render2(page, output, (int)x*multiply,(int)y*multiply,
180                           (int)x1*multiply,(int)y1*multiply,(int)x2*multiply,(int)y2*multiply);
181 }
182
183 void pdf_doc_destroy(gfxdocument_t*gfx)
184 {
185     pdf_doc_internal_t*i= (pdf_doc_internal_t*)gfx->internal;
186
187     delete i->doc; i->doc=0;
188     free(i->pages); i->pages = 0;
189    
190     if(i->pagemap) {
191         free(i->pagemap);
192     }
193
194     i->docinfo.free();
195
196     if(i->filename) {
197         free(i->filename);i->filename=0;
198     }
199     
200     if(i->info) {
201         delete i->info;i->info=0;
202     }
203     if(i->parameters) {
204         gfxparams_free(i->parameters);
205         i->parameters=0;
206     }
207
208     free(gfx->internal);gfx->internal=0;
209     free(gfx);gfx=0;
210
211     if(global_page_range) {
212         free(global_page_range);
213         global_page_range = 0;
214     }
215     
216     /*globalparams_count--;
217     if(!globalparams_count) {
218         delete globalParams;
219         globalParams = 0;
220         globalparams_count = 0;
221     }*/
222 }
223
224 static void add_page_to_map(gfxdocument_t*gfx, int pdfpage, int outputpage)
225 {
226     pdf_doc_internal_t*i= (pdf_doc_internal_t*)gfx->internal;
227     if(pdfpage < 0)
228         return;
229     if(pdfpage >= i->pagemap_size) {
230         int oldlen = i->pagemap_size;
231         i->pagemap_size = oldlen + 1024;
232         if(pdfpage > i->pagemap_size)
233             i->pagemap_size = pdfpage+1;
234
235         if(i->pages) {
236             i->pagemap = (int*)malloc(i->pagemap_size*sizeof(int));
237         } else {
238             i->pagemap = (int*)realloc(i->pages, i->pagemap_size*sizeof(int));
239         }
240         memset(&i->pagemap[oldlen], -1, (i->pagemap_size-oldlen)*sizeof(int));
241     }
242     i->pagemap[pdfpage] = outputpage;
243     if(pdfpage > i->pagemap_pos)
244         i->pagemap_pos = pdfpage;
245 }
246
247 void pdf_doc_setparameter(gfxdocument_t*gfx, const char*name, const char*value)
248 {
249     pdf_doc_internal_t*i= (pdf_doc_internal_t*)gfx->internal;
250     if(!strcmp(name, "pagemap")) {
251         int pdfpage=0, outputpage=0;
252         sscanf(value,"%d:%d", &pdfpage, &outputpage);
253         add_page_to_map(gfx, pdfpage, outputpage);
254     } else if(!strcmp(name, "poly2bitmap")) {
255         i->config_bitmap_optimizing = atoi(value);
256     } else if(!strcmp(name, "bitmapfonts") || !strcmp(name, "bitmap")) {
257         i->config_full_bitmap_optimizing = atoi(value);
258     } else if(!strcmp(name, "asprint")) {
259         i->config_print = 1;
260     } else {
261         gfxparams_store(i->parameters, name, value);
262     }
263 }
264
265 gfxpage_t* pdf_doc_getpage(gfxdocument_t*doc, int page)
266 {
267     pdf_doc_internal_t*di= (pdf_doc_internal_t*)doc->internal;
268
269     if(page < 1 || page > doc->num_pages)
270         return 0;
271     
272     gfxpage_t* pdf_page = (gfxpage_t*)malloc(sizeof(gfxpage_t));
273     pdf_page_internal_t*pi= (pdf_page_internal_t*)malloc(sizeof(pdf_page_internal_t));
274     memset(pi, 0, sizeof(pdf_page_internal_t));
275     pdf_page->internal = pi;
276
277     pdf_page->destroy = pdfpage_destroy;
278     pdf_page->render = pdfpage_render;
279     pdf_page->rendersection = pdfpage_rendersection;
280     pdf_page->width = di->pages[page-1].width;
281     pdf_page->height = di->pages[page-1].height;
282
283     pdf_page->parent = doc;
284     pdf_page->nr = page;
285     return pdf_page;
286 }
287
288 static char*getInfoString(Dict *infoDict, const char *key)
289 {
290     Object obj;
291     GString *s1, *s2;
292     int i;
293
294     if (infoDict && infoDict->lookup((char*)key, &obj)->isString()) {
295         s1 = obj.getString();
296         if ((s1->getChar(0) & 0xff) == 0xfe &&
297             (s1->getChar(1) & 0xff) == 0xff) {
298             s2 = new GString();
299             for (i = 2; i < obj.getString()->getLength(); i += 2) {
300               if (s1->getChar(i) == '\0') {
301                 s2->append(s1->getChar(i+1));
302               } else {
303                 delete s2;
304                 s2 = new GString("<unicode>");
305                 break;
306               }
307             }
308             char*ret = strdup(s2->getCString());
309             delete s2;
310             obj.free();
311             return ret;
312         } else {
313             char*ret = strdup(s1->getCString());
314             obj.free();
315             return ret;
316         }
317     }
318     return strdup("");
319 }
320
321 static char*getInfoDate(Dict *infoDict, const char *key) 
322 {
323     Object obj;
324     char *s;
325
326     if (infoDict && infoDict->lookup((char*)key, &obj)->isString()) {
327         s = obj.getString()->getCString();
328         if (s[0] == 'D' && s[1] == ':') {
329           s += 2;
330         }
331         char*ret = strdup(s);
332         obj.free();
333         return ret;
334     }
335     return strdup("");
336 }
337
338 char* pdf_doc_getinfo(gfxdocument_t*doc, const char*name)
339 {
340     pdf_doc_internal_t*i= (pdf_doc_internal_t*)doc->internal;
341     if(!strcmp(name, "title")) return getInfoString(i->docinfo.getDict(), "Title");
342     else if(!strcmp(name, "subject")) return getInfoString(i->docinfo.getDict(), "Subject");
343     else if(!strcmp(name, "keywords")) return getInfoString(i->docinfo.getDict(), "Keywords");
344     else if(!strcmp(name, "author")) return getInfoString(i->docinfo.getDict(), "Author");
345     else if(!strcmp(name, "creator")) return getInfoString(i->docinfo.getDict(), "Creator");
346     else if(!strcmp(name, "producer")) return getInfoString(i->docinfo.getDict(), "Producer");
347     else if(!strcmp(name, "creationdate")) return getInfoDate(i->docinfo.getDict(), "CreationDate");
348     else if(!strcmp(name, "moddate")) return getInfoDate(i->docinfo.getDict(), "ModDate");
349     else if(!strcmp(name, "linearized")) return strdup(i->doc->isLinearized() ? "yes" : "no");
350     else if(!strcmp(name, "tagged")) return strdup(i->doc->getStructTreeRoot()->isDict() ? "yes" : "no");
351     else if(!strcmp(name, "encrypted")) return strdup(i->doc->isEncrypted() ? "yes" : "no");
352     else if(!strcmp(name, "oktoprint")) return strdup(i->doc->okToPrint() ? "yes" : "no");
353     else if(!strcmp(name, "oktocopy")) return strdup(i->doc->okToCopy() ? "yes" : "no");
354     else if(!strcmp(name, "oktochange")) return strdup(i->doc->okToChange() ? "yes" : "no");
355     else if(!strcmp(name, "oktoaddnotes")) return strdup(i->doc->okToAddNotes() ? "yes" : "no");
356     else if(!strcmp(name, "version")) { 
357         char buf[32];
358         sprintf(buf, "%.1f", i->doc->getPDFVersion());
359         return strdup(buf);
360     }
361     return strdup("");
362 }
363
364
365 /* shortcut to InfoOutputDev.cc */
366 extern int config_addspace;
367 extern int config_fontquality;
368 extern int config_bigchar;
369
370 static void pdf_setparameter(gfxsource_t*src, const char*name, const char*value)
371 {
372     gfxsource_internal_t*i = (gfxsource_internal_t*)src->internal;
373         
374     gfxparams_store(i->parameters, name, value);
375
376     msg("<verbose> setting parameter %s to \"%s\"", name, value);
377     if(!strncmp(name, "fontdir", strlen("fontdir"))) {
378         addGlobalFontDir(value);
379     } else if(!strcmp(name, "addspacechars")) {
380         config_addspace = atoi(value);
381         gfxparams_store(i->parameters, "detectspaces", "0");
382     } else if(!strcmp(name, "detectspaces")) {
383         config_addspace = atoi(value);
384     } else if(!strcmp(name, "fontquality")) {
385         config_fontquality = atoi(value);
386     } else if(!strcmp(name, "bigchar")) {
387         config_bigchar = atoi(value);
388     } else if(!strcmp(name, "pages")) {
389         global_page_range = strdup(value);
390     } else if(!strncmp(name, "font", strlen("font")) && name[4]!='q') {
391         addGlobalFont(value);
392     } else if(!strncmp(name, "languagedir", strlen("languagedir"))) {
393         addGlobalLanguageDir(value);
394     } else if(!strcmp(name, "zoomtowidth")) {
395         zoomtowidth = atoi(value);
396     } else if(!strcmp(name, "zoom")) {
397         char buf[80];
398         zoom = atof(value);
399     } else if(!strcmp(name, "jpegdpi") || !strcmp(name, "ppmdpi")) {
400         msg("<error> %s not supported anymore. Please use jpegsubpixels/ppmsubpixels");
401     } else if(!strcmp(name, "multiply")) {
402         multiply = atoi(value);
403     } else if(!strcmp(name, "help")) {
404         printf("\nPDF device global parameters:\n");
405         printf("fontdir=<dir>     a directory with additional fonts\n");
406         printf("font=<filename>   an additional font filename\n");
407         printf("pages=<range>     the range of pages to convert (example: pages=1-100,210-)\n");
408         printf("zoom=<dpi>        the resultion (default: 72)\n");
409         printf("languagedir=<dir> Add an xpdf language directory\n");
410         printf("multiply=<times>  Render everything at <times> the resolution\n");
411         printf("poly2bitmap       Convert graphics to bitmaps\n");
412         printf("bitmap            Convert everything to bitmaps\n");
413     }   
414 }
415
416 void pdf_doc_prepare(gfxdocument_t*doc, gfxdevice_t*dev)
417 {
418     pdf_doc_internal_t*i= (pdf_doc_internal_t*)doc->internal;
419     i->info->dumpfonts(dev);
420 }
421
422 static gfxdocument_t*pdf_open(gfxsource_t*src, const char*filename)
423 {
424     gfxsource_internal_t*isrc = (gfxsource_internal_t*)src->internal;
425     gfxdocument_t*pdf_doc = (gfxdocument_t*)malloc(sizeof(gfxdocument_t));
426     memset(pdf_doc, 0, sizeof(gfxdocument_t));
427     pdf_doc_internal_t*i= (pdf_doc_internal_t*)malloc(sizeof(pdf_doc_internal_t));
428     memset(i, 0, sizeof(pdf_doc_internal_t));
429     i->parent = src;
430     i->parameters = gfxparams_new();
431     pdf_doc->internal = i;
432     char*userPassword=0;
433     
434     i->filename = strdup(filename);
435
436     char*x = 0;
437     if((x = strchr((char*)filename, '|'))) {
438         *x = 0;
439         userPassword = x+1;
440     }
441     
442     GString *fileName = new GString(filename);
443     GString *userPW;
444
445     // open PDF file
446     if (userPassword && userPassword[0]) {
447       userPW = new GString(userPassword);
448     } else {
449       userPW = NULL;
450     }
451     i->doc = new PDFDoc(fileName, userPW);
452     if (userPW) {
453       delete userPW;
454     }
455     if (!i->doc->isOk()) {
456         return 0;
457     }
458
459     // get doc info
460     i->doc->getDocInfo(&i->docinfo);
461     
462     pdf_doc->num_pages = i->doc->getNumPages();
463     i->protect = 0;
464     if (i->doc->isEncrypted()) {
465           if(!i->doc->okToCopy()) {
466               i->nocopy = 1;
467           }
468           if(!i->doc->okToPrint()) {
469               i->noprint = 1;
470           }
471           if(!i->doc->okToChange() || !i->doc->okToAddNotes())
472               i->protect = 1;
473     }
474         
475     if(zoomtowidth && i->doc->getNumPages()) {
476         Page*page = i->doc->getCatalog()->getPage(1);
477         PDFRectangle *r = page->getCropBox();
478         double width_before = r->x2 - r->x1;
479         zoom = 72.0 * zoomtowidth / width_before;
480         msg("<notice> Rendering at %f DPI. (Page width at 72 DPI: %f, target width: %d)", zoom, width_before, zoomtowidth);
481     }
482
483     i->info = new InfoOutputDev(i->doc->getXRef());
484     int t;
485     i->pages = (pdf_page_info_t*)malloc(sizeof(pdf_page_info_t)*pdf_doc->num_pages);
486     memset(i->pages,0,sizeof(pdf_page_info_t)*pdf_doc->num_pages);
487     for(t=1;t<=pdf_doc->num_pages;t++) {
488         if(!global_page_range || is_in_range(t, global_page_range)) {
489             i->doc->displayPage((OutputDev*)i->info, t, zoom, zoom, /*rotate*/0, /*usemediabox*/true, /*crop*/true, i->config_print);
490             i->doc->processLinks((OutputDev*)i->info, t);
491             i->pages[t-1].xMin = i->info->x1;
492             i->pages[t-1].yMin = i->info->y1;
493             i->pages[t-1].xMax = i->info->x2;
494             i->pages[t-1].yMax = i->info->y2;
495             i->pages[t-1].width = i->info->x2 - i->info->x1;
496             i->pages[t-1].height = i->info->y2 - i->info->y1;
497             i->pages[t-1].number_of_images = i->info->num_ppm_images + i->info->num_jpeg_images;
498             i->pages[t-1].number_of_links = i->info->num_links;
499             i->pages[t-1].number_of_fonts = i->info->num_fonts;
500             i->pages[t-1].has_info = 1;
501         }
502     }
503
504     pdf_doc->get = 0;
505     pdf_doc->destroy = pdf_doc_destroy;
506     pdf_doc->setparameter = pdf_doc_setparameter;
507     pdf_doc->getinfo = pdf_doc_getinfo;
508     pdf_doc->getpage = pdf_doc_getpage;
509     pdf_doc->prepare = pdf_doc_prepare;
510
511     /* pass global parameters to PDF driver*/
512     gfxparam_t*p = isrc->parameters->params;
513     while(p) {
514         pdf_doc->setparameter(pdf_doc, p->key, p->value);
515         p = p->next;
516     }
517     
518     return pdf_doc;
519 }
520     
521 void pdf_destroy(gfxsource_t*src)
522 {
523     if(!src->internal)
524         return;
525     gfxsource_internal_t*i = (gfxsource_internal_t*)src->internal;
526    
527     gfxparams_free(i->parameters);
528     i->parameters=0;
529     
530     free(src->internal);src->internal=0;
531
532     delete globalParams;globalParams = 0;
533     free(src);
534 }
535
536 gfxsource_t*gfxsource_pdf_create()
537 {
538     gfxsource_t*src = (gfxsource_t*)malloc(sizeof(gfxsource_t));
539     memset(src, 0, sizeof(gfxsource_t));
540     src->setparameter = pdf_setparameter;
541     src->open = pdf_open;
542     src->destroy = pdf_destroy;
543     gfxsource_internal_t*i = (gfxsource_internal_t*)rfx_calloc(sizeof(gfxsource_internal_t));
544     src->internal = (void*)i;
545     i->parameters = gfxparams_new();
546
547     if(!globalParams) {
548         globalParams = new GFXGlobalParams();
549         //globalparams_count++;
550     }
551     
552
553     return src;
554 }