added 'bitmap' option
[swftools.git] / lib / pdf / pdf.cc
1 #include "../gfxdevice.h"
2 #include "../gfxsource.h"
3 #include "../devices/rescale.h"
4 #include "../log.h"
5 #include "config.h"
6 #include "GlobalParams.h"
7 #include "InfoOutputDev.h"
8 #include "GFXOutputDev.h"
9 #include "FullBitmapOutputDev.h"
10 #include "BitmapOutputDev.h"
11 #include "DummyOutputDev.h"
12 #include "../mem.h"
13 #include "pdf.h"
14 #define NO_ARGPARSER
15 #include "../args.h"
16
17 static double zoom = 72; /* xpdf: 86 */
18 static int jpeg_dpi = 0;
19 static int ppm_dpi = 0;
20 static int multiply = 1;
21 static char* global_page_range = 0;
22
23 static parameter_t* device_config = 0;
24 static parameter_t* device_config_next = 0;
25
26 typedef struct _pdf_page_info
27 {
28     int xMin, yMin, xMax, yMax;
29     int width,height;
30     int number_of_images;
31     int number_of_links;
32     int number_of_fonts;
33     char has_info;
34 } pdf_page_info_t;
35
36 typedef struct _pdf_doc_internal
37 {
38     int protect;
39     int nocopy;
40     PDFDoc*doc;
41     Object docinfo;
42     InfoOutputDev*info;
43     CommonOutputDev*outputDev;
44     pdf_page_info_t*pages;
45     gfxdevice_t* middev;
46     char*filename;
47 } pdf_doc_internal_t;
48
49 typedef struct _pdf_page_internal
50 {
51 } pdf_page_internal_t;
52
53 typedef struct _dev_output_internal
54 {
55     CommonOutputDev*outputDev;
56 } dev_output_internal_t;
57
58
59 static char* dirseparator()
60 {
61 #ifdef WIN32
62     return "\\";
63 #else
64     return "/";
65 #endif
66 }
67
68
69 void pdfpage_destroy(gfxpage_t*pdf_page)
70 {
71     pdf_page_internal_t*i= (pdf_page_internal_t*)pdf_page->internal;
72     free(pdf_page->internal);pdf_page->internal = 0;
73     free(pdf_page);pdf_page=0;
74 }
75
76 void render2(gfxpage_t*page, gfxdevice_t*dev)
77 {
78     pdf_doc_internal_t*pi = (pdf_doc_internal_t*)page->parent->internal;
79     
80     if(pi->middev) {
81         gfxdevice_rescale_setdevice(pi->middev, dev);
82         pi->middev->setparameter(pi->middev, "protect", "1");
83         dev = pi->middev;
84     } 
85         
86     if(!pi) {
87         msg("<fatal> pdf_page_render: Parent PDF this page belongs to doesn't exist yet/anymore");
88         return;
89     }
90
91     if(!pi->pages[page->nr-1].has_info) {
92         msg("<fatal> pdf_page_render: page %d was previously set as not-to-render via the \"pages\" option", page->nr);
93         return;
94     }
95
96     pi->outputDev->setDevice(dev);
97
98     if(pi->protect) {
99         dev->setparameter(dev, "protect", "1");
100     }
101     
102     /* pass global parameters to output device */
103     parameter_t*p = device_config;
104     while(p) {
105         dev->setparameter(dev, p->name, p->value);
106         p = p->next;
107     }
108     pi->doc->displayPage((OutputDev*)pi->outputDev, page->nr, zoom*multiply, zoom*multiply, /*rotate*/0, true, true, /*doLinks*/(int)1);
109     pi->doc->processLinks((OutputDev*)pi->outputDev, page->nr);
110     pi->outputDev->setDevice(0);
111     if(pi->middev) {
112         gfxdevice_rescale_setdevice(pi->middev, 0x00000000);
113     }
114 }
115
116     
117 void pdfpage_render(gfxpage_t*page, gfxdevice_t*output)
118 {
119     pdf_doc_internal_t*pi = (pdf_doc_internal_t*)page->parent->internal;
120     pi->outputDev->setMove(0,0);
121     pi->outputDev->setClip(0,0,0,0);
122     render2(page, output);
123 }
124
125 void pdfpage_rendersection(gfxpage_t*page, gfxdevice_t*output, gfxcoord_t x, gfxcoord_t y, gfxcoord_t _x1, gfxcoord_t _y1, gfxcoord_t _x2, gfxcoord_t _y2)
126 {
127     pdf_doc_internal_t*pi = (pdf_doc_internal_t*)page->parent->internal;
128
129     int x1=(int)_x1,y1=(int)_y1,x2=(int)_x2,y2=(int)_y2;
130     if((x1|y1|x2|y2)==0) x2++;
131
132     pi->outputDev->setMove((int)x*multiply,(int)y*multiply);
133     pi->outputDev->setClip((int)x1*multiply,(int)y1*multiply,(int)x2*multiply,(int)y2*multiply);
134     render2(page, output);
135 }
136
137 static int globalparams_count=0;
138
139 void pdf_doc_destroy(gfxdocument_t*gfx)
140 {
141     pdf_doc_internal_t*i= (pdf_doc_internal_t*)gfx->internal;
142
143     if(i->outputDev) {
144         delete i->outputDev;i->outputDev=0;
145     }
146     if(i->middev) {
147         gfxdevice_rescale_setdevice(i->middev, 0x00000000);
148         i->middev->finish(i->middev);
149     }
150     delete i->doc; i->doc=0;
151     free(i->pages); i->pages = 0;
152
153     i->docinfo.free();
154
155     if(i->filename) {
156         free(i->filename);i->filename=0;
157     }
158     
159     if(i->info) {
160         delete i->info;i->info=0;
161     }
162
163     free(gfx->internal);gfx->internal=0;
164     free(gfx);gfx=0;
165
166     if(global_page_range) {
167         free(global_page_range);
168         global_page_range = 0;
169     }
170     
171     /*globalparams_count--;
172     if(!globalparams_count) {
173         delete globalParams;
174         globalParams = 0;
175         globalparams_count = 0;
176     }*/
177 }
178
179 void pdf_doc_set_parameter(gfxdocument_t*gfx, const char*name, const char*value)
180 {
181     pdf_doc_internal_t*i= (pdf_doc_internal_t*)gfx->internal;
182     CommonOutputDev*o = i->outputDev;
183     if(!strcmp(name, "pagemap")) {
184         int pdfpage=0, outputpage=0;
185         sscanf(value,"%d:%d", &pdfpage, &outputpage);
186         o->preparePage(pdfpage, outputpage);
187     } else {
188         o->setParameter(name, value);
189     }
190 }
191
192 gfxpage_t* pdf_doc_getpage(gfxdocument_t*doc, int page)
193 {
194     pdf_doc_internal_t*di= (pdf_doc_internal_t*)doc->internal;
195
196     if(page < 1 || page > doc->num_pages)
197         return 0;
198     if(di->nocopy) {
199         msg("<error> PDF disallows copying.");
200         return 0;
201     }
202     
203     gfxpage_t* pdf_page = (gfxpage_t*)malloc(sizeof(gfxpage_t));
204     pdf_page_internal_t*pi= (pdf_page_internal_t*)malloc(sizeof(pdf_page_internal_t));
205     memset(pi, 0, sizeof(pdf_page_internal_t));
206     pdf_page->internal = pi;
207
208     pdf_page->destroy = pdfpage_destroy;
209     pdf_page->render = pdfpage_render;
210     pdf_page->rendersection = pdfpage_rendersection;
211     pdf_page->width = di->pages[page-1].width;
212     pdf_page->height = di->pages[page-1].height;
213
214     pdf_page->parent = doc;
215     pdf_page->nr = page;
216     return pdf_page;
217 }
218
219 static char*getInfoString(Dict *infoDict, char *key)
220 {
221     Object obj;
222     GString *s1, *s2;
223     int i;
224
225     if (infoDict && infoDict->lookup(key, &obj)->isString()) {
226         s1 = obj.getString();
227         if ((s1->getChar(0) & 0xff) == 0xfe &&
228             (s1->getChar(1) & 0xff) == 0xff) {
229             s2 = new GString();
230             for (i = 2; i < obj.getString()->getLength(); i += 2) {
231               if (s1->getChar(i) == '\0') {
232                 s2->append(s1->getChar(i+1));
233               } else {
234                 delete s2;
235                 s2 = new GString("<unicode>");
236                 break;
237               }
238             }
239             char*ret = strdup(s2->getCString());
240             delete s2;
241             obj.free();
242             return ret;
243         } else {
244             char*ret = strdup(s1->getCString());
245             obj.free();
246             return ret;
247         }
248     }
249     return strdup("");
250 }
251
252 static char*getInfoDate(Dict *infoDict, char *key) 
253 {
254     Object obj;
255     char *s;
256
257     if (infoDict && infoDict->lookup(key, &obj)->isString()) {
258         s = obj.getString()->getCString();
259         if (s[0] == 'D' && s[1] == ':') {
260           s += 2;
261         }
262         char*ret = strdup(s);
263         obj.free();
264         return ret;
265     }
266     return strdup("");
267 }
268
269 char* pdf_doc_getinfo(gfxdocument_t*doc, const char*name)
270 {
271     pdf_doc_internal_t*i= (pdf_doc_internal_t*)doc->internal;
272     if(!strcmp(name, "title")) return getInfoString(i->docinfo.getDict(), "Title");
273     else if(!strcmp(name, "subject")) return getInfoString(i->docinfo.getDict(), "Subject");
274     else if(!strcmp(name, "keywords")) return getInfoString(i->docinfo.getDict(), "Keywords");
275     else if(!strcmp(name, "author")) return getInfoString(i->docinfo.getDict(), "Author");
276     else if(!strcmp(name, "creator")) return getInfoString(i->docinfo.getDict(), "Creator");
277     else if(!strcmp(name, "producer")) return getInfoString(i->docinfo.getDict(), "Producer");
278     else if(!strcmp(name, "creationdate")) return getInfoDate(i->docinfo.getDict(), "CreationDate");
279     else if(!strcmp(name, "moddate")) return getInfoDate(i->docinfo.getDict(), "ModDate");
280     else if(!strcmp(name, "linearized")) return strdup(i->doc->isLinearized() ? "yes" : "no");
281     else if(!strcmp(name, "tagged")) return strdup(i->doc->getStructTreeRoot()->isDict() ? "yes" : "no");
282     else if(!strcmp(name, "encrypted")) return strdup(i->doc->isEncrypted() ? "yes" : "no");
283     else if(!strcmp(name, "oktoprint")) return strdup(i->doc->okToPrint() ? "yes" : "no");
284     else if(!strcmp(name, "oktocopy")) return strdup(i->doc->okToCopy() ? "yes" : "no");
285     else if(!strcmp(name, "oktochange")) return strdup(i->doc->okToChange() ? "yes" : "no");
286     else if(!strcmp(name, "oktoaddnotes")) return strdup(i->doc->okToAddNotes() ? "yes" : "no");
287     else if(!strcmp(name, "version")) { 
288         char buf[32];
289         sprintf(buf, "%.1f", i->doc->getPDFVersion());
290         return strdup(buf);
291     }
292     return 0;
293 }
294
295
296 static void storeDeviceParameter(const char*name, const char*value)
297 {
298     parameter_t*o = device_config;
299     while(o) {
300         if(!strcmp(name, o->name)) {
301             /* overwrite old value */
302             free(o->value);
303             o->value = strdup(value);
304             return;
305         }
306         o = o->next;
307     }
308     parameter_t*p = new parameter_t();
309     p->name = strdup(name);
310     p->value = strdup(value);
311     p->next = 0;
312
313     if(device_config_next) {
314         device_config_next->next = p;
315         device_config_next = p;
316     } else {
317         device_config = p;
318         device_config_next = p;
319     }
320 }
321
322 typedef struct _gfxsource_internal
323 {
324     int config_bitmap_optimizing;
325     int config_full_bitmap_optimizing;
326 } gfxsource_internal_t;
327
328 static void pdf_set_parameter(gfxsource_t*src, const char*name, const char*value)
329 {
330     gfxsource_internal_t*i = (gfxsource_internal_t*)src->internal;
331     msg("<verbose> setting parameter %s to \"%s\"", name, value);
332     if(!strncmp(name, "fontdir", strlen("fontdir"))) {
333         addGlobalFontDir(value);
334     } else if(!strcmp(name, "pages")) {
335         global_page_range = strdup(value);
336     } else if(!strncmp(name, "font", strlen("font"))) {
337         addGlobalFont(value);
338     } else if(!strncmp(name, "languagedir", strlen("languagedir"))) {
339         addGlobalLanguageDir(value);
340     } else if(!strcmp(name, "zoom")) {
341         char buf[80];
342         zoom = atof(value);
343         sprintf(buf, "%f", (double)jpeg_dpi/(double)zoom);
344         storeDeviceParameter("jpegsubpixels", buf);
345         sprintf(buf, "%f", (double)ppm_dpi/(double)zoom);
346         storeDeviceParameter("ppmsubpixels", buf);
347     } else if(!strcmp(name, "jpegdpi")) {
348         char buf[80];
349         jpeg_dpi = atoi(value);
350         sprintf(buf, "%f", (double)jpeg_dpi/(double)zoom);
351         storeDeviceParameter("jpegsubpixels", buf);
352     } else if(!strcmp(name, "ppmdpi")) {
353         char buf[80];
354         ppm_dpi = atoi(value);
355         sprintf(buf, "%f", (double)ppm_dpi/(double)zoom);
356         storeDeviceParameter("ppmsubpixels", buf);
357     } else if(!strcmp(name, "poly2bitmap")) {
358         i->config_bitmap_optimizing = atoi(value);
359     } else if(!strcmp(name, "bitmapfonts") || !strcmp(name, "bitmap")) {
360         i->config_full_bitmap_optimizing = atoi(value);
361     } else if(!strcmp(name, "multiply")) {
362         multiply = atoi(value);
363     } else if(!strcmp(name, "help")) {
364         printf("\nPDF device global parameters:\n");
365         printf("fontdir=<dir>   a directory with additional fonts\n");
366         printf("font=<filename> an dditional font filename\n");
367         printf("pages=<range>   the range of pages to convert (example: pages=1-100,210-)\n");
368         printf("zoom=<dpi>      the resultion (default: 72)\n");
369     }   
370     storeDeviceParameter(name,value);
371 }
372
373 static gfxdocument_t*pdf_open(gfxsource_t*src, const char*filename)
374 {
375     gfxsource_internal_t*isrc = (gfxsource_internal_t*)src->internal;
376     gfxdocument_t*pdf_doc = (gfxdocument_t*)malloc(sizeof(gfxdocument_t));
377     memset(pdf_doc, 0, sizeof(gfxdocument_t));
378     pdf_doc_internal_t*i= (pdf_doc_internal_t*)malloc(sizeof(pdf_doc_internal_t));
379     memset(i, 0, sizeof(pdf_doc_internal_t));
380     pdf_doc->internal = i;
381     char*userPassword=0;
382     
383     i->filename = strdup(filename);
384
385     char*x = 0;
386     if((x = strchr(filename, '|'))) {
387         *x = 0;
388         userPassword = x+1;
389     }
390     
391     GString *fileName = new GString(filename);
392     GString *userPW;
393
394     // open PDF file
395     if (userPassword && userPassword[0]) {
396       userPW = new GString(userPassword);
397     } else {
398       userPW = NULL;
399     }
400     i->doc = new PDFDoc(fileName, userPW);
401     if (userPW) {
402       delete userPW;
403     }
404     if (!i->doc->isOk()) {
405         printf("xpdf reports document as broken.\n");
406         return 0;
407     }
408
409     // get doc info
410     i->doc->getDocInfo(&i->docinfo);
411     
412     pdf_doc->num_pages = i->doc->getNumPages();
413     i->protect = 0;
414     if (i->doc->isEncrypted()) {
415           if(!i->doc->okToCopy()) {
416               i->nocopy = 1;
417           }
418           if(!i->doc->okToChange() || !i->doc->okToAddNotes())
419               i->protect = 1;
420     }
421
422     i->info = new InfoOutputDev(i->doc->getXRef());
423     int t;
424     i->pages = (pdf_page_info_t*)malloc(sizeof(pdf_page_info_t)*pdf_doc->num_pages);
425     memset(i->pages,0,sizeof(pdf_page_info_t)*pdf_doc->num_pages);
426     for(t=1;t<=pdf_doc->num_pages;t++) {
427         if(!global_page_range || is_in_range(t, global_page_range)) {
428             i->doc->displayPage((OutputDev*)i->info, t, zoom, zoom, /*rotate*/0, /*usemediabox*/true, /*crop*/true, /*doLinks*/(int)1);
429             i->doc->processLinks((OutputDev*)i->info, t);
430             i->pages[t-1].xMin = i->info->x1;
431             i->pages[t-1].yMin = i->info->y1;
432             i->pages[t-1].xMax = i->info->x2;
433             i->pages[t-1].yMax = i->info->y2;
434             i->pages[t-1].width = i->info->x2 - i->info->x1;
435             i->pages[t-1].height = i->info->y2 - i->info->y1;
436             i->pages[t-1].number_of_images = i->info->num_images;
437             i->pages[t-1].number_of_links = i->info->num_links;
438             i->pages[t-1].number_of_fonts = i->info->num_fonts;
439             i->pages[t-1].has_info = 1;
440         }
441     }
442
443     if(isrc->config_full_bitmap_optimizing) {
444         FullBitmapOutputDev*outputDev = new FullBitmapOutputDev(i->info, i->doc);
445         i->outputDev = (CommonOutputDev*)outputDev;
446     } else if(isrc->config_bitmap_optimizing) {
447         BitmapOutputDev*outputDev = new BitmapOutputDev(i->info, i->doc);
448         i->outputDev = (CommonOutputDev*)outputDev;
449     } else {
450         GFXOutputDev*outputDev = new GFXOutputDev(i->info, i->doc);
451         i->outputDev = (CommonOutputDev*)outputDev;
452     }
453
454     /* pass global parameters to PDF driver*/
455     parameter_t*p = device_config;
456     while(p) {
457         i->outputDev->setParameter(p->name, p->value);
458         p = p->next;
459     }
460
461     i->middev = 0;
462     if(multiply>1) {
463         i->middev = (gfxdevice_t*)malloc(sizeof(gfxdevice_t));
464         gfxdevice_rescale_init(i->middev, 0x00000000, 0, 0, 1.0 / multiply);
465     }
466
467     pdf_doc->get = 0;
468     pdf_doc->destroy = pdf_doc_destroy;
469     pdf_doc->set_parameter = pdf_doc_set_parameter;
470     pdf_doc->getinfo = pdf_doc_getinfo;
471     pdf_doc->getpage = pdf_doc_getpage;
472
473
474     return pdf_doc;
475
476 }
477     
478 void pdf_destroy(gfxsource_t*src)
479 {
480     if(!src->internal)
481         return;
482     gfxsource_internal_t*i = (gfxsource_internal_t*)src->internal;
483     free(src->internal);src->internal=0;
484 }
485
486 gfxsource_t*gfxsource_pdf_create()
487 {
488     gfxsource_t*src = (gfxsource_t*)malloc(sizeof(gfxsource_t));
489     memset(src, 0, sizeof(gfxsource_t));
490     src->set_parameter = pdf_set_parameter;
491     src->open = pdf_open;
492     src->destroy = pdf_destroy;
493     src->internal = malloc(sizeof(gfxsource_internal_t));
494     memset(src->internal, 0, sizeof(gfxsource_internal_t));
495
496     if(!globalParams) {
497         globalParams = new GFXGlobalParams();
498         //globalparams_count++;
499     }
500     
501
502     return src;
503 }