added fallthrough opcode
[swftools.git] / lib / as3 / code.c
1 /* code.c
2
3    Routines for handling Flash2 AVM2 ABC Actionscript
4
5    Extension module for the rfxswf library.
6    Part of the swftools package.
7
8    Copyright (c) 2008 Matthias Kramm <kramm@quiss.org>
9  
10    This program is free software; you can redistribute it and/or modify
11    it under the terms of the GNU General Public License as published by
12    the Free Software Foundation; either version 2 of the License, or
13    (at your option) any later version.
14
15    This program is distributed in the hope that it will be useful,
16    but WITHOUT ANY WARRANTY; without even the implied warranty of
17    MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
18    GNU General Public License for more details.
19
20    You should have received a copy of the GNU General Public License
21    along with this program; if not, write to the Free Software
22    Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307  USA */
23
24 #include <assert.h>
25 #include "code.h"
26 #include "pool.h"
27
28 #define OP_REGISTER 1
29 #define OP_STACK_ARGS 2
30 #define OP_STACK_NS 4
31 #define OP_SET_DXNS 8
32 #define OP_RETURN 16
33 #define OP_THROW 32
34 #define OP_BRANCH 64
35 #define OP_JUMP 128
36 #define OP_LABEL 256
37 #define OP_LOOKUPSWITCH 512
38 #define OP_NEED_ACTIVATION 1024
39 #define OP_STACK_ARGS2 2048
40 #define OP_INTERNAL 32768
41
42 /* 2 = u30 index into multiname
43    m = u30 index into method
44    n = u30 number of params
45    i = u30 index into method info
46    b = byte
47    c = u30 index into class
48    s = string (u30 index into strings)
49    S = switch
50    u = u30
51    r = register
52 */
53
54 opcode_t opcodes[]={
55 {0xa0, "add", "",              -2, 1, 0, 0},
56 {0xc5, "add_i", "",            -2, 1, 0, 0},
57 {0x86, "astype", "2",          -1, 1, 0, 0},
58 {0x87, "astypelate", "",       -2, 1, 0, 0},
59 {0xA8, "bitand", "",           -2, 1, 0, 0},
60 {0x97, "bitnot", "",           -1, 1, 0, 0},
61 {0xa9, "bitor", "",            -2, 1, 0, 0},
62 {0xaa, "bitxor", "",           -2, 1, 0, 0},
63 {0x41, "call", "n",            -2, 1, 0, OP_STACK_ARGS},
64 {0x43, "callmethod", "mn",     -1, 1, 0, OP_STACK_ARGS},
65 {0x4c, "callproplex", "2n",    -1, 1, 0, OP_STACK_ARGS|OP_STACK_NS},
66 {0x46, "callproperty", "2n",   -1, 1, 0, OP_STACK_ARGS|OP_STACK_NS},
67 {0x4f, "callpropvoid", "2n",   -1, 0, 0, OP_STACK_ARGS|OP_STACK_NS},
68 {0x44, "callstatic", "in",     -1, 1, 0, OP_STACK_ARGS},
69 {0x45, "callsuper", "2n",      -1, 1, 0, OP_STACK_ARGS|OP_STACK_NS},
70 {0x4e, "callsupervoid", "2n",  -1, 0, 0, OP_STACK_ARGS|OP_STACK_NS},
71 {0x78, "checkfilter", "",      -1, 1, 0, 0},
72 {0x80, "coerce", "2",          -1, 1, 0, 0},
73 {0x82, "coerce_a", "",         -1, 1, 0, 0},
74 {0x85, "coerce_s", "",         -1, 1, 0, 0},
75 {0x42, "construct", "n",       -1, 1, 0, OP_STACK_ARGS},
76 {0x4a, "constructprop", "2n",  -1, 1, 0, OP_STACK_ARGS|OP_STACK_NS},
77 {0x49, "constructsuper", "n",  -1, 0, 0, OP_STACK_ARGS},
78 {0x76, "convert_b", "",        -1, 1, 0, 0},
79 {0x73, "convert_i", "",        -1, 1, 0, 0},
80 {0x75, "convert_d", "",        -1, 1, 0, 0},
81 {0x77, "convert_o", "",        -1, 1, 0, 0},
82 {0x74, "convert_u", "",        -1, 1, 0, 0},
83 {0x70, "convert_s", "",        -1, 1, 0, 0},
84 {0xef, "debug", "D",            0, 0, 0, 0},
85 {0xf1, "debugfile", "s",        0, 0, 0, 0},
86 {0xf0, "debugline", "u",        0, 0, 0, 0},
87 {0x94, "declocal", "r",         0, 0, 0, OP_REGISTER},
88 {0xc3, "declocal_i", "r",       0, 0, 0, OP_REGISTER},
89 {0x93, "decrement", "",        -1, 1, 0, 0}, 
90 {0xc1, "decrement_i", "",      -1, 1, 0, 0},
91 {0x6a, "deleteproperty", "2",  -1, 1, 0, OP_STACK_NS},
92 {0xa3, "divide", "",           -2, 1, 0, 0},
93 {0x2a, "dup", "",              -1, 2, 0, 0},
94 {0x06, "dxns", "s",             0, 0, 0, OP_SET_DXNS},
95 {0x07, "dxnslate", "",         -1, 0, 0, OP_SET_DXNS},
96 {0xab, "equals", "",           -2, 1, 0, 0},
97 {0x72, "esc_xattr", "",        -1, 1, 0, 0},
98 {0x71, "esc_xelem", "",        -1, 1, 0, 0},
99 {0x5e, "findproperty", "2",     0, 1, 0, OP_STACK_NS},
100 {0x5d, "findpropstrict", "2",   0, 1, 0, OP_STACK_NS},
101 {0x59, "getdescendants", "2",  -1, 1, 0, OP_STACK_NS},
102 {0x64, "getglobalscope", "",    0, 1, 0, 0},
103 {0x6e, "getglobalslot", "u",    0, 1, 0, 0},
104 {0x60, "getlex", "2",           0, 1, 0, 0}, //multiname may not be runtime
105 {0x62, "getlocal", "r",         0, 1, 0, OP_REGISTER},
106 {0xd0, "getlocal_0", "",        0, 1, 0, OP_REGISTER},
107 {0xd1, "getlocal_1", "",        0, 1, 0, OP_REGISTER},
108 {0xd2, "getlocal_2", "",        0, 1, 0, OP_REGISTER},
109 {0xd3, "getlocal_3", "",        0, 1, 0, OP_REGISTER},
110 {0x66, "getproperty", "2",     -1, 1, 0, OP_STACK_NS},
111 {0x65, "getscopeobject", "u",   0, 1, 0, 0}, // u = index into scope stack
112 {0x6c, "getslot", "u",         -1, 1, 0, 0},
113 {0x04, "getsuper", "2",        -1, 1, 0, OP_STACK_NS},
114 {0xaf, "greaterthan", "",      -2, 1, 0, 0},
115 {0xb0, "greaterequals", "",    -2, 1, 0, 0},
116 {0x1f, "hasnext", "",          -2, 1, 0, 0},
117 {0x32, "hasnext2", "rr",        0, 1, 0, OP_REGISTER},
118 {0x13, "ifeq", "j",            -2, 0, 0, OP_BRANCH},
119 {0x12, "iffalse", "j",         -1, 0, 0, OP_BRANCH},
120 {0x18, "ifge", "j",            -2, 0, 0, OP_BRANCH},
121 {0x17, "ifgt", "j",            -2, 0, 0, OP_BRANCH},
122 {0x16, "ifle", "j",            -2, 0, 0, OP_BRANCH},
123 {0x15, "iflt", "j",            -2, 0, 0, OP_BRANCH},
124 {0x0f, "ifnge", "j",           -2, 0, 0, OP_BRANCH},
125 {0x0e, "ifngt", "j",           -2, 0, 0, OP_BRANCH},
126 {0x0d, "ifnle", "j",           -2, 0, 0, OP_BRANCH},
127 {0x0c, "ifnlt", "j",           -2, 0, 0, OP_BRANCH},
128 {0x14, "ifne", "j",            -2, 0, 0, OP_BRANCH},
129 {0x19, "ifstricteq", "j",      -2, 0, 0, OP_BRANCH},
130 {0x1a, "ifstrictne", "j",      -2, 0, 0, OP_BRANCH},
131 {0x11, "iftrue", "j",          -1, 0, 0, OP_BRANCH},
132 {0xb4, "in", "",               -2, 1, 0, 0},
133 {0x92, "inclocal", "r",         0, 0, 0, OP_REGISTER},
134 {0xc2, "inclocal_i", "r",       0, 0, 0, OP_REGISTER},
135 {0x91, "increment", "",        -1, 1, 0, 0},
136 {0xc0, "increment_i", "",      -1, 1, 0, 0},
137 {0x68, "initproperty", "2",    -2, 0, 0, OP_STACK_NS},
138 {0xb1, "instanceof", "",       -2, 1, 0, 0},
139 {0xb2, "istype", "2",          -1, 1, 0, 0}, // may not be a runtime multiname
140 {0xb3, "istypelate", "",       -2, 1, 0, 0},
141 {0x10, "jump", "j",             0, 0, 0, OP_JUMP},
142 {0x08, "kill", "r",             0, 0, 0, OP_REGISTER},
143 {0x09, "label", "",             0, 0, 0, OP_LABEL},
144 {0xae, "lessequals", "",       -2, 1, 0, 0},
145 {0xad, "lessthan", "",         -2, 1, 0, 0},
146 {0x1b, "lookupswitch", "S",    -1, 0, 0, OP_LOOKUPSWITCH},
147 {0xa5, "lshift", "",           -2, 1, 0, 0},
148 {0xa4, "modulo", "",           -2, 1, 0, 0},
149 {0xa2, "multiply", "",         -2, 1, 0, 0},
150 {0xc7, "multiply_i", "",       -2, 1, 0, 0},
151 {0x90, "negate", "",           -1, 1, 0, 0},
152 {0xc4, "negate_i", "",         -1, 1, 0, 0},
153 {0x57, "newactivation", "",     0, 1, 0, OP_NEED_ACTIVATION},
154 {0x56, "newarray", "n",         0, 1, 0, OP_STACK_ARGS},
155 {0x5a, "newcatch", "u",         0, 1, 0, 0}, //u = index into exception_info
156 {0x58, "newclass", "c",        -1, 1, 0, 0}, //c = index into class_info
157 {0x40, "newfunction", "m",      0, 1, 0, 0}, //i = index into method_info
158 {0x55, "newobject", "n",        0, 1, 0, OP_STACK_ARGS2},
159 {0x1e, "nextname", "",         -2, 1, 0, 0},
160 {0x23, "nextvalue", "",        -2, 1, 0, 0},
161 {0x02, "nop", "",               0, 0, 0, 0},
162 {0x96, "not", "",              -1, 1, 0 ,0},
163 {0x29, "pop", "",              -1, 0, 0, 0},
164 {0x1d, "popscope", "",          0, 0,-1, 0},
165 {0x24, "pushbyte", "b",         0, 1, 0, 0},
166 {0x2f, "pushdouble", "f",       0, 1, 0, 0}, //index into floats
167 {0x27, "pushfalse", "",         0, 1, 0, 0},
168 {0x2d, "pushint", "I",          0, 1, 0, 0}, //index into ints
169 {0x31, "pushnamespace", "u",    0, 1, 0, 0}, //index into namespace TODO
170 {0x28, "pushnan", "",           0, 1, 0, 0},
171 {0x20, "pushnull", "",          0, 1, 0, 0},
172 {0x30, "pushscope", "",        -1, 0, 1, 0},
173 {0x25, "pushshort", "u",        0, 1, 0, 0},
174 {0x2c, "pushstring", "s",       0, 1, 0, 0},
175 {0x26, "pushtrue", "",          0, 1, 0, 0},
176 {0x2e, "pushuint", "U",         0, 1, 0, 0}, //index into uints
177 {0x21, "pushundefined", "",     0, 1, 0, 0},
178 {0x1c, "pushwith", "",         -1, 0, 1, 0},
179 {0x48, "returnvalue", "",      -1, 0, 0, OP_RETURN},
180 {0x47, "returnvoid", "",        0, 0, 0, OP_RETURN},
181 {0xa6, "rshift", "",           -2, 1, 0, 0},
182 {0x63, "setlocal", "r",        -1, 0, 0, OP_REGISTER},
183 {0xd4, "setlocal_0", "",       -1, 0, 0, OP_REGISTER},
184 {0xd5, "setlocal_1", "",       -1, 0, 0, OP_REGISTER},
185 {0xd6, "setlocal_2", "",       -1, 0, 0, OP_REGISTER},
186 {0xd7, "setlocal_3", "",       -1, 0, 0, OP_REGISTER},
187 {0x6f, "setglobalslot", "u",   -1, 0, 0, 0},
188 {0x61, "setproperty", "2",     -2, 0, 0, OP_STACK_NS},
189 {0x6d, "setslot", "u",         -2, 0, 0, 0},
190 {0x05, "setsuper", "2",        -2, 0, 0, OP_STACK_NS},
191 {0xac, "strictequals", "",     -2, 1, 0, 0},
192 {0xa1, "subtract", "",         -2, 1, 0, 0},
193 {0xc6, "subtract_i", "",       -2, 1, 0, 0},
194 {0x2b, "swap", "",             -2, 2, 0, 0},
195 {0x03, "throw", "",            -1, 0, 0, OP_THROW},
196 {0x95, "typeof", "",           -1, 1, 0, 0},
197 {0xa7, "urshift", "",          -2, 1, 0, 0},
198
199 /* opcodes not documented, but seen in the wild */
200 //0x53: seen in builtin.abc
201 {0x53, "applytype", "n",       -1, 1, 0, OP_STACK_ARGS},
202
203 /* dummy instructions. Warning: these are not actually supported by flash */
204 {0xfd, "__fallthrough__", "s",           0, 0, 0, OP_INTERNAL},
205 {0xfe, "__continue__", "s",           0, 0, 0, OP_RETURN|OP_INTERNAL},
206 {0xff, "__break__", "s",            0, 0, 0, OP_RETURN|OP_INTERNAL},
207 };
208
209 static U8 op2index[256] = {254};
210
211 opcode_t* opcode_get(U8 op)
212 {
213     int t;
214     if(op2index[0]==254) {
215         memset(op2index, 255, sizeof(op2index));
216         for(t=0;t<sizeof(opcodes)/sizeof(opcodes[0]);t++) {
217             op2index[opcodes[t].opcode] = t;
218         }
219     }
220     if(op2index[op]!=255)
221         return &opcodes[op2index[op]];
222     return 0;
223 }
224
225 static code_t*pos2code(code_t**bytepos, code_t*c, int pos, int len)
226 {
227     if(c) {
228         pos+=c->pos;
229     }
230     if(pos < 0 ||
231        pos > len ||
232       (pos!=len && !bytepos[pos])) {
233         /* flex likes to generate these. yuck. */
234         if(c) {
235             opcode_t*op = opcode_get(c->opcode);
236             fprintf(stderr, "Warning: Invalid jump instruction \"%s\" from %d to %d (%d)\n", op->name, c->pos, pos, len);
237         } else {
238             fprintf(stderr, "Warning: Invalid jump to %d (%d)\n", pos, len);
239         }
240         return 0;
241     } else {
242         if(pos==len) {
243             //opcode_t*op = opcode_get(c->opcode);
244             //fprintf(stderr, "Warning: jump beyond end of code in instruction %s at position %d\n", op->name, c->pos);
245             return 0;
246         } else {
247             return bytepos[pos];
248         }
249     }
250 }
251 code_t* code_atposition(codelookup_t*l, int pos)
252 {
253     return pos2code(l->bytepos, 0, pos, l->len);
254 }
255
256 void lookupswitch_print(lookupswitch_t*l)
257 {
258     printf("default: %08x\n", l->def);
259     code_list_t*t = l->targets;
260     while(t) {
261         printf("target: %08x\n", t->code);
262         t = t->next;
263     }
264 }
265
266 code_t*code_parse(TAG*tag, int len, abc_file_t*file, pool_t*pool, codelookup_t**codelookup)
267 {
268     code_t*head=0;
269     code_t*code=0;
270     int start=tag->pos;
271     int end=tag->pos+len;
272     //printf("-->\n");fflush(stdout);
273
274     code_t**bytepos = rfx_calloc(sizeof(code_t*)*len);
275         
276     while(tag->pos<end) {
277         int codepos = tag->pos-start;
278         U8 opcode = swf_GetU8(tag);
279         opcode_t*op = opcode_get(opcode);
280         if(!op) {
281             fprintf(stderr, "Can't parse opcode %02x\n", opcode);
282             continue;
283         }
284         //printf("%s\n", op->name);fflush(stdout);
285         NEW(code_t,c);
286         c->pos = codepos;
287
288         bytepos[codepos] = c;
289
290         if(!head) {
291             head = code = c;
292         } else {
293             code->next = c;
294             code = c;
295         }
296
297         c->opcode = opcode;
298
299         char*p = op->params;
300         int pos = 0;
301         while(*p) {
302             void*data = 0;
303             if(*p == 'n') { // number
304                 data = (void*)(ptroff_t)swf_GetU30(tag);
305             } else if(*p == '2') { //multiname
306                 data = multiname_clone(pool_lookup_multiname(pool, swf_GetU30(tag)));
307             } else if(*p == 'U') { //uint
308                 data = (void*)(ptroff_t)pool_lookup_uint(pool, swf_GetU30(tag));
309             } else if(*p == 'I') { //int
310                 data = (void*)(ptroff_t)pool_lookup_int(pool, swf_GetU30(tag));
311             } else if(*p == 'f') { //int
312                 double*fp = malloc(sizeof(double));
313                 *fp = pool_lookup_float(pool, swf_GetU30(tag));
314                 data = fp;
315             } else if(*p == 'm') { //method
316                 data = array_getvalue(file->methods, swf_GetU30(tag));
317             } else if(*p == 'c') { //classinfo
318                 data = array_getvalue(file->classes, swf_GetU30(tag));
319             } else if(*p == 'i') {
320                 data = array_getvalue(file->method_bodies, swf_GetU30(tag));
321             } else if(*p == 'u') { // generic integer
322                 data = (void*)(ptroff_t)swf_GetU30(tag);
323             } else if(*p == 'r') { // local register
324                 data = (void*)(ptroff_t)swf_GetU30(tag);
325             } else if(*p == 'b') { // byte
326                 data = (void*)(ptroff_t)swf_GetU8(tag);
327             } else if(*p == 'j') { // jump
328                 int j = swf_GetS24(tag);
329                 data = (void*)(ptroff_t)j;
330             } else if(*p == 's') { // string
331                 string_t s = pool_lookup_string2(pool, swf_GetU30(tag));
332                 data = string_dup3(&s);
333             } else if(*p == 'D') { // debug
334                 /*type, usually 1*/
335                 U8 type = swf_GetU8(tag);
336                 if(type!=1) 
337                     fprintf(stderr, "Unknown debug type: %02x\n", type);
338                 /*register name*/
339                 code->data[0] = strdup((char*)pool_lookup_string(pool, swf_GetU30(tag)));
340                 /*register index*/
341                 code->data[1] = (void*)(ptroff_t)swf_GetU8(tag);
342                 /*unused*/
343                 swf_GetU30(tag);
344             } else if(*p == 'S') { // switch statement
345                 lookupswitch_t*l = malloc(sizeof(lookupswitch_t));
346                 l->def = (code_t*)(ptroff_t)swf_GetS24(tag);
347                 l->targets = list_new();
348                 int num = swf_GetU30(tag)+1;
349                 int t;
350                 for(t=0;t<num;t++) 
351                     list_append(l->targets, (code_t*)(ptroff_t)swf_GetS24(tag));
352                 data = l;
353             } else {
354                 printf("Can't parse opcode param type \"%c\" (for op %02x %s).\n", *p, code->opcode, op->name);
355                 return 0;
356             }
357             if(data)
358                 code->data[pos++] = data;
359             p++;
360         }
361     }
362
363 //#define DEBUG_BYTES
364 #ifdef DEBUG_BYTES
365     int t;
366     for(t=0;t<len;t++) {
367         code_t*c = bytepos[t];
368         if(c) {
369             opcode_t*op = opcode_get(c->opcode);
370             if(op->flags & (OP_JUMP|OP_BRANCH)) {
371                 printf("%5d) %02x %s %d\n", t, tag->data[start+t], op->name, c->data[0]);
372             } else {
373                 printf("%5d) %02x %s\n", t, tag->data[start+t], op->name);
374             }
375         } else {
376             printf("%5d) %02x\n", t, tag->data[start+t]);
377         }
378     }
379     //printf("%5d) %02x\n", t, tag->data[start+t]);
380 #endif
381
382     code_t*c = head;
383     while(c) {
384         opcode_t*op = opcode_get(c->opcode);
385         if(op->flags & (OP_JUMP|OP_BRANCH)) {
386             int j = ((int)(ptroff_t)c->data[0]);
387             c->branch = pos2code(bytepos,c,j+4,len);
388         } else if(op->flags & (OP_LOOKUPSWITCH)) {
389             lookupswitch_t*l = (lookupswitch_t*)c->data[0];
390             int offset = 0;
391             l->def = pos2code(bytepos,c,(ptroff_t)l->def+offset,len);
392             code_list_t*t=l->targets;
393             while(t) {
394                 t->code = pos2code(bytepos,c,(ptroff_t)t->code+offset,len);
395                 t = t->next;
396             }
397         }
398         c = c->next;
399     } 
400
401     if(codelookup) {
402         (*codelookup) = malloc(sizeof(codelookup_t));
403         (*codelookup)->bytepos = bytepos;
404         (*codelookup)->len = len;
405     } else {
406         free(bytepos);
407     }
408
409     return head;
410 }
411
412 void codelookup_free(codelookup_t*codelookup)
413 {
414     free(codelookup->bytepos);codelookup->bytepos=0;
415     free(codelookup);
416 }
417
418 code_t*code_find_start(code_t*c)
419 {
420     while(c && c->prev) 
421         c=c->prev;
422     return c;
423 }
424
425 void code_free(code_t*c)
426 {
427     c = code_find_start(c);
428     while(c) {
429         code_t*next = c->next;
430         opcode_t*op = opcode_get(c->opcode);
431         char*p = op?op->params:"";
432         int pos=0;
433         while(*p) {
434             void*data = c->data[pos];
435             if(*p == '2') { //multiname
436                 multiname_destroy(data);
437             } else if(strchr("sDf", *p)) {
438                 free(data);
439             } else if(strchr("S", *p)) {
440                 lookupswitch_t*l = (lookupswitch_t*)data;
441                 list_free(l->targets);l->targets=0;
442                 free(l);
443             }
444             c->data[pos]=0;
445             p++;pos++;
446         }
447         memset(c, 0, sizeof(c));
448         free(c);
449         c = next;
450     }
451 }
452
453 static int opcode_write(TAG*tag, code_t*c, pool_t*pool, abc_file_t*file, int length)
454 {
455     opcode_t*op = opcode_get(c->opcode);
456     char*p = op->params;
457     int pos = 0;
458     int len = 0;
459
460     if(tag)
461         swf_SetU8(tag, c->opcode);
462     len++;
463
464     if(op->flags & OP_INTERNAL) {
465         if(c->opcode == OPCODE___BREAK__ ||
466            c->opcode == OPCODE___CONTINUE__) {
467             fprintf(stderr, "Unresolved %s\n", op->name);
468         } else {
469             fprintf(stderr, "Error: writing undefined internal opcode %s", op->name);
470         }
471     }
472
473     while(*p) {
474         void*data = c->data[pos++];
475         assert(pos<=2);
476         if(*p == 'n') { // number
477             len += swf_SetU30(tag, (ptroff_t)data);
478         } else if(*p == '2') { //multiname
479             multiname_t*m = (multiname_t*)data;
480             len += swf_SetU30(tag, pool_register_multiname(pool, m));
481         } else if(*p == 'm') { //method
482             abc_method_t*m = (abc_method_t*)data;
483             len += swf_SetU30(tag, m->index);
484         } else if(*p == 'c') { //classinfo 
485             abc_class_t*cls = (abc_class_t*)data;
486             len += swf_SetU30(tag, cls->index);
487         } else if(*p == 'i') { //methodbody
488             abc_method_body_t*m = (abc_method_body_t*)data;
489             len += swf_SetU30(tag, m->index);
490         } else if(*p == 'I') { // int
491             len += swf_SetU30(tag, pool_register_int(pool, (ptroff_t)data));
492         } else if(*p == 'U') { // uint
493             len += swf_SetU30(tag, pool_register_uint(pool, (ptroff_t)data));
494         } else if(*p == 'f') { //  float
495             len += swf_SetU30(tag, pool_register_float(pool, *(double*)data));
496         } else if(*p == 'u') { // integer
497             len += swf_SetU30(tag, (ptroff_t)data);
498         } else if(*p == 'r') { // integer
499             len += swf_SetU30(tag, (ptroff_t)data);
500         } else if(*p == 'b') { // byte
501             if(tag)
502                 swf_SetU8(tag, (ptroff_t)data);
503             len++;
504         } else if(*p == 'j') { // jump
505             int skip = length-c->pos-4;
506             if(c->branch) 
507                 skip = (c->branch->pos) - c->pos - 4;
508             len += swf_SetS24(tag, skip);
509         } else if(*p == 's') { // string
510             int index = pool_register_string2(pool, (string_t*)data);
511             len += swf_SetU30(tag, index);
512         } else if(*p == 'D') { // debug statement
513             if(tag)
514                 swf_SetU8(tag, 1);
515             len++;
516             len+=swf_SetU30(tag, pool_register_string(pool,c->data[0]));
517             if(tag)
518                 swf_SetU8(tag, (ptroff_t)c->data[1]);
519             len++;
520             len+=swf_SetU30(tag, 0);
521         } else if(*p == 'S') { // switch statement
522             lookupswitch_t*l = (lookupswitch_t*)data;
523             int offset = 0;
524             len+=swf_SetS24(tag, l->def->pos-c->pos+offset); //default
525             code_list_t*t = l->targets;
526             if(list_length(t)) {
527                 len+=swf_SetU30(tag, list_length(t)-1); //nr-1
528                 code_list_t*t = l->targets;
529                 while(t) {
530                     len+=swf_SetS24(tag, t->code->pos - c->pos+offset);
531                     t = t->next;
532                 }
533             } else {
534                 len+=swf_SetU30(tag, 0); //nr-1
535                 len+=swf_SetS24(tag, l->def->pos-c->pos+offset);
536             }
537         } else {
538             printf("Can't parse opcode param type \"%c\"\n", *p);
539         }
540         p++;
541     }
542     return len;
543 }
544
545 void code_write(TAG*tag, code_t*code, pool_t*pool, abc_file_t*file)
546 {
547     code = code_find_start(code);
548     int pos = 0;
549     int length = 0;
550     code_t*c = code;
551     while(c) {
552         c->pos = pos;
553         pos += opcode_write(0, c, pool, file, 0);
554         c = c->next;
555     }
556     length = pos;
557     swf_SetU30(tag, pos);
558     int start = tag->len;
559     c = code;
560     pos = 0;
561     while(c) {
562         opcode_t*op = opcode_get(code->opcode);
563         if(op->flags&(OP_BRANCH|OP_JUMP)) {
564             int skip = 0;
565         }
566         pos += opcode_write(tag, c, pool, file, length);
567         c = c->next;
568     }
569     assert(tag->len - start == pos);
570 }
571
572 typedef struct {
573     int stackpos;
574     int scopepos;
575     code_t*code;
576     char flags;
577     char error;
578 } stackpos_t;
579
580 typedef struct {
581     stackpos_t*stack;
582     int num;
583     int maxlocal;
584     int maxstack;
585     int maxscope;
586     int flags;
587 } currentstats_t;
588
589 static int stack_minus(code_t*c)
590 {
591     opcode_t*op = opcode_get(c->opcode);
592     if(op->stack_minus>0) {
593         fprintf(stderr, "Invalid opcode entry %02x %s\n", c->opcode, op->name);
594     }
595     int stack = op->stack_minus;
596     if(op->flags&OP_STACK_NS) {
597         multiname_t*m = (multiname_t*)c->data[0];
598         if(multiname_late_namespace(m))
599             stack--;
600         if(multiname_late_name(m))
601             stack--;
602     } 
603     if(op->flags&OP_STACK_ARGS || op->flags&OP_STACK_ARGS2) {
604         assert(strchr(op->params, 'n'));
605         int nr = (ptroff_t)(op->params[0]=='n'?c->data[0]:c->data[1]);
606         stack-=nr;
607         if(op->flags&OP_STACK_ARGS2)
608             stack-=nr;
609     }
610     return stack;
611 }
612 static void handleregister(currentstats_t*stats, int reg)
613 {
614     if(reg+1 > stats->maxlocal)
615         stats->maxlocal = reg+1;
616 }
617
618 #define FLAG_SEEN 1
619 #define FLAG_ERROR 2
620
621 static void dumpstack(currentstats_t*stats)
622 {
623     int t;
624     for(t=0;t<stats->num;t++) {
625         code_t*c = stats->stack[t].code;
626         opcode_t*op = opcode_get(c->opcode);
627         printf("%5d) %c %d:%d %s", t, (stats->stack[t].flags&FLAG_SEEN)?'x':'|', 
628                                stats->stack[t].stackpos,
629                                stats->stack[t].scopepos,
630                                op->name);
631
632         if(op->flags&(OP_BRANCH|OP_JUMP)) {
633             if(c->branch)
634                 printf(" ->%d\n", c->branch->pos);
635             else
636                 printf(" 00000000\n");
637         }
638         if(op->params[0]=='2') {
639             printf(" %s", multiname_tostring(c->data[0]));
640         }
641         printf("\n");
642     }
643 }
644
645 static char callcode(currentstats_t*stats, int pos, int stack, int scope)
646 {
647     while(pos<stats->num) {
648         if(stats->stack[pos].flags&FLAG_SEEN) {
649             if(stats->stack[pos].stackpos != stack ||
650                stats->stack[pos].scopepos != scope) {
651                 //dumpstack(stats);
652                 stats->stack[pos].flags |= FLAG_ERROR;
653                 fprintf(stderr, "Stack mismatch at pos %d\n", pos);
654                 fprintf(stderr, "Should be: %d:%d, is: %d:%d\n", stack, scope,
655                     stats->stack[pos].stackpos, stats->stack[pos].scopepos);
656                
657                 /* return error here if we do verification */
658                 //return 0;
659             }
660             return 1;
661         }
662     
663         stats->stack[pos].flags |= FLAG_SEEN;
664         stats->stack[pos].stackpos = stack;
665         stats->stack[pos].scopepos = scope;
666
667         code_t*c = stats->stack[pos].code;
668         opcode_t*op = opcode_get(c->opcode);
669         
670         //printf("Walking %s at position %d, stack=%d, scope=%d\n", op->name, pos, stack, scope);
671
672         stack += stack_minus(c);
673
674         if(stack<0) {
675             stats->stack[pos].flags |= FLAG_ERROR;
676             fprintf(stderr, "error: stack underflow at %d (%s)\n", pos, op->name);
677            
678             /* if we would do true verification (if we would be a vm), this is 
679                where we would return the error 
680                return 0;
681              */
682         }
683
684         stack += op->stack_plus;
685         scope += op->scope_stack_plus;
686
687         if(stack > stats->maxstack)
688             stats->maxstack = stack;
689         if(scope > stats->maxscope)
690             stats->maxscope = scope;
691
692         if(op->flags & OP_SET_DXNS)
693             stats->flags |= FLAGS_SET_DXNS;
694         if(op->flags & OP_NEED_ACTIVATION)
695             stats->flags |= FLAGS_ACTIVATION;
696
697         if(c->opcode == OPCODE_NEWCLASS) {
698             abc_class_t*cls = (abc_class_t*)(c->data[0]);
699             if(scope > cls->init_scope_depth)
700                 cls->init_scope_depth = scope;
701         }
702         if(c->opcode == OPCODE_NEWFUNCTION) {
703             abc_method_t*m = (abc_method_t*)(c->data[0]);
704             if(m->body && scope > m->body->init_scope_depth)
705                 m->body->init_scope_depth = scope;
706         }
707         
708         if(op->flags & OP_REGISTER) {
709             char*p = op->params;
710             int pos = 0;
711             char ok=0;
712             while(*p) {
713                 if(*p=='r') {
714                     handleregister(stats, (ptroff_t)c->data[pos]);
715                     ok = 1;
716                 }
717                 p++;
718             }
719             if(!ok) {
720                 handleregister(stats, c->opcode&3);
721             }
722         }
723         if(op->flags&OP_RETURN) {
724             if(OP_RETURN==0x48/*returnvalue*/) {
725                 if(stack!=1) {
726                     stats->stack[pos].flags |= FLAG_ERROR;
727                     fprintf(stderr, "return(value) with stackposition %d\n", stack);
728                 }
729             } else if(OP_RETURN==0x47) {
730                 if(stack!=0) {
731                     stats->stack[pos].flags |= FLAG_ERROR;
732                     fprintf(stderr, "return(void) with stackposition %d\n", stack);
733                 }
734             }
735         }
736         if(op->flags & (OP_THROW|OP_RETURN))
737             return 1;
738         if(op->flags & OP_JUMP) {
739             if(!c->branch) {
740                 stats->stack[pos].flags |= FLAG_ERROR;
741                 fprintf(stderr, "Error: Invalid jump target in instruction %s at position %d.\n", op->name, pos);
742                 return 0;
743             }
744             c = c->branch;
745             pos = c->pos;
746             continue;
747         }
748         if(op->flags & OP_BRANCH) {
749             if(!c->branch) {
750                 stats->stack[pos].flags |= FLAG_ERROR;
751                 fprintf(stderr, "Error: Invalid jump target in instruction %s at position %d\n", op->name, pos);
752                 return 0;
753             }
754             int newpos = c->branch->pos;
755             if(!callcode(stats, newpos, stack, scope))
756                 return 0;
757         }
758         if(op->flags & OP_LOOKUPSWITCH) {
759             lookupswitch_t*l = c->data[0];
760             if(!l->def) {
761                 stats->stack[pos].flags |= FLAG_ERROR;
762                 fprintf(stderr, "Error: Invalid jump target in instruction %s at position %d\n", op->name, pos);
763                 return 0;
764             }
765             if(!callcode(stats, l->def->pos, stack, scope))
766                 return 0;
767             code_list_t*t = l->targets;
768             while(t) {
769                 if(!t->code) {
770                     stats->stack[pos].flags |= FLAG_ERROR;
771                     fprintf(stderr, "Error: Invalid jump target in instruction %s at position %d\n", op->name, pos);
772                     return 0;
773                 }
774                 if(!callcode(stats, t->code->pos, stack, scope))
775                     return 0;
776                 t = t->next;
777             }
778         }
779     
780         pos++;
781         if(pos<stats->num) {
782             assert(c->next == stats->stack[pos].code);
783         }
784     }
785     return 1;
786 }
787
788 static currentstats_t* code_get_stats(code_t*code, abc_exception_list_t*exceptions) 
789 {
790     code = code_find_start(code);
791     int num = 0;
792     code_t*c = code;
793     while(c) {
794         num++;
795         c = c->next;
796     }
797     currentstats_t* current = malloc(sizeof(currentstats_t));
798     current->stack = rfx_calloc(sizeof(stackpos_t)*num);
799     current->maxlocal = 0;
800     current->maxstack = 0;
801     current->maxscope = 0;
802     current->num = num;
803     current->flags = 0;
804
805 //#define DEBUG_BYTES
806 #ifdef DEBUG_BYTES
807     int t;
808     c = code;
809     for(t=0;t<num;t++) {
810         opcode_t*op = opcode_get(c->opcode);
811         if(op->flags & (OP_JUMP|OP_BRANCH)) {
812             printf("%5d) %s %08x\n", t, op->name, c->branch);
813         } else if(op->params[0]=='2') {
814             printf("%5d) %s %s\n", t, op->name, multiname_tostring(c->data[0]));
815         } else {
816             printf("%5d) %s\n", t, op->name);
817         }
818         c = c->next;
819     }
820     //printf("%5d) %02x\n", t, tag->data[start+t]);
821 #endif
822
823     num = 0;
824     c = code;
825     while(c) {
826         //crosslink
827         current->stack[num].code = c;
828         c->pos = num;
829         num++;
830         c = c->next;
831     }
832
833     if(!callcode(current, 0, 0, 0)) {
834         free(current);
835         return 0;
836     }
837     abc_exception_list_t*e = exceptions;
838     while(e) {
839         if(e->abc_exception->target)
840             callcode(current, e->abc_exception->target->pos, 1, 0);
841         e = e->next;
842     }
843
844     return current;
845 }
846
847 void stats_free(currentstats_t*stats)
848 {
849     if(stats) {
850         free(stats->stack);stats->stack=0;
851         free(stats);
852     }
853 }
854
855 int code_dump(code_t*c, abc_exception_list_t*exceptions, abc_file_t*file, char*prefix, FILE*fo)
856 {
857     abc_exception_list_t*e = exceptions;
858     c = code_find_start(c);
859     currentstats_t*stats =  code_get_stats(c, exceptions);
860
861     int pos = 0;
862     while(c) {
863         U8 opcode = c->opcode;
864         char found = 0;
865         opcode_t*op = opcode_get(opcode);
866
867         e = exceptions;
868         while(e) {
869             if(c==e->abc_exception->from)
870                 fprintf(fo, "%s   TRY {\n", prefix);
871             if(c==e->abc_exception->target) {
872                 char*s1 = multiname_tostring(e->abc_exception->exc_type);
873                 char*s2 = multiname_tostring(e->abc_exception->var_name);
874                 fprintf(fo, "%s   CATCH(%s %s)\n", prefix, s1, s2);
875                 free(s1);
876                 free(s2);
877             }
878             e = e->next;
879         }
880
881         if(!op) {
882             fprintf(stderr, "Can't parse opcode %02x.\n", opcode);
883             return 0;
884         } else {
885             char*p = op->params;
886             char first = 1;
887             int i=0;
888
889             if(stats) {
890                 int f = stats->stack[c->pos].flags;
891                 fprintf(fo, "%s%5d) %c %d:%d %s ", prefix, c->pos, 
892                                        (f&FLAG_ERROR)?'E':((f&FLAG_SEEN)?'+':'|'),
893                                        stats->stack[c->pos].stackpos,
894                                        stats->stack[c->pos].scopepos,
895                                        op->name);
896             } else {
897                 fprintf(fo, "%s%5d) ? ?:? %s ", prefix, c->pos, op->name);
898             }
899
900             while(*p) {
901                 void*data = c->data[i];
902                 if(i>0)
903                     printf(", ");
904
905                 if(*p == 'n') {
906                     int n = (ptroff_t)data;
907                     fprintf(fo, "%d params", n);
908                 } else if(*p == '2') {
909                     multiname_t*n = (multiname_t*)data;
910                     char* m = multiname_tostring(n);
911                     fprintf(fo, "%s", m);
912                     free(m);
913                 } else if(*p == 'm') {
914                     abc_method_t*m = (abc_method_t*)data;
915                     fprintf(fo, "[method %08x %s]", m, m->name);
916                 } else if(*p == 'c') {
917                     abc_class_t*cls = (abc_class_t*)data;
918                     char*classname = multiname_tostring(cls->classname);
919                     fprintf(fo, "[classinfo %s]", classname);
920                     free(classname);
921                 } else if(*p == 'i') {
922                     abc_method_body_t*b = (abc_method_body_t*)data;
923                     fprintf(fo, "[methodbody]");
924                 } else if(*p == 'u' || *p == 'I' || *p == 'U') {
925                     int n = (ptroff_t)data;
926                     fprintf(fo, "%d", n);
927                 } else if(*p == 'f') {
928                     double f = *(double*)data;
929                     fprintf(fo, "%f", f);
930                 } else if(*p == 'r') {
931                     int n = (ptroff_t)data;
932                     fprintf(fo, "r%d", n);
933                 } else if(*p == 'b') {
934                     int b = (ptroff_t)data;
935                     fprintf(fo, "%02x", b);
936                 } else if(*p == 'j') {
937                     if(c->branch)
938                         fprintf(fo, "->%d", c->branch->pos);
939                     else
940                         fprintf(fo, "%08x", c->branch);
941                 } else if(*p == 's') {
942                     char*s = string_escape((string_t*)data);
943                     fprintf(fo, "\"%s\"", s);
944                     free(s);
945                 } else if(*p == 'D') {
946                     fprintf(fo, "[register %02x=%s]", (ptroff_t)c->data[1], (char*)c->data[0]);
947                 } else if(*p == 'S') {
948                     lookupswitch_t*l = c->data[0];
949                     fprintf(fo, "[");
950                     if(l->def)
951                         fprintf(fo, "default->%d", l->def->pos);
952                     else
953                         fprintf(fo, "default->00000000", l->def->pos);
954                     code_list_t*t = l->targets;
955                     while(t) {
956                         if(t->code)
957                             fprintf(fo, ",->%d", t->code->pos);
958                         else
959                             fprintf(fo, ",->00000000");
960                         t = t->next;
961                     }
962                     fprintf(fo, "]");
963                 } else {
964                     fprintf(stderr, "Can't parse opcode param type \"%c\"\n", *p);
965                     return 0;
966                 }
967                 p++;
968                 i++;
969                 first = 0;
970             }
971             fprintf(fo, "\n");
972         }
973         
974         e = exceptions;
975         while(e) {
976             if(c==e->abc_exception->to) {
977                 if(e->abc_exception->target)
978                     fprintf(fo, "%s   } // END TRY (HANDLER: %d)\n", prefix, e->abc_exception->target->pos);
979                 else
980                     fprintf(fo, "%s   } // END TRY (HANDLER: 00000000)\n", prefix);
981             }
982             e = e->next;
983         }
984
985         pos++;
986         c = c->next;
987     }
988     stats_free(stats);
989     return 1;
990 }
991
992 codestats_t* code_get_statistics(code_t*code, abc_exception_list_t*exceptions) 
993 {
994     currentstats_t*current = code_get_stats(code, exceptions);
995     if(!current)
996         return 0;
997     codestats_t*stats = rfx_calloc(sizeof(codestats_t));
998     stats->local_count = current->maxlocal;
999     stats->max_stack = current->maxstack;
1000     stats->max_scope_depth = current->maxscope;
1001     stats->flags = current->flags;
1002
1003     stats_free(current);current=0;
1004     return stats;
1005 }
1006
1007 void codestats_free(codestats_t*s)
1008 {
1009     free(s);
1010 }
1011
1012 code_t* add_opcode(code_t*atag, U8 op)
1013 {
1014     code_t*tmp = (code_t*)rfx_calloc(sizeof(code_t));
1015     tmp->opcode = op;
1016     tmp->next = 0;
1017     if(atag) {
1018         tmp->prev = atag;
1019         tmp->next = atag->next;
1020         atag->next = tmp;
1021     } else {
1022         tmp->prev = 0;
1023     }
1024     return tmp;
1025 }
1026     
1027 void codestats_print(codestats_t*stats)
1028 {
1029     printf("max_stack: %d\n", stats->max_stack);
1030     printf("local_count: %d\n", stats->local_count);
1031     printf("scope_depth: %d\n", stats->max_scope_depth);
1032 }
1033
1034 code_t* code_end(code_t*code)
1035 {
1036     if(!code)
1037         return 0;
1038     while(code->next)
1039         code = code->next;
1040     return code;
1041 }
1042
1043 code_t* code_append(code_t*code, code_t*toappend)
1044 {
1045     if(!code)
1046         return code_end(toappend);
1047     if(!toappend)
1048         return code_end(code);
1049     //find end of first list
1050     while(code->next) {
1051         code = code->next;
1052     }
1053     code_t*start=toappend;
1054     //and start of second list
1055     while(start->prev) {
1056         start = start->prev;
1057     }
1058     code->next = start;
1059     start->prev = code;
1060     return code_end(toappend);
1061 }
1062
1063 lookupswitch_t*lookupswitch_dup(lookupswitch_t*l)
1064 {
1065     lookupswitch_t*n = malloc(sizeof(lookupswitch_t));
1066     fprintf(stderr, "Error: lookupswitch dupping not supported yet\n");
1067     n->targets = list_clone(l->targets);
1068     return 0;
1069 }
1070
1071 code_t*code_dup(code_t*c)
1072 {
1073     if(!c) return 0;
1074
1075     while(c->prev) c = c->prev;
1076
1077     code_t*last = 0;
1078     while(c) {
1079         NEW(code_t, n);
1080         memcpy(n, c, sizeof(code_t));
1081
1082         opcode_t*op = opcode_get(c->opcode);
1083         if(c->branch) {
1084             fprintf(stderr, "Error: Can't duplicate branching code\n");
1085             return 0;
1086         }
1087         char*p = op?op->params:"";
1088         int pos=0;
1089         while(*p) {
1090             if(*p == '2') { //multiname
1091                 c->data[pos] = multiname_clone(c->data[pos]);
1092             } else if(*p == 's') {
1093                 c->data[pos] = string_dup3(c->data[pos]);
1094             } else if(*p == 'D') {
1095                 c->data[pos] = strdup(c->data[pos]);
1096             } else if(*p == 'f') {
1097                 double old = *(double*)c->data[pos];
1098                 c->data[pos] = malloc(sizeof(double));
1099                 *(double*)c->data[pos] = old;
1100             } else if(strchr("S", *p)) {
1101                 c->data[pos] = lookupswitch_dup(c->data[pos]);
1102             }
1103             p++;pos++;
1104         }
1105
1106         n->prev = last;
1107         if(last) {
1108             last->next = n;
1109         }
1110         last = n;
1111         c = c->next;
1112     }
1113     return last;
1114 }
1115
1116 code_t*code_cutlast(code_t*c)
1117 {
1118     if(!c) return c;
1119     assert(!c->next);
1120     code_t*prev = c->prev;
1121     c->prev = 0;
1122     if(prev)
1123         prev->next=0;
1124     code_free(c);
1125     return prev;
1126 }
1127
1128 code_t* cut_last_push(code_t*c)
1129 {
1130     while(c) {
1131         if(!c) break;
1132         opcode_t*op = opcode_get(c->opcode);
1133         /* cut conversion type operations */
1134         if(op->stack_minus == -1 && op->stack_plus == 1 && !(op->flags)) {
1135             c = code_cutlast(c);
1136             continue;
1137         }
1138         /* cut any type of push */
1139         else if(op->stack_minus == 0 && op->stack_plus == 1 && !(op->flags)) {
1140             return code_cutlast(c);
1141         }
1142         /* cut register lookups */
1143         else if(c->opcode == OPCODE_GETLOCAL ||
1144            c->opcode == OPCODE_GETLOCAL_0 ||
1145            c->opcode == OPCODE_GETLOCAL_1 ||
1146            c->opcode == OPCODE_GETLOCAL_2 ||
1147            c->opcode == OPCODE_GETLOCAL_3) {
1148             return code_cutlast(c);
1149         }
1150         /* discard function call values */
1151         else if(c->opcode == OPCODE_CALLPROPERTY) {
1152             c->opcode = OPCODE_CALLPROPVOID;
1153             return c;
1154         } else if(c->opcode == OPCODE_CALLSUPER) {
1155             c->opcode = OPCODE_CALLSUPERVOID;
1156             return c;
1157         } else if(c->opcode == OPCODE_NEWOBJECT ||
1158                   c->opcode == OPCODE_NEWARRAY) {
1159             // we can discard these if they're not eating up stack parameters
1160             if(!c->data[0])
1161                 return code_cutlast(c);
1162         }
1163         else
1164             break;
1165     }
1166     c = abc_pop(c);
1167     return c;
1168 }
1169
1170