最近在搞Compiler的CodeGenerator实验,有一部分需要把Java程序翻译成C程序,比如:
代码如下:
int [] array;
array = new int[10];
System.out.println(array.length); //10
这段代码翻译成C很自然的想法是:
代码如下:
int * array; // int array[] not support in C
array = (int*)malloc(sizof(int)*10);
printf("%d\n",sizof(array)/sizeof(int)); // 1
但很可惜这样是错误的,因为malloc操作在堆上分配空间,不一定是连续的,sizof(array)得到的是指针本身所占的单元,和sizeof(int)相等,无法通过sizof求得数组长度。它和下面还不一样:
代码如下:
int array[10];
printf("%d\n",sizof(array)/sizeof(int)); // 10
这里array是数组,是指向整个连续存储空间的常量,所以sizeof对其操作求得的是整个区域的长度。但是当数组名作为函数的参数传递时,数组就退化为指针,又回到了刚才问题。
我们应该怎么做?
在 StackOverflow 搜了一下,发现ANSI C根本没有直接办法通过指向内存的指针求得分配长度。但Windows下提供了计算指针指向的内存大小的方法[malloc.h]:
_msize : returns the size (in bytes) as an unsigned integer.
代码如下:
size_t _msize(
void *memblock
);
但由于操作系统策略的原因,实际分配到的大小可能会比指定的大一些.
在Linux下,指针往前偏移一个整形大小的单元也会记录实际分配的大小,我们来窥探一下那个单元的内容:
代码如下:
//test.c
int main(){
int * p;
int i;
int size;
for (i=1;i<11;i++)
printf("%d ",i);
printf("\n");
for (i=0;i<10;i++){
p = (int*)malloc(sizeof(int)*i);
size = *(int*)((char*)p-sizeof(int));
printf("size:%d ",size);
free(p);
}
printf("\n");
}
$gcc test.c
$./a.out
1 2 3 4 5 6 7 8 9 10
17 17 17 17 25 25 33 33 41 41