内存分布
C代码编译成可执行程序经过4步:
- 预处理:宏定义展开、头文件展开、条件编译,这里并不会检查语法
- 编译:检查语法,将预处理后文件编译生成汇编文件
- 汇编:将汇编文件生成目标文件(二进制文件)
- 链接:将目标文件链接为可执行程序
程序文件分析
通过size
查看程序文件的内容分段:
shell
$ size a.out
text data bss dec hex filename
2258 652 12 2922 b6a a.out
代码区(text segment)
加载的是可执行文件代码段,所有的可执行代码都加载到代码区,这块内存是不可以在运行期间修改的。
未初始化数据区(BSS)
加载的是可执行文件BSS段,位置可以分开亦可以紧靠数据段,存储于数据段的数据(全局未初始化,静态未初始化数据)的生存周期为整个程序运行过程。
全局初始化数据区/静态数据区(data segment)
加载的是可执行文件数据段,存储于数据段(全局初始化,静态初始化数据,文字常量(只读))的数据的生存周期为整个程序运行过程。
text + data + bss 十进制表示是dec
text + data + bss 十六进制表示是hex
程序加载到内存后
栈区(stack)
栈是一种先进后出的内存结构,由编译器自动分配释放,存放函数的参数值、返回值、局部变量等。在程序运行过程中实时加载和释放,因此,局部变量的生存周期为申请到释放该段栈空间。
堆区(heap)
堆是一个大容器,它的容量要远远大于栈,但没有栈那样先进后出的顺序。用于动态内存分配。堆在内存中位于BSS区和栈区之间。一般由程序员分配和释放,若程序员不释放,程序结束时由操作系统回收。
内存分区模型
内存分区图:
环境变量,命令行参数.在栈上面位置
通常使用变量在内存中位置分析:
c
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
int a = 100; // data段
int b; // bss段
int c = 0; // bss段
void foo(void) {
int num = 100; // 栈内存stack
char* str = "abcdedsgads"; // 文字常量区data
char str_arr[] = "abcdedsgads"; // 把常量区的字符串copy一份到栈区
static char s_str_arr[] = "abcdedsgads"; // 静态数据区data
}
void* bar(const char* str, int len) { // str,num 栈区stack
char* s = (char*)malloc(1024); // s指向堆heap内存,s指针在栈区stack
strncpy(s, str, len);
return s;
}
int main(int argc, char* argv[]) {
char* str = "hello world";
char* s = bar(str, strlen(str));
free(s);
return 0;
}