C语言中的内存管理详情

1.malloc

2.内存泄露

3.内存池

4.理论

5.代码数据结构

6.代码

7.blk->begin

8.总结

内容提要：

大家写C程序时，手工申请过内存吗？每次需要存储空间时都向操作系统申请吗？使用完申请到的内存后有把它还给操作系统吗？遇到过“段错误”吗？本文的主题和这一串问题有很大的关系。

1.malloc

手工申请内存使用malloc。先看一段例程。

#include <stdio.h>
#include <string.h>
#include <stdlib.h>
char *say_hi();
int main(int argc, char *argv[])
{
   char *str = say_hi();
   printf("str = %s\n", str);
   free(str);
   return 0;
}
char *say_hi()
{
   char *ptr = (char *)malloc(100);
   char *str = "how are you?";
   strcpy(ptr, str);
   return ptr;
}

执行结果如下：

[root@localhost compiler-basic]# gcc -o t t.c -g -m32
[root@localhost compiler-basic]# ./t
str = how are you?

把修改成：

char *say_hi()
{
   char *ptr = (char *)malloc(100);
   char *str = "how are you?";
   strcpy(ptr, str);
   return str;
}

执行结果如下：

[root@localhost compiler-basic]# gcc -o t t.c -g -m32
[root@localhost compiler-basic]# ./t
str = how are you?
Segmentation fault (core dumped)

在第二版say_hi中，返回值是str，我们看到，打印出的数据是how are you?。然而，这只是偶尔正确。C语言的函数并不能总是正确返回非数字类型的局部变量的值。在程序变得复杂后，保不准某个时候这样的函数就不能返回预期数据。

Segmentation fault (core dumped)，这又是怎么回事呢？str不是malloc申请到的内存空间，用free释放它导致错误。

2.内存泄露

用malloc申请了内存空间却不用free释放，会造成内存泄露。

在前面的第二版say_hi中，ptr指向的内存空间就被泄露了。在程序员看来，执行完say_hi后，ptr指向的内存就没有价值了；由于没有正确地释放它，操作系统认为它仍然在使用中，当其他进程申请内存时，不会把这片内存回收重新分配。

像这样的内存泄露越来越多，会一直多到耗尽所有的内存。但实际上，那些被泄露的内存是完全应该被回收再使用的。

内存泄露后，会成为操作系统和程序员都无法掌控的内存。

我们在手工申请内存、使用完毕之后，一定要释放内存。malloc和free犹如一对连体婴儿，总是一起使用。

3.内存池

前面的例子，在say_hi使用malloc，在main使用free。连体婴儿却只能出现在两个函数中，这很危险。一不留神，就会忘记释放内存。

每次申请内存都使用malloc，需要陷入内核，性能开销很大。

有朋友会说，我只是个小菜鸟，暂时还不需要考虑性能开销，只要我写的程序能跑就行。

哈哈，你并不是第一个这么想的人，我也是这样想的，所以我不厌其烦地、勤快地多次使用malloc。终于，在昨天，我遇到了非常烦人的段错误。

段错误发生在malloc中，导致错误的函数调用链不同，在测试数据中随便加几个字符后错误又消失。断点调试不管用，在前几十次执行malloc没有段错误，在后面几十次中的某一次执行malloc时才出现段错误。段错误出现在内核中。内核是不会有问题的，即使问题指向内核，那一定是向内核提供了错误的输入数据。

在束手无策快要绝望之前，我把原始的malloc换成了向内存池申请内存。先前发生的奇怪错误，再也没有出现了。

4.理论

内存池，是使用malloc申请的一段内存；进程需要内存空间时，从这段内存中拿一块去用；当这段内存被用完后，再使用malloc申请一段新内存；像这样重复这个过程。

很容易发现，内存池减少了使用malloc的次数；在进程结束前，程序员能方便地一次性释放这些内存。

5.代码数据结构

struct mblock{
   char *begin;
   char *avail;
   char *end;
};
typedef struct heap{
  struct mblock *last;
   struct mblock head;
} *Heap;
#define HEAP(hp) struct heap hp = { &hp.head }
Heap CurrentHeap;
struct heap ProgrameHeap;
int HeapAlloc(Heap hp, int size);
void *do_malloc(int size);

6.代码

char *HeapAlloc(Heap hp, int size){
   struct mblock *blk = NULL;
   blk = hp->last;
   while(size > blk->end - blk->avail){
       int m = 4096 + sizeof(struct mblock) + size;
       blk->next = malloc(m);
       blk = blk->next;
       if(blk == NULL){
           printf("内存耗尽\n");
           exit(-1);
        }
       blk->begin = blk->avail = (char *)(blk + 1);
       blk->end = (char *)blk + m;
       hp->last = blk;
    }
   blk->avail += size;
   return blk->avail - size;
}
void *do_malloc(int size){
  CurrentHeap = HEAP(ProgrameHeap);
   void *p = HeapAlloc(CurrentHeap, size);
   memset(p, 0, size);
   return 0;
}

要申请内存的时候，原来是使用malloc，现在，我们有了上面的这套内存管理机制后，就使用do_malloc来申请内存。

**解说
HEAP**
这个宏把heap的第一个成员last的值设置成第二个成员head的内存地址。

要熟悉这种{ &hp.head }初始化结构体的语法。

7.blk->begin blk->begin = blk->avail = (char *)(blk + 1);

先看blk + 1。它表示，在blk的基础上，往后移动sizeof(struct mblock)个字节。指针的加减就是这么计算的。

blk指向一段m个字节的内存空间，这段内存空间的前sizeof(struct mblock)个字节存储一个mblock结构。怎么理解这个结构？它是这段内存空间的元数据。了解文件系统的实现机制的朋友会很容易理解这一点。

从元数据中，获取begin、avail、end。

如果把blk->begin做如下修改。

blk->begin = blk->avail = (char *)(blk);

怎么样？我们来推演一番。

第一次执行HeapAlloc，申请了一段内存，这段内存的前面是元数据；返回给进程的是这段内存的开始地址，也就是元数据的开始地址。

执行memset(p, 0, size);，元数据被擦除。