GC

C#的 GC工作原理基础

作为一位C++出身的C#程序员,我最初对垃圾收集(GC)抱有怀疑态度,怀疑它是否能够稳定高效的运作;而到了现在,我自己不得不说我已经逐渐习惯并依赖GC与我的程序“共同奔跑”了,对“delete”这个习惯于充当罪魁祸首的关键字也渐渐产生了陌生感。然而实践证明,我对GC的过分信赖却招致了很多意想不到的错误,这也激励了我对GC的运作机制作深入一步的了解。随后我开始翻书,查资料,终于对GC有了一个比较完整的理解(但远远算不上深入)。有人也许会说:“研究GC的内部机制有什么价值吗?我们是搞应用程序开发的,客户的机器可以达到很高的配置,内存资源不是问题。”这种说法明显是认为“垃圾收集=内存释放”了,其实在垃圾收集中,造成最多麻烦的往往不是内存量,而是在内存释放之外,GC暗地里为我们做的繁杂事务(例如非托管资源的清理和释放)。如果你对GC的基本运作还不了解,而又没有时间仔细阅读众多技术资料的话,那么我的这几篇文章或许对你能有一些帮助。

下面就从资源的分配和释放入手,先了解一下背景知识。

一. 托管资源的分配

CLR在运行时管理着一段内存地址空间(虚拟地址空间,在运行中会映射到物理内存地址中),分为“托管堆”和“栈”两部分,栈用于存储值类型数据,它会在方法执行结束后自动销毁其中引用的值类型变量,这一部分不属于垃圾收集的范围。托管堆用于引用类型的变量存储,是垃圾收集的关键阵地。

托管堆是一段连续的地址空间,其中所分配出去的空间呈现出类似数组形态的队列结构:

NextObjPtr是托管堆所维护的一个内存指针,指示下一个对象分配的内存起始地址,它会随着内存的分配而不断移动(当然也会随着内存垃圾回收而发生移动),永远指向下一个空闲的地址。

到了这里,我们不妨与C++比较一下内存分配机制的效率(对效率不感兴趣的大可以跳过:)),顺便让C++的朋友们打消一些对CLR分配内存效率的疑虑。在查找空闲内存空间时,CLR只需要在NextObjPtr处直接留出指定大小的空间提供给数据初始化,然后计算新的空闲地址并重置NextObjPtr指针即可。而在C/C++中,在分配内存之前先要遍历一遍内存占用的链表以查找合适大小的内存块,然后再修改此链表,这样也很容易产生内存碎块,使得内存分配性能下降。很明显,.NET的分配方式效率更高。但是这种效率是以GC的劳动为代价的。

二. 垃圾判定

要进行垃圾收集,首先要知道什么是垃圾。GC通过遍历应用程序中的“根”来寻找垃圾。我们可以认为根是一个指向引用类型对象内存地址的指针。如果一个对象没有了根,就是它不再被任何位置所引用,那么它就是垃圾的候选者了。

值得注意的一点是,对象可能在其生存期结束之前就被列入垃圾名单,甚至已经被GC所暗杀!那是因为对象可能在生存期的某一时刻已经不再被引用,如果在这个时候执行垃圾收集,那么这个不幸的对象极有可能已经被列为垃圾并被销毁(为什么说是“可能”呢?因为它不一定在GC的视力范围内。后面讲到“代龄”时会详细介绍相关细节)。

1publicstaticvoid Main()

2 {

3string sGarbage= "I'm here";

4

5//下面的代码没有再引用s,它已经成为垃圾对象---当然,这样的代码本身也是垃圾;

6//此时如果执行垃圾收集,则sGarbage可能已经魂归西天

7

8 Console.WriteLine("Main() is end");

9 }

三. 对象代龄

尽管GC总是在默默为我们劳动,但它毕竟是由人创造的,人会偷懒,它也会。为了减少每次的工作量,它总是希望能够减少工作的范围;它坚信,越晚创建的对象往往越短命,因此它会集中精力处理这一部分的内存区域,暂且搁置其他部分。GC引入“代龄”的概念来划分对象生存级别。

CLR初始化后的第一批被创建的对象被列为0代对象。CLR会为0代对象设定一个容量限制,当创建的对象大小超过这个设定的容量上限时,GC就会开始工作,工作的范围是0代对象所处的内存区域,然后开始搜寻垃圾对象,并释放内存。当GC工作结束后,幸存的对象将被列为第1代对象而保留在第1代对象的区域内。此后新创建的对象将被列为新的一批0代对象,直到0代的内存区域再次被填满,然后会针对0代对象区域进行新一轮的垃圾收集,之后这些0代对象又会列为第1代对象,并入第1代区域内。第1代区域起初也会被设上一个容量限制值,等到第1代对象大小超过了这个限制之后,GC就会扩大战场,对第1代区域也做一次垃圾收集,之后,又一次幸存下来的对象将会提升一个代龄,成为第2代对象。

可见,有一些对象虽然符合垃圾的所有条件,但它们如果是第1代(甚至是第2代老臣)对象,并且第1代的分配量还小于被设定的限制值时,这些垃圾对象就不会被GC发现,并且可以继续存活下去。

另外,GC还会在工作过程中汲取经验,根据应用程序的特点而自动调整每代对象区域的容量,从而可以更高效的工作。

应该了解的垃圾收集机制(二)

对于大多数应用而言,了解垃圾收集机制的主要动机并不是为了对内存“省吃俭用”,而是为了处理非托管资源的控制问题,这些问题往往跟内存的大小没有什么关系。例如对一个文件进行操作,该何时关闭文件,关闭文件时要注意什么问题,如果忘了关闭会带来什么后果?这些都是我们需要认真考虑的,无论你的内存有多大:)

对于这一类的操作,我们不能依赖GC帮我们做,因为它并不知道我们在释放时想干什么,它甚至不知道自己该干什么!我们不得不自己动手来编写处理代码。当然,微软已经为我们搭好了框架,就是这两个函数:Finalize和Dispose。它们也代表了非托管清理的两种方式:自动和手动。

一. Finalize

Finalize很像C++的析构函数,我们在代码中的实现形式为这与C++的析构函数在形式上完全一样,但它的调用过程却大不相同。

~ClassName() {//释放你的非托管资源}

比如类A中实现了Finalize函数,在A的一个对象a被创建时(准确的说应该是构造函数被调用之前),它的指针被插入到一个finalization链表中;在GC运行时,它将查找finalization链表中的对象指针,如果此时a已经是垃圾对象的话,它会被移入一个freachable队列中,最后GC会调用一个高优先级线程,这个线程专门负责遍历freachable队列并调用队列中所有对象的Finalize方法,至此,对象a中的非托管资源才得到了释放(当然前提是你正确实现了它的Finalize方法),而a所占用的内存资源则必需等到下一次GC才能得到释放,所以一个实现了Finalize方法的对象必需等两次GC才能被完全释放。

由于Finalize是由GC负责调用,所以可以说是一种自动的释放方式。但是这里面要注意两个问题:第一,由于无法确定GC何时会运作,因此可能很长的一段时间里对象的资源都没有得到释放,这对于一些关键资源而言是非常要命的。第二,由于负责调用Finalize的线程并不保证各个对象的Finalize的调用顺序,这可能会带来微妙的依赖性问题。如果你在对象a的Finalize中引用了对象b,而a和b两者都实现了Finalize,那么如果b的Finalize先被调用的话,随后在调用a的Finalize时就会出现问题,因为它引用了一个已经被释放的资源。因此,在Finalize方法中应该尽量避免引用其他实现了Finalize方法的对象。

可见,这种“自动”释放资源的方法并不能满足我们的需要,因为我们不能显示的调用它(只能由GC调用),而且会产生依赖型问题。我们需要更准确的控制资源的释放。

二. Dispose

Dispose是提供给我们显示调用的方法。由于对Dispose的实现很容易出现问题,所以在一些书籍上(如《Effective C#》和《Applied Microsoft.Net Framework Programming》)给出了一个特定的实现模式:

class DisposePattern :IDisposable

{

private System.IO.FileStream fs = new System.IO.FileStream("test.txt", System.IO.FileMode.Create);

~DisposePattern()

{

Dispose(false);

}

IDisposable Members#region IDisposable Members

public void Dispose()

{

//告诉GC不需要再调用Finalize方法,

//因为资源已经被显示清理

GC.SupdivssFinalize(this);

Dispose(true);

}

endregion

protected virtual void Dispose(bool disposing)

{

//由于Dispose方法可能被多线程调用,

//所以加锁以确保线程安全

lock (this)

{

if (disposing)

{

//说明对象的Finalize方法并没有被执行,

//在这里可以安全的引用其他实现了Finalize方法的对象

}

if (fs != null)

{

fs.Dispose();

fs = null; //标识资源已经清理,避免多次释放

}

}

}

}

在注释中已经有了比较清楚的描述,另外还有一点需要说明:如果DisposePattern类是派生自基类B,而B是一个实现了Dispose的类,那么DisposePattern中只需要override基类B的带参的Dispose方法即可,而不需要重写无参的Dispose和Finalize方法,此时Dispose的实现为:

class DerivedClass : DisposePattern

{

protected override void Dispose(bool disposing)

{

lock (this)

{

try

{

//清理自己的非托管资源,

//实现模式与DisposePattern相同

}

finally

{

base.Dispose(disposing);

}

}

}

}

当然,如果DerivedClass本身没有什么资源需要清理,那么就不需要重写Dispose方法了,正如我们平时做的一些对话框,虽然都是继承于System.Windows.Forms.Form,但我们常常不需要去重写基类Form的Dispose方法,因为本身没有什么非托管的咚咚需要释放。

了解GC的脾性在很多时候是非常必要的,起码在出现资源泄漏问题的时候你不至于手足无措。我写过一个生成excel报表的控件,其中对excel对象的释放就让我忙活了一阵。如果你做过excel开发的话,可能也遇到过结束excel进程之类的问题,特别是包装成一个供别人调用的库时,何时释放excel对象以确保进程结束是一个关键问题。当然,GC的内部机制非常复杂,还有许多内容可挖,但了解所有细节的成本太高,只需了解基础,够用就好。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 214,128评论 6 493
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,316评论 3 388
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 159,737评论 0 349
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,283评论 1 287
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,384评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,458评论 1 292
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,467评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,251评论 0 269
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,688评论 1 306
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,980评论 2 328
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,155评论 1 342
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,818评论 4 337
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,492评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,142评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,382评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,020评论 2 365
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,044评论 2 352

推荐阅读更多精彩内容

  • 概念1:内存自动管理,1、提高了软件开发的抽象度;2、程序员可以将精力集中在实际的问题上而不用分心来管理内存的问题...
    诸子百家谁的天下阅读 1,770评论 2 1
  • [TOC] 内存管理 一、托管堆基础 在面向对象中,每个类型代表一种可使用的资源,要使用该资源,必须为代表资源的类...
    _秦同学_阅读 3,795评论 0 3
  • 原文阅读 前言 这段时间懈怠了,罪过! 最近看到有同事也开始用上了微信公众号写博客了,挺好的~给他们点赞,这博客我...
    码农戏码阅读 5,958评论 2 31
  • 什么是GC GC如其名,就是垃圾收集,当然这里仅就内存而言。Garbage Collector(垃圾收集器,在不至...
    此年此景阅读 990评论 0 1
  • 原文链接:https://www.cnblogs.com/byue/p/5734779.html 一个优秀Java...
    Easy的幸福阅读 495评论 0 2