今天在做一个打开文件对话框OpenFileDialog时,需要对打开的文件进行读取,显示在在窗体中的RichTextBox中。但是在显示文件时,却发现显示的中文字符串出现乱码。代码的关键部分如下所示:
1 StreamReader sr = new StreamReader(openFileDialog.OpenFile());
2 string str = sr.ReadToEnd();
3 childForm.richTextBox1.Text = str;
开始我也想到了是字符编码出了问题,于是我在初始化StreamReader时,给它加了字符编码参数,加了好几次,Encoding.Unicode,Encoding.UTF32,Encoding.UTF7,Encoding.UTF8,Encoding.ASCII,这些能加的编码方案我都试过了,结果都不行,还是会乱码。百般无奈之下,我只好在.net爱好者群里问了。然后群里就有好心人给我发了一个链接,点进去看了之后恍然大悟。链接如下所示:http://www.cnblogs.com/wmw1989/archive/2008/05/19/1202500.html
原来,中文编码是GB2312,而当前系统的代码页的编码方案采用的是ANSI编码,出现乱码也就不足为奇了。解决方案很简单,就是初始化StreamReader的时候告诉它目前代码页的编码方案。可是由于Encoding类并没有定义ANSI编码方案,所以只能采用Default让系统获取当前操作系统的当前ANSI代码页的编码方案。因此上面的代码换成如下的代码就解决了:
1 StreamReader sr = new StreamReader(openFileDialog.OpenFile(), Encoding.Default);
2 string str = sr.ReadToEnd();
3 childForm.richTextBox1.Text = str;