[理解] C/C++ 字符编码

直接说说我的理解。

char与wchar_t

  1. 这两个类型是C++定义的类型。
    用char定义的字符串,对应的字符集是扩展的ANSI,在简体中文的操作系统上,就是gb2312字符集。
    用wchar_t定义的字符串,对应的字符集是Unicode,UTF16编码方式,这是一个定长的编码方式。
    C/C++定义的就这两种,没有再多了。假设要增加一种,比如UTF8的编码方式的,那么就要顶一个新类型,比如kchar_t?
const char* pStr1 = "你好世界A";
// const wchar_t* pStr2 = "你好世界A"; // 编译失败
const wchar_t* pStr2 = L"你好世界A";  

printf("%d\n", strlen(pStr1)); // 打印9。9个字节,考虑到"\0",pStr1实际上是10个字节。
printf("%d\n", wcslen(pStr2)); // 打印5。10个字节,考虑到"\0",pStr2实际上是12个字节。
  1. char与wchar_t的相互转化
    可以使用利用Windows API中的函数 WideCharToMultiByte 和 MultiByteToWideChar。
    代码网上很多,暂时不贴了。

VS2005的CharacterSet设置

  1. 有两个可以设置:Multi-Byte Character Set和Unicode Character Set。
  2. 这个设置,只是通过预编译宏,修改一些宏定义,参数类型。比如MessageBox使用MessageBoxA版本还是MessageBoxW版本。对char还有wchar_t没有什么影响。
WINUSERAPI
int
WINAPI
MessageBoxA(
    __in_opt HWND hWnd,
    __in_opt LPCSTR lpText,
    __in_opt LPCSTR lpCaption,
    __in UINT uType);
WINUSERAPI
int
WINAPI
MessageBoxW(
    __in_opt HWND hWnd,
    __in_opt LPCWSTR lpText,
    __in_opt LPCWSTR lpCaption,
    __in UINT uType);
#ifdef UNICODE
#define MessageBox  MessageBoxW
#else
#define MessageBox  MessageBoxA
#endif // !UNICODE

UTF8

基于Unicode字符集的一种变长编码方式,为了节省数据而创造出来的。常用语网络数据传输。

项目中的应用

  1. Data编辑器
    数据结构使用wchar_t,持久化到文件的时候,直接持久化wchar_t,二进制的方式读写文件。
  2. 网络传输
    数据结构,可以使用wchar_t,也可以使用char_t。绝大部分都是wchar_t,只用登录用的是char_t。收发协议,只要一直就可以了。网络发包最外层有没有压缩数据,就不知道了。先不管了。
  3. Lua配表文件
    Lua文件是UTF8的。读写Lua的时候。部分怎么读写的,还要再看看???
  4. 国际化工具
    还没看???

参考

带你玩转Visual Studio——带你理解多字节编码与Unicode码
C++ WINDOWS下 wchar_t *和char * 相互转化总结篇
彻底搞定char/wchar_t!
最后这篇文章要好好看看。

  1. CString
    CString对应的字符串应该是TCHAR,TCHAR的定义是这样的,
#ifdef _UNICODE
typedef wchar_t TCHAR;
#else
typedef char TCHAR;
#endif
  1. 通用性字符串
    通用字符型TCHAR
    ifdef UNICODE it is wchar_t(WCHAR)for Unicode platforms;
    else it is char for ANSI and DBCS platforms.
    通用字符串指针LPTSTR
    ifdef UNICODE it is LPWSTR(wchar_t) for Unicode platforms;
    else it is LPSTR (
    char) for ANSI and DBCS platforms.
    通用通用常数字符串指针LPCTSTR
    ifdef UNICODE it is LPCWSTR(const wchar_t) for Unicode platforms;
    else it is LPCSTR (
    const char) for ANSI and DBCS platforms.
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 215,723评论 6 498
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,003评论 3 391
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 161,512评论 0 351
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,825评论 1 290
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,874评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,841评论 1 295
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,812评论 3 416
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,582评论 0 271
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,033评论 1 308
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,309评论 2 331
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,450评论 1 345
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,158评论 5 341
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,789评论 3 325
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,409评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,609评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,440评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,357评论 2 352