UNICODE编程    [ Date: 2005-8-14 16:57:00 | 作者: 四年缘尽 ]

发信人: gege (呖咕呖咕我发财), 信区: C++
标  题: UNICODE编程
发信站: 飘渺水云间 (Thu Apr 25 21:00:30 2002), 站内信件

这是一个许多人(包括我自己)曾经或至今仍疑惑的问题(这里我们只讨论UTF-16,即双字节版本)。
1.关于UNICODE
  首先,UNICODE主要使用的字符类型是WCHAR,定义是unsigned short。从定义我们可以看出这是一个双字节的类型,就是每一个字符占2个字节。这样的话,可以表示的字符类型就可以多达6万多。所有之前的ASCII码分布在0x0000-0x00ff之间,而汉字(包括
big5)分布在0x4e00到0x9fff之间。整个unicode包含了几乎世界上所有的文字。关于UNICODE的细节,可以参看以下网页
http://www.unicode.org/unicode/standard/translations/s-chinese.html
2.为什么要使用UNICODE
  1) COM:在COM规范中,明确指定了必须使用UNICODE类型,这正是微软充分考虑了跨平台的结果。这也是为什么经常在COM中可以看到BSTR(WCHAR*)类型
  2)WIN2000和WINNT:在这两个平台中,默认的字符处理方式是UNICODE。即使你写了一个非UNICODE(multibyte)的程序,系统在执行的时候仍然会对你的字符进行一次转换,这样无疑浪费了CPU时间,使用UNICODE可以有效的提高程序的运行效率(仅使用于这两个平台)。当然将来的XP也会如此。
  3)通用性:使用UNICODE可以使我们不在为汉字和英文字符的判断而烦恼(都是2个字节)。
3.如何使用UNICODE
  1)首先推荐的类型是TCHAR(通用字符类型)。当你定义了_UNICODE宏的时候,TCHAR就是WCHAR,当你没有定义这个宏的时候,TCHAR就是char,很不可思议吧,我们可以来看一下TCHAR的定义:
#ifdef UNICODE // r_winnt
typedef WCHAR TCHAR, *PTCHAR;
#else /* UNICODE */ // r_winnt
typedef char TCHAR, *PTCHAR;
#endif /* !_TCHAR_DEFINED */
上面的代码来自WINNT.H我剔除了一些无关的部分。现在一切都显而易见了。
通过TCHAR,我们只需要这样一段代码:
TCHAR tStr[] = _T("t code");
MessageBox(tStr);
就可以支持UNICODE和MULTIBYTE两种版本。_T宏的作用就是转换成TCHAR。
2)关于其他的处理
首先是常用的CString,它本身就支持UNICODE。下面的例子说明了用法:
CString *pFileName = new CString("c://tmpfile.txt");
#ifdef _UNICODE
m_hFile = CreateFile(pFileName->AllocSysString(),
GENERIC_READ | GENERIC_WRITE,
FILE_SHARE_READ,
NULL,
OPEN_EXISTING,
FILE_ATTRIBUTE_NORMAL,
NULL);
#else
m_hFile = CreateFile(pFileName->GetBuffer(pFileName->GetLength()),
GENERIC_READ | GENERIC_WRITE,
FILE_SHARE_READ,
NULL,
OPEN_EXISTING,
FILE_ATTRIBUTE_NORMAL,
NULL);
#endif
3) 当我们在UNICODE方式中需要为一个字串常量附值时可以使用L宏,如:
BSTR wcsStr = L"unicode";
  这样的附值很简便,但是,经过L宏处理后的字串一定是UNICODE,如果你吧它附给一个MULTIBYTE的字串,字符将可能会被截断。
  另外,VC还提供了一些函数如WideCharToMultiByte和MultiByteToWideChar还有另外的一些宏来支持转换。大家可以看MSDN。
3.编译器的设置:
  首先我们需要在project->settings->C/C++的属性页中的Preprocessor中写入_UNICODE,然后在link属性页中Category中选择output,在Entry-Point symbol 中添加wWinMainCRTStartup,这样,我们的UNICODE工程便大功告成。

发信人: olddog (汪汪汪), 信区: C++
标  题: Re: UNICODE编程
发信站: 飘渺水云间 (Thu Apr 25 21:44:26 2002), 转信

补充一些:

字符集有UNICODE,ACSII,MBCS等

UNICDE是ASCII的一个扩展, 用16位字符编码。
MBCS是UNICODE的一个替代物,可以用一个或者两个字节(byte)来表示字符。用两个byt
e的时候,头一个byte叫做lead-byte,要表明接下来两个byte代表一个字符。不同范围的
lead-byte表明了不同的字符集合(code page)  好比   n1-n2表明是日文,   n3-n4表明
是中文字符。
如果程序考虑到在国际上发布,那么就要用MBCS或者UNICODE,或者使得程序能够以多种模
式编译。
MBCS最普遍的一种情况是DBCS。

使用宽字符的时候需要注意下面几个地方:
1.文件名    2.字符操作(delete,右方向键移动一个character...)    3.string长度
4.程序入口函数
crt和mfc支持single-byte,MBCS,UNICODE
字符串处理函数一般分下面几个版本:
str...      single-byte
_mbs       MBCS
wcs        UNICODE
MFC的类成员函数一般用可移植的函数_.....

三种字符间的可移植性
通过TCHAR.H里面的前缀_tcs将三种字符串处理函数统一起来,以及在编译的时候定义不同的宏开关,可以自由选择按照什么方式进行编译。
TCHAR.H里面定义了宏_TCHAR    当按照UNICODE编译的时候,是wchar_t   而按照singlg
_code或者MBCS编译的时候则是char

一般来说,我们使用tcs...函数,操作_TCHAR

使用unicode和MCBS的区别;
UNICODE    在win_nt, win_2k平台上  不能在95下用  (字符串一定是16位/character)
MCBS        任何win32平台   (每个字符可以是1个或者2个字节)

收藏:UNICODE编程相关推荐

  1. Windows环境下Unicode编程总结和将ANSI转换到Unicode 将Unicode转换到ANSI

    Windows环境下Unicode编程总结 UNICODE环境设置 在安装Visual Studio时,在选择VC++时需要加入unicode选项,保证相关的库文件可以拷贝到system32下. UN ...

  2. C++ UNICODE 编程从入门到精通

    C++ UNICODE 编程从入门到精通 每件事情,首先从简单的开始,再一步一步深入了解,不但容易接受,而且是从它的根本掌握它. UNICODE编程其实很简单,初学会觉得复杂而已.真的很简单的,开始吧 ...

  3. windows环境下unicode编程总结

    windows环境下unicode编程总结 UNICODE环境设置 在安装Visual Studio时,在选择VC++时需要加入unicode选项,保证相关的库文件可以拷贝到system32下. UN ...

  4. Unicode介绍及Unicode编程

    目录 1.什么是Unicode? 2.为什么使用Unicode? 3.Unicode有什么缺点 4.Unicode编程 4.1 C运行时库对Unicode的支持 4.1.1 字符串类型 4.1.2 字 ...

  5. 读书几年收藏的编程利器网站,给大家分享出来

    前言 大家好,我是bigsai,今天给大家分享几个非常适合程序员编程学习的网站. 工欲善其事,必先利其器,有好的武器才能打更好的仗,今天给大家分享一些程序员学习必备的编程学习网站. 像谷歌.知乎.B站 ...

  6. 自学编程,10个程序员学习必收藏的编程网站,你知道几个?

    很多小伙伴在刚开始学习编程的时候,都去找一些网站来提高自己的水平.但现在网络越来越发达,学习类的网站真的是多如牛毛.有的网站真的是非常的优秀,可以让你学到不少的技术,但是同样也有的网站真的是非常的垃圾 ...

  7. [收藏] Java 编程的动态性

    Java 编程的动态性,第 1 部分: 类和类装入 Java编程 的动态性,第 2部分: 引入反射 Java 编程的动态性,第3部分: 应用反射 Java 编程的动态性, 第 4 部分: 用 Java ...

  8. UNICODE编程资料(转贴)

    1. 如何取得一个既包含单字节字符又包含双字节字符的字符串的字符个数? 可以调用Microsoft Visual C++的运行期库包含函数_mbslen来操作多字节(既包括单字节也包括双字节)字符串. ...

  9. 跨平台Unicode编程的一点问题

    最近在做一个跨平台的库,想让这个库支持ANSI和UNICODE,但是在LINUX下不像WINDOWS下有那么多UNICODE的函数可供使用,比如fopen在LINUX下并没有像WINDOWS中一样有一 ...

最新文章

  1. 消除安卓SDK更新时的“https://dl-ssl.google.com refused”异常的方法
  2. 防注入php 留言板代码,简单的 php 防注入代码
  3. 控件制作之design-time attribute
  4. linux网络服务学习笔记--基本网络配置
  5. 借助mapshaper的简化来修复geojson的拓扑错误
  6. 游侠小秘书基本智能框架完成!!!
  7. C# winform 开发总结 -- 【持续更新】
  8. 干货分享! 20种数学建模方法!
  9. 腾讯业务安全岗 IDP 谈话总结
  10. rust腐蚀帧数_腐蚀游戏怎么提高帧数 Rust设置隐藏画质提高FPS教程
  11. 独立游戏开发日志:2021年2月14日 斜面攀爬
  12. MP3 MP5 车机 音视频解码方案设计开发
  13. Python基于WordCloud词云图的数据可视化分析 词云图的基本使用 政府工作报告分析
  14. 去年写的代码大全笔记(其实是摘记)
  15. loadrunner使用web_add_header添加HTTP信息头(比如Content-Type,token等)和使用
  16. 初级程序员 高级程序员_程序员的十大电影
  17. 李航《统计学习方法》读书笔记(1):朴素贝叶斯分类
  18. 驱动开发入门:WDK与VS2010
  19. python对银行工作有用吗_银行工作真的很可怕吗?
  20. 一个简易的c语言卷积或互相关函数写法

热门文章

  1. 如果你一直都是在假装学习,那么你永远不可能进步!
  2. STM32 PLC底层Keil源码 实现三菱FX2N
  3. 数学建模常用模型及代码
  4. 压缩包密码如何解除?
  5. 结构化数据(structured),半结构化数据(semi-structured),非结构化数据(unstructured)...
  6. 欧阳璠——学习分析在计算机支持的协作学习中的应用
  7. 经典算法:Z算法(z algorithm)
  8. 信息隐写--1998年出版高被引论文--on the limits of steganography隐写技术的局限性
  9. ERROR: Failed cleaning build dir for cryptography (mac环境)
  10. 大富翁Deal 维基百科 规则