- 浏览: 79653 次
- 性别:
- 来自: 苏州
文章分类
最新评论
C,C++ 的字符串和操作.
- 博客分类:
- C/C++
C,C++ 的字符串和操作.
1. 字符基础: ASCII, MBCS/DBCS, Unicode
有3种编码模式,并对应3种字符类型。
(1)单字节字符集(single-byte character set (SBCS)).
-在这种编码模式下,所有的字符都只用一个字节(Byte)标示。
-ASCII是SBCS,用一个字节标示为'\0'的来标识SBCS字符串的结束
-单字节字符包含拉丁文字母表,accented characters及ASCII标准和DOS操作系统定义的图形字符。
例如"Hi!"是如下存放的. (1Byte存放数值范围: 00 ~ FF (16进制))
┌─────────────────────────────────┐
Size 1Byte 1Byte 1Byte 1Byte
Memory Content(Hex) 48 69 21 00
Charactor H i !
└─────────────────────────────────┘
(2)多字节字符集(multi-bye character set (MBCS)).
-在Windows中MBCS包含两种字符类型,单字节字符和双字节字符.由于windows使用的多字节字符绝大部分是两个字节长,所以MBCS常被DBCS代替.
-在DBCS编码模式中,一些特定的值被保留用来表明他们是双字节字符的一部分。
例如,在Shift-JIS编码中(一个常用的日文编码模式),0x81-0x9f之间和 0xe0-oxfc之间的值表示"这是一个双字节字符,下一个子节是这个字符的一部分。"这样的值被称作"leading bytes",他们都大于0x7f。跟随在一个
leading byte子节后面的字节被称作"trail byte"。在DBCS中,trail byte可以是任意非0值。像SBCS一样,DBCS字符串的结束标志也是一个单字节表示的0。
-双字节字符被用来表示东亚及中东的语言。
┌─────────────────────────────────┐
Size 2Byte 2Byte 2Byte 2Byte
Memory Content(Hex) C4 E3 BA C3 A3 A1
Charactor 你 好 !
└─────────────────────────────────┘
(3)Unicode。
-Unicode是一种所有的字符都使用两个字节编码的编码模式。Unicode字符有时也被称作宽字符,因为它比单子节字符宽(使用了更多的存储空间)。
-注意,Unicode不能被看作MBCS。MBCS的独特之处在于它的字符使用不同长度的字节编码。Unicode字符串使用两个字节表示的0作为它的结束标志。
-Unicode被用在COM及Windows NT操作系统内部。
┌───────────────────────────────────────┐
Size 2Byte 2Byte 2Byte 2Byte 2Byte
Memory Content(Hex) FF FE 48 00 69 00 21 00 00 00
Charactor H i !
└───────────────────────────────────────┘
FF FE 标示 Unicode 采用的是小头方式. (little endian, 第二个(低位)字节在前)
如果是FE FF 则表示为大头方式. ( big endian unicode ) H 的存储为 00 48;
当使用char时,处理的是单字节字符。双字节字符也用char类型来进行操作(这是我们将会看到的关于双子节字符的很多奇怪的地方之一)。Unicode字符用wchar_t来表示。Unicode字符和字符串常量用前缀L来表示。
例如:
wchar_t wch = L'1'; // 2 bytes, 0x0031
wchar_t *wsz = L"Hello"; // 12 bytes, 6 wide characters
2. C语言中, 没有字符串的数据类型,使用一个以NULL('\0')字符结尾的字符数组来保存字符串。
声明:
char a[100];
//或 char *p=(char *)malloc(100*sizeof(char));
操作:
//字符串初始化:
char a[100]="Hello World!";
char *p="Hello World!";
//赋值: (在定义时可以用"="进行初始化,但是以后不能用"="对C字符串进行赋值.)
strcpy(a,"Ni Hao!");
//获取字符串长度.(不包括 ‘\0’)
strlen(a);
printf("%s",a);
3. 标准 C++ 的字符串数据类型是 string 类. (需要包含头文件<string> 或 <string.h>)
声明:
CString str;
在操作字符串 CString类之前,先了解Windows字符的类型.
┌──────────────────────────────┐
类型 MBCS 中含义 Unicode 中含义
TCHAR char wchar_t
WCHAR wchar_t wchar_t
LPSTR char* char*
LPCSTR const char* const char*
LPWSTR wchar_t* wchar_t*
LPCWSTR const wchar_t* const wchar_t*
LPTSTR TCHAR* TCHAR*
LPCTSTR const TCHAR* const TCHAR*
char 标准c的字符类型(1Byte)
wchar_t 保存UNICODE字符集的类型(2Byte)
└──────────────────────────────┘
TCHAR的定义如下:
#ifdef UNICODE
typedef wchar_t TCHAR;
#else
typedef char TCHAR;
#endif
再了解一个宏_T(),使用宏_T(),使代码有了unicode的意识。
#ifdef UNICODE
#define _T(x) L##x
#else
#define _T(x) x
#endif
##是一个预处理操作符,它可以把两个参数连在一起.
TCHAR str[] = _T("I love c++.");
操作:
//初始化.
//法1)直接初始化:
CString str="Hello World!";
//法2)通过构造函数初始化化:
CString str("aaaaaaaaaa");
CString str('a',10); //长度为10的“aaaaaaaaaa"字符串.
//法3)通过加载字符串资源:
CString str;
str.LoadString(IDS_STR);
//法4)使用CString类的成员函数Format进行初始化:
CString str;
int total=100;
str.Format(_T("The total is %d"), total);
//转化: char* -> CString
char *p1="This is a string in 8-bit only.";
TCHAR *p2=_T("This is a string with unicode-aware.");
LPTSTR p=_T("This is a string with unicode-aware."); //等价于上句.
CString s1=p1;
CString s2(p2);
CString s3(p3);
//转化: CString -> char*
//法1)使用LPCTSTR 操作符.
CString s("Hello World!");
LPCTSTR p=s; //LPCTSTR 操作符(或者更明确地说就是const TCHAR * 操作符)在 CString 类中被重载了,该操作符的定义是返回缓冲区的地址(指向 CString 的 字符串指针).
//法2)使用 CString 对象的 GetBuffer 方法
CString s(_T("Hello World!");
LPTSTR p=s.GetBuffer();
//s.ReleaseBuffer();
//delete p;
//法3)使用控件
CString str;
CListBox *pLB = (CListBox*)GetDlgItem(YOUR_LISTBOX_ID); // 获取你的ListBox对象指针,
//YOUR_LISTBOX_ID为其资源标识
pLB->GetText(pLB->GetCurSel(), str); // 获取当前选项字符串并存储于str中
发表评论
-
C/C++ 习题 : 链表
2012-11-24 17:32 971反转链表. 解答: 首先要明白链表相关的几个基本的概念. ... -
C/C++习题 - 数组 , 指针,取址
2012-11-24 09:51 930题目: #include <stdio.h>voi ... -
C/C++ 基本概念
2012-11-21 19:19 682整理稿: Question ... -
Return to the basic - 容器类(container),迭代器(Iterator)
2012-11-21 14:34 756标准模板库(STL) 的核心内容是3个基本组件: 容器,算法, ... -
Return to the Basic - 类 (class )
2012-05-24 11:38 725创建一个队列类(Queue, FIFO) 声明: clas ... -
Return to the Basic - 虚函数(virtual)
2012-05-26 10:06 679虚函数是指在基类中使用了vitual申明,并且在一个或多个派生 ... -
Return to the Basic - 纯虚函数(pure virtual)和抽象类(abstract class)
2012-05-26 11:27 757纯虚函数(pure virtual function)是指在基 ... -
Return to the Basic - 模板(template)
2012-05-26 12:24 655使用模板可以创建可重用的代码。模板可以分为两类,一个是函数模板 ... -
Return to the Basic - 限定符: const和volatile.
2012-05-28 10:56 697如果在变量申明语句中使用了限定符const, 那么变量在程序执 ... -
(C++)从本机获取WMI数据.
2012-05-30 11:46 1687(C++)从本机获取WMI数据. 下面的步骤被用于执行WMI ...
相关推荐
C++字符串操作的基本指南,新手必读
C语言字符串函数大全C/C++基础 函数名: stpcpy 功 能: 拷贝一个字符串到另一个 用 法: char *stpcpy(char *destin, char *source); 程序例: #include <stdio.h> #include <string.h> int main(void) ...
c/c++字符串操作大全,基本包含了对字符串的全部操作,简单实用。
必须实现如下操作,字符串比较、求串的长度、判断串是否为空、将串置空、字符串赋值(包括两个字符串类复制,一个字符串赋值到CmyString对象)、求字符串中的一个字符或改变字符串中的一个字符(采用重载[]),完成...
【项目资源】:包含前端、后端、移动开发、操作系统、人工智能、物联网、信息化管理、数据库、硬件开发、大数据、课程资源、音视频、网站开发等各种技术项目的源码。包括STM32、ESP8266、PHP、QT、Linux、iOS、C++、...
2. 给定两个字符串A、B,试输入A和B连接后的字符串; 3. 给定字符串A和整数n、m,求出A的第 n 个和第m个字符之间的子串并输出; 4. 给定两个字符串,判断A和B是否相等; 5. 不能利用已有的系统函数实现上述功能...
lchar,wchar_t,CHAR,BYTE,UCHAR,WCHAR,TCHAR,TBYTE char是C语言标准数据类型,字符型,至于由几个字节组成通常由编译器决定,一般一个字节。 wchar_t是char的Unicode版本。...本文档介绍C++字符串操作经验
C++ 字符串使用详解
4字符串转十六进制字符串、二进制字符串 5转义字符串 6随机数 源码包含了封装的功能模块类以及测试类, 全部源码都可以用VS2020编译通过,请放心使用! 友情提示,为了兼顾一些旧代码,预编译头文件用的是StdAfx.h...
string,但是他们的缺点是不能完成汉字各种类型之间的转换,提供三种类库ascString,ucsString,utfString以及工具utfCount,utf8_ucs2_t,tcf8_ucs4_t类库,用于各种字符串之间的直接转换`操作`统计。简化中文软件的...
在不调用string.h库函数的情况下用C语言进行字符串切分,并且不用调用get()函数利用最基本的输入输出语句,实现字符串切分操作
老鼠走迷宫c
dk2j_c_字符串的输入和输出.mp4 dk2j_c_字符型数据.mp4 dk2j_c_实型数据.mp4 dk2j_c_局部变量.mp4 dk2j_c_常量.mp4 dk2j_c_库函数.mp4 dk2j_c_数据输入.mp4 dk2j_c_数据输出.mp4 dk2j_c_整型数据.mp4 dk2j...
字符串的粘贴(全部粘贴、定长粘贴和是否允许字符串中包含空格); 字符串的排序; 代码使用的文件之间调用的方式,最终在主函数被调用使用。 代码基于VS2010编写,在VS2010以下版本可能无法点击工程文件直接运行,...
开始没太多字符串操作,很繁琐、难点也多,后逐渐改进。 典型问题1: sizeof()局限于栈数组 char a[] = "asd213123123"; 形式,并且这种不能用'\0'判断是否结束(这种判断方式能很方便加在while条件中用于判断...
c++字符串string操作集合,字符串操作大全
C语言字符串函数大全 ................................................................................................................ 62 17. C语言宏定义技巧 ..............................................
面试有用的东东。编程常用。编程编程编程编程编程编程编程编程编程编程编程编程编程编程编程