在 C# 语言里,string 和 System.String 一样吗? string 有多种字面量(literal),原始字符串字面量(Raw string literals)的规则有哪些? string 类型的 Length 属性为什么不一定等于字符个数? 下面整理一些网络上的文档,分别给出答案。
string 和 String 的关系
string 是 C# 的关键字,表示 string 类型,即字符串类型。
String 全名为 System.String,是 dotnet 的字符串类型。
string 是 System.String 的别名,两者是同一个东西,完全一样。
string 可以直接使用;String 在一些环境下,有时需要写全名 System.String 或先使用 using System;
C# 的三种字符串字面量(literal)
字面量(literal),指的是直接把值写在代码里的文本(源代码)形式。
(1)带引号的字符串字面量(Quoted string literals)
字符串用双引号 " 包括起来。只能写在一行里。特殊字符需要转义。
下面是一些例子,代码在 C# Interactive 窗口执行,后面的一些例子也是的。
(2)逐字字符串字面量(Verbatim string literals)
字符串用 @ 做前导和双引号 " 包括起来。可以写在多行里。只有 " 字符需要转义(双写)。
(3)原始字符串字面量(Raw string literals)
从 C# 11 开始, 可以使用原始字符串字面量。
字符串用三个以上双引号 " 包括起来。可以写在多行里。字符不需要转义。
另外增加了一些规则,使得它更加实用。
- 单行时,左引号和右引号必须在同一行上。
- 多行时,遵循以下规则
- 左引号和右引号都单独一行。
- 左引号右边的空白不算。
- 右引号左边的空白不算。
- 中间每行不能比右引号更左。
- 中间每行到右引号等距离的空白不算。
粗看规则好像比较复杂,但你看到具体结果时,你肯定觉得这效果就是你所希望的。
如果有编译错误,对一下规则。
C#中的代理字符与组合字符
string 是字符串类型,表示文本。内部是一个元素为 Char 类型的数组。Char 类型为 2 个字节,16 位。
string 的 Length 属性,指的是 Char 的个数。
Char 是 unicode-16 编码,能表示世界上大部分常见文字字符,但不是全部。
string 里面可能包含代理字符和组合字符(surrogate and combining characters)。Char 的个数和字符个数有时并不相等。
在一些语言(如欧洲和阿拉伯等等)有时可能会包含代理字符和组合字符。
需要处理单个 Unicode 字符时,可使用 StringInfo 类(命名空间 System.Globalization)。
结束语
string 字符串类型,应该算是 C# 语言最基本的类型了。在使用字符串时,有一些细节需要我们注意。