C#语言学习笔记16 —— string 类型的几个小知识

在 C# 语言里,string 和 System.String 一样吗? string 有多种字面量(literal),原始字符串字面量(Raw string literals)的规则有哪些? string 类型的 Length 属性为什么不一定等于字符个数? 下面整理一些网络上的文档,分别给出答案。

string 和 String 的关系

string 是 C# 的关键字,表示 string 类型,即字符串类型。

String 全名为 System.String,是 dotnet 的字符串类型。

string 是 System.String 的别名,两者是同一个东西,完全一样。

string 可以直接使用;String 在一些环境下,有时需要写全名 System.String 或先使用 using System;

C# 的三种字符串字面量(literal)

字面量(literal),指的是直接把值写在代码里的文本(源代码)形式。

(1)带引号的字符串字面量(Quoted string literals)

字符串用双引号 " 包括起来。只能写在一行里。特殊字符需要转义。

下面是一些例子,代码在 C# Interactive 窗口执行,后面的一些例子也是的。

(2)逐字字符串字面量(Verbatim string literals)

字符串用 @ 做前导和双引号 " 包括起来。可以写在多行里。只有 " 字符需要转义(双写)。

(3)原始字符串字面量(Raw string literals)

从 C# 11 开始, 可以使用原始字符串字面量。

字符串用三个以上双引号 " 包括起来。可以写在多行里。字符不需要转义。

另外增加了一些规则,使得它更加实用。

  • 单行时,左引号和右引号必须在同一行上。
  • 多行时,遵循以下规则
  1. 左引号和右引号都单独一行。
  2. 左引号右边的空白不算。
  3. 右引号左边的空白不算。
  4. 中间每行不能比右引号更左。
  5. 中间每行到右引号等距离的空白不算。

粗看规则好像比较复杂,但你看到具体结果时,你肯定觉得这效果就是你所希望的。

如果有编译错误,对一下规则。

C#中的代理字符与组合字符

string 是字符串类型,表示文本。内部是一个元素为 Char 类型的数组。Char 类型为 2 个字节,16 位。

string 的 Length 属性,指的是 Char 的个数。

Char 是 unicode-16 编码,能表示世界上大部分常见文字字符,但不是全部。

string 里面可能包含代理字符和组合字符(surrogate and combining characters)。Char 的个数和字符个数有时并不相等。

在一些语言(如欧洲和阿拉伯等等)有时可能会包含代理字符和组合字符。

需要处理单个 Unicode 字符时,可使用 StringInfo 类(命名空间 System.Globalization)。

结束语

string 字符串类型,应该算是 C# 语言最基本的类型了。在使用字符串时,有一些细节需要我们注意。

原文链接:,转发请注明来源!