JavaScript中的转义字符如何使用

开发技术作者：iii 2024-04-22 02:00:01

这篇文章主要介绍“JavaScript中的转义字符如何使用”，在日常操作中，相信很多人在JavaScript中的转义字符如何使用问题上存在疑惑，小编查阅了各式资料，整理出...

这篇文章主要介绍“JavaScript中的转义字符如何使用”，在日常操作中，相信很多人在JavaScript中的转义字符如何使用问题上存在疑惑，小编查阅了各式资料，整理出简单好用的操作方法，希望对大家解答”JavaScript中的转义字符如何使用”的疑惑有所帮助！接下来，请跟着小编一起来学习吧！

字符串中的转义

使用反斜杠来表示转义字符时，主要是在字符串中使用。这里就需要了解字符集和编码等知识，具体可见前文前端开发中需要搞懂的字符编码。

字符集就是字符的集合，最常见的 ASCII字符集、Unicode字符集等：

ASCII的任一个字符都可以被转义，使用的就是反斜杠加上数字编码，特殊的也能使用反斜杠加上字母。

Unicode，也能进行转义，使用则是反斜杠加上码点。由于Unicode包含了ASCII的所有字符，且编码一致，所以都可算编码转义，而现在前端编程所涉及到的已经都是Unicode字符。

一般，反斜杠（\\）在字符串中有特殊的含义，用来和后面的字符一起组合表示一些特殊字符，所以又被称为转义符。

反斜杠后面可以跟着的字符大致有以下几种：

字母
三位八进制
x 加上两位十六进制
Unicode码点

字母

转义字符中最基础的就是：使用反斜杠\\加上字母，表示那些无法输入表示特殊含义的字符，常见的有以下几种：

\\b 后退键
\\f 换页符
\\n 换行符
\\r 回车键
\\t 制表符
\\v 垂直制表符

以前在字符串拼接时，就经常使用\\n、\\t：

  "\\n      " +
  console.log('test') +
  "\\n    "

需要注意的是，这些字母是特殊的可应用于转义的字母。

如果是非特殊字母，加上反斜杠，则会忽略反斜杠，很多字符也是同样忽略反斜杠：

'\\a' // 'a'
'\\"' // '"'
'\\?' // '?'

十六进制数字

十六进制更常用，它的转义规则：\\x<hex>，\\x后跟上2位十六进制数。

因为只有两位，范围是：0x00-0xFF，所以这种方式也只能输出265种字符，其中：

0x00-0x7F 和ASCII码一致
0x80-0x9F 表示控制字符
0xA0-0xFF 表示文字字符

'\\xA9' // '©'
'\\x75' === 'u' // true
'\\x67' // 'g'

八进制数字

反斜杠后面跟3位八进制数()，就代表一个转义字符：

'\\251' // '©'
'\\165' === 'u' // true
'\\106' // 'F'

取值范围：000-377，总共也是有256种字符，其中就包含了所有的ASCII码。

八进制和十六进制能转义的字符是一样的，进行进制转换即可，见前文搞懂JavaScript中的进制与进制转换。

在JS中，用这两种方式的转义字符是相等的：

'\\xA9' === '\\251' // true
'\\200' === '\\x80' // true

Unicode码点

提到Unicode，首先需明确的一点，JS中的字符串是基于Unicode的UTF-16编码方式。

Unicode字符规定了码点和字符平面。

码点使用从U+0000到U+10FFFF的方位来表示所有的字符。

如果直接使用码点来转义所有的Unicode字符，则使用规则：\\u{<hex>}，\\u后跟上1-6位的十六进制：

'\\u{A9}' // '©'
'\\u{597d}' // '好'
'\\u{1f604}' // '????'

字符平面又分为基本平面和非基本平面。

其中对于基本平面(65536个字符)的字符，转义规则：\\u<hex>，\\u后跟上4位十六进制数：

'\\u00A9' // "©"
'\\u0075' === 'u' // true
'\\u597d' // '好'

对于非基本平面的字符，则要使用UTF-16的码元规则，一般是两个码元：\\u<hex>\\u<hex>，\\u后各4位十六进制：

'\\uD83D\\uDE04' // '????'
'\\uD83C\\uDF34' // '????'

只要获取到字符的Unicode编号码点，即可以通过这种方式转义所有的字符。

正则表达式中的转义

在正则表达式中有许多特殊的符号，起着不同的作用，但如果要匹配这些特殊符号本身，就需要用到转义了。

这里的转义字符也是使用反斜杠，后面跟上需要匹配的符号，即可，如：\\+ 匹配加号。

在正则表达式中，需要反斜杠转义匹配的字符，一共是12个：^ . [ $ ( ) | * + ? { \\，这些字符都是正则的特殊字符。

/5$/.test('5$') // false
/5\\$/.test('5$') // true

上面代码，$符号加了转义才能匹配成功，否则不匹配。

当使用RegExp方法时，正则参数是字符串，反斜杠\\需要2个，因为字符串内会先转义一次：

(new RegExp('5$')).test('5$') // false
(new RegExp('5\\$')).test('5$') // false
(new RegExp('5\\\\$')).test('5$') // true

上面代码中，只有第三行因为使用了两个反斜杠，才能转义成功，得到正确的值。

HTML中的转义

HTML中转义字符也是较常见的，主要有三种形式的转义。

最常见的是基于实体名称：

& 后加上实体名称再加上分号 ;：

空格
大于号 > >

实体名称转义以前是为了处理html中的特殊的字符显示问题，比如小于号 <在THML中是作为元素标签的一部分使用的，作为特殊字符，直接输入会出错。

但目前在现代浏览器上，已经能正常显示大于小于号这些符号，可以不使用转义字符。

另两种是基于Unicode码点：

&#x 后加十六进制码点再加上分号 ;：

&#x1f604; => ????
&#x597d; => 好
&#x26; => &

&# 后加十进制的码点再加上分号 ;：

&#128516; => ????
&#22909; => 好
&#38; => &

基于实体名称转义的字符，也是被包含在Unicode字符集中的，所以也可以使用码点来进行转义。

在HTML中最常用到的转义字符，可见下面整理的表格：

字符	名称	名称转义	码点转义
"	双引号	"	"
&	和号	&	&
<	小于号	<	<
>	大于号	>	>
'	单引号	'	'
空格	空格
©	版权号	©	©
￠	分	¢	¢
£	镑	£	£
¥	人名币	¥	¥
$	美元	&dollar;	$
©	版权	©	©
®	注册商标	®	®
×	乘号	×	×
÷	除号	÷	÷

URL转义字符

另外，在web开发中，URL链接也是有编码转义的，特别是针对URL元字符和中文等特殊字符： http://baidu.com/中国 编码转义为 http%3A%2F%2Fbaidu.com%2F%E4%B8%AD%E5%9B%BD

可以使用encodeURIComponent 和 decodeURIComponent 对URL链接进行编解码处理。

URL中的转义规则：根据系统的默认编码(一般是UTF-8)，是使用百分号(%)加上两位的十六进制数。

实际的转义，就是基于Unicode字符的码点，不过与字符串不太一样，这里使用的一般是UTF-8编码方式。

URL部分元字符的转义：

元字符	名称	转义符
+	加号	%2B
空格	空格	%20
/	斜杠	%2F
?	问号	%3F
#	井号	%23
&	和号	%26
=	等号	%3D
:	冒号	%3A
@	at符	%40
,	逗号	%2C
;	分号	%3B

中文等特殊字符则被转义成多个组合：

encodeURIComponent('http://baidu.com/中国????') // 'http%3A%2F%2Fbaidu.com%2F%E4%B8%AD%E5%9B%BD%F0%9F%98%84'

上面代码中，

就有元字符的转义：':' => %3A、'/' => %2F，

而中文则转义成：中 => %E4%B8%AD、国 => %E5%9B%BD，

表情符号转义成：???? => %F0%9F%98%84。

到此，关于“JavaScript中的转义字符如何使用”的学习就结束了，希望能够解决大家的疑惑。理论与实践的搭配能更好的帮助大家学习，快去试试吧！若想继续学习更多相关知识，请继续关注捷杰建站网站，小编会继续努力为大家带来更多实用的文章！

原创声明

本站部分文章基于互联网的整理，我们会把真正“有用/优质”的文章整理提供给各位开发者。本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。

本文链接：http://www.jiecseo.com/news/show_15550.html

JavaScript中的转义字符如何使用

字符串中的转义

字母

十六进制数字

八进制数字

Unicode码点

正则表达式中的转义

HTML中的转义

URL转义字符

猜你喜欢

相关新闻

推荐模板

推荐精华

热门标签