文法是编译原理中对语言的写法的一种规定,一般来说,文法分成词法和语法两种。
词法规定了语言的最小语义单元:token(之前的了解是前后端一个标志值,了解的太少了)
JavaScript 源代码中的输入可以这样分类:
WhiteSpace 空白字符
LineTerminator 换行符
Comment 注释
Token 词
1.空白符号 Whitespace 常见:空格
2.换行符 LineTerminator 常见:回车 \n \r\n
3.注释 Comment 常见:// /* */
4.标识符名称 IdentifierName 常见:美元符“$”、下划线“_”或者 Unicode 字母开始或者
关键字
await break case catch class const continue debugger default delete do else export extends finally for function if import instance of new return super switch this throw try typeof var void while with yield
特殊:
enum
额外特殊:
implements package protected interface private public
符号 Punctuator
{ ( ) [ ] . ... ; , < > <= >= == != === !== + - * % ** ++ -- << >> >>> & | ^ ! ~ && || ? : = += -= *= %= **= <<= >>= >>>= &= |= ^= => / /= }
数字直接量 NumericLiteral
举例:
十进制的 Number 可以带小数,小数点前后部分都可以省略,但是不能同时省略
.01
12.
12.01
因此12.toString()要写成12 .toString()
字符串直接量 StringLiteral
JavaScript 中的 StringLiteral 支持单引号和双引号两种写法。
在双引号字符串直接量中,双引号必须转义,在单引号字符串直接量中,单引号必须转义。字符串中其他必须转义的字符是\和所有换行符
正则表达式直接量 RegularExpressionLiteral
正则表达式由 Body 和 Flags 两部分组成
/RegularExpressionBody/g
其中 Body 部分至少有一个字符,第一个字符不能是 *(因为 /* 跟多行注释有词法冲突)
字符串模板 Template
`Hello, ${name}`
“ ${ } ”内部可以放任何 JavaScript 表达式代码,而这些代码是以“ } ” 结尾的,也就是说,这部分词法不允许出现“ } ”运算符
是否允许“ } ”的两种情况,与除法和正则表达式的两种情况相乘就是四种词法定义,所以你在 JavaScript 标准中,可以看到四种定义:InputElementDiv;InputElementRegExp;InputElementRegExpOrTemplateTail;InputElementTemplateTail。为了解决这两个问题,标准中还不得不把除法、正则表达式直接量和“ } ”从 token 中单独抽出来,用词上,也把原本的 Token 改为 CommonToken。
总结:以上对JavaScript的词法有了更深的梳理,很多很细节很有内涵很有深度的知识点,给了我很大的启发
此文章为3月Day16学习笔记,内容来源于极客时间《重学前端》,推荐该课程。