当一个项目开发时间较长以后,总会存在一些重复的代码,这就给维护和扩展带来障碍。
特别是我们的前端项目,多个项目中都存在一些较相似的功能,这部分之前不少采用复制粘贴的方式处理。于是为了优化前端项目的代码,最近我们考虑使用代码重复度来作为衡量指标,对单个或多个项目进行重复代码的统计,并着手重构可优化的重复代码。
而为了统计项目中是否有代码重复,我们使用了 jscpd
工具库,本文将详细介绍该工具的使用方法。
jscpd是一个开源的js工具库,用于检测项目的代码重复率,针对复制粘贴的代码尤其有效,支持超过150种的源码文件格式。
我们在前端项目中,无论是原生的javascript、css、html代码,还是使用typescript、less、vue、react等代码,都能较好的识别出项目中的重复代码。
当然,这里的重复,更多的指代码完全重复,即代码行与代码字符串,都相同。
下面,先看下如何使用它。
我们先以全局方式,安装该工具库:
npm install jscpd -g
安装成功后,系统就有一个全局命令 jscpd
,可以查看版本号,当前最新版本是 3.5.3
,如下所示:
$ jscpd -V
3.5.3
安装成功后,我们就可以很方便的使用它。
例如,我们需要统计一个文件 app.js
,只需要在文件目录执行以下命令:
jscpd ./app.js
执行成功后,在命令行界面会显示结果,如下图所示:
图中的内容,我们下面一一做个说明说明:
Clone found (javascript)
HTML report saved to report\html\
report\html\
目录下,用于在页面中展示结果。Format
javascript
,还可以是 typescript
、tsx
等。Files analyzed
Total lines
Total tokens
标识符/变量等
、数字
、字符串
、空格
或 符号
等等作为一个 token
来统计数量。Clones found
Duplicated lines
Total
行里,重复代码的占比就是代码行的重复度了,这里是18.1%。Duplicated tokens
Found 0 clones
Detection time
由此可知,./app.js
检测1个文件,发现了1个重复快,在总行数为105行的代码中,共有19行代码完全重复,重复度为 18.1%
。
以上示例是比较简单的,直接检测单个文件,通过命令行检测单个文件,打印结果,并默认生成report报告的页面。
如果是在当前主流的前端项目中,由于很多文件是辅助工具如依赖包、构建、文档等,并不是有效的代码,需要排除。这种情况下,我们一般使用配置文件的方式,通过选项配置规范 jscpd
的使用场景。
jscpd
的配置选项可以通过以下两种方式创建:
.jscpd.json
,然后在该文件中增加具体的配置选项;package.json
文件中添加如果项目根目录下没有
package.json
文件,可以自行添加一个,然后在该件中个增加对应的配置。
无论是Vue还是React项目,使用大致都一样,如下,在 package.json
中增加 jscpd
配置属性:
"jscpd": {"threshold": 1,"reporters": ["html","console"],"ignore": [".git","node_modules","public",".husky"],"format": ["javascript", "typescript"],"absolute": true
}
以上是一个常用的配置,具体说明:
ERROR: jscpd found too many duplicates (18.1%) over threshold (1%)
。html
页面json
格式的文件报告xml
格式的文件报告csv
格式的文件报告md
格式的文件报告debug
信息javascript
、typescript
、css
等除此以外,还有很多配置属性,我们这里不在一一介绍。
上面介绍会输出重复度检测报告,我们在项目中设置好配置文件以后,执行以下命令:
jscpd ./src -o 'report'
项目中的业务代码,通常会选择放在 ./src
目录下,所以我们可以直接检测该目录。
-o 'report'
通过命令行参数,输出检测报告到项目根目录下的 report
文件夹中——当然也可以自定义目录,这时候就会生成对应的页面文件:
如上所示,本质上是一个本地网页,而且是基于 VUE
框架创建的网页,可以在浏览器访问查看,界面长这样:
从上图可知,检测了149个文件,其中存在8块拷贝复制的代码,代码行计算的重复度是 1.18%
,非常直观。
通过生成本地网页直接展示所有的检测报告,并且还能查看到重复的代码具体在哪:
上图可以看到,在两个 tsx
组件文件中,存在一段重复的代码,也标识除了这两段代码在这两个文件中的具体行数,非常直观方便。
上面介绍的是单个项目的重复度检测,如果有多个项目,且存在代码的复制粘贴现象,也可以通过jscpd工具进行检测处理。
我们只需要在多个项目的上层目录下新建一个 package.json
文件,设置相应的配置选项,就能根据设置检测这些项目间的重复代码。这里需要注意的是,一般只需要检测业务代码 src
,所以在配置文件中 ignore
属性的忽略目录,需要带上各自项目的项目名称。
"ignore": ["project1/.git","project1/node_modules","project2/.git","project2/node_modules"// ...
]
这样,就能快速检测出多个项目中的重复代码,仍然可在命令行输出基本信息,以及对应的report页面报告。
当我们使用jscpd执行项目的重复度检测时,由于一些重复代码可能是必要的,不想检测,可以使用代码注释标识的方式,让这部分代码不用检测。
在代码的首尾位置添加相应注释,jscpd:ignore-start
和 jscpd:ignore-end
,包裹代码即可。
如在js代码中,可以这样使用:
/* jscpd:ignore-start */
import { provide, computed, watch, onMounted, defineComponent } from 'vue'
import { useStore } from 'vuex'
/* jscpd:ignore-end */
在css及各种预处理中,也是与js中的用法一样:
/* jscpd:ignore-start */
.content {height: 100vh;width: 100vw;display: flex;justify-content: center;align-items: center;overflow: hidden;
}
/* jscpd:ignore-end */
如下在html中的使用:
通过以上注释标识以后,这部分的代码就不会再被统计为重复代码了。
以上可知,jscpd工具的使用是非常简单的,只需要少许配置就能输出比较直观的代码数据,方便我们统计代码的重复度。
知道了项目中的重复代码,给我们优化代码结构,提炼代码逻辑,增强代码的可维护性、可扩展性和可复用性方面,都能带来比较多的好处,研发效率的提高也是随之而来的。
但需要知道的是,该工具统计的都是代码完全相同情形下的重复,如果有变量名或标识符改动的则难以检测到,就更别提代码逻辑上的重复了。