我们是如何做go语言系统测试覆盖率收集的
工程效能领域,测试覆盖率度量总是绕不开的话题,我们也不例外。在七牛云,我们主要使用 go 语言构建云服务,在考虑系统测试覆盖率时,最早也是通过围绕原生go test -c -cover
的能力来构建。这个方案,笔者还曾在 MTSC2018 大会上有过专项分享。其实我们当时已经做了不少自动化工作,能够针对很多类型的代码库,自动插桩服务,自动生成 TestMain()等方法,但随着接入项目越来越多,以及后面使用场景的不断复杂化,我们发现这套还是有其先天局限,会让后面越来越难受:
- 程序必须关闭才能收集覆盖率。如果将这套系统仅定位在收集覆盖率数据上,这个痛点倒也能忍受。但是如果想进一步做精准测试等方向,就很受局限。
- 因为不想污染被测代码库,我们采取了自动化的方式,在编译阶段给每个服务生成类似 main_test.go 文件。但这种方式,其最难受的地方在于 flag 的处理,要知道 go test 命令本身会调用flag.Parse 方法,所以这里需要自动化的修改源码,保证被测程序的 flag 定义,要先于 go test 调用 flag.Parse 之前。但是,随着程序自己使用 flag 姿势的复杂化,我们发现越来越难有通用方案来处理这些 flag,有点难受。
- 受限于
go test -c
命令的先天缺陷,它会给被测程序注入一些测试专属的 flag ,比如-test.coverprofile, -test.timeout 等等。这个是最难受的,因为它会破坏被测程序的启动姿势。我们知道系统测试面对是完整被测集群,如果你需要专门维护一套测试集群来做覆盖率收集时,就会显得非常浪费。好钢就应该用在刀刃上,在七牛云,我们倡导极客文化,追求用工程师思维解决重复问题。而作为业务效率部门,我们自己更应该走在前列。
也是因为以上的种种考量,我们内部一直在优化这一套系统,到今天这一版,我们已从架构和实现原理上完成了颠覆,能够做到无损插桩,运行时分析覆盖率,当属非常优雅。
Goc - A Comprehensive Coverage Testing System for The Go Programming Language
一图胜千言:
使用goc run .
的姿势直接运行被测程序,就能在运行时,通过goc profile
命令方便的得到覆盖率结果。是不是很神奇?是不是很优雅?
这个系统就是goc, 设计上希望完全兼容 go 命令行工具核心命令(go buld/install/run)。使用体验上,也希望向 go 命令行工具靠拢:
以下是goc 1.0 版本支持的功 能:
系统测试覆盖率收集方案
有了 goc,我们再来看如何收集 go 语言系统测试覆盖率。整体比较简单,大体只需要三步:
-
首先通过
goc server
命令部署一个服务注册中心,它将会作为枢纽服务跟所有的被测服务通信。 -
使用
goc build --center="<server>"
命令编译被测程序。goc 不会破坏被测程序的启动方式,所以你可以直接将编译出的二进制发布到集成测试环境。 -
环境部署好之后,就可以做执行任意的系统测试。而在测试期间,可以在任何时间,通过
goc profile --center="<server>"
拿到当前被测集群的覆盖率结果。 是不是很优雅?
goc 核心原理及未来
goc 在设计上,抛弃老的go test -c -cover
模式,而是直接与go tool cover
工具交互,避免因go test
命令引入的一系列弊端。goc 同样没有选择自己做插桩,也是考虑 go 语言的兼容性,以及性能问题,毕竟go tool cover
工具,原生采用结构体来定义 counter 收集器,每个文件都有单独的结构体,性能相对比较可靠。goc 旨在做 go 语言领域综合性的覆盖率工具以 及精准测试系统,其还有很长的路要走:
- 基于 PR 的单测/集测/系统覆盖率增量分析
- 精准测试方向,有一定的产品化设计体验,方便研发与测试日常使用
- 拥抱各种 CICD 系统
当前goc 已经开源了,欢迎感兴趣的同学,前往代码仓库查看详情并 Star 支持。当然,我们更欢迎有志之士,能够参与贡献,和我们一起构建这个有意思的系统。
最后,父亲节快乐!