- Go 语言编译原理与优化
- 编译阶段 (Compilation)
- debug 参数
- 优化和内联
- 逃逸分析
- 链接阶段 (Linking)
- 关于 CGO
- internal linking
- external linking
- static link
- ldflags 其它常用参数
- 使用 Docker 编译
- 参考资料
- 编译阶段 (Compilation)
Go 语言编译原理与优化
编译阶段 (Compilation)
debug 参数
-m 打印编译器更多想法的细节
-gcflags '-m'
-S 打印汇编
-gcflags '-S'
优化和内联
默认开启了优化和内联,但是debug的时候开启可能会出现一些奇怪的问题,通过下面的参数可以禁止任何优化
-gcflags '-N -l'
内联级别:
-gcflags='-l -l'内联级别2,更积极,可能更快,可能会制作更大的二进制文件。-gcflags='-l -l -l'内联级别3,再次更加激进,二进制文件肯定更大,也许更快,但也许会有 bug。-gcflags=-l=4(4个-l)在 Go 1.11 中将支持实验性的中间栈内联优化。
逃逸分析
- 如果一个局部变量值超越了函数调用的生命周期,编译器自动将它逃逸到堆
- 如果一个通过new或make来分配的对象,在函数内即使将指针传递给了其它函数,其它函数会被内联到当前函数,相当于指针不会逃逸出本函数,最终不返回指针的话,该指针对应的值也都会分配在栈上,而不是在堆
链接阶段 (Linking)
- Go 支持 internal 和 external 两种链接方式: internal 使用 go 自身实现的 linker,external 需要启动外部的 linker
- linker 的主要工作是将
.o(object file) 链接成最终可执行的二进制 - 对应命令:
go tool link,对应源码:$GOROOT/src/cmd/link - 通过
-ldflags给链接器传参,参数详见:go tool link --help
关于 CGO
- 启用cgo可以调用外部依赖的c库
- go的编译器会判断环境变量
CGO_ENABLED来决定是否启用cgo,默认CGO_ENABLED=1即启用cgo - 源码文件头部的
build tag可以根据cgo是否启用决定源码是否被编译(// +build cgo表示希望cgo启用时被编译,相反的是// +build !cgo) - 标准库中有部分实现有两份源码,比如:
$GOROOT/src/os/user/lookup_unix.go和$GOROOT/src/os/user/cgo_lookup_unix.go,它们有相同的函数,但实现不一样,前者是纯go实现,后者是使用cgo调用外部依赖来实现,标准库中使用cgo比较常见的是net包。
internal linking
- link 默认使用 internal 方式
- 直接使用 go 本身的实现的 linker 来链接代码,
- 功能比较简单,仅仅是将
.o和预编译的.a写到最终二进制文件中(.a文件在$GOROOT/pkg和$GOPATH/pkg中,其实就是.o文件打包的压缩包,通过tar -zxvf可以解压出来查看)
external linking
- 会启动外部 linker (gcc/clang),通过
-ldflags '-linkmode "external"'启用 external linking - 通过
-extldflags给外部 linker 传参,比如:-ldflags '-linkmode "external" -extldflags "-static"'
static link
go编译出来就是一个二进制,自带runtime,不需要解释器,但并不意味着就不需要任何依赖,但也可以通过静态链接来做到完全不用任何依赖,全部”揉“到一个二进制文件中。实现静态链接的方法:
- 如果是
external linking,可以这样:-ldflags '-linkmode external -extldflags -static' - 如果用默认的
internal linking,可以这样:-ldflags '-d'
ldflags 其它常用参数
-s -w是去除符号表和DWARF调试信息(可以减小二进制体积,但不利于调试,可在用于生产环境),示例:-ldflags '-s -w'-X可以给变量注入值,比如编译时用脚本动态注入当前版本和commit id到代码的变量中,通常程序的version子命令或参数输出当前版本信息时就用这种方式实现,示例:-ldflags '-X myapp/pkg/version/version=v1.0.0'
使用 Docker 编译
使用 Docker 编译可以不用依赖本机 go 环境,将编译环境标准化,特别在有外部动态链接库依赖的情况下很有用,可以直接 run 一个容器来编译,给它挂载源码目录和二进制输出目录,这样我们就可以拿到编译出来的二进制了,这里以编译cfssl为例:
ROOT_PKG=github.com/cloudflare/cfsslCMD_PKG=$ROOT_PKG/cmdLOCAL_SOURCE_PATH=/Users/roc/go/src/$ROOT_PKGLOCAL_OUTPUT_PATH=$PWDGOPATH=/go/srcROOT_PATH=$GOPATH/$ROOT_PKGCMD_PATH=$GOPATH/$CMD_PKGdocker run --rm \-v $LOCAL_SOURCE_PATH:$ROOT_PATH \-v $LOCAL_OUTPUT_PATH:/output \-w $ROOT_PATH \golang:1.13 \go build -v \-ldflags '-d' \-o /output/ \$CMD_PATH/...
编译镜像可以参考下面示例(使用docker多阶段构建,完全静态编译,没有外部依赖):
FROM golang:1.12-stretch as builderMAINTAINER rockerchen@tencent.comENV BUILD_DIR /go/src/cloud.tencent.com/qc_container_cluster/hpa-metrics-serverWORKDIR $BUILD_DIRCOPY ./ $BUILD_DIRRUN CGO_ENABLED=0 go build -v -o /hpa-metrics-server \-ldflags '-d' \./FROM ubuntu:16.04MAINTAINER rockerchen@tencent.comRUN apt-get update -yRUN DEBIAN_FRONTEND=noninteractive apt-get install -y curl iproute2 inetutils-tools telnet inetutils-pingRUN apt-get install --no-install-recommends --no-install-suggests ca-certificates -yCOPY --from=builder /hpa-metrics-server /hpa-metrics-serverRUN chmod a+x /hpa-metrics-server
参考资料
- Go 性能调优之 —— 编译优化: https://segmentfault.com/a/1190000016354799
