教程集 www.jiaochengji.com
教程集 >  Golang编程  >  golang教程  >  正文 go 只使用函数返回的一个值_详解二:Go 语言机制之逃逸分析

go 只使用函数返回的一个值_详解二:Go 语言机制之逃逸分析

发布时间:2021-12-09   编辑:jiaochengji.com
教程集为您提供go 只使用函数返回的一个值,详解二:Go 语言机制之逃逸分析等资源,欢迎您收藏本站,我们将为您提供最新的go 只使用函数返回的一个值,详解二:Go 语言机制之逃逸分析资源
<h2>前序(Prelude)</h2>

本系列文章总共四篇,主要帮助大家理解 Go 语言中一些语法结构和其背后的设计原则,包括指针、栈、堆、逃逸分析和值/指针传递。这是第二篇,主要介绍堆和逃逸分析。

以下是本系列文章的索引:

<ol><li>Go 语言机制之栈与指针</li><li>Go 语言机制之逃逸分析</li><li>Go 语言机制之内存剖析</li><li>Go 语言机制之数据和语法的设计哲学</li></ol><h2>介绍(Introduction)</h2>

在四部分系列的第一部分,我用一个将值共享给 goroutine 栈的例子介绍了指针结构的基础。而我没有说的是值存在栈之上的情况。为了理解这个,你需要学习值存储的另外一个位置:堆。有这个基础,就可以开始学习逃逸分析。

逃逸分析是编译器用来决定你的程序中值的位置的过程。特别地,编译器执行静态代码分析,以确定一个构造体的实例化值是否会逃逸到堆。在 Go 语言中,你没有可用的关键字或者函数,能够直接让编译器做这个决定。只能够通过你写代码的方式来作出这个决定。

<h2>堆(Heaps)</h2>

堆是内存的第二区域,除了栈之外,用来存储值的地方。堆无法像栈一样能自清理,所以使用这部分内存会造成很大的开销(相比于使用栈)。重要的是,开销跟 GC(垃圾收集),即被牵扯进来保证这部分区域干净的程序,有很大的关系。当垃圾收集程序运行时,它会占用你的可用 CPU 容量的 25%。更有甚者,它会造成微秒级的 “stop the world” 的延时。拥有 GC 的好处是你可以不再关注堆内存的管理,这部分很复杂,是历史上容易出错的地方。

在 Go 中,会将一部分值分配到堆上。这些分配给 GC 带来了压力,因为堆上没有被指针索引的值都需要被删除。越多需要被检查和删除的值,会给每次运行 GC 时带来越多的工作。所以,分配算法不断地工作,以平衡堆的大小和它运行的速度。

<h2>共享栈(Sharing Stacks)</h2>

在 Go 语言中,不允许 goroutine 中的指针指向另外一个 goroutine 的栈。这是因为当栈增长或者收缩时,goroutine 中的栈内存会被一块新的内存替换。如果运行时需要追踪指针指向其他的 goroutine 的栈,就会造成非常多需要管理的内存,以至于更新指向那些栈的指针将使 “stop the world” 问题更严重。

这里有一个栈被替换好几次的例子。看输出的第 2 和第 6 行。你会看到 main 函数中的栈的字符串地址值改变了两次。https://play.golang.org/p/pxn5u4EBSI

<h2>逃逸机制(Escape Mechanics)</h2>

任何时候,一个值被分享到函数栈帧范围之外,它都会在堆上被重新分配。这是逃逸分析算法发现这些情况和管控这一层的工作。(内存的)完整性在于确保对任何值的访问始终是准确、一致和高效的。

通过查看这个语言机制了解逃逸分析。https://play.golang.org/p/Y_VZxYteKO

<h3>清单 1</h3>
<pre class="has"><code>package main type user struct { name string email string } func main() { u1 := createUserV1() u2 := createUserV2() println("u1", &u1, "u2", &u2) } //go:noinline func createUserV1() user { u := user{ name: "Bill", email: "bill@ardanlabs.com", } println("V1", &u) return u } //go:noinline func createUserV2() *user { u := user{ name: "Bill", email: "bill@ardanlabs.com", } println("V2", &u) return &u } </code></pre>

我使用 <code>go:noinline</code> 指令,阻止在 <code>main</code> 函数中,编译器使用内联代码替代函数调用。内联(优化)会使函数调用消失,并使例子复杂化。我将在下一篇博文介绍内联造成的副作用。

在表 1 中,你可以看到创建 <code>user</code> 值,并返回给调用者的两个不同的函数。在函数版本 1 中,返回值。

<h3>清单 2</h3>
<pre class="has"><code>16 func createUserV1() user { 17 u := user{ 18 name: "Bill", 19 email: "bill@ardanlabs.com", 20 } 21 22 println("V1", &u) 23 return u 24 }</code></pre>

我说这个函数返回的是值是因为这个被函数创建的 <code>user</code> 值被拷贝并传递到调用栈上。这意味着调用函数接收到的是这个值的拷贝。

你可以看下第 17 行到 20 行 <code>user</code> 值被构造的过程。然后在第 23 行,<code>user</code> 值的副本被传递到调用栈并返回给调用者。函数返回后,栈看起来如下所示。

<h3>图 1</h3>

你可以看到图 1 中,当调用完 <code>createUserV1</code> ,一个 <code>user</code> 值同时存在(两个函数的)栈帧中。在函数版本 2 中,返回指针。

<h3>清单 3</h3>
<pre class="has"><code>27 func createUserV2() *user { 28 u := user{ 29 name: "Bill", 30 email: "bill@ardanlabs.com", 31 } 32 33 println("V2", &u) 34 return &u 35 }</code></pre>

我说这个函数返回的是指针是因为这个被函数创建的 <code>user</code> 值通过调用栈被共享了。这意味着调用函数接收到一个值的地址拷贝。

你可以看到在第 28 行到 31 行使用相同的字段值来构造 <code>user</code> 值,但在第 34 行返回时却是不同的。不是将 <code>user</code> 值的副本传递到调用栈,而是将 <code>user</code> 值的地址传递到调用栈。基于此,你也许会认为栈在调用之后是这个样子。

<h3>图 2</h3>

如果看到的图 2 真的发生的话,你将遇到一个问题。指针指向了栈下的无效地址空间。当 <code>main</code> 函数调用下一个函数,指向的内存将重新映射并将被重新初始化。

这就是逃逸分析将开始保持完整性的地方。在这种情况下,编译器将检查到,在 <code>createUserV2</code> 的(函数)栈中构造 <code>user</code> 值是不安全的,因此,替代地,会在堆中构造(相应的)值。这(个分析并处理的过程)将在第 28 行构造时立即发生。

<h2>可读性(Readability)</h2>

在上一篇博文中,我们知道一个函数只能直接访问它的(函数栈)空间,或者通过(函数栈空间内的)指针,通过跳转访问(函数栈空间外的)外部内存。这意味着访问逃逸到堆上的值也需要通过指针跳转。

记住 <code>createUserV2</code> 的代码的样子:

<h3>清单 4</h3>
<pre class="has"><code>27 func createUserV2() *user { 28 u := user{ 29 name: "Bill", 30 email: "bill@ardanlabs.com", 31 } 32 33 println("V2", &u) 34 return &u 35 }</code></pre>

语法隐藏了代码中真正发生的事情。第 28 行声明的变量 <code>u</code> 代表一个 <code>user</code> 类型的值。Go 代码中的类型构造不会告诉你值在内存中的位置。所以直到第 34 行返回类型时,你才知道值需要逃逸(处理)。这意味着,虽然 <code>u</code> 代表类型 <code>user</code> 的一个值,但对该值的访问必须通过指针进行。

你可以在函数调用之后,看到堆栈就像(图 3)这样。

<h3>图 3</h3>

在 <code>createUserV2</code> 函数栈中,变量 <code>u</code> 代表的值存在于堆中,而不是栈。这意味着用 <code>u</code> 访问值时,使用指针访问而不是直接访问。你可能想,为什么不让 <code>u</code> 成为指针,毕竟访问它代表的值需要使用指针?

<h3>清单 5</h3>
<pre class="has"><code>27 func createUserV2() *user { 28 u := &user{ 29 name: "Bill", 30 email: "bill@ardanlabs.com", 31 } 32 33 println("V2", u) 34 return u 35 }</code></pre>

如果你这样做,将使你的代码缺乏重要的可读性。(让我们)离开整个函数一秒,只关注 <code>return</code>。

<h3>清单 6</h3>
<pre class="has"><code>34 return u 35 }</code></pre>

这个 <code>return</code> 告诉你什么了呢?它说明了返回 <code>u</code> 值的副本给调用栈。然而,当你使用 <code>&</code> 操作符,<code>return</code> 又告诉你什么了呢?

<h3>清单 7</h3>
<pre class="has"><code>34 return &u 35 }</code></pre>

多亏了 <code>&</code> 操作符,<code>return</code> 告诉你 <code>u</code> 被分享给调用者,因此,已经逃逸到堆中。记住,当你读代码的时候,指针是为了共享,<code>&</code> 操作符对应单词 "sharing"。这在提高可读性的时候非常有用,这(也)是你不想失去的部分。

<h3>清单 8</h3>
<pre class="has"><code>01 var u *user 02 err := json.Unmarshal([]byte(r), &u) 03 return u, err</code></pre>

为了让其可以工作,你一定要通过共享指针变量(的方式)给(函数) <code>json.Unmarshal</code>。<code>json.Unmarshal</code> 调用时会创建 <code>user</code> 值并将其地址赋值给指针变量。https://play.golang.org/p/koI8EjpeIx

代码解释:

01:创建一个类型为 <code>user</code>,值为空的指针。 02:跟函数 <code>json.Unmarshal</code> 函数共享指针。 03:返回 <code>u</code> 的副本给调用者。

这里并不是很好理解,<code>user</code>值被 <code>json.Unmarshal</code> 函数创建,并被共享给调用者。

如何在构造过程中使用语法语义来改变可读性?

<h3>清单 9</h3>
<pre class="has"><code>01 var u user 02 err := json.Unmarshal([]byte(r), &u) 03 return &u, err</code></pre>

代码解释:

01:创建一个类型为 <code>user</code>,值为空的变量。 02:跟函数 <code>json.Unmarshal</code> 函数共享 <code>u</code>。 03:跟调用者共享 <code>u</code>。

这里非常好理解。第 02 行共享 <code>user</code> 值到调用栈中的 <code>json.Unmarshal</code>,在第 03 行 <code>user</code> 值共享给调用者。这个共享过程将会导致 <code>user</code> 值逃逸。

在构建一个值时,使用值语义,并利用 <code>&</code> 操作符的可读性来明确值是如何被共享的。

<h2>编译器报告(Compiler Reporting)</h2>

想查看编译器(关于逃逸分析)的决定,你可以让编译器提供一份报告。你只需要在调用 <code>go build</code> 的时候,打开 <code>-gcflags</code> 开关,并带上 <code>-m</code> 选项。

实际上总共可以使用 4 个 <code>-m</code>,(但)超过 2 个级别的信息就已经太多了。我将使用 2 个 <code>-m</code> 的级别。

<h3>清单 10</h3>
<pre class="has"><code>$ go build -gcflags "-m -m" ./main.go:16: cannot inline createUserV1: marked go:noinline ./main.go:27: cannot inline createUserV2: marked go:noinline ./main.go:8: cannot inline main: non-leaf function ./main.go:22: createUserV1 &u does not escape ./main.go:34: &u escapes to heap ./main.go:34: from ~r0 (return) at ./main.go:34 ./main.go:31: moved to heap: u ./main.go:33: createUserV2 &u does not escape ./main.go:12: main &u1 does not escape ./main.go:12: main &u2 does not escape </code></pre>

你可以看到编译器报告是否需要逃逸处理的决定。编译器都说了什么呢?请再看一下引用的 <code>createUserV1</code> 和 <code>createUserV2</code> 函数。

<h3>清单 13</h3>
<pre class="has"><code>16 func createUserV1() user { 17 u := user{ 18 name: "Bill", 19 email: "bill@ardanlabs.com", 20 } 21 22 println("V1", &u) 23 return u 24 } 27 func createUserV2() *user { 28 u := user{ 29 name: "Bill", 30 email: "bill@ardanlabs.com", 31 } 32 33 println("V2", &u) 34 return &u 35 }</code></pre>

从报告中的这一行开始。

<h3>清单 14</h3>
<pre class="has"><code>./main.go:22: createUserV1 &u does not escape</code></pre>

这是说在函数 <code>createUserV1</code> 调用 <code>println</code> 不会造成 <code>user</code> 值逃逸到堆。这是必须检查的,因为它将会跟函数 <code>println</code> 共享(<code>u</code>)。

接下来看报告中的这几行。

<h3>清单 15</h3>
<pre class="has"><code>./main.go:34: &u escapes to heap ./main.go:34: from ~r0 (return) at ./main.go:34 ./main.go:31: moved to heap: u ./main.go:33: createUserV2 &u does not escape </code></pre>

这几行是说,类型为 <code>user</code>,并在第 31 行被赋值的 <code>u</code> 的值,因为第 34 行的 <code>return</code> 逃逸。最后一行是说,跟之前一样,在 33 行调用 <code>println</code> 不会造成 <code>user</code> 值逃逸。

阅读这些报告可能让人感到困惑,(编译器)会根据所讨论的变量的类型是基于值类型还是指针类型而略有变化。

将 <code>u</code> 改为指针类型的 <code>*user</code>,而不是之前的命名类型 <code>user</code>。

<h3>清单 16</h3>
<pre class="has"><code>27 func createUserV2() *user { 28 u := &user{ 29 name: "Bill", 30 email: "bill@ardanlabs.com", 31 } 32 33 println("V2", u) 34 return u 35 }</code></pre>

再次生成报告。

<h3>清单 17</h3>
<pre class="has"><code>./main.go:30: &user literal escapes to heap ./main.go:30: from u (assigned) at ./main.go:28 ./main.go:30: from ~r0 (return) at ./main.go:34 </code></pre>

现在报告说在 28 行赋值的指针类型 <code>*user</code>,<code>u</code> 引用的 <code>user</code> 值,因为 34 行的 <code>return</code> 逃逸。

<h2>结论</h2>

值在构建时并不能决定它将存在于哪里。只有当一个值被共享,编译器才能决定如何处理这个值。当你在调用时,共享了栈上的一个值时,它就会逃逸。在下一篇中你将探索一个值逃逸的其他原因。

这些文章试图引导你选择给定类型的值或指针的指导原则。每种方式都有(对应的)好处和(额外的)开销。保持在栈上的值,减少了 GC 的压力。但是需要存储,跟踪和维护不同的副本。将值放在堆上的指针,会增加 GC 的压力。然而,也有它的好处,只有一个值需要存储,跟踪和维护。(其实,)最关键的是如何保持正确地、一致地以及均衡(开销)地使用。


首发于: https://studygolang.com/articles/12444

作者:William Kennedy

译者:gogeof

校对:polaris1119

本文由 GCTT 原创编译,Go语言中文网 荣誉推出

了解更多Go资讯,欢迎关注微信公众号:Go语言中文网

到此这篇关于“go 只使用函数返回的一个值_详解二:Go 语言机制之逃逸分析”的文章就介绍到这了,更多文章或继续浏览下面的相关文章,希望大家以后多多支持JQ教程网!

您可能感兴趣的文章:
go 手动释放内存_Go语言-逃逸分析
详解Go逃逸分析
go语言杂谈-----函数返回局部变量问题(“逃逸分析”)
golang 日志分析_Golang 内存分配之逃逸分析
【golang】逃逸分析
go 只使用函数返回的一个值_详解二:Go 语言机制之逃逸分析
golang 的GC原理
Go语言---函数返回局部变量地址
Go 语言机制之逃逸分析
Go 语言机制之内存剖析(Language Mechanics On Memory Profiling)

[关闭]
~ ~