V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
sanbenweiyang
V2EX  ›  程序员

Golang 中逃逸现象,局部变量“何时栈?何时堆?”

  •  
  •   sanbenweiyang · 2020-03-10 12:13:36 +08:00 · 1439 次点击
    这是一个创建于 1711 天前的主题,其中的信息可能已经有所发展或是发生改变。

    一、C/C++报错?Golang 通过?

    我们先看一段代码

    package main
    
    func foo(arg_val int)(*int) {
    
        var foo_val int = 11;
        return &foo_val;
    }
    
    func main() {
    
        main_val := foo(666)
    
        println(*main_val)
    }
    

    编译运行

    $ go run pro_1.go 
    11
    

    竟然没有报错!

    了解 C/C++的小伙伴应该知道,这种情况是一定不允许的,因为 外部函数使用了子函数的局部变量, 理论来说,子函数的foo_val 的声明周期早就销毁了才对,如下面的 C/C++代码

    #include <stdio.h>
    
    int *foo(int arg_val) {
    
        int foo_val = 11;
    
        return &foo_val;
    }
    
    int main()
    {
        int *main_val = foo(666);
    
        printf("%d\n", *main_val);
    }
    
    

    编译

    $ gcc pro_1.c 
    pro_1.c: In function ‘foo’:
    pro_1.c:7:12: warning: function returns address of local variable [-Wreturn-local-addr]
         return &foo_val;
                ^~~~~~~~
    
    

    出了一个警告,不管他,再运行

    $ ./a.out 
    段错误 (核心已转储)
    

    程序崩溃.

    如上 C/C++编译器明确给出了警告,foo 把一个局部变量的地址返回了;反而高大上的 go 没有给出任何警告,难道是 go 编译器识别不出这个问题吗?

    二、Golang 编译器得逃逸分析

    ​ go 语言编译器会自动决定把一个变量放在栈还是放在堆,编译器会做逃逸分析(escape analysis)当发现变量的作用域没有跑出函数范围,就可以在栈上,反之则必须分配在堆。 go 语言声称这样可以释放程序员关于内存的使用限制,更多的让程序员关注于程序功能逻辑本身。

    我们再看如下代码:

    package main
    
    func foo(arg_val int) (*int) {
    
        var foo_val1 int = 11;
        var foo_val2 int = 12;
        var foo_val3 int = 13;
        var foo_val4 int = 14;
        var foo_val5 int = 15;
    
    
        //此处循环是防止 go 编译器将 foo 优化成 inline(内联函数)
        //如果是内联函数,main 调用 foo 将是原地展开,所以 foo_val1-5 相当于 main 作用域的变量
        //即使 foo_val3 发生逃逸,地址与其他也是连续的
        for i := 0; i < 5; i++ {
            println(&arg_val, &foo_val1, &foo_val2, &foo_val3, &foo_val4, &foo_val5)
        }
    
        //返回 foo_val3 给 main 函数
        return &foo_val3;
    }
    
    
    func main() {
        main_val := foo(666)
    
        println(*main_val, main_val)
    }
    
    

    我们运行一下

    $ go run pro_2.go 
    0xc000030758 0xc000030738 0xc000030730 0xc000082000 0xc000030728 0xc000030720
    0xc000030758 0xc000030738 0xc000030730 0xc000082000 0xc000030728 0xc000030720
    0xc000030758 0xc000030738 0xc000030730 0xc000082000 0xc000030728 0xc000030720
    0xc000030758 0xc000030738 0xc000030730 0xc000082000 0xc000030728 0xc000030720
    0xc000030758 0xc000030738 0xc000030730 0xc000082000 0xc000030728 0xc000030720
    13 0xc000082000
    
    

    我们能看到foo_val3是返回给 main 的局部变量, 其中他的地址应该是0xc000082000,很明显与其他的 foo_val1、2、3、4 不是连续的.

    我们用go tool compile测试一下

    $ go tool compile -m pro_2.go
    pro_2.go:24:6: can inline main
    pro_2.go:7:9: moved to heap: foo_val3
    

    果然,在编译的时候, foo_val3具有被编译器判定为逃逸变量, 将foo_val3放在堆中开辟.

    我们在用汇编证实一下:

    $ go tool compile -S pro_2.go > pro_2.S
    

    打开 pro_2.S 文件, 搜索runtime.newobject关键字

     ...
     16     0x0021 00033 (pro_2.go:5)   PCDATA  $0, $0
     17     0x0021 00033 (pro_2.go:5)   PCDATA  $1, $0
     18     0x0021 00033 (pro_2.go:5)   MOVQ    $11, "".foo_val1+48(SP)
     19     0x002a 00042 (pro_2.go:6)   MOVQ    $12, "".foo_val2+40(SP)
     20     0x0033 00051 (pro_2.go:7)   PCDATA  $0, $1
     21     0x0033 00051 (pro_2.go:7)   LEAQ    type.int(SB), AX
     22     0x003a 00058 (pro_2.go:7)   PCDATA  $0, $0
     23     0x003a 00058 (pro_2.go:7)   MOVQ    AX, (SP)
     24     0x003e 00062 (pro_2.go:7)   CALL    runtime.newobject(SB)  //foo_val3 是被 new 出来的
     25     0x0043 00067 (pro_2.go:7)   PCDATA  $0, $1
     26     0x0043 00067 (pro_2.go:7)   MOVQ    8(SP), AX
     27     0x0048 00072 (pro_2.go:7)   PCDATA  $1, $1
     28     0x0048 00072 (pro_2.go:7)   MOVQ    AX, "".&foo_val3+56(SP)
     29     0x004d 00077 (pro_2.go:7)   MOVQ    $13, (AX)
     30     0x0054 00084 (pro_2.go:8)   MOVQ    $14, "".foo_val4+32(SP)
     31     0x005d 00093 (pro_2.go:9)   MOVQ    $15, "".foo_val5+24(SP)
     32     0x0066 00102 (pro_2.go:9)   XORL    CX, CX
     33     0x0068 00104 (pro_2.go:15)  JMP 252
     ...
    

    看出来, foo_val3 是被 runtime.newobject()在堆空间开辟的, 而不是像其他几个是基于地址偏移的开辟的栈空间.

    三、new 的变量在栈还是堆?

    那么对于 new 出来的变量,是一定在 heap 中开辟的吗,我们来看看

    package main
    
    func foo(arg_val int) (*int) {
    
        var foo_val1 * int = new(int);
        var foo_val2 * int = new(int);
        var foo_val3 * int = new(int);
        var foo_val4 * int = new(int);
        var foo_val5 * int = new(int);
    
    
        //此处循环是防止 go 编译器将 foo 优化成 inline(内联函数)
        //如果是内联函数,main 调用 foo 将是原地展开,所以 foo_val1-5 相当于 main 作用域的变量
        //即使 foo_val3 发生逃逸,地址与其他也是连续的
        for i := 0; i < 5; i++ {
            println(arg_val, foo_val1, foo_val2, foo_val3, foo_val4, foo_val5)
        }
    
        //返回 foo_val3 给 main 函数
        return foo_val3;
    }
    
    
    func main() {
        main_val := foo(666)
    
        println(*main_val, main_val)
    }
    
    

    我们将 foo_val1-5 全部用 new 的方式来开辟, 编译运行看结果

    $ go run pro_3.go 
    666 0xc000030728 0xc000030720 0xc00001a0e0 0xc000030738 0xc000030730
    666 0xc000030728 0xc000030720 0xc00001a0e0 0xc000030738 0xc000030730
    666 0xc000030728 0xc000030720 0xc00001a0e0 0xc000030738 0xc000030730
    666 0xc000030728 0xc000030720 0xc00001a0e0 0xc000030738 0xc000030730
    666 0xc000030728 0xc000030720 0xc00001a0e0 0xc000030738 0xc000030730
    0 0xc00001a0e0
    

    很明显, foo_val3的地址0xc00001a0e0依然与其他的不是连续的. 依然具备逃逸行为.

    四、结论

    Golang 中一个函数内局部变量,不管是不是动态 new 出来的,它会被分配在堆还是栈,是由编译器做逃逸分析之后做出的决定。

    按理来说, 人家 go 的设计者明明就不希望开发者管这些,但是面试官就偏偏找这种问题问? 醉了也是.



    文章推荐

    开源软件作品

    (原创开源)Zinx-基于 Golang 轻量级服务器并发框架-完整版(附教程视频)

    (原创开源)Lars-基于 C++负载均衡远程调度系统-完整版

    精选文章

    典藏版-Golang 调度器 GMP 原理与调度全分析 使用 Golang 的 interface 接口设计原则 深入浅出 Golang 的协程池设计 Go 语言构建微服务一站式解决方案


    ###关于作者:

    mail: [email protected]

    github: https://github.com/aceld

    原创书籍 gitbook: http://legacy.gitbook.com/@aceld

    创作不易, 共同学习进步, 欢迎关注作者, 回复"zinx"有好礼

    作者微信公众号


    文章推荐

    开源软件作品

    (原创开源)Zinx-基于 Golang 轻量级服务器并发框架-完整版(附教程视频)

    (原创开源)Lars-基于 C++负载均衡远程调度系统-完整版

    精选文章

    典藏版-Golang 调度器 GMP 原理与调度全分析

    Golang 中的局部变量“何时栈?何时堆?”

    使用 Golang 的 interface 接口设计原则

    深入浅出 Golang 的协程池设计

    Go 语言构建微服务一站式解决方案


    1 条回复    2020-03-10 13:27:32 +08:00
    leido
        1
    leido  
       2020-03-10 13:27:32 +08:00
    第一感觉不是 go 多牛逼, 而是不敢用 go
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   5410 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 23ms · UTC 07:10 · PVG 15:10 · LAX 23:10 · JFK 02:10
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.