GCC 4.8 发布

近日，GCC正式发布了GCC 4.8版本，这是GCC又一次重大的升级。下面我们逐一列举之。

亮点

从这个版本开始，GCC开始直接在其源码中使用C++.这意味着在编译GCC的时候，需要现有一个支持C++ 2003的编译器。相关的改动，以及GCC使用C++的情况，请参考这里。
基于多面体理论的循环优化Graphite更新了CLOOG和ISL的版本。
更激进的循环上界分析推到算法。根据新的语言标准中的一些约束，GCC使用了更激进一些的循环上界分析策略，但这有可能导致一些老的程序运行出错。打算用GCC来跑SPEC CPU分数的朋友注意了，SPEC CPU 2006的464和416会出错。如果要关闭此优化，需要使用选项： -fno-aggressive-loop-optimizations 。
ARM上有关向量-NEON的一个bug修正。因为ABI的变化，和此bug的修正，有可能导致旧的使用intrinsic函数编写的向量化程序，与先前版本GCC编译的binary无法兼容。自动向量化的程序不受影响。

通用优化方面的改进

改用DWARF4标准生成调试信息。现在使用-g选项，默认就会生成DWARF 4格式的调试信息。如果需要使用之前版本GCC采用的DWARF 2格式信息，可以使用选项-gdwarf-2。
增加了一个新的优化级别 -Og, 相比于其他优化级别，该优化级别的亮点是：快速编译、调试信息、一些有必要的程序优化。虽然不是很具体，《灵犀志趣》怀疑此选项实际为 “-O0 -g -fXXXX …”（一些常用优化选项)
引入新选项 -ftree-partial-pre用于控制部分冗余删除优化。该选项会在O3中打开。
-fconserve-space选项被移除。因为GCC已经支持将变量直接放入BSS段，因此大多数后端CPU已经用不着此优化了。
移除了结构体域重排优化和矩阵重排优化，因为这两个优化bug太多，且对大多数程序无效，无法和链接时优化很好的联合工作。
优化了GCC编译较大函数时的速度
重写了链接时优化的代码，修正了一些bug，提升了代码的可靠性和可维护性。
过程间优化也做了改进： 1）引入了一个新的符号表，该符号表在已有调用图和变量池的基础上构建，并且对外提供一些API。该表对一些别名和变量可见性的分析更准确，能为链接时优化中的，激进冗余代码删除，提供依据； 2) 改进了inline策略，现在即使函数的size较大，如果inline有好处，gcc仍然会inline； 3）不管是值传参还是引用传参，对于常数，GCC都能做一些常数传播了。
引入了一个新的内存错误检测工具： AddressSanitizer。使用选项-fsanitize=address能打开此检测器。该检测器会对访存指令插装，帮助快速检测堆、栈以及全局的缓冲区溢出，以及use-after-free bug。这个检测工具可以在Intel/PowerPC Linux系统，以及Intel Darwin上使用， ARM还不行。
引入了一个新的data race检测器： ThreadSanitizer。使用选项 -fsanitize=thread能打开此检测器。头疼多线程bug调试的朋友，可以试试。

语言相关改进

C语言

前端的错误和警告输出增加列信息。现在的GCC可以像LLVM那样，输出更加精确的出错代码的位置了。选项 -fno-diagnostics-show-caret 能关闭此功能.
报警信息中默认包含宏展开栈信息。因为默认打开了选项-ftrack-macro-expansion=2，再结合错误输出的列信息，如果代码中有宏展开引起的错误，GCC能报的更加容易理解了。
增加新的警告选项 -Wsizeof-pointer-memaccess，默认关闭，但在-Wall中会被打开。这样，对于一些需要传入长度的函数，比如memcpy之类的，可以给出一些可能导致出错的sizeof（）使用。
调整了两个警报选项的报警规则和打开方式： -Wpedantic 和 -Wshadow

C++语言

支持了C++11中的thread_local关键字，用于声明线程私有变量。
支持了C++11中的属性文法，和地址对齐文法
支持了C++11中的继承基类构造函数。
增加了一个新的选项-std=c++1y, 用于支持将于2017年才发布的一些C++语言特性的实验性功能。
还增加了一个-fext-numeric-literal选型来控制数字格式在编译器中，和C++11标准的结合方式。另外还废弃了一个有关命名空间的扩展 __attribute((strong)).

运行时库(libstdc++)

针对ISO C++11标准的一些实验性特性进行了改进。
改进了标准库 <random>和<ext/random>
增加新的选项：–disable-libstdcxx-verbose 。使用该选项configure libstdc++能避免在程序异常崩溃时生成一些调试信息。没有这些信息之后，能减小生成的libstdc++库的大小，这在嵌入式系统中很有用。

Fortran、Go语言

Fortran前端增加了几个警告选项，对Fortran 2003的标准支持也有了提升
Go语言方面，实现了针对Go 1.1版本的原则性支持，目前还不完善。

后端相关改进

AArch64

增加了AArch64这一新的后端，一个64bit版本的ARM体系结构。该机构和已有的32位ARM完全独立
目前只是针对Cortex-A53和Cortex-A57处理器提供了基本支持。可以分别使用选项-mcpu=cortex-a53 和 -mcpu=coretex-a57 打开对这两个处理器的支持。

ARM

增加一个针对AArch32的基本支持
Cortex-A7和Cortex-A15的代码生成阶段做了优化
增加了针对Marvell PJ4处理器的支持，可以使用选项 -mcpu=marvell-pj4打开该支持。
引入了一个新的针对自动向量化的代价模型。
指令调度器也做了更新

IA-32/X86-64

在禁止SSE扩展的条件下，支持 -mpreferred-stack-boundary=3。这个选项用于解决一个栈上的内存对齐问题。如果你的代码中包含了SSE，推荐使用该选项重新编译一次相关代码库。
支持BroadWell处理器中的 RDSEED, ADCX, ADOX, PREFETCHW。需要同时使用相应的选项才能打开。
针对处理器的一些新增指令，增加了对应的intrinsic，比如Intel RTM, HLE, FXSR, XSAVE, XSAVEOPT.
增加新的builtin函数，可以在程序运行时判断CPU的类型和指令集
在G++中支持了同名函数的多版本。比如可以指定一个函数有普通标量版本、SSE向量版本、AVX向量版本等。这样可以在运行时，针对不同的ISA选择不同的版本。详细的内容参考这里
增加了针对AMD的两款CPU的支持： AMD 15h 和 16h

IT69

亮点

通用优化方面的改进

语言相关改进

C语言

C++语言

运行时库(libstdc++)

Fortran、Go语言

后端相关改进

AArch64

ARM

IA-32/X86-64

暂无评论