C++ 中的未定义行为

现在我们需要一个程序从控制台读入一个 INT 型整数(输入确保是INT),然后输出其绝对值,你可能闭着眼睛就会写出下面的代码:

#include <iostream>

int main()
{
    int n;
    std::cin >> n;
    std::cout << abs(n) << std::endl;
}

等下,好好思考两分钟,然后写几个测试例子跑一下程序。那么你找出程序存在的问题了吗?好了,欢迎走进未定义行为 (Undefined Behavior) 的世界。

未定义行为

什么是未定义行为

文章一开始的程序中用到了 abs 求绝对值函数,当n为 INT_MIN 时,函数返回什么呢?C++ 标准中有这么一条:

If during the evaluation of an expression, the result is not mathematically defined or not in the range of representable values for its type, the behavior is undefined.

在一个2进制系统中,当 n 是 INT_MIN 时,int abs(int n) 返回的值超出了 int 的范围,所以这将导致一个未定义行为。很多时候,标准过于精炼,不便于我们快速查找,因此我们可以在 cppreference 找到需要的信息,以 abs函数为例,cppreference 明确指出可能导致未定义行为:

Computes the absolute value of an integer number. The behavior is undefined if the result cannot be represented by the return type.

那么到底什么是未定义行为呢?简单来说,就是某个操作逻辑上是不合法的,比如越界访问数组等,但是C++ 标准并没有告诉我们遇到这种情况该如何去处理。

我们知道在大部分语言(比如 Python 和 Java)中,一个语句要么按照我们的预期正确执行,要么立即抛出异常。但是在 C++ 中,还有一种情况就是,某条语句并没有按照预期执行(逻辑上已经出错了),但是程序还是可以继续执行(C++标准没有告诉怎么继续执行)。只不过程序的行为已经不可预测了,也就是说程序可能发生运行时错误,也可能给出错误的结果,甚至还可能给出正确的结果。

有一点需要注意的是,对于有的未定义行为,现代编译器有时候可以给出警告,或者是编译失败的提示信息。此外,不同编译器对于未定义行为的处理方式也不同。

常见的未定义行为

C++ 标准中有大量的未定义行为,如果在标准中查找 undefined behavior,将会看到几十条相关内容。如此众多的未定义行为,无疑给我们带来了许多麻烦,下面我们将列出一些常见的未定义行为,写程序时应该尽量避免。

指针相关的常见未定义行为有如下内容:

  • 解引用 nullptr 指针;
  • 解引用一个未初始化的指针;
  • 解引用 new 操作失败返回的指针;
  • 指针访问越界(解引用一个超出数组边界的指针);
  • 解引用一个指向已销毁对象的指针;

解引用一个指向已销毁对象的指针,有时候很容易就会犯这个错误,例如在函数中返回局部指针地址。 一些简单的错误代码如下:

#include <iostream>

int * get(int tmp){
    return &tmp;
}
int main()
{
    int *foo = get(10);
    std::cout << *foo << std::endl; // Undefined Behavior;

    int arr[] = {1,2,3,4};
    std::cout << *(arr+4) << std::endl; // Undefined Behavior;

    int *bar=0;
    *bar = 2;                       // Undefined Behavior;
    std::cout << *bar << std::endl;
    return 0;
}

其他常见未定义行为如下:

  • 有符号整数溢出(文章开头的例子);
  • 整数做左移操作时,移动的位数为负数;
  • 整数做移位操作时,移动的位数超出整型占的位数。(int64_t i = 1; i <<= 72);
  • 尝试修改字符串字面值或者常量的内容;
  • 对自动初始化且没有赋初值的变量进行操作;(int i; i++; cout << i;)
  • 在有返回值的函数结束时不返回内容;

更完整的未定义行为列表可以在这里找到。

为什么存在未定义行为

C++ 程序经常因为未定义行为而出现各种千奇百怪的 Bug,调试起来也十分困难。相反,其他很多语言中并没有未定义行为,比如 python,当访问 list 越界时会抛出 list index out of range,这些语言中不会因为未定义行为出现各种奇怪的错误。那么为什么 C++ 标准为什么要搞这么多未定义行为呢?

原因是这样可以简化编译器的工作,有时候还可以产生更加高效的代码。举个例子来说,如果我们想让解引用指针的操作行为变的明确起来(成功或者抛出异常),就需要在编译期知道指针使用是否合法,那么编译器至少需要做下面这些工作:

  • 检查指针是否为 nullptr;
  • 通过某种机制检查指针保存的地址是否合法;
  • 通过某种机制抛出错误

这样的话编译器的实现会复杂很多。此外,如果我们有一个循环需要对大量的指针进行操作,那么编译生成的代码就会因为做各种附加检查而导致效率低下。

实际上,很多未定义行为,都是因为程序违反了某一先决条件而导致的,比如赋给指针的地址值必须是可访问的,数组访问时下标在正确的范围内。对 C++来说,语言设计者认为这是程序员(大家都是成年人了)需要保证的内容,语言层面并不会去做相应的检查。

不过,好消息是现在很多编译器已经可以诊断出一些可能导致未定义行为的操作,可以帮我们写出更加健壮的程序。

其他一些行为

C++ 标准还规定了一些 Unspecified Behavior,一个简单的例子(一个大公司曾经的笔试题目)如下:

#include <iostream>
using namespace std;

int get(int i){
    cout << i << endl;
    return i+1;
}

int Cal(int a, int b) {
    return a+b;
}

int main() {
    cout << Cal(get(0), get(10)) << endl;
    return 0;
}

程序输出多少?答案是视编译器而定,可能是0 10 12,也可能是 10 0 12。这是因为函数参数的执行顺序是 Unspecified Behavior,引用C++标准对 Unspecified Behavior 的说明:

Unspecified behavior use of an unspecified value, or other behavior where this International Standard provides two or more possibilities and imposes no further requirements on which is chosen in any instance.

此外,C++标准中还有所谓的 implementation-defined behavior,比如C++标准说需要一个数据类型,然后具体的编译器去选择该类型占用的字节数,或者是存储方式(大端还是小端)。

一般情况下,我们需要关心的只有未定义行为,因为它通常会导致程序出错。而其他的两种行为,不需要我们去关心。

更多阅读

Cppreference:Undefined behavior
What are all the common undefined behaviors that a C++ programmer should know about?
What are the common undefined/unspecified behavior for C that you run into?
function parameter evaluation order
A Guide to Undefined Behavior in C and C++, Part 1
A Guide to Undefined Behavior in C and C++, Part 2
Why is there so much undefined behavior in C++?
Cplusplus: abs
What Every C Programmer Should Know About Undefined Behavior
Undefined behavior and sequence points
Undefined, unspecified and implementation-defined behavior
Where do I find the current C or C++ standard documents?

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 160,387评论 4 364
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 67,845评论 1 298
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 110,091评论 0 246
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 44,308评论 0 214
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 52,662评论 3 288
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 40,795评论 1 222
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 32,008评论 2 315
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 30,743评论 0 204
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 34,466评论 1 246
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 30,687评论 2 249
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 32,181评论 1 262
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 28,531评论 3 258
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 33,177评论 3 239
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 26,126评论 0 8
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 26,902评论 0 198
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 35,862评论 2 283
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 35,734评论 2 274

推荐阅读更多精彩内容