关于语言律师：您遇到的C常见的未定义/未指定行为是什么？

What are the common undefined/unspecified behavior for C that you run into?

C语言中未指定行为的一个示例是对函数自变量的求值顺序。您可能不知道它可能是从左到右或从右到左。这将影响foo(c++, c)或foo(++c, c)的评估方式。

还有哪些其他未指定的行为可以使无意识的程序员感到惊讶？

语言律师的问题。嗯

我的个人top3：

违反严格的别名规则

:-)

编辑这是一个小示例，它两次出错：

(假设32位整数和小尾数)

1
2
3
4
5
6

float funky_float_abs (float a)
{
unsigned int temp = *(unsigned int *)&a;
temp &= 0x7fffffff;
return *(float *)&temp;
}

该代码试图通过在浮点数表示中直接与符号位进行位旋转来获取浮点数的绝对值。

但是，通过从一种类型转换为另一种类型来创建指向对象的指针的结果不是有效的C。编译器可能会假定指向不同类型的指针没有指向同一块内存。这对于除void *和char *之外的所有类型的指针都是正确的(符号无关紧要)。

在上面的例子中，我做了两次。一次获取float的整数别名，一次将值转换回float。

有三种有效的方法可以做到这一点。

在转换过程中使用char或void指针。这些总是别名，所以它们是安全的。

1
2
3
4
5
6
7
8

float funky_float_abs (float a)
{
float temp_float = a;
// valid, because it's a char pointer. These are special.
unsigned char * temp = (unsigned char *)&temp_float;
temp[3] &= 0x7f;
return temp_float;
}

使用内存复制。 Memcpy使用void指针，因此也会强制使用别名。

1
2
3
4
5
6
7
8
9

float funky_float_abs (float a)
{
int i;
float result;
memcpy (&i, &a, sizeof (int));
i &= 0x7fffffff;
memcpy (&result, &i, sizeof (int));
return result;
}

第三种有效方式：使用联合。自C99以来，这显然不是未定义的：

1
2
3
4
5
6
7
8
9
10
11
12

float funky_float_abs (float a)
{
union
{
unsigned int i;
float f;
} cast_helper;

cast_helper.f = a;
cast_helper.i &= 0x7fffffff;
return cast_helper.f;
}

我个人最喜欢的未定义行为是，如果非空源文件未以换行符结尾，则行为未定义。

我怀疑这是真的，尽管除了发出警告之外，没有其他编译器会根据是否以换行符终止对源文件进行不同的处理。因此，除了可能使警告感到惊讶之外，没有什么会让真正的程序员感到惊讶。

因此，对于真正的可移植性问题(主要是依赖于实现的，而不是未指定或未定义的，但我认为这属于问题的实质)：

char不一定是(未)签名的。
int可以是16位中的任意大小。
浮点数不一定是IEEE格式或一致的。
整数类型不一定是二进制补码，并且整数算术溢出会导致未定义的行为(现代硬件不会崩溃，但是某些编译器优化会导致行为不同于环绕操作，即使这是硬件所做的操作。例如，if (x+1 < x)可能已被优化与x具有签名类型一样，总是错误的：请参见GCC中的-fstrict-overflow选项)。
" /"，"。" #include中的" .."和" .."没有定义的含义，可以由不同的编译器以不同的方式处理(这实际上有所不同，如果出错，将会毁了您的一天)。

真正严重的行为，即使在您开发的平台上也可能令人惊讶，因为行为只是部分未定义/未指定：

POSIX线程和ANSI内存模型。并发访问内存的定义不如新手想象的那样。 volatile不会像新手那样做。内存访问的顺序没有新手认为的那样明确。可以在某些方向跨存储屏障移动访问。不需要内存缓存一致性。
分析代码并不像您想的那么容易。如果您的测试循环无效，则编译器可以删除其中的一部分或全部。内联没有定义的效果。

而且，正如我认为Nils提到的那样：