位域
声明具有以位计的明确大小的类数据成员。相邻的位域成员可以打包成共享和跨过各个字节。
位域声明是使用下列声明符的类数据成员声明:
标识符 (可选) 属性 (可选) : 大小
|
(1) | ||||||||
标识符 (可选) 属性 (可选) : 大小 花括号或等号初始化器
|
(2) | (C++20 起) | |||||||
位域的类型 由声明语法的声明说明符序列 引入。
| 属性 | - | (C++11 起) 任意数量属性的序列 |
| 标识符 | - | 被声明的位域名。名字是可选的:无名位域引入指定数量的填充位。 |
| 大小 | - | 值大于或等于零的整数常量表达式。大于零时,这是位域将占有的位数。零值只能用于无名位域并具有特殊含义。 |
| 花括号或等号初始化器 | - | 此位域所使用的默认成员初始化器 |
解释
位域的类型只能是整数类型(包括 bool)或(可有 cv 限定的)枚举类型,无名位域不能声明为具有有 cv 限定的类型。
位域不能是静态数据成员。
没有位域纯右值:左值到右值转换始终生成位域底层类型的对象。
位域中的位数设置它能保有的值的极限:
#include <iostream>
struct S
{
// 三位的无符号位域,允许的值有 0...7
unsigned int b : 3;
};
int main()
{
S s = {6};
++s.b; // 在位域中存储值 7
std::cout << s.b << '\n';
++s.b; // 值 8 不适合此位域
std::cout << s.b << '\n'; // 正式来说是由实现定义的行为,通常为 0
}
可能的输出:
7
0
多个相邻位域通常打包在一起(尽管此行为由实现定义):
#include <bit>
#include <cstdint>
#include <iostream>
struct S
{
// 通常会占用 2 个字节:
unsigned char b1 : 3; // 前 3 位(第 1 个字节)为 b1
unsigned char : 2; // 下 2 位(第 1 个字节)被跳过为未使用
unsigned char b2 : 6; // 6 位给 b2 - 并不适于第 1 个字节 => 开始第 2 个
unsigned char b3 : 2; // 2 位给 b3 - 接下来(即最后 2)位在第 2 个字节
};
int main()
{
std::cout << sizeof(S) << '\n'; // 通常打印 2
S s;
// 设置各域为可区分的值
s.b1 = 0b111;
s.b2 = 0b101111;
s.b3 = 0b11;
// 显式 S 中各域的布局
auto i = std::bit_cast<std::uint16_t>(s);
// 通常打印 1110000011110111
// 分解为: └┬┘├┘└┬┘└─┬──┘└┤
// b1 u a b2 b3
// 其中 “u” 标记结构体中未使用的 :2,而 “a” 标记由编译器添加用以字节对齐下一个域的填充位。
// 发生字节对齐是因为 b2 的类型被声明为了 unsigned char;
// 如果 b2 声明为 uint16_t 则将不会有 “a”,b2 将紧挨 “u”。
for (auto b = i; b; b >>= 1) // 按 LSB 先序打印
std::cout << (b & 1);
std::cout << '\n';
}
可能的输出:
2
1110000011110111
特殊的零大小无名位域可用于强行打破填充。它指定下个位域在它的分配单元的开始处开始:
#include <iostream>
struct S
{
// 通常会占用 2 个字节:
// 3 位:b1 的值
// 5 位:不使用
// 2 位:b2 的值
// 6 位:不使用
unsigned char b1 : 3;
unsigned char :0; // 开始新字节
unsigned char b2 : 2;
};
int main()
{
std::cout << sizeof(S) << '\n'; // 通常打印 2
// 若没有第 11 行打断填充则通常会打印 1
}
可能的输出:
2
如果位域所指定的大小大于它的类型的大小,那么值由类型所限制:std::uint8_t b : 1000; 仍只能保存范围 [0, 255] 中的值。额外的位都是填充位。
因为位域不一定在一个字节的开始处开始,所以不能取位域的地址。指向位域的指针和非 const 引用是不可行的。从位域初始化 const 引用时,将创建一个临时量(其类型是位域的类型),并以该位域的值复制初始化,而引用绑定到该临时量。
|
位域没有默认成员初始化器: |
(C++20 前) |
|
在位域大小与默认初始化器有歧义的情况下,选择组成合法大小的最长记号序列: int a;
const int b = 0;
struct S
{
// 简单情况
int x1 : 8 = 42; // OK:"= 42" 是花括号或等号初始化器
int x2 : 8 {42}; // OK:"{42}" 是花括号或等号初始化器
// 有歧义
int y1 : true ? 8 : a = 42; // OK:不存在花括号或等号初始化器
int y2 : true ? 8 : b = 42; // 错误:不能赋值给 const int
int y3 : (true ? 8 : b) = 42; // OK:"= 42" 是花括号或等号初始化器
int z : 1 || new int{0}; // OK:不存在花括号或等号初始化器
};
|
(C++20 起) |
注解
位域的下列性质由实现定义:
- 以范围外的值对有符号位域进行赋值或初始化,或对有符号位域进行自增越过其范围,所产生的值。
- 任何关于类对象中位域的实际分配细节:
- 例如,在某些平台上,位域不跨过字节,其他平台上会跨过
- 还有,在某些平台上,位域从左到右打包,其他平台上从右到左
在 C 编程语言中,位域的宽度不能超过底层类型的宽度,并且未显式标为 signed 或 unsigned 的 int 位域是有符号还是无符号由实现定义。例如,C 中 int b:3; 可能有值域 [0, 7] 或 [-4, 3],但在 C++ 中只有后者。
缺陷报告
下列更改行为的缺陷报告追溯地应用于以前出版的 C++ 标准。
| 缺陷报告 | 应用于 | 出版时的行为 | 正确行为 |
|---|---|---|---|
| CWG 324 | C++98 | 未指明对位域的赋值的返回值是否也是位域 | 对可能返回左值的操作符添加位域说明 |
| CWG 739 | C++98 | 未显式声明为 signed 或 unsigned 的位域由实现定义是否有符号
|
与底层类型一致 |
| CWG 2229 | C++98 | 无名位域可以声明为具有有 cv 限定的类型 | 已禁止 |
| CWG 2511 | C++98 | 位域类型不能有 cv 限定 | 位域的类型可以是有 cv 限定的枚举类型 |
引用
- C++23 标准(ISO/IEC 14882:2024):
- 11.4.10 Bit-fields [class.bit]
- C++20 标准(ISO/IEC 14882:2020):
- 11.4.9 Bit-fields [class.bit]
- C++17 标准(ISO/IEC 14882:2017):
- 12.2.4 Bit-fields [class.bit]
- C++14 标准(ISO/IEC 14882:2014):
- 9.6 Bit-fields [class.bit]
- C++11 标准(ISO/IEC 14882:2011):
- 9.6 Bit-fields [class.bit]
- C++03 标准(ISO/IEC 14882:2003):
- 9.6 Bit-fields [class.bit]
- C++98 标准(ISO/IEC 14882:1998):
- 9.6 Bit-fields [class.bit]
参阅
| 实现常量长度的位数组 (类模板) | |
| 节省空间的动态 bitset (类模板特化) | |
| 位操纵工具 (C++20) | 用来访问,操纵以及处理单独位和位序列的工具 |
位域的 C 文档
| |