std::mbrlen
来自cppreference.com
<tbody>
</tbody>
| 在标头 <cwchar> 定义
|
||
std::size_t mbrlen( const char* s, std::size_t n, std::mbstate_t* ps); |
||
给定当前转换状态 ps,确定首字节为 s 所指向的多字节字符的剩余字节大小。
此函数等价于对于某 std::mbstate_t 类型的隐藏对象 internal 的调用 std::mbrtowc(nullptr, s, n, ps ? ps : &internal),但它只求值表达式 ps 一次。
参数
| s | - | 指向多字节字符串元素的指针 |
| n | - | s 中能检验的字节数限制
|
| ps | - | 指向保有转换状态的对象的指针 |
返回值
- 若下
n个或更少字节完成空字符则为0。 - 完成合法多字节字符的字节数(
1与n之间)。 - 若发生编码错误则为
std::size_t(-1)。 - 若下
n个字节为可能合法,而在检验全部n个字节后仍不完整的多字节字符的一部分,则为std::size_t(-2)。
示例
运行此代码
#include <clocale>
#include <cwchar>
#include <iostream>
#include <string>
int main()
{
// 允许 mbrlen() 以 UTF-8 多字节编码工作
std::setlocale(LC_ALL, "en_US.utf8");
// UTF-8 窄多字节编码
std::string str = "水"; // 或 u8"\u6c34" 或 "\xe6\xb0\xb4"
std::mbstate_t mb = std::mbstate_t();
// 简单用法:完整多字节字符的长度
const std::size_t len = std::mbrlen(&str[0], str.size(), &mb);
std::cout << "The length of " << str << " is " << len << " bytes\n";
// 高级用法:从多字节字符的中间重新计数
const std::size_t len1 = std::mbrlen(&str[0], 1, &mb);
if (len1 == std::size_t(-2))
std::cout << str << "的第一个字节是不完整的多字节字符 (mbrlen 返回 -2)\n";
const std::size_t len2 = std::mbrlen(&str[1], str.size()-1, &mb);
std::cout << str << " 的剩余 " << str.size()-1 << " 个字节"
<< "持有多字节字符的 " << len2 << " 个字节\n";
// 错误情况:
std::cout << "尝试在初始转换状态中在 " << str
<< " 的中间调用 mbrlen() 返回 "
<< (int)mbrlen(&str[1], str.size(), &mb) << '\n';
}
输出:
水 的长度是 3 个字节。
水 的第一个字节是不完整的多字节字符 (mbrlen 返回 -2)
水 的剩余 2 个字节持有多字节字符的 2 个字节
尝试在初始转换状态中在 水 的中间调用 mbrlen() 返回 -1
参阅
| 给定状态,转换下个多字节字符为宽字符 (函数) | |
| 返回下一个多字节字符中的字节数 (函数) | |
[虚] |
计算转换成给定的 InternT 缓冲区会消耗的 ExternT 字符串长度 ( std::codecvt<InternT,ExternT,StateT> 的虚受保护成员函数)
|
mbrlen 的 C 文档
| |