std::wctomb
来自cppreference.com
<tbody>
</tbody>
| 在标头 <cstdlib> 定义
|
||
int wctomb( char* s, wchar_t wc ); |
||
转换宽字符 wc 为多字节编码并存储之(包含任何迁移序列)于首元素为 s 所指向的字符数组。不存储多于 MB_CUR_MAX 个字符。转换受当前本地环境的 LC_CTYPE 类别影响。
若 wc 是空字符,则将空字节写入 s,前附任何需要恢复到初始迁移状态的迁移序列。
若 s 是空指针,则重置全局转换状态并确定是否使用迁移序列。
参数
| s | - | 指向输出的字符数组的指针 |
| wc | - | 要转换的宽字符 |
返回值
若 s 不是空指针,则返回 wc 的多字节表示中的字节数,或若 wc 不是合法字符则为 -1。
若 s 是空指针,则重置其内部转换状态为表示初始迁移状态,且若当前多字节编码不依赖状态(不使用迁移序列)则返回 0,或若当前多字节编码以来状态(使用迁移序列)则返回非零值。
注解
每次到 wctomb 的调用更新全局转换状态(std::mbstate_t 类型静态对象,仅为此函数所知)。若多字节编码使用迁移状态,则此函数不可重入。任何情况下,多个线程不应调用 wctomb 而不同步:可用 std::wcrtomb 替代。
示例
运行此代码
#include <clocale>
#include <cstdlib>
#include <iomanip>
#include <iostream>
#include <string>
void print_wide(const std::wstring& wstr)
{
bool shifts = std::wctomb(nullptr, 0); // 重置转换状态
std::cout << (shifts ? "" : "不" )
<< "使用迁移序列\n" << std::uppercase << std::setfill('0');
for (const wchar_t wc : wstr)
{
std::string mb(MB_CUR_MAX, '\0');
const int ret = std::wctomb(&mb[0], wc);
// const char* s = ret > 1 ? "s" : "";
std::cout << "多字节字符 '" << mb << "' 有 " << ret
<< " 个字节" << ": [" << std::hex;
for (int i{0}; i != ret; ++i)
{
const int c = 0xFF & mb[i];
std::cout << (i ? " " : "") << std::setw(2) << c;
}
std::cout << "]\n" << std::dec;
}
}
int main()
{
std::setlocale(LC_ALL, "en_US.utf8");
// UTF-8 窄多字节编码
std::wstring wstr = L"z\u00df\u6c34\U0001d10b"; // 或 L"zß水𝄋"
print_wide(wstr);
}
输出:
不使用迁移序列
多字节字符 'z' 有 1 个字节: [7A]
多字节字符 'ß' 有 2 个字节: [C3 9F]
多字节字符 '水' 有 3 个字节: [E6 B0 B4]
多字节字符 '𝄋' 有 4 个字节: [F0 9D 84 8B]
参阅
| 转换下一个多字节字符为宽字符 (函数) | |
| 给定状态,转换宽字符到其多字节表示 (函数) | |
[虚] |
将字符串从 InternT 转换到 ExternT,例如在写入文件时 ( std::codecvt<InternT,ExternT,StateT> 的虚受保护成员函数)
|
wctomb 的 C 文档
| |