meryngii.neta

今日も新たな"ネタ"を求めて。

文字コード

22.3 Standard code conversion facets
1 The header provides code conversion facets for various character encodings.
(略)
3 For each of the three code conversion facets codecvt_utf8, codecvt_utf16, and codecvt_utf8_utf16:

http://www.open-std.org/jtc1/sc22/wg21/docs/papers/2008/n2723.pdf

Unicode間で文字コードを変換するものらしい。codecvt_utf8とcodecvt_utf16はUTF-8UTF-16と、UCS-2かUCS-4との変換をして、codecvt_utf8_utf16はUTF-8UTF-16の変換をするらしい。
UCS-2は2バイトで定義されている部分だけで、UTF-16サロゲートペアで4バイト文字も使える、という意味なのかな?正直よく分かっていない。