UnicodeコードポイントとUTF-16との相互変換
2バイトで表せる範囲であれば、Unicodeコードポイント(*1)とUTF-16(*2)は一致します。
しかし、サロゲートペア(Surrogate Pair)の領域はUnicodeコードポイントとUTF-16のコードが一致しません。
Unicodeコードポイントは5桁になり、UTF-16は4バイト(8桁)になります。
そのため、UnicodeコードポイントとUTF-16を相互変換できるJavaScriptを作成しました。
*1 Unicodeコードポイントは「U+1234」のような書き方をします。
*2 UTF-16 Big Endian(ビックエンディアン)の場合です。
結果
文字 | |
Unicode code point | |
上位サロゲート(16進数) | |
下位サロゲート(16進数) |