テキストエリアに文字を入力して、様々な方法で文字数を数えた場合の違いを確認してみましょう。
数え方 | 文字数 |
---|---|
バイト数 (UTF-8)
データを保存・通信する際のサイズ。UTF-8ではバイト数=コードユニット数になる
|
0 |
コードユニット数 (UTF-16) (.length )
サロゲートペアの文字は2と数えられる。
|
0 |
コードポイント数
Unicode上の文字の数。
|
0 |
書記素クラスタ数 (Intl.Segmenter )
人間が「1文字」と認識する数。「か」+「゛」も1文字になる。
|
0 |
異体字セレクタ (IVS)
異体字セレクタ(U+FE00..FE0F、U+E0100..E01EF)の有無を表示します。
|
未検査 |
Shift_JIS互換性チェック
Shift_JISに収録されていない可能性のある文字を検出します(簡易判定)。
|
未検査 |