トップ 差分 一覧 ソース 置換 検索 ヘルプ PDF RSS ログイン

JavaScriptでUTF-8のバイト数をカウント

http://www.skyarc.co.jp/engineerblog/entry/javascript.html

<script type="text/javascript">
var a = 'ABC123あいう';// in 15 bytes UTF-8
var tbl = [ 0, 1, 1, 1, 2, 3, 2, 3, 4, 3 ];
var len = 0;
for (i = 0; i < a.length; i++)
 len += tbl [encodeURIComponent(a.charAt(i)).length];
alert(len);

</script>

下表のようなテーブルを用いてバイト数をカウントしています。

   %XX%XX%XX 9 -> 3
   %XX%XXAA 8 -> 4
   %XX%XXA 7 -> 3
   %XX%XX 6 -> 2
   %XXAA 5 -> 3
   %XXA 4 -> 2
   %XX 3 -> 1
   %X 2 -> 1
   A 1 -> 1
   (0) -> 0

[カテゴリ: プログラミング言語 > JavaScirpt]



  • Hatenaブックマークに追加
  • livedoorクリップに追加
  • del.icio.usに追加
  • FC2ブックマークに追加

最終更新時間:2010年09月14日 22時26分01秒