なんじゃくにっき

プログラミングの話題中心。

2012-12-11から1日間の記事一覧

文字の出現頻度を数える

前回、英文に出現する単語の出現頻度を数えてみましたが、 今回は前回よりもさらに細かい単位、文字単位で分割してみます。 前置きとして、シャノンの情報量 の定義では、 確率pで起こる事象の情報量I(p)は I(p) = -log2p bit で与えられます。 簡単のため、…