なんじゃくにっき

プログラミングの話題中心。

2012-11-27から1日間の記事一覧

単語の出現頻度を数える

英文に出現する単語の頻度を数えてみます。 とりあえずは形態素解析とか難しいことは使わずに、アルファベット以外の文字を区切り文字として単語を切り出します。 題材はシェイクスピアのハムレット。 何故か自然言語処理でよく使われます。 約400年前の文章…