MeCab
一つに結合された住所文字列から、『都道府県』、『市区町村』、『町域名以降』を高速に分割したい。 簡単に思いつく方法としては、日本郵便で公開されている住所データを元に1行づつ比較していく方法が考えられますが、生成に時間が掛かってしまいます。こ…
Rubyで使う。 MacPortsにportが準備されているので、それを使うのが早いです。 $ sudo port install mecab +utf8 $ sudo port install rb-mecabテストスクリプトを用意 $ vi mecab-test.rb#!/opt/local/bin/ruby require 'MeCab' m = MeCab::Tagger.new("-Oc…
MacPortsを使えば呆気ないくらい簡単にインストールできます。 追記 こちらに書きました。 http://d.hatena.ne.jp/pcmaster/20080324/p2自然言語処理 (IT Text)作者: 天野真家,宇津呂武仁,成田真澄,福本淳一,石崎俊出版社/メーカー: オーム社発売日: 2007/10…