2009 |
12,20 |
たまには研究メモ。
文書から住所抽出するperlモジュールGeography::AddressExtract::Japanを使いたくて、
Geography::AddressExtract::JapanをCentOS4に入れる
[cotalog]Geography::AddressExtract::Japanを使って住所抽出
この二つの記事を参考にさせてもらって、
eclipse上で実行してみるけど
なかなかうまくいかない。
Geography::AddrresExtract::Japan入れるときになんか間違えたかな?
それともvine linuxだからかな・・・?
文字コード回りに問題があるって事はだいたいわかってるんだけど・・・
結局euc-jpモード(いつもはutf-8)で
--
use strict;
use Geography::AddressExtract::Japan;
use encoding "euc-jp", STDOUT => "euc-jp";
my $addr = <<_EOD_;
福岡県筑紫野市
_EOD_
my $t = Geography::AddressExtract::Japan->extract($addr);
print map { $_->{"city"} . $_->{"aza"} . $_->{"number"} . ""; }@{$t};
--
こんな感じにしたらうごいた。
もう少し勉強しないとなぁ・・・
[追記]
use encoding "euc-jp", STDOUT => "euc-jp";
を
use encoding "euc-jp", STDOUT => "utf8";
にしたらutf8モードでも動いた。
とりあえずここPerl5.8の文字コード周りを参考にさせてもらって
文字コードのおべんきょする。
[追記おわり]
PR
Post your Comment
プロフィール
HN:
fukushimu
性別:
男性
自己紹介:
熊本の某大学で情報処理の勉強をしてます。
カレンダー
カテゴリー
ブログ内検索
つぶやきパーツテスト
カレンダー
最新記事
最新コメント
最古記事
最新TB
P R
カウンター
フリーエリア