忍者ブログ

fukushimuのメモ帳

旧fukushimu'sページ。&旧理系大学院生の怠惰な日々。 fukushimuのメモ帳です。。
2024
04,27

«[PR]»

×

[PR]上記の広告は3ヶ月以上新規記事投稿のないブログに表示されています。新しい記事を書く事で広告が消えます。

2009
12,20

たまには研究メモ。

文書から住所抽出するperlモジュールGeography::AddressExtract::Japanを使いたくて、

Geography::AddressExtract::JapanをCentOS4に入れる
[cotalog]Geography::AddressExtract::Japanを使って住所抽出

この二つの記事を参考にさせてもらって、

eclipse上で実行してみるけど

なかなかうまくいかない。

Geography::AddrresExtract::Japan入れるときになんか間違えたかな?

それともvine linuxだからかな・・・?

文字コード回りに問題があるって事はだいたいわかってるんだけど・・・

結局euc-jpモード(いつもはutf-8)で

--

use strict;
use Geography::AddressExtract::Japan;
use encoding "euc-jp", STDOUT => "euc-jp";


my $addr = <<_EOD_;
福岡県筑紫野市
_EOD_

my $t = Geography::AddressExtract::Japan->extract($addr);

print map { $_->{"city"} . $_->{"aza"} . $_->{"number"} . ""; }@{$t};

--

こんな感じにしたらうごいた。

もう少し勉強しないとなぁ・・・

[追記]
use encoding "euc-jp", STDOUT => "euc-jp";

use encoding "euc-jp", STDOUT => "utf8";
にしたらutf8モードでも動いた。
とりあえずここPerl5.8の文字コード周りを参考にさせてもらって
文字コードのおべんきょする。
[追記おわり]

PR
Post your Comment
Name:
Title:
Mail:
URL:
Color:
Comment:
pass: emoji:Vodafone絵文字 i-mode絵文字 Ezweb絵文字

trackback
この記事のトラックバックURL:

[54] [53] [52] [51] [50] [49] [48] [47] [46] [45] [44]


« さむい: HOME : Twitter忘年会 »
プロフィール
HN:
fukushimu
性別:
男性
自己紹介:
熊本の某大学で情報処理の勉強をしてます。
カレンダー
03 2024/04 05
S M T W T F S
1 2 3 4 5 6
7 8 9 10 11 12 13
14 15 16 17 18 19 20
21 22 23 24 25 26 27
28 29 30
ブログ内検索
つぶやきパーツテスト
カレンダー
最新コメント
[12/12 nvvkofkjdl]
[12/12 clmmxjdfzx]
[12/12 byuahjtfun]
[12/12 lyzithxbgh]
[12/11 xcjlfpuicg]
バーコード
最新TB
P R
カウンター
フリーエリア

Powered by Ninja.blog * TemplateDesign by TMP
忍者ブログ[PR]