忍者ブログ

fukushimuのメモ帳

旧fukushimu'sページ。&旧理系大学院生の怠惰な日々。 fukushimuのメモ帳です。。
2024
11,23

«[PR]»

×

[PR]上記の広告は3ヶ月以上新規記事投稿のないブログに表示されています。新しい記事を書く事で広告が消えます。

2010
08,26
Text::MeCabを以下の手順でvine5.1にインストールします。


・mecabインストール
・Text::Mecabインストール


文字コードはutf8で使おうと思っています。まずmecab本体はapt-getでインストール。


[guest@localhost ~]$ su -
[root@localhost ~]# apt-get install mecab


続いて辞書を公式ページからダウンロードして、公式ページの記述通りにして"utf8"でインストール


% tar zxfv mecab-ipadic-2.7.0-xxxx
% ./configure --with-charset=utf8
% make
% make install


前後でいろいろインストールしたりアンインストールしたりeucでインストールしたのをutfに変換するという技を試みたりしたのですが、たったこれだけのシンプルな方法でutf8でmecabが文字化けせずに使えました(汗


[guest@localhost ~]$ mecab
今日は晴れの日いい天気
今日    名詞,副詞可能,*,*,*,*,今日,キョウ,キョー
は    助詞,係助詞,*,*,*,*,は,ハ,ワ
晴れ    名詞,一般,*,*,*,*,晴れ,ハレ,ハレ
の    助詞,連体化,*,*,*,*,の,ノ,ノ
日    名詞,非自立,副詞可能,*,*,*,日,ヒ,ヒ
いい    形容詞,自立,*,*,形容詞・イイ,基本形,いい,イイ,イイ
天気    名詞,一般,*,*,*,*,天気,テンキ,テンキ
EOS





ではつづいてperlからmecabを使うためにText::Mecabをインストールします。cpanからcpan[1]> install Text::MeCab でサクッと入るとおもいきや、


Can't locate Devel/CheckLib.pm in @INC


こんなメッセージがでてインストールできない。なので、先にこのDevel/CheckLibとやらをcpanでいれて再度チャレンジ。入った…。もちろんutf-8なので途中で聞かれたら迷わず「utf-8!」と答えます。

Encoding of your mecab dictionary? (shift_jis, euc-jp, utf-8) [euc-jp] utf-8


ということで、Text::MeCabがeclipseで動くかどうか確認しました。スクリプトはこちらを参考に(少し改良しました)します。


use Text::MeCab;

my $m = Text::MeCab->new();
my $str_utf = "今日も明日もしないとね";
my $n = $m->parse($str_utf);
do{
    printf("%s\t%s\t%d\n",
        $n->surface,
        $n->feature,
        $n->cost
        );
}while($n = $n->next);
 


実行結果

 
Use of uninitialized value in printf at /home/akito/workspace/test/test.pl line 7.
今日    名詞,副詞可能,*,*,*,*,今日,キョウ,キョー    3947
も    助詞,係助詞,*,*,*,*,も,モ,モ    5553
明日    名詞,副詞可能,*,*,*,*,明日,アシタ,アシタ    8310
も    助詞,係助詞,*,*,*,*,も,モ,モ    9916
し    動詞,自立,*,*,サ変・スル,未然形,する,シ,シ    15929
ない    助動詞,*,*,*,特殊・ナイ,基本形,ない,ナイ,ナイ    7964
と    助詞,接続助詞,*,*,*,*,と,ト,ト    9079
ね    助詞,終助詞,*,*,*,*,ね,ネ,ネ    15039
    BOS/EOS,*,*,*,*,*,*,*,*    12655
 


できました!というこで無事Text::MeCabが入りました。
エラーが気になるけどまた明日ということで。


PR
2010
08,26
現在perlのみが入っている状況で、eclipseによってperlのプログラミングをするためにVine5.1に今回以下をインストールします。

・JDK
・eclipse
・eclipse日本語化言語パック
・PadWalker
・EPIC

まず、eclipseをインストールする前にJDKをインストールする必要があります。そうしないとこんなメッセージがでます(汗)
 
A Java Runtime Environment (JRE) or Java Development Kit (JDK)
must be available in order to run Eclipse. No Java virtual machine
was found after searching the following locations: …

ということでJDKをダウンロード。apt-getでサクッと入りました。
 
[guest@localhost ~]$ su -
パスワード:
[root@localhost akito]# apt-get install jdk
パッケージリストを読みこんでいます... 完了
依存情報ツリーを作成しています... 完了       
'jdk' として java-1.6.0-sun-devel を選択しました
以下の追加パッケージがインストールされます:

                        ・・・

  java-1.6.0-sun-alsa-1.6.0.21-1vl5.i586 ############################## [100%]
  java-1.6.0-sun-devel-1.6.0.21-1vl5.i58 ############################## [100%]
完了

次にeclipseをダウンロード。前回Classicをいれたらすんなり入った記憶があったのでClassicをダウンロード。バージョンは3.6。回答したらeclipseが起動できます。

その次に日本語化をします。というか、記事を書いてるうちに以前にもeclipseの日本語化を試みた記事を書いたことがあるのを思い出したのでそちらを参考に、こちらから日本語化言語パックをダウンロード。って3.5って書いてあるけど、大丈夫か…!?

大丈夫でした。

では次にeclipseでperlをするためにこちらのサイトを参考EPICPadWalkerをいれます。PadWalkerはSynapticで見つけたのでそちらからインストール。apt-getの場合はapt-get install perl-PadWalkerでしょうか。


最後にEPICをいれます。以前とはどうも違うやり方ですが、eclipseを起動して、「ヘルプ」->「新規ソフトウェアのインストール」から、インストールします。ダイアログ上部の「サイトを入力または選択」と書いてある部分にhttp://e-p-i-c.sf.net/updates/testing
と書き込み、次へ。画面に従って進めばEPICがインストールできます。


ちゃんと動くか確認します。eclipseを起動して、「ファイル」->「新規」->「プロジェクト」でPerl Projectが選択できるようになっています。.plファイルも無事動き、「hello world」が表示できました!

ということで、無事eclipseでperlをする環境ができました。
2010
08,26
Adobe Flash Playerのプラグインをfirefoxにインストールします。まぁ、Adobeのサイトを見ればのっていますが、なにしろ前回firefoxをバージョン2から3にアップグレードしたときFlash Playerをいれるのに少々手間取ったので。

ここでファイルをダウンロードします。Flash Playerのインストール手順を見たところlinux(x86)には5つもインストール手段がありますが、何となく一番簡単そうな.tar.gzファイルの手順を参考にやってみました。

  1. ダウンロードリンクをクリックして、インストール手続きを開始します。 ファイルの保存先を指定するためのダイアログボックスが表示されます。
  2. .tar.gzファイルをデスクトップに保存するよう指定し、ファイルが完全にダウンロードされるのを待ちます。
  3. このファイルを展開します。
  4. libflashplayer.soファイルをブラウザーのpluginsフォルダーにコピーします。このフォルダーの場所については、ブラウザーのベンダーにお問い合わせください。
  5. プラグインがMozillaブラウザーに正しくインストールされていることを確認するには、Mozillaを起動してブラウザーのメニューからヘルプ/プラグインについてを選択します。

4番目のpluginsフォルダーは僕の場合usr/lib/mozilla/pulugns にありました。ここに回答したlibflashplayer.soをコピペします。これでfirefoxを起動し、バージョン確認したとろこ、見事インストールできていることを確認できました。なぜ前回なかなかうまくいかなかったのか不思議なほど簡単に入りました。
2010
08,26
最近Vineを4.?から5.1にアップグレードしたんだけど、いろいろ不都合(perlモジュールが消えてたり、インストールできなかったりemacsの日本語入力ができなかったり…)がおきて、面倒くさくなったので、インストールし直すことにしました。

今までことあるごとに同研究室のA部君に設定とか手伝ってもらってて、自分が知らないことがいろいろあったんだけど、やっぱり自分でいろいろ把握してないとまずいなーと思うので、設定やインストールを勉強してメモすることに。


とりあえず、インストールして最初の解像度があっていなかったので、解像度変更メモ。

デスクトップ左上の、システム->設定->ハードウェア->ディスプレイで解像度が変更できます。しかし、解像度の一覧に自分の使ってるディスプレイの解像度1920x1200がない。ということで、試行錯誤の上、ect/X11/xorg.confの、Section "Screen"中のSubsection "Display"に、Modesから始まる一行を以下のように追加し、自分のPCの解像度を追加することで解決しました。例)解像度が1920 ,1200なら"1920x1200"を追加。(xはエックスの小文字)
Section "Screen"
    Identifier "Screen0"
    Device     "Videocard0"
    DefaultDepth     24
    SubSection "Display"
        Viewport   0 0
        Depth     24
        Modes    "1680x1050" "1600x1200" "1280x1024" "1280x960" "1024x768" "800x600" "720x400" "640x480" *この一行を追加
    EndSubSection
EndSection
なお、デスクトップ左上システム->システム管理->デスクトップの方の解像度をいじくることでect/X11/xorg.confが書き換わり、上のように記述すればいいことに気づきました。ect/X11/xorg.confを変にいじくると再起動後にX window systemが起動しなくなり、軽い絶望感を味わうことになるので注意が必要。
2009
12,20

たまには研究メモ。

文書から住所抽出するperlモジュールGeography::AddressExtract::Japanを使いたくて、

Geography::AddressExtract::JapanをCentOS4に入れる
[cotalog]Geography::AddressExtract::Japanを使って住所抽出

この二つの記事を参考にさせてもらって、

eclipse上で実行してみるけど

なかなかうまくいかない。

Geography::AddrresExtract::Japan入れるときになんか間違えたかな?

それともvine linuxだからかな・・・?

文字コード回りに問題があるって事はだいたいわかってるんだけど・・・

結局euc-jpモード(いつもはutf-8)で

--

use strict;
use Geography::AddressExtract::Japan;
use encoding "euc-jp", STDOUT => "euc-jp";


my $addr = <<_EOD_;
福岡県筑紫野市
_EOD_

my $t = Geography::AddressExtract::Japan->extract($addr);

print map { $_->{"city"} . $_->{"aza"} . $_->{"number"} . ""; }@{$t};

--

こんな感じにしたらうごいた。

もう少し勉強しないとなぁ・・・

[追記]
use encoding "euc-jp", STDOUT => "euc-jp";

use encoding "euc-jp", STDOUT => "utf8";
にしたらutf8モードでも動いた。
とりあえずここPerl5.8の文字コード周りを参考にさせてもらって
文字コードのおべんきょする。
[追記おわり]

プロフィール
HN:
fukushimu
性別:
男性
自己紹介:
熊本の某大学で情報処理の勉強をしてます。
カレンダー
10 2024/11 12
S M T W T F S
1 2
3 4 5 6 7 8 9
10 11 12 13 14 15 16
17 18 19 20 21 22 23
24 25 26 27 28 29 30
ブログ内検索
つぶやきパーツテスト
カレンダー
最新コメント
[12/12 nvvkofkjdl]
[12/12 clmmxjdfzx]
[12/12 byuahjtfun]
[12/12 lyzithxbgh]
[12/11 xcjlfpuicg]
バーコード
最新TB
P R
カウンター
フリーエリア

Powered by Ninja.blog * TemplateDesign by TMP
忍者ブログ[PR]