2007年12月19日水曜日

Tritonn vs Ludia (1)

Tritonnで1000万件程度のレコードから全文検索してみたけど、思った以上に好パフォーマンスを出してくれた。で、折角だからPostgreSQLのSenna+MeCab実装であるLudiaも試してみようと思った。このあたりの話が全文検索でもいえるのかどうか調べるいい機会でもありますしね。

「PostgreSQLは遅い」は本当か?:OSSデータベース比較
http://japan.cnet.com/news/ent/story/0,2000056022,20346959,00.htm

まずはCentOS4.4にPostgreSQL8.2をインストールするところからはじめる。というのも、CentOS4.x系のレポジトリに用意されているものは8.1.x系だからです。

1.最新のsrpmをダウンロードする
# wget ftp://ftp2.jp.postgresql.org/pub/postgresql/binary/v8.2.5/linux/srpms/redhat/rhel-es-4/postgresql-8.2.5-2PGDG.f7.src.rpm

2.rpmパッケージを作成する
# rpmbuild --rebuild postgresql-8.2.5-2PGDG.f7.src.rpm

libtcl-develパッケージがないという依存エラーが出たのでyumでさくっとインストールしておく。

3.出来上がったrpmパッケージをインストールする
# rpm -ihv /usr/src/redhat/RPMS/i386/postgres*

4.サービスを開始する
# service postgresql start

5.postgresユーザになってデータベースを作成する
# su postgres
$ createdb test

6.(おまけ)データをインポートするJavaプログラムの書き換え
Class.forName("com.mysql.jdbc.Driver")

Class.forName("org.postgresql.Driver")

DriverManager.getConnection("jdbc:mysql:test?useUnicode=true&username=root&password=XXX")

DriverManager.getConnection("jdbc:postgresql:test", "root", "XXX")

とりあえずこれでデータのインポートは開始できた。終わったらいよいよCREATE INDEXでインデックスを作成していく。

次回へ続く(あるのか・・・?)


参考サイト
(1) Ludia Wiki
http://ludia.sourceforge.jp/moin.cgi/

(2) らむの備忘録 - [CentOS4.4]PostgreSQL8.23のインストール http://www.e-tsuyama.com/cgi-bin/blog/ms.cgi?ShowDiary_file=/centos/1176191143&blogid=20&t=sketch

2 コメント:

グニャラくん さんのコメント...

続きわくわく。

Daisuke さんのコメント...

続き楽しみにしてます。