Tritonnで1000万件程度のレコードから全文検索してみたけど、思った以上に好パフォーマンスを出してくれた。で、折角だからPostgreSQLのSenna+MeCab実装であるLudiaも試してみようと思った。このあたりの話が全文検索でもいえるのかどうか調べるいい機会でもありますしね。
「PostgreSQLは遅い」は本当か?:OSSデータベース比較
http://japan.cnet.com/news/ent/story/0,2000056022,20346959,00.htm
まずはCentOS4.4にPostgreSQL8.2をインストールするところからはじめる。というのも、CentOS4.x系のレポジトリに用意されているものは8.1.x系だからです。
1.最新のsrpmをダウンロードする
# wget ftp://ftp2.jp.postgresql.org/pub/postgresql/binary/v8.2.5/linux/srpms/redhat/rhel-es-4/postgresql-8.2.5-2PGDG.f7.src.rpm
2.rpmパッケージを作成する
# rpmbuild --rebuild postgresql-8.2.5-2PGDG.f7.src.rpm
libtcl-develパッケージがないという依存エラーが出たのでyumでさくっとインストールしておく。
3.出来上がったrpmパッケージをインストールする
# rpm -ihv /usr/src/redhat/RPMS/i386/postgres*
4.サービスを開始する
# service postgresql start
5.postgresユーザになってデータベースを作成する
# su postgres
$ createdb test
6.(おまけ)データをインポートするJavaプログラムの書き換え
Class.forName("com.mysql.jdbc.Driver")
↓
Class.forName("org.postgresql.Driver")
DriverManager.getConnection("jdbc:mysql:test?useUnicode=true&username=root&password=XXX")
↓
DriverManager.getConnection("jdbc:postgresql:test", "root", "XXX")
とりあえずこれでデータのインポートは開始できた。終わったらいよいよCREATE INDEXでインデックスを作成していく。
次回へ続く(あるのか・・・?)
参考サイト
(1) Ludia Wiki
http://ludia.sourceforge.jp/moin.cgi/
(2) らむの備忘録 - [CentOS4.4]PostgreSQL8.23のインストール http://www.e-tsuyama.com/cgi-bin/blog/ms.cgi?ShowDiary_file=/centos/1176191143&blogid=20&t=sketch
登録:
コメントの投稿 (Atom)
2 コメント:
続きわくわく。
続き楽しみにしてます。
コメントを投稿