TPC-H

とあるデータベースの社内性能評価を行うにあたり、色々とモデリングなどを模索していたところ、DWH系の性能評価に使えるTPC-Hというものがありました。

全て英文ですが、テーブル定義やデータ生成ツール(dbgen)、ベンチマーク用SQLも用意されており、そのまま性能評価に利用することができそうです。

マニュアルやツールなどのダウンロードはこちらから
2010/08/12現在のツール最新は tpch_20100211.zip です。

テーブルは定義があれば何とかなりますが問題はデータ作成です。

データ生成ツールが付属していますが、手元にUnix(Linux)が用意できなかったので、Cygwinで試してみました。
Cygwinをインストールしてコンパイルに必要なものをインストール。
[gcc、automake]

解凍したフォルダの直下にある makefile.suite を編集します。

CC = gcc
DATABASE= ORACLE
MACHINE = LINUX
WORKLOAD = TPCH

Cygwinのプロンプトから

make -f makefile.suite

でコンパイル。
qgen?のコンパイルはエラーになりますが、dbgenはできたので気にせず目的のデータを作成します。

dbgen -s 1

これでSF(スケールファクター)1のデータが無事作成されました。
そしてテーブル定義から作成したテーブルへ・・・。

つづきはそのうち。。。

コメント