2013年10月21日
国立大学法人東京大学
株式会社日立製作所
東大生研と日立による研究開発成果を基にしたデータベース製品が
データベースシステムの業界標準ベンチマーク「TPC-H」における
最大クラス(100TB)に世界で初めて登録
国立大学法人東京大学生産技術研究所(所長:中埜 良昭/以下、東大生研)と株式会社日立製作所(執行役社長:中西 宏明/以下、日立)が、内閣府最先端研究開発支援プログラム*1「超巨大データベース時代に向けた超高速データベースエンジンの開発と当該エンジンを核とする戦略的社会サービスの実証・評価」(中心研究者:喜連川 優 東大生研教授/国立情報学研究所所長、実施期間:2010年3月~2014年3月)において共同で実施している「非順序型実行原理」に基づく超高速データベースエンジンの研究開発成果を基にした日立製データベース製品*2が、このたび、データベースシステムの検索処理性能に関する業界標準ベンチマーク(性能測定基準)である「TPC-H」*3における最大のデータベース規模である100TB*4のクラスにおいて、82,678.0QphH@100TB*5という優れた性能を達成し、同クラスで公表されている性能測定結果リストに世界で初めて登録されました。このたびの「TPC-H」の性能測定結果リストへの同データベース製品の登録は、東大生研と日立による日本発のデータベース技術の有効性が、国際的な基準の下、公的に証明されたことを示すものです。
*1 最先端研究開発支援プログラムは、世界のトップをめざした先端的研究を推進することにより、産業、安全保障等の分野における日本の中長期的な国際的競争力、底力の強化を図るとともに、研究開発成果の国民及び社会への確かな還元を図ることを目的として創設された国の研究開発プログラムです。
*2 超高速データベースエンジンは、日立製のサーバおよびストレージと組み合わせた高速データアクセス基盤「Hitachi Advanced Data Binder プラットフォーム」として、2012年6月に日立により製品化されています。
*3 「TPC-H」は、非営利団体であるTransaction Processing Performance Councilが仕様を定めているデータベースシステムの標準的なベンチマークであり、意思決定支援のための複雑なデータベース検索処理を対象としています。 「TPC-H」ホームページ:http://www.tpc.org/tpch/default.asp
*4 100TBのデータは、大手コンビニエンスストアのPOSデータに換算して、約7年分に相当するデータ量です(日立調べ)。
*5 QphH(TPC-H Composite Query-per-Hour Performance Metric)は、「TPC-H」におけるデータベース検索処理の性能を示す指標で、QphHの後ろに@を付けてデータベース規模を併記します。
近年、クラウドコンピューティングの拡大や、多機能情報端末の急速な普及などを背景として、企業や社会活動で発生するデータが増加しており、グローバルでの事業拡大や、新事業の創出、より豊かでスマートな社会の実現に向けて、ビッグデータ利活用に対する期待が急速に高まっており、データの超高速な検索処理を可能にするデータべース製品が求められています。
東大生研と日立は、このような中、内閣府最先端研究開発支援プログラムにおいて、「非順序型実行原理」に基づく超高速データベースエンジンの研究開発を進めてきており、2011年6月に、一般的なHDD(Hard Disk Drive)構成のストレージ環境において、従来型のデータベースエンジン比で約100倍*6のデータ検索処理性能を確認したことを発表し、日立は、2012年6月に、同データベースエンジンを製品化*2しています。その後、東大生研と日立は、フラッシュメモリをストレージデバイスとして活用したストレージ環境(フラッシュストレージ環境)において性能検証を行い、2013年8月に、同環境においても従来型のデータベースエンジン比で約100倍*6のデータ検索処理性能を達成しました。さらに、東大生研と日立は、100TBを超える大規模なデータベース環境への適用に向けて、東大生研の大規模実験環境を利用した実験を進めてきました。
*6 解析系データベースに関する標準的なベンチマークを元に作成した、各種のデータ解析要求の実行性能を計測しました。データ解析要求の種類によって高速化率に差は見られるものの、データベースにおいて特定の条件を満たす一定量のデータを絞り込んで解析を行うデータ解析要求においては、約100倍の高速化を確認しています。
今回、これまで進めてきた実験の結果を踏まえ、東大生研と日立による研究開発成果を基にした日立製データベース製品の大規模なデータベース環境における有効性を、公的な基準の下で確認するため、データベースシステムの検索処理性能に関する業界標準のベンチマークである「TPC-H」における最大のデータベース規模である100TBのクラスにおいて、日立が性能の検証を行いました。この結果、同データベース製品が82,678.0QphH@100TBという優れた性能を達成したことが確認され、同クラスにおいて公表されている性能測定結果リストに登録されました。「TPC-H」では、従来、30TBまでのクラスにのみ、各種のデータベース製品が登録されており、100TBのクラスは未到達の領域でした。今回の日立製データベース製品の登録は、100TBのクラスにおける世界で初めての登録です。今回の登録は、100TBという大規模なデータベースの検索処理において、日本発の超高速データベースエンジンが優れた性能を発揮できることが、国際的な基準の下、公的に証明されたことを示すものです。東大生研と日立は、このたびの性能検証および「TPC-H」の性能測定結果リストへの登録を踏まえ、今後も超高速データベースエンジンの検索処理性能の向上に向けた共同研究開発を推進し、ビッグデータ利活用によるイノベーションの実現に貢献していきます。
■今回のベンチマーク評価構成の概要
データベース:Hitachi Advanced Data Binder 01-02
サーバ:BladeSymphony BS2000(8CPU(80コア)構成、2TBメモリ)×4式
ストレージ:Hitachi Unified Storage 150(900GB 10,000rpm SAS HHD×100台)×16式
■東大生研と日立の超高速データベースエンジンの共同研究開発について
東大生研と日立は、従来は困難であったビッグデータに対する高速検索処理の実現をめざし、内閣府最先端研究開発支援プログラム「超巨大データベース時代に向けた超高速データベースエンジンの開発と当該エンジンを核とする戦略的社会サービスの実証・評価」(中心研究者:喜連川 優 東大生研教授/国立情報学研究所所長、実施期間:2010年3月~2014年3月)において、「非順序型実行原理」に基づく超高速データベースエンジンの共同研究開発を実施しています。
■「非順序型実行原理」の概要と特徴について
非順序型実行原理は、喜連川 優 東大生研教授/国立情報学研究所所長と合田 和生 東大生研特任准教授が考案した実行原理で、データの要求順序とは無関係な順序で非同期にデータを処理することにより、ハードウェアの処理性能を最大限に引き出すことを可能にする点に特徴があります。東大生研と日立が研究開発中の超高速データベースエンジンは、当該実行原理により、ストレージシステムならびにマルチコアプロセッサの利用効率を大きく向上させることを実現することにより、ビッグデータに対する検索処理の飛躍的な高速化をめざしています。
■最先端研究開発支援プログラム「巨大データベース時代に向けた最高速データベースエンジンの開発と当該エンジンを核とする戦略的社会サービスの実証・評価」に関するホームページ
http://www.tkl.iis.u-tokyo.ac.jp/FIRST/
■商標に関する注記
・TPC-H、QphHは、Transaction Processing Performance Councilの商標です。
・その他、記載の会社名、製品名は、それぞれの会社または団体の商標または登録商標です。
■本件に関するお問い合わせ先
国立大学法人東京大学 生産技術研究所最先端研究開発支援室 [担当:大内]
〒153-8505 東京都目黒区駒場四丁目6番1号
電話:03-5452-6706(直通)
株式会社日立製作所 情報・通信システム社 ITプラットフォーム事業本部 開発統括本部
ソフトウェア開発本部 先端開発プロジェクト室 [担当:吉野]
〒244-0817 神奈川県横浜市戸塚区吉田町292番地
電話:045-862-8714(直通)