本文へジャンプ

大容量かつ多様なデータを活用し、これまでとは異なる視点でデータ分析を強力にサポート

これまでデータ量や処理時間の制限から、多くのデータが活用されずに捨てられてきました。GridData Grid Processing Serverの並列分散処理を利用することで、膨大な量のデータを高速に処理し、埋もれていた新しい価値をビジネスに活用できます。

各種データを組み合わせて大規模データの分析が可能

これまではシステムごとに蓄積されたデータ内でのみの分析でしたが、企業内外に散在する各種データをひとくくりにして、さまざまな組み合わせでのデータ分析が可能になります。

企業内のさまざまなシステムのデータやシステムログ、ソーシャルメディアデータなど、さまざまなデータをGridDBに蓄積します。蓄積されるデータは膨大な量となるため、データを分析するには並列分散処理が必要になります。

各種データを組み合わせた大規模データの分析イメージ

各種データを組み合わせた大規模データの分析イメージ

※画像が見えづらい場合はピンチインしてご覧ください。

並列分散処理を高速にするGridDB連携

GridDB内のデータを直接MapReduce方式で並列分散に処理します。一般的な並列分散処理ではデータベースのデータを一旦HDFSに落とします。GridDBとGridData Grid Processing Server を組み合わせると、GridDBから直接並列分散処理が実行できます。HDFSへのインポート/エクスポート処理が発生しないため、高速にデータを処理することができます。

GridDB連携による並列分散処理イメージ図

GridDB連携による並列分散処理イメージ図

既存のHadoopアプリケーションの活用

Hadoopと当社製品であるGridDBとの連携が可能です。これにより、既存のHadoopアプリケーションを簡単に活用できます。

Hive、Pigの利用が可能

GridDB内のデータに対しても簡易型データ処理言語であるHive、Pigの利用が可能です。Hiveはリレーショナル・データベースで利用しているSQLに似た記法で、Pigは簡単なデータフローを表現した記法でそれぞれ並列分散処理を記述できます。

分析アプリケーションの要求に応えるRアダプタ搭載

統計解析専用言語であるR言語からGridDBを利用できるように、GridDBと接続するためのRアダプタを提供しています。高度な統計解析を利用したデータ分析を行いたい場合に有用です。

ライセンス体系

ライセンス形態

パーペチュアルライセンス 購入後、永続的に使用できるライセンス(保守契約が必要)
サブスクリプションライセンス 契約期間だけサービスを使用できるライセンス

サポート環境

OS Red Hat Enterprise Linux 6.4/6.5(x86_64)、CentOS 6.4/6.5(x86_64)
メモリ 32GB以上
必要ソフト Oracle® Java SE Development Kit 8, Update 45 (JDK 8u45)以上
GridDB/NoSQL DB V2.7、GridDB/NewSQL DB V1.5.0
hive-0.13.0-cdh5.3.3(Hiveを利用する場合は必要)
pig-0.12.0-cdh5.3.3(Pigを利用する場合は必要)
sqoop-1.4.5-cdh5.3.3(Sqoopを利用する場合は必要)
zookeeper-3.4.5-cdh5.3.3(ZooKeeperを利用する場合は必要)
R version 3.1.2(Rを利用する場合は必要)

関連製品/ソリューション
  • SPINEX

Get Adobe Reader

PDFファイルの閲覧には、
Adobe® Reader® が必要です。別ウィンドウで開きます

別ウィンドウで開きますマークの付いたリンクは、別ウィンドウで開きます。