本文へジャンプ

お知らせ

2017年4月25日
GridDBをAWSマーケットプレイスで米国市場向けに販売を開始しました。
詳しくはこちらをご覧ください。
IoT向けスケールアウト型データベース「GridDB」をAWSマーケットプレイスで米国市場向けに発売
2017年2月7日
2017年3月10日(金)、11日(土)開催 「 オープンソースカンファレンス 2017 Tokyo/Spring 別ウィンドウで開きます」でビッグデータ/IoT時代に対応するための高速処理と高信頼性を両立した、ペタバイト級の多種大量データを蓄積するオープンソースデータベース GridDBをご紹介します。
2017年1月24日
GridDB Vector Editionのマニュアル最新版を公開しました。詳しくは下記をご覧ください。
GridDB Vector Edition

バックナンバー

IoT/ビッグデータ向けスケールアウト型データベースGridDB®

マシンやデバイスに設置したセンサーなどから大量のデータが集まるIoTの分野では、「将来にわたってデータがどれだけ増えるかわからない」という課題があります。世の中で生成されるデータの量は数年で数倍、もしくはそれ以上のスピードで増えています。ビッグデータであるIoTデータ(センサー、ログ、履歴、株価など)を扱う情報システムは、分・秒周期、さらにそれ以下の周期で発生する膨大な時系列データを扱うことが求められます。また、各センサー内のデータの欠損や参考データの矛盾などがないようにデータの一貫性や整合性を保つ必要も求められます。
これらのビッグデータを格納するデータベースは、高速性のみならず、高い拡張性や信頼性、さらにはデータの一貫性が実現されることが重要と東芝は考えます。
これらの実現を目指したスケールアウト型のデータベースが東芝のGridDBです。GridDBは、インメモリー指向アーキテクチャ、キーコンテナ型データモデル、自律制御クラスタ管理機能などにより、ペタバイト級のビッグデータでも高速に登録し検索できます。また、コンテナ単位でのデータ一貫性を保証したスケールアウトや、無停止運用なども実現しています。

IoT指向モデルのデータベース

GridDBは、キーコンテナ型データモデルと時系列データ処理で、増加し続けるIoTデータの管理を最適化しています。キーコンテナ型データモデルは、NoSQLの代表的なデータモデルであるキー・バリュー型を拡張したものです(図参照)。キーとコンテナの関係は、RDBのテーブル名とテーブルの関係に相当し、RDBと同様の感覚でスキーマ定義やデータ設計ができます。Java/C APIによりデータへの高速なアクセスを可能にし、コンテナ単位でデータの一貫性を保証しています。
IoTで発生する時系列データは、タイムスタンプに関連付けられたデータの管理に適した、時系列コンテナで管理します。

IoT指向モデルのデータベースの図

インメモリー型アーキテクチャで高速にデータベース処理を実現

従来のデータベースではI/Oがボトルネックとなり、CPUが十分な性能を発揮できていませんでした。GridDBは必要なデータをメモリに格納し、それ以外のデータをストレージ、例えばSSDやHDDに渡します。「メモリが主、ストレージが従」という構造は従来とは逆。このほかにもさまざまな工夫で、ハードウェアの性能を最大限に引出します。

データ量に応じて簡単にスケールアウト

スケールアップとスケールアウトのうち、スケールアップ型の代表的な存在がRDB(Relational Database)です。RDBの場合、サーバーを多数並べて運用すると、一貫性を維持するためにサーバー間のやり取りが頻繁に発生します。この制約により分散化には不向きで、データ量が一定レベルを超えるとRDBは性能面での問題が表面化します。
一方、分散KVS(Key-Valueストア)は、機能がシンプルなので、スケールアウトが容易です。しかし、データの一貫性のレベルが低く、トランザクション機能も備えていないのが一般です。
GridDBは、キーコンテナ型データモデルにより、コンテナ単位でACID(Atomicity, Consistency, Isolation, Durability)と呼ばれるデータベースの一貫性を保持します。これにより優れたスケーラビリティを実現しました。千台規模までリニアにスケールするうえ、運用中のサービスを停止することなくノードを追加することもできます。独自に開発した非共有型クラスタ技術などのアルゴリズムに基づくノンストップのスケールアウトは、ビジネスそのものに大きなメリットをもたらします。

障害が発生しても無停止運用の実現

マスターサーバーを自動選出する自律制御クラスタ管理機能により、SPOF(Single Point of Failure:単一障害点)を排除しました。また、レプリケーションによるデータ多重化を自動的に実行し、サーバーに障害が発生しても、システムを止めることなく運用を継続できます。クリティカルなシステムが要求する水準を十分にクリアする堅牢さを実現しました。

多様なデータ構造のサポート

コンテナとしてレコード集合を管理するコレクションコンテナと時系列データを管理する時系列コンテナが用意され、特に時系列データの管理に強みを持っています。例えば、RDBで時系列データの管理をする場合、日付などの重複したデータが多くなるため、データサイズが肥大化しますが、時系列データに強いGridDBなら、独自のデータ圧縮機能でRDBに比べてデータサイズを大幅に圧縮し、メモリ使用量を大幅に抑えます。そのうえ、保持期限を決めることで、不要となったデータを自動削除する期限解放機能を用いることで、データサイズをさらに小さくすることも可能です。「1年経過したデータを消去」のように、期限がきたデータを解放する処理を実行する場合、RDBでは明示的な操作が必要なうえ、解放作業中はほかのサービスが圧迫されます。また、2次元、3次元の空間データもサポートしています。地図における位置情報など、空間データの登録と空間領域を利用した検索が容易にできます。


関連製品/ソリューション
  • SPINEX

Get Adobe Reader

PDFファイルの閲覧には、
Adobe® Reader® が必要です。別ウィンドウで開きます

別ウィンドウで開きますマークの付いたリンクは、別ウィンドウで開きます。

オープンソースデータベース GridDB別ウィンドウで開きます

インダストリアルICTソリューション社のトップへ