このような悩みであればオープンデータレイクが役立ちます

  • 担当者がいくつかのシステムのデータを見る必要があるため画面にいくつものシステムビューを立ち上げている
  • 社内の複数システムに保存されたデータを整理統合したいけどできない
  • 高速なデータの追加と参照系が多いのでRDBでは対応できない
  • IoTやWebログなど多様なデータを整理統合して分析したい
  • 将来的にカラムが増えることが容易に想像できるシステム
  • データベース性能はともかく、データ構造の多様性や柔軟性が求められるシステム

オープンデータレイクの概念図

オープンデータレイク構築サービスの特徴

POCファースト

POC(Proof Of Concept)からスタートします。オープンデータレイクの構築は簡単でもビジネスインパクトは仮説を実証してみる必要があります。当社は闇雲なサービス提供ではなく、お客様との対話を通じてオープンデータレイクの構築によって得られる価値について話し合います。

MongoDB活用

NoSQLデータベースのデファクトスタンダードであるMongoDBを活用しています。MongoDBの利便性、柔軟性、パフォーマンスはNoSQLデータベースでは世界最大級の実績で実証済みです。オープンデータレイクの構築はMongoDBを活用しているので、安心してデータを蓄積することができます。

多様なデータソースへの対応

企業が社内に蓄積している殆どのデータをオープンデータレイクに蓄積することができます。対象データは、ORACLE、MySQL、Postgres、DB2/AS400、SQL Server、Vertica、Informix、Amazon RDS、Microsoft Access、Box、Dropbox、AWS S3、Nettiza、TERADATA、AWS Redshift、Hortonworks、MapR、Cloudera、PIVOTAL、csv、XML、JSON、Marketo、Salesforce、Microsoft CRM、SugarCRM、Microsoft Excel、SAPなどです。

データプロファイリング

社内に蓄積しているデータをオープンデータレイクに蓄積するために既存データのプロファイリングが必要になります。既存データの属性やメタデータなどを調査分析することによってオープンデータレイクからデータを抽出して分析するプロセスが容易かつ品質が高まります。

スキーマ・オン・リード

オープンデータレイクも基本的にスキーマ・オン・リードのアーキテクチャを採用しています。スキーマ・オン・リードであるため、データを格納する前に、将来的にどのようにデータを取り出したいのか、どのような観点で分析したいのか、どのようなデータを使いたいのかを格納時点で定義する必要はありません。したがって、新しいデータソースを簡単に取り込めますし、大規模データであっても短時間で新しいレポートの作成などが可能となります。

オープンデータ対応

日本政府は、官民データ活用推進基本法を制定し、国及び地方公共団体はオープンデータに取り組むことを義務付けました。つまり、多くの政府公共団体のデータが公開されています。このようなオープンデータをオープンデータレイクに蓄積しておくことで、お客様の社内のデータと社外のオープンデータを統合して新しいインサイトを得ることができます。