...

エンタープライズグレードのHadoopによってApache Hadoopの価値と

by user

on
Category: Documents
6

views

Report

Comments

Transcript

エンタープライズグレードのHadoopによってApache Hadoopの価値と
パンフレット
エンタープライズグレードの
Hadoop
Apache Hadoop の価値とパフォーマンスを最大限に活用し、
妥協のない拡張性を実現
P2
パンフレット
ビッグデータの価値を特定して実現するために、多くの組織がアジャイルで高機能な分析システ
ムを探し求めています。Apache Hadoop は、非常に大規模なストレージ / データ処理について、
コストを大幅に削減して高い価値を実現できるソフトウェアフレームワークです。多くの組織で
は、シンプルなワークロード用のデータレポジトリとして Hadoop を試験的に導入していますが、
プラットフォーム内のデータをさらに活用し、データを操作して新たなビジネスインサイトを発
見すれば、Hadoop からはるかに多くの価値を得られます。しかし、課題も存在しており、この
価値が制限されて、チャンスを活かせない可能性があります。ヒューレット・パッカード エンター
プライズは、堅牢かつ柔軟な製品を利用して、そのような課題を解決するソリューションを開発
しました。ビジネスニーズの変化に合わせて拡張できる、将来性に優れたデータ中心型基盤を実
現できます。
今日のビジネス課題
60%
100%
8倍
の HDFS への書き込み性能の向上 1
の関連データ
最大
高速な分析
2
データはアイデアエコノミーを推進する燃料です。しかし、すべての関連データを利用するには、
この燃料を消費する新しいエンジンを活用し、優れたビジネス成果を実現する必要があります。
過去 10 年間で、Hadoop は重要なエンジン / 燃料タンクになり、クリティカルマスに相当する開
発者、データサイエンティスト、IT プロフェッショナルから支持を得てきました。Hadoop は主
要な先見的企業で利用されてきましたが、アーリーアダプターの大多数では、ほとんどの用途が
科学実験、単純なワークロード、試験導入に限られていました。ヒューレット・パッカード エン
タープライズは Hadoop がもたらす課題とチャンスを理解しており、お客様の組織でエンタープ
ライズグレードの Hadoop をデータ中心型プラットフォームの基礎として活用できるように支援
します。
お客様の課題
お客様のニーズ
既存テクノロジーではデータ増加への対応が不可能 :
現在利用できるデータは、大部分が過去 2 年間に生成
されたものです。新しいデータソースやタイプから生
成された場合が多く、既存のアーキテクチャー、デー
タベース、データ管理アプローチでは対応が困難に
なっています。ある調査では、調査対象の企業の 41
パーセントが、さまざまなソースから生成される大量
のデータを自社のシステムでは処理できないと回答し
ています 3。
ビッグデータ用の拡張可能で低コストな統合レポジト
リ : 組織は、Hadoop を通じて幅広いデータを低コス
トに保管して管理できる一元的な場所を必要としてい
ます。従来型データベースのような厳格な構造を持た
ないビジネスデータから、幅広い構造化データ、半構
造化データ、非構造化データまでが対象となります。
また、そこでは、標準的な SQL や高度なツールを活
用できる必要もあります。
妥協のない Hadoop の拡張性 : 組織は Hadoop への
投資を有効に活用して、データレイクを拡張したいと
考えています。しかし、Hadoop には、複雑なワーク
ロード用の分析機能やパフォーマンス最適化機能が備
わっていません。また、堅牢なセキュリティが欠けて
おり、規模が拡大すればリスクが高まります。
エンタープライズグレードのワークロード管理、パ
フォーマンス、可用性、セキュリティ : 実績あるイン
フラストラクチャと分析テクノロジーを活用した、柔
軟かつ堅牢なソリューションです。ANSI SQL クエリ
が使用され、ユースケースに応じた適切な量のコン
ピュート、ストレージ、分析機能が提供されます。
Hadoop と統合されたセキュリティ機能により、移動
中 / 保管中 / 使用中のデータが保護されます。
Hadoop を活用する方法の特定 :
多くの組織が、Hadoop を最大限に活用できる適切な
お客様のビジネスを理解でき、複雑な異機種混在 IT
環境に関する経験を持つパートナー : お客様の組織は、
確実に価値を実現できる Hadoop ユースケースに優
先的に取り組み、既存のアプリケーションや大規模な
ビジネスインテリジェンス (BI)/ 分析環境と統合する
必要があります。IT 環境は難解で複雑であり、これら
の課題を解決するには、高度な専門知識を持つパート
ナーが必要です。
プロジェクトやユースケースの特定に苦労していま
す。Hadoop フレームワークは多数のワークロードや
ユースケースを実現できますが、組織は実行するワー
クロードやユースケースを特定し、ビジネスに対する
影響 / 価値を判断しようと悪戦苦闘しています。
お客様にとっての価値
『 HPE
Big Data Reference Architecture:
A Modern Approach』、4AA5-6141ENW、
2015 年 10 月、Rev. 2。
1
2
3
HPE 社内調査。
Capitalizing on the promise of Big Data』、
PwC ホワイトペーパー、2013 年 1 月。
『
ヒューレット・パッカード エンタープライズは、企業がアイデアエコノミーで生き残り、成功す
るために必要な要素を理解しています。まずアイデアを基にして適切な検証を行い、その結果か
ら大規模なビジネスソリューションを構築する必要があります。この 2 段階の取り組みは、デー
タからインサイトを獲得し、そのインサイトから優れたビジネス成果を生み出す必要があること
を示しています。ヒューレット・パッカード エンタープライズは、お客様と連携してデータの価
値を発見できます。データ中心型基盤を構築して、そのデータからインサイトを獲得し、ビジネ
スのスピードに合わせてインサイトから優れたビジネス成果を生み出せるようにお客様を支援し
ます。その際に、Hadoop をビッグデータ分析ソリューションの基礎として組み込みます。
P3
パンフレット
Hadoop の専門知識 : ヒューレット・パッカード エンタープライズは、Hadoop 環境のすべての
側面を最適化してきた実績があります。最適化により、お客様が複数のアプリケーションを実行し、
複数のデータストアを単一システムに集約できるようになります。HPE のリファレンスアーキテ
クチャーは、新たなニーズに適応するために開発されました。これにより、コンピュートとスト
レージを個別に拡張し、標準的な Hadoop ローカルノードのコンピュート / ストレージチェーン
を分割し、従来型アーキテクチャーを最適化できます。このような進歩により、YARN、Spark、
Kafka、Mahout を最大限に活用できるようになります。当然、コアモジュールの Hive、HBase、
MapReduce、Hadoop Distributed File System (HDFS) も最大限に活用できます。さらに、ヒュー
レット・パッカード エンタープライズは Hadoop に機能を追加する業界最先端のソフトウェア
も用意しています。Vertica for SQL on Apache Hadoop、予測分析向けの Vertica Enterprise
Edition、幅広い情報ガバナンス / 管理 / データセキュリティスイートにより、包括的なエンター
プライズグレードの機能を確保できます。
Hadoop はビッグデータや分析の市場において、有効なオープンソーステクノロジーとして急速
に注目を集めてきましたが、広範なデータ革命でも見られたように、重大な課題が多数現れて
います。適切なセキュリティと信頼性を確保した方法で Hadoop を大規模に実装するには、非
常に複雑なプランニング、配備、長期管理の課題を解決する必要があります。現在、市場では
Hadoop の専門家が全体的に不足しています。専門家の不足に加えて、Hadoop のテクノロジー
スタックが継続的に進化 / 成熟していることも課題を複雑にしており、難度と不確実性が高まっ
ています。
ヒューレット・パッカード エンタープライズは、高度なデータ / 分析システムの実装に対して、
定評ある 4 段階のアプローチ(ディスカバリー、開発、統合、実装)を使用します。Hadoop の
価値を最適化して優れたビジネス成果を実現できるように、このアプローチで大企業から中小企
業まで世界中のお客様をサポートしてきました。
グローバルに展開した分析スタッフ : ヒューレット・パッカード エンタープライズは、世界中で
活動している 3,500 人以上の分析エキスパートを通じて、お客様のミッションクリティカルソ
リューションを実装します。分析エキスパートは、平均で 18 年を超える分析の専門知識を持ち、
4 大陸の 9 カ所にある分析のセンターオブエクセレンスに所属しています。
統合ソリューション : ヒューレット・パッカード エンタープライズは、オープンスタンダード製品、
オープンなアーキテクチャー / サービス、高度な専門知識で構成された強力なポートフォリオを
提供しています。これらにより、分析機能を標準のプロセスやワークフローに統合して組み込め
るため、インサイトを行動につなげやすくなります。次第にメリットが減少していく、柔軟性の
低い独自仕様のソリューションにロックインされる心配はありません。
のグローバル分析プロフェッショ
ナル
18 年
以上
ビッグデータ分析リファレンス
アーキテクチャー
人以上
SAP® HANA
HPE Vertica
for SQL on
Apache Hadoop®
HPE IDOL
HPE情報
ガバナンス
HPE SecureData for Apache Hadoop
Hadoop (Hortonworks、Cloudera、MapRディストリビューション)
HPE対称型/非対称型コンピュート/ストレージアーキテクチャー
にわたる分析経験
オンプレミス/ハイブリッドクラウド配備オプション
図 1: ソリューション概要
Hadoop向けHPE統合サービス
1200
Hadoop向けHPE分析コンサルティングサービス
パンフレット
エンタープライズグレードの Hadoop
あらゆるタイプのビッグデータ(マシンデータ / ヒューマンデータ / 従来型ビジネスデータ)にわたり、TB から PB 規模のデータを扱うための
データ中心型基盤については、例外なく Hadoop がコアコンポーネントになるという共通認識が広がっています。HDFS は、既存のスキーマベー
スのデータベースから抽出されたデータ用のデータレイクになります。また、それほど構造化されていない新しい多様なデータソース(ソーシャ
ルメディア、マシンログ、他の新しいビッグデータソースなど)用のデータレイクにもなります。ヒューレット・パッカード エンタープライズは
オープンソースをベースとして、エンタープライズグレードの Hadoop を実現します。
ソリューション
コンポーネント
説明
Hadoop 向け
Hadoop 向け HPE As a Service ソリューションは、オープンソースをベースとしたエンタープライズクラスのビッグデータプラットフォームです。
HPE As a Service as-a-Service のクラウドベース配備 / 消費モデルで、HPE のホステッド / オンプレミスソリューションとともに使用します。HPE のソリューション
ソリューション
では、HPE Helion クラウド内で構成済みの Hadoop プラットフォームが提供されるため、高額な初期コスト、大きな実装リスク、IT リソースの
負担増加は発生せず、「シェルフウェア」になる事態も避けられます。これにより、お客様はビジネス目標の達成に集中できるようになります。階
層型のワークロードオプションで提供されるため、変化に柔軟に適応できると同時に、テクノロジーの陳腐化リスクを低減できます。
Hadoop 向け HPE As a Service ソリューションは、HPE Vertica の分析データベース機能を追加して、大量のデータセットをほぼリアルタイムで
扱えるように拡張できます。また、IDOL を追加すると、あらゆる形式の非構造化データを処理できるようになります。
HPE 分析コンサル HPE 分析コンサルティングサービスでは、データの価値を判断する作業を、数週間や数カ月ではなく数時間や数日で完了できます。その後は、デー
ティングサービス
タ中心型基盤を構築するための適切なコンポーネントを特定し、ビジネスプロセスの現場で分析機能をその基盤上で運用する方法を確認し、実装
できるようにお客様をサポートします。HPE は、お客様の組織が BI/ エンタープライズデータウェアハウス (EDW) に対する既存の投資の最適な
組み合わせを判断し、リアルタイム分析とバッチ分析への投資のバランスを取り、Hadoop をデータレイクと分析プラットフォームとして利用で
きるように支援します。
Hadoop
Hadoop は、Apache でビッグデータ管理 / 分析用に開発されているオープンソースのモジュール式ソフトウェアフレームワークです。オープンス
データ中心型基盤
の Hadoop 統合
サービス
Hadoop 向け HPE ディスカバリー / トランスフォーメーションサービスにより、次の取り組みが可能になります。データ / 分析ディスカバリーに
対する正式な体系的アプローチ(体系的な方法論を含む)、統合プラットフォームの一部としての専用データ可視化 / 共有ツールの使用、スキル向
HPE IDOL 10
HPE Vertica for
SQL on Apache
Hadoop
タンダードハードウェア上で数ペタバイトのデータを処理できるように拡張できます。
上とコラボレーション手法の改善、大規模かつ費用効果の高い検証をサポートするベストプラクティス。
Hadoop 向け HPE 統合サービスは、インフラストラクチャの最適化とモダナイゼーションを支援し、Hadoop プラットフォームにエンタープライ
ズグレードの機能を搭載するための追加のシステム要件に対応できるようにします。
HPE Intelligent Data Operating Layer (IDOL) を使用すると、データレイクに保存されているペタバイト規模のヒューマンインフォメーションに
アクセスし、分析して理解し、それに基づいて行動できるようになります(コンテキストに応じて複数の言語で可能)。クラウドやオンプレミスな
ど、ほぼすべてのソースに対応しています。テキスト、画像、音声、ビデオ、ソーシャルメディア、データベース内の構造化データに適用できる、
500 の分析機能が含まれています。IDOL には、1,000 以上の標準ファイル形式と 400 のアプリケーション / データベースインターフェイスに対
応した、すぐに使用できるコネクターが備わっています。IDOL を Hadoop とともに使用して、データレイクのカテゴライズ / インデックス化 /
把握が可能です。
HPE Vertica for SQL on Apache Hadoop は、Hadoop データに対して SQL クエリを実行するための、最もエンタープライズに適した方法です。
MapR、Hortonworks、Cloudera 上で完全な ANSI SQL 構文を提供します。お客様のビジネスアナリスト、データサイエンティスト、開発者は、
特別な設定なしで HPE Vertica for SQL on Apache Hadoop を従来型 BI ツールや最新の業界標準の分析 / 可視化ツールと統合して利用できます。
HPE Vertica は、エンタープライズに対応する高度な分析機能を提供します。完全な ANSI SQL、Atomicity/Consistency/Isolation/Durability (ACID)
への準拠、複雑なデータタイプ、SQL on Hadoop 環境でのみ利用可能なその他の機能がサポートされています。圧縮、列指向(カラムナー)保管、
プロジェクションなどの機能を備えており、標準的な SQL on Hadoop をはるかに上回るレベルのパフォーマンスを実現します。
リスクを低減して、人材 / 資金 / データセンターリソースを最適化するには、お客様固有の Hadoop ユースケースをサポートできる適切なアーキ
Hadoop 向け
HPE リファレンス テクチャーの採用が不可欠です。たとえば、Hive、SQL、Spark のインメモリ処理、Kafka のストリーミングデータ、Mahout の機械学習などで
アーキテクチャー す。ヒューレット・パッカード エンタープライズは、Moonshot、HPE Apollo 2000/4000 シリーズ、ProLiant XL シリーズサーバーを組み合わ
せて、Hadoop 用のワークロード最適化に対応できる多数のリファレンスアーキテクチャーを用意しています。これにより、Hadoop ディストリ
ビューションの 3 つすべて (MapR、Hortonworks、Cloudera) について、Hadoop クラスターのコンピュート / ストレージ要件の バランスを取
れます。Minotaur のリファレンスアーキテクチャーは、Hadoop のみのリファレンスアーキテクチャーを拡張して、SAP HANA、HPE Vertica、
HPE IDOL を組み込みます。
HPE ファイナン
シャルサービス
新しく追加される Hadoop のデータレイク / 分析機能と既存のインフラストラクチャ / 環境とのバランスを取るには、財務の柔軟性が必要です。ファ
イナンシングにより、実装プロセス全体を通じて変化に対応 / 適応し、イノベーションを推進し、コストと使用状況を整合させることができます。
また、HPE ファイナンシャルサービスでは HPE アセットリカバリサービスを活用して、レガシー機器の廃棄に伴う評判や法規制のリスクを低減
します。
HPE SecureData HPE SecureData は、Hadoop のセキュリティに対するデータ中心型アプローチです。データを暗号化してトークン化し、可能な限りソースに近
い形で非識別化します。機密データ要素は、使用可能かつ非識別化された同等のデータ要素で変換されますが、形式 / 挙動 / 意味は保持されます。
この保護された形式のデータは、後続のアプリケーション、分析エンジン、データ転送、データストアで使用できます。その際には、データを必
要とするそのような特定のアプリケーションやユーザー用に、迅速かつ安全に再識別化されます。HPE SecureData は、事実上無限のデータタイ
プをデータレベルで保護します。
お客様のビジネスやトランスフォーメー
ションの目標に合わせてテクノロジーを
取得 / 購入 / 使用できる新たな方法によ
り、IT 投資戦略を最適化できます。
http://www8.hp.com/jp/ja/hp-financialservices/
次のステップ
トランスフォーメーションワークショップをご予約ください。トランスフォーメーションワーク
ショップのお申し込み方法については、HPE の担当者までお問い合わせください。
詳細情報
https://www.hpe.com/jp/ja/solutions/empower-data-driven.html
メールニュース配信登録
© Copyright 2016 Hewlett Packard Enterprise Development LP. 本書の内容は、将来予告なく変更されることがあり
ます。
ヒューレット・パッカード エンタープライズ製品およびサービスに対する保証については、当該製品およびサービス
の保証規定書に記載されています。本書のいかなる内容も、新たな保証を追加するものではありません。本書の内容に
つきましては万全を期しておりますが、本書中の技術的あるいは校正上の誤り、省略に対しては責任を負いかねますので
ご了承ください。
SAPは、
ドイツおよびその他の国におけるSAP SEの商標または登録商標です。Apache HadoopおよびHadoopは、米国
およびその他の国におけるApache Software Foundationの登録商標または商標です。
4AA6-3745JPN、2016年5月、Rev. 2
Fly UP