Comments
Description
Transcript
キュレーターが語る。 データ駆動型ものづくり
Interview データキュレーションサービス Interview 「キュレーターが語る。 データ駆動型ものづくり」 富士通株式会社 コンバージェンスサービス本部 インテリジェントコンピューティング室 シニアマネージャー 高梨 益樹 富士通のコンバージェンスサービスを支え、ビッグデータ活用の最前線で活躍するキーパーソンの1人、データ分析の専門家集団 「キュレーター(注1)」をけん引する高梨益樹シニアマネージャーに取材しました。 (聞き手:株式会社富士通総研 亀廼井千鶴子マネジメントコンサルタント) (注1) キュレーター:従来の意味は、博物館や美術館等で施設が収集する資料に関する鑑定や研究、業務の管理監督を行う専門職である学芸員のこと を言います。富士通では、業務知識に依存した仮説検証型ではない、新たなデータ活用の専門家を指します。データモデリング、アナリティク ス、データにまつわるシステムデザインのプロフェッショナルであり、お客様が必要としているデータ活用をサポートします。データ活用の専 門家として「データサイエンティスト」という役割もありますが、富士通では分析のみに留まらずに、お客様企業の商品やサービスに深くかか わっていくデータの専門家として「キュレーター」を定義しています。 高梨益樹 略歴 1990年-日本語推敲や文書分類など、自然言語処理システムの開発 2000年-テキストマイニングなどの自然言語検索、セマンティックWeb技術のビジネス化 2011年-コンバージェンスサービスにおけるデータ活用・分析の専門家集団「キュレーター」を組織化したインテリジェントコンピューティング室 の立ち上げに参画 第1章 ビッグデータを使って何をするべきか? 価値あるデータとは? 亀廼井:まずはビッグデータそのものについて伺いましょうか? 高梨:データの定義には、こだわらないですね。キュレーション の対象としては、業務アプリケーションのデータやテキス トなども扱います。今回は、「ものづくり」におけるビッ グデータの活用に焦点を当ててお話ししたいので、セン サーのログなど今まで活用されなかったデータを想定して 進めたいと思います。 高梨: 既存のデータは、何らかの業務や目的に合わせて、必要最 低限の情報が蓄積されています。たとえば、修理データは 故障した部品の修理記録で、コールセンターのデータは問 い合わせの記録です。故障した、問い合わせがあった、な どの「NG」データはあっても、なぜNGになったのか、NG に至るまでに商品やサービスがどう使われてきたか、とい うデータがないんです。 亀廼井:わかりました。ではデータの特徴についてお願いします。 高梨:ビッグデータはどこにあるのかというところから考えてみ ましょう。様々な企業の方とお話をさせていただくと、未 活用の大量データを持っているケースは少ないです。 ビッグデータというと、オープンデータやソーシャルデー タ、POS、地図、気象などの外部データをイメージする方 も多いです。しかし、ものづくりにおいては、企業のビジ ネスの中で発生する独自性のあるデータの価値にこそ目を 向けていただきたいと思います。ビジネスの中で発生する データというと、業務システムのデータがありますし、通 信機能を備えた機器を販売している企業では、製品のログ を取得しているケースもあります。 亀廼井:ビジネスの当事者にしか入手できないデータということ ですね。 1/4 ページ http://jp.fujitsu.com/solutions/convergence/service/curation/ Interview データキュレーションサービス 一見するとムダなデータは、正直なデータ 亀廼井:今までのビジネスでは「商品やサービスの使われ方」 のデータを必要としていなかったということですよね。 高梨:「使われ方」が分かるデータを取得すると、トラブルなど の特徴的なデータはごく少数です。今まで蓄積してきたNG のデータと比べると、量ばかり多くて業務の役に立たない データに感じると思います。 亀廼井:仮にNGのデータが1%だとしたら、99倍の正常データが あるということですね。確かにムダに感じるかもしれま せんね。集めてどうするのかと。 高梨:しかし、そのムダに感じるデータがあることで、自分達の 提供している製品やサービスは、どのように使われている のか? その向こう側にいるカスタマーがどのような思いで 利用しているのか? という商品や利用者の理解が深められ るとしたら、決してムダではないと思いませんか。 亀廼井:今までは、各業務のプロが仮説や推測で捉えていた商品 や利用者を、データから正確に理解していこうというこ となんですね。 曖昧性が入りこむ余地がありません。土壌、微生物、化 合物、植物などの研究者が、この同じ大量のデータを活 用しようとしています。 亀廼井:ゲノムの読み取りという手段が進化したことで可能に なったんですね。楽しそうですね。 高梨:大量の正直なデータがあることで、様々な専門家が新し い接点を持って研究していくのです。研究分野の境界線 も変わっていくかもしれません。これと同じようなこと が、先ほどの商品や利用者を理解するための大量データ の周りでも起きると思っています。 要するに企業の「ものづくり」の様々なプロセスの専門 家の間でデータの共有がなされていけば、ものづくりの プロセスも、そして、そこから生み出される製品やサー ビスも、きっと楽しいものになっていくと思いませんか。 そんな「ものづくり」に、大量の「正直なデータ」を活 かせるように、データに意味を持たせる、役立つ写像を 作るという役を、キュレーターが担うことができたら嬉 しいです。 高梨:収集したデータを使って、バーチャルな世界に商品や利用 者をどこまで正確に「写像」できるかというのがポイント になります。 精度の高い写像を作ることができれば、商品の故障や利用 者の行動を理解したり、更に発展させて、予測したりする こともできるかもしれません。 商品や利用者を正確に写像するためには、ヒントとしての データは多い方がよく、しかも恣意性のない「正直なデー タ」が重要だと思います。 第2章 キュレーターってなんだ? 業務知識を積み重ねても行けない領域 亀廼井:データの次は、キュレーターについて伺っていきたいと 思います。 高梨:キュレーターを組織化するにあたって、キュレーターには 業種/業務ノウハウが必要なのかどうかを検討しました。 例えば、多くのSEは、業種/業務を軸に組織化されてい ます。 データから考えるということ 亀廼井:大量の「正直なデータ」、ビッグデータらしい話になっ てきました。このような考え方は一般的になっているん ですか。 高梨:データ駆動型という言い方があります。例として、自然科 学の世界のメタゲノミクスという話をご紹介しましょう。 土壌や人間の健康状態を理解するために、サンプルとなる 土壌細菌や人の腸内細菌のゲノムを丸ごと読んでしまうと いうやり方です。大量の正直なデータという意味ではゲノ ムは最強ですよね。 ものすごく無駄なことにも見えますが、このやり方には、 2/4 ページ 亀廼井:開発する対象が業務アプリであるため、SEは業種/業 務の知識を大切にしています。対して、キュレーターは 何を作り出すのか、そして、業種/業務の知識は必要か ということですね。 高梨:答えはNOなんですが、少し考え方をお話します。 キュレーターの得意技として、予測ロジックの作成とい うのがあります。人が病気になるリスク予測、機械の故 障予測、サービス会員の退会予測など、さまざまな分野 で今後の展開が期待されています。この予測ロジックに 関して、2つの事をお話します。 亀廼井:まず1つ目をお願いします。 http://jp.fujitsu.com/solutions/convergence/service/curation/ Interview データキュレーションサービス 高梨:1つ目は、業務/業種の知識を使って予測ロジックを作る ことの限界についてです。業種/業務のノウハウから仮説 を作っていくというアプローチは、将棋の強い人が将棋 ソフトを作る、医療の専門家が病気リスクの判定システ ムを作るということになります。 亀廼井:昔のAIのアプローチのようなものですね。 高梨:このアプローチで作られた将棋ソフトが、アマチュア2段 クラスの強さだったらしいです。しかし、プロ棋士の対局 の棋譜から、要するに大量のデータから学習して作成した 将棋ソフトは、プロ棋士にも匹敵する強さになりました。 人間が予測ロジックを作るには、限界があるということで す。ヒントとなる正直なデータを増やして、データから予 測ロジックを作るべきだと思います。 亀廼井:1つ目のお話は、業務知識による仮説よりも、大量デー タからの学習が予測ロジックづくりのポイントというこ とですね。 データを使って飛びぬけるためには? 高梨:2つ目は、誮が予測ロジックづくりを実施すべきか、とい う話です。業務知識に依存しないでデータから学習する というやり方では、業務知識は必要なくなりました。し かしそれは機械学習のプログラムにまかせなさいという 単純な話ではないんです。 データを使って、何を見ますか? 亀廼井:キュレーターの持つ素養の中で、「モデリング」という のが、今まではあまり表面にでてこなかったものかと思 います。 高梨:例として良く使うのですが、コモディティ化を打ち破るた めに「朝までよく眠れるエアコン」を作りたいという発想 があったとします。従来のエアコンは、室温を対象に制御 してきたわけですが、「朝までよく眠れるエアコン」を作 ろうと思ったら、「人の眠り」を対象にした制御を作らな ければなりません。人の眠りとはどのような状態を指すの か? その状態は、どのようなデータを取得して、どのよ うに解析すれば導き出せるのか?を構築にして行くのがモ デリングです。 亀廼井:今の話ですと、モデリングは、製品の企画や開発業務に も関連していますね。キュレーターの役割はどこまでで すか。 高梨:例で言うと、「人の眠り」を数値化するところまでがキュ レーターの役割です。この指標ができることで、エアコン の専門家が人の眠りを対象にして制御を開発できるように なるはずです。はじめての試みなので、指標も制御もテス トを繰り返して精度を上げていくことになると思います。 製品を知り尽くした業務のプロと、データのプロである キュレーターの共同作業が必要だと思います。 データから機械学習で予測ロジックを作ると言っても、 データや目的に合った方法や、どうやって予測する対象/ 事象を定義するか、必要ならデータの持つ特徴をより学 習しやすいように強調していくなど、データ寄りの知識 や方法論が必要になります。 亀廼井:業務の知識は必要なく、キュレーターはデータ寄りの知 識の上になりたっているということですね。 高梨:データ寄りの知識を体系化することができれば、人の病 気、機械の故障、利用者の退会、という別々の業種向け の予測ロジックづくりを、同じような問題として捉える ことができるはずだと考えたんです。 そして、実際に可能だったので、データ寄りの知識を軸 にした新しい分析のエキスパートとして、キュレーター という職種を作ることができたんです。 第3章 新しい事業には新しいデータが必要 データに限界を教わろう 亀廼井:先ほどの予測ロジック作成の話では、予測ロジックの精度 はデータが握っているということでした。しかし、十分な 精度を確保するだけのデータ量になっていないことはない ですか。 高梨:あります。現状の精度の到達点は、現状のデータの限界点 なんです。キュレーターは、この限界を明確にすること、 そして、お客様のビジネスに必要なデータの種類や量につ いて提言もします。 亀廼井:予測ロジックのような新しいビジネスを目指したもので はなく、製品や利用者の理解を深めて、製品や業務を改 善していこうというような場合はいかがですか。 高梨:予測ロジックという例が、新しい特別なものに感じている かもしれませんが、製品や利用者を写像して深く理解する ということの先に、予測ロジックもあるのです。ですから、 キュレーターが最初に行うことは、現状を理解すること、 要するに、今あるデータから何がどこまで写像できるかを 見極めることになります。 3/4 ページ http://jp.fujitsu.com/solutions/convergence/service/curation/ Interview データキュレーションサービス データをデザインするということは、 ビジネスをデザインすること キュレーターが、お客さまのものづくりの一員に 亀廼井:限界がわかると、次は、お客様の企業にとって、これか ら増やすべきデータのデザインをするということになり ますか? 高梨:企業として、商品や利用者、市場をどのように捉えていく べきか、どのようなデータを蓄積して、何を写像して見つ め続けていくと競争力につながるかという観点で、データ を捉えるべきです。データデザインの半分は、ビジネス目 標といいますか、企業として何を写像して見続けるべきか という考え方で決めるべきだと思います。それを写像する ために、データはこうあるべき…という残りの部分は、 キュレーターに相談してほしいです。 亀廼井:データはビジネス目標にリンクしているべきというこ とですね。 高梨:新しいデータを決めたら、まずは限定的な環境(機器であ ればデモ機、サービスであれば実証実験など)で収集し、 目的に見合う結果(写像)が得られるかどうかのテストを します。 亀廼井:目的に見合う写像という言い方からすると、データから 写像を作る際にキュレーターによりビジネス目標が考慮 された写像が計られるということでしょうか? 高梨:実際に家庭に設置された機器からログを収集し、その機器 の稼働状況を把握します。その稼働状況から機器の使われ 方をとらまえることによって、利用している人の特性を写 像するものです。もとのデータを束ねることによって、利 用者像を導き出します。 亀廼井:ビジネスの目的とデータとの間をつなぐということです ね? 高梨:目的によって、データの種別や解像度は異なると考えてい ます。例えば、センサーデータを取得する場合、1時間に1 回取得すればよいものと、1分に1回取得が必要なものがあ ります。これは取得したデータで何をするのかという目的 と密接に関係があります。 亀廼井:取得したデータから新たな評価指標のようなものを導く こともキュレーターの仕事でしょうか? 高梨:はい。キュレーターは、「この製品にこんな機能をつけた い」という求めに応じて、その機能がつけられた製品を利 用者が使う場面を想定し、そこでの満足度を評価する指標 の作成も行います。このあたりが、従来のSIとは違う「ビ ジネスを作る」という行為なのだと思います。 亀廼井:そうすると、お客様にとってキュレーターとはどのよう な位置付けになりますか。 高梨:そうですね。今までのICT担当の位置付けではなくて、 もっと商品やサービスのものづくりの上流から長くお付き 合いをさせていただきたいと思います。 お客様のものづくりチームの中でデータに関連する諸事を 担当するメンバー。それがキュレーターです。 本記事では、ものづくりを中心にご説明しましたが、業種を問わず、キュレーターがお客様をご支援します。 キュレーターによる「データキュレーションサービス」については、弊社Webサイトをご覧ください。 お問い合わせ・資料請求は、富士通コンタクトラインまでお願いします。 データキュレーションサービス、コンバージェンスサービスに関する情報はこちら データキュレーションサービス ご紹介サイト: http://jp.fujitsu.com/solutions/convergence/service/curation/ コンバージェンスサービス ご紹介サイト : http://jp.fujitsu.com/solutions/convergence/ 注:本インタビューに記載の肩書きや数値、固有名詞等は取材日現在のものであり、閲覧時には変更されている可能性があることをご了承ください。 お問い合わせ先 製品・サービスについてのお問合わせは 富士通コンタクトライン 0120-933-200 受付時間 9:00~17:30(土・日・祝日・当社指定の休業日を除く) 富士通公開サイト http://jp.fujitsu.com http://jp.fujitsu.com/solutions/convergence/service/curation/ 4/4 ページ 詳細はこちら http://jp.fujitsu.com/solutions/convergence/service/curation/