...

キュレーターが語る。 データ駆動型ものづくり

by user

on
Category: Documents
12

views

Report

Comments

Transcript

キュレーターが語る。 データ駆動型ものづくり
Interview データキュレーションサービス
Interview
「キュレーターが語る。
データ駆動型ものづくり」
富士通株式会社
コンバージェンスサービス本部
インテリジェントコンピューティング室
シニアマネージャー 高梨 益樹
富士通のコンバージェンスサービスを支え、ビッグデータ活用の最前線で活躍するキーパーソンの1人、データ分析の専門家集団
「キュレーター(注1)」をけん引する高梨益樹シニアマネージャーに取材しました。
(聞き手:株式会社富士通総研 亀廼井千鶴子マネジメントコンサルタント)
(注1) キュレーター:従来の意味は、博物館や美術館等で施設が収集する資料に関する鑑定や研究、業務の管理監督を行う専門職である学芸員のこと
を言います。富士通では、業務知識に依存した仮説検証型ではない、新たなデータ活用の専門家を指します。データモデリング、アナリティク
ス、データにまつわるシステムデザインのプロフェッショナルであり、お客様が必要としているデータ活用をサポートします。データ活用の専
門家として「データサイエンティスト」という役割もありますが、富士通では分析のみに留まらずに、お客様企業の商品やサービスに深くかか
わっていくデータの専門家として「キュレーター」を定義しています。
高梨益樹 略歴
1990年-日本語推敲や文書分類など、自然言語処理システムの開発
2000年-テキストマイニングなどの自然言語検索、セマンティックWeb技術のビジネス化
2011年-コンバージェンスサービスにおけるデータ活用・分析の専門家集団「キュレーター」を組織化したインテリジェントコンピューティング室
の立ち上げに参画
第1章 ビッグデータを使って何をするべきか?
価値あるデータとは?
亀廼井:まずはビッグデータそのものについて伺いましょうか?
高梨:データの定義には、こだわらないですね。キュレーション
の対象としては、業務アプリケーションのデータやテキス
トなども扱います。今回は、「ものづくり」におけるビッ
グデータの活用に焦点を当ててお話ししたいので、セン
サーのログなど今まで活用されなかったデータを想定して
進めたいと思います。
高梨: 既存のデータは、何らかの業務や目的に合わせて、必要最
低限の情報が蓄積されています。たとえば、修理データは
故障した部品の修理記録で、コールセンターのデータは問
い合わせの記録です。故障した、問い合わせがあった、な
どの「NG」データはあっても、なぜNGになったのか、NG
に至るまでに商品やサービスがどう使われてきたか、とい
うデータがないんです。
亀廼井:わかりました。ではデータの特徴についてお願いします。
高梨:ビッグデータはどこにあるのかというところから考えてみ
ましょう。様々な企業の方とお話をさせていただくと、未
活用の大量データを持っているケースは少ないです。
ビッグデータというと、オープンデータやソーシャルデー
タ、POS、地図、気象などの外部データをイメージする方
も多いです。しかし、ものづくりにおいては、企業のビジ
ネスの中で発生する独自性のあるデータの価値にこそ目を
向けていただきたいと思います。ビジネスの中で発生する
データというと、業務システムのデータがありますし、通
信機能を備えた機器を販売している企業では、製品のログ
を取得しているケースもあります。
亀廼井:ビジネスの当事者にしか入手できないデータということ
ですね。
1/4 ページ
http://jp.fujitsu.com/solutions/convergence/service/curation/
Interview データキュレーションサービス
一見するとムダなデータは、正直なデータ
亀廼井:今までのビジネスでは「商品やサービスの使われ方」
のデータを必要としていなかったということですよね。
高梨:「使われ方」が分かるデータを取得すると、トラブルなど
の特徴的なデータはごく少数です。今まで蓄積してきたNG
のデータと比べると、量ばかり多くて業務の役に立たない
データに感じると思います。
亀廼井:仮にNGのデータが1%だとしたら、99倍の正常データが
あるということですね。確かにムダに感じるかもしれま
せんね。集めてどうするのかと。
高梨:しかし、そのムダに感じるデータがあることで、自分達の
提供している製品やサービスは、どのように使われている
のか? その向こう側にいるカスタマーがどのような思いで
利用しているのか? という商品や利用者の理解が深められ
るとしたら、決してムダではないと思いませんか。
亀廼井:今までは、各業務のプロが仮説や推測で捉えていた商品
や利用者を、データから正確に理解していこうというこ
となんですね。
曖昧性が入りこむ余地がありません。土壌、微生物、化
合物、植物などの研究者が、この同じ大量のデータを活
用しようとしています。
亀廼井:ゲノムの読み取りという手段が進化したことで可能に
なったんですね。楽しそうですね。
高梨:大量の正直なデータがあることで、様々な専門家が新し
い接点を持って研究していくのです。研究分野の境界線
も変わっていくかもしれません。これと同じようなこと
が、先ほどの商品や利用者を理解するための大量データ
の周りでも起きると思っています。
要するに企業の「ものづくり」の様々なプロセスの専門
家の間でデータの共有がなされていけば、ものづくりの
プロセスも、そして、そこから生み出される製品やサー
ビスも、きっと楽しいものになっていくと思いませんか。
そんな「ものづくり」に、大量の「正直なデータ」を活
かせるように、データに意味を持たせる、役立つ写像を
作るという役を、キュレーターが担うことができたら嬉
しいです。
高梨:収集したデータを使って、バーチャルな世界に商品や利用
者をどこまで正確に「写像」できるかというのがポイント
になります。
精度の高い写像を作ることができれば、商品の故障や利用
者の行動を理解したり、更に発展させて、予測したりする
こともできるかもしれません。
商品や利用者を正確に写像するためには、ヒントとしての
データは多い方がよく、しかも恣意性のない「正直なデー
タ」が重要だと思います。
第2章 キュレーターってなんだ?
業務知識を積み重ねても行けない領域
亀廼井:データの次は、キュレーターについて伺っていきたいと
思います。
高梨:キュレーターを組織化するにあたって、キュレーターには
業種/業務ノウハウが必要なのかどうかを検討しました。
例えば、多くのSEは、業種/業務を軸に組織化されてい
ます。
データから考えるということ
亀廼井:大量の「正直なデータ」、ビッグデータらしい話になっ
てきました。このような考え方は一般的になっているん
ですか。
高梨:データ駆動型という言い方があります。例として、自然科
学の世界のメタゲノミクスという話をご紹介しましょう。
土壌や人間の健康状態を理解するために、サンプルとなる
土壌細菌や人の腸内細菌のゲノムを丸ごと読んでしまうと
いうやり方です。大量の正直なデータという意味ではゲノ
ムは最強ですよね。
ものすごく無駄なことにも見えますが、このやり方には、
2/4 ページ
亀廼井:開発する対象が業務アプリであるため、SEは業種/業
務の知識を大切にしています。対して、キュレーターは
何を作り出すのか、そして、業種/業務の知識は必要か
ということですね。
高梨:答えはNOなんですが、少し考え方をお話します。
キュレーターの得意技として、予測ロジックの作成とい
うのがあります。人が病気になるリスク予測、機械の故
障予測、サービス会員の退会予測など、さまざまな分野
で今後の展開が期待されています。この予測ロジックに
関して、2つの事をお話します。
亀廼井:まず1つ目をお願いします。
http://jp.fujitsu.com/solutions/convergence/service/curation/
Interview データキュレーションサービス
高梨:1つ目は、業務/業種の知識を使って予測ロジックを作る
ことの限界についてです。業種/業務のノウハウから仮説
を作っていくというアプローチは、将棋の強い人が将棋
ソフトを作る、医療の専門家が病気リスクの判定システ
ムを作るということになります。
亀廼井:昔のAIのアプローチのようなものですね。
高梨:このアプローチで作られた将棋ソフトが、アマチュア2段
クラスの強さだったらしいです。しかし、プロ棋士の対局
の棋譜から、要するに大量のデータから学習して作成した
将棋ソフトは、プロ棋士にも匹敵する強さになりました。
人間が予測ロジックを作るには、限界があるということで
す。ヒントとなる正直なデータを増やして、データから予
測ロジックを作るべきだと思います。
亀廼井:1つ目のお話は、業務知識による仮説よりも、大量デー
タからの学習が予測ロジックづくりのポイントというこ
とですね。
データを使って飛びぬけるためには?
高梨:2つ目は、誮が予測ロジックづくりを実施すべきか、とい
う話です。業務知識に依存しないでデータから学習する
というやり方では、業務知識は必要なくなりました。し
かしそれは機械学習のプログラムにまかせなさいという
単純な話ではないんです。
データを使って、何を見ますか?
亀廼井:キュレーターの持つ素養の中で、「モデリング」という
のが、今まではあまり表面にでてこなかったものかと思
います。
高梨:例として良く使うのですが、コモディティ化を打ち破るた
めに「朝までよく眠れるエアコン」を作りたいという発想
があったとします。従来のエアコンは、室温を対象に制御
してきたわけですが、「朝までよく眠れるエアコン」を作
ろうと思ったら、「人の眠り」を対象にした制御を作らな
ければなりません。人の眠りとはどのような状態を指すの
か? その状態は、どのようなデータを取得して、どのよ
うに解析すれば導き出せるのか?を構築にして行くのがモ
デリングです。
亀廼井:今の話ですと、モデリングは、製品の企画や開発業務に
も関連していますね。キュレーターの役割はどこまでで
すか。
高梨:例で言うと、「人の眠り」を数値化するところまでがキュ
レーターの役割です。この指標ができることで、エアコン
の専門家が人の眠りを対象にして制御を開発できるように
なるはずです。はじめての試みなので、指標も制御もテス
トを繰り返して精度を上げていくことになると思います。
製品を知り尽くした業務のプロと、データのプロである
キュレーターの共同作業が必要だと思います。
データから機械学習で予測ロジックを作ると言っても、
データや目的に合った方法や、どうやって予測する対象/
事象を定義するか、必要ならデータの持つ特徴をより学
習しやすいように強調していくなど、データ寄りの知識
や方法論が必要になります。
亀廼井:業務の知識は必要なく、キュレーターはデータ寄りの知
識の上になりたっているということですね。
高梨:データ寄りの知識を体系化することができれば、人の病
気、機械の故障、利用者の退会、という別々の業種向け
の予測ロジックづくりを、同じような問題として捉える
ことができるはずだと考えたんです。
そして、実際に可能だったので、データ寄りの知識を軸
にした新しい分析のエキスパートとして、キュレーター
という職種を作ることができたんです。
第3章 新しい事業には新しいデータが必要
データに限界を教わろう
亀廼井:先ほどの予測ロジック作成の話では、予測ロジックの精度
はデータが握っているということでした。しかし、十分な
精度を確保するだけのデータ量になっていないことはない
ですか。
高梨:あります。現状の精度の到達点は、現状のデータの限界点
なんです。キュレーターは、この限界を明確にすること、
そして、お客様のビジネスに必要なデータの種類や量につ
いて提言もします。
亀廼井:予測ロジックのような新しいビジネスを目指したもので
はなく、製品や利用者の理解を深めて、製品や業務を改
善していこうというような場合はいかがですか。
高梨:予測ロジックという例が、新しい特別なものに感じている
かもしれませんが、製品や利用者を写像して深く理解する
ということの先に、予測ロジックもあるのです。ですから、
キュレーターが最初に行うことは、現状を理解すること、
要するに、今あるデータから何がどこまで写像できるかを
見極めることになります。
3/4 ページ
http://jp.fujitsu.com/solutions/convergence/service/curation/
Interview データキュレーションサービス
データをデザインするということは、
ビジネスをデザインすること
キュレーターが、お客さまのものづくりの一員に
亀廼井:限界がわかると、次は、お客様の企業にとって、これか
ら増やすべきデータのデザインをするということになり
ますか?
高梨:企業として、商品や利用者、市場をどのように捉えていく
べきか、どのようなデータを蓄積して、何を写像して見つ
め続けていくと競争力につながるかという観点で、データ
を捉えるべきです。データデザインの半分は、ビジネス目
標といいますか、企業として何を写像して見続けるべきか
という考え方で決めるべきだと思います。それを写像する
ために、データはこうあるべき…という残りの部分は、
キュレーターに相談してほしいです。
亀廼井:データはビジネス目標にリンクしているべきというこ
とですね。
高梨:新しいデータを決めたら、まずは限定的な環境(機器であ
ればデモ機、サービスであれば実証実験など)で収集し、
目的に見合う結果(写像)が得られるかどうかのテストを
します。
亀廼井:目的に見合う写像という言い方からすると、データから
写像を作る際にキュレーターによりビジネス目標が考慮
された写像が計られるということでしょうか?
高梨:実際に家庭に設置された機器からログを収集し、その機器
の稼働状況を把握します。その稼働状況から機器の使われ
方をとらまえることによって、利用している人の特性を写
像するものです。もとのデータを束ねることによって、利
用者像を導き出します。
亀廼井:ビジネスの目的とデータとの間をつなぐということです
ね?
高梨:目的によって、データの種別や解像度は異なると考えてい
ます。例えば、センサーデータを取得する場合、1時間に1
回取得すればよいものと、1分に1回取得が必要なものがあ
ります。これは取得したデータで何をするのかという目的
と密接に関係があります。
亀廼井:取得したデータから新たな評価指標のようなものを導く
こともキュレーターの仕事でしょうか?
高梨:はい。キュレーターは、「この製品にこんな機能をつけた
い」という求めに応じて、その機能がつけられた製品を利
用者が使う場面を想定し、そこでの満足度を評価する指標
の作成も行います。このあたりが、従来のSIとは違う「ビ
ジネスを作る」という行為なのだと思います。
亀廼井:そうすると、お客様にとってキュレーターとはどのよう
な位置付けになりますか。
高梨:そうですね。今までのICT担当の位置付けではなくて、
もっと商品やサービスのものづくりの上流から長くお付き
合いをさせていただきたいと思います。
お客様のものづくりチームの中でデータに関連する諸事を
担当するメンバー。それがキュレーターです。
本記事では、ものづくりを中心にご説明しましたが、業種を問わず、キュレーターがお客様をご支援します。
キュレーターによる「データキュレーションサービス」については、弊社Webサイトをご覧ください。
お問い合わせ・資料請求は、富士通コンタクトラインまでお願いします。
データキュレーションサービス、コンバージェンスサービスに関する情報はこちら
データキュレーションサービス ご紹介サイト: http://jp.fujitsu.com/solutions/convergence/service/curation/
コンバージェンスサービス ご紹介サイト
: http://jp.fujitsu.com/solutions/convergence/
注:本インタビューに記載の肩書きや数値、固有名詞等は取材日現在のものであり、閲覧時には変更されている可能性があることをご了承ください。
お問い合わせ先
製品・サービスについてのお問合わせは
富士通コンタクトライン 0120-933-200
受付時間 9:00~17:30(土・日・祝日・当社指定の休業日を除く)
富士通公開サイト http://jp.fujitsu.com
http://jp.fujitsu.com/solutions/convergence/service/curation/
4/4 ページ
詳細はこちら
http://jp.fujitsu.com/solutions/convergence/service/curation/
Fly UP