Comments
Description
Transcript
Basis Technology 顧客導入事例集
Basis Technology 顧客導入事例集 Basis Technology 顧客事例 Rosette®文字・言語コード判別システム NTT レゾナント株式会社様 事例概要: NTT レゾナントが運営するインターネットポータルサイト「goo」は、2005 年にインターネット上の画像、動画、 音楽データを任意のキーワードで検索できる「画像・動画・音楽検索」サービスを開始。検索DBは常時追加、 更新され、常に最新の情報を検索できます。 Basis Technology 製品導入背景: 「画像、動画、音楽検索」は画像データ等につけられた説明文をキーワードで検索します。適切な検索結果を 提供するため、画像等が掲載された Web ページの言語に合った処理を行ない索引を生成しますが、そのために は、対象ページの言語、文字コードの正確な判別が求めらます。この課題解決のため、ほぼ 100%という高い精 度で判別を行う Basis Technology の Rosette® 言語・文字コード判別システム(RLI:Rosette® Language and Encoding Identifier) が採用されました。 構成図: 導入効果: Rosette 言語・文字コード判別システムの利用により、対象ページの言語や文字コードを正しく認識すること が可能となり、効率的で精度の高い検索が可能になりました。 また処理速度が速く、かつ安定しているので、 継続的な検索DBの追加・更新も効率的かつ順調に進めることができます。 NTT レゾナント、ポータル事業本部技術マーケティング部担当部長の竹野浩氏のコメント: 「Basis Technology の言語・文字コード判別システムの導入により、インターネット上のテキストデータの記述 言語を明確に判別し、最適な自然言語処理が可能になり、検索の効率と精度の向上に大変役立っています。ま た、膨大な量のテキストデータも瞬時に処理することができる処理速度、言語判別の高精度など、この製品の パフォーマンスにとても満足しています。」 Basis Technology 顧客事例 Rosette®文字・言語コード判別システム 文部科学省リーディングプロジェクト様 プロジェクト概要: 2003年度から実施の文部科学省リーディングプロジェクト「e-Society 基盤ソフトウェアの総合開発」の研 究開発課題「インターネット上の知識集約を可能にするプラットフォーム構築技術」(研究代表者:早稲田大学 理工学部 村岡洋一教授)では、Web 情報の大規模な収集ならびにこれらの情報を対象としたマイニング技術の 開発がおこなわれてました。約120億規模の Web データを収集し、必要情報抽出のための知識フィルタリン グ技術の開発がおこなわれました。 Basis Technology 製品導入背景: Web 上のデータは、言語および文字コード情報が不明なものや、文字コードが指定されていても間違っているも のがあり、結果として文字化けを生じてしまい適切に利用することができなくなるものが多くあります。本プ ロジェクトでは、膨大な多言語情報の収集および解析をおこなうため、データの言語ならびに文字コードの正 確な判別と文字化けをなくすことが大前提でした。そこで、Basis Technology の Rosette 言語・文字コード判 別システム(RLI) は世界の主要40言語および29種類の文字コードに対応しており、本プロジェクトのニー ズにかなう製品であることから採用となりました。 構成図: 導入効果: RLI の導入により、広範囲にわたる Web データ収集・解析をより正確におこなうことが可能となりました。 早稲田大学理工学部 山名早人助教授のコメント: 「本プロジェクトで扱うデータの量は膨大で、またいろいろな国からの情報を収集し解析するものですから、 データの言語および文字コードの判別をおこなうシステムは必要不可欠でした。Web ページの記述言語を判別し てくれるこの Rosette 言語・文字コード判別システムは、主要なサーチエンジン、さらには、Web データを扱 う世界の多数の製品で使用されているデファクト的なものであり、本プロジェクトで採用することにしまし た。」 Basis Technology 顧客事例 Rosette®Unicode 対応ライブラリ サイボウズ株式会社様 会社概要: サイボウズ株式会社(以下サイボウズ)は 1997 年に設立。オフィスでの情報共有を目的とした EIP (Web)型 グループウェアを提供するほか、Web ナレッジベースならびにCRM製品を提供しています。 事例概要: グループウェアの製品展開において、その製品特性から、海外に拠点を持つ企業では多言語対応が必要とされ ます。その対応ができるようサイボウズでは国際版グループウェア「サイボウズ Share360」をリリースしまし た。その開発に際し、重要課題となったのは「文字コード」でした。世界各国で使用される文字コードがそれ ぞれ異なり、たとえば日本で通常使用される Shift-JIS という文字コードで作成したメッセージを、GB2312 と いう文字コードを使う中国のPCで開くと文字化けしてしまいます。サイボウズではこのような文字化けを防 止するために、世界共通の文字コードである Unicode 対応が必須であるといち早く判断し、その Unicode 化作 業を簡便・確実におこなうことのできる外部ツールとして Basis Technology の Rosette® Unicode 対応ライ ブラリを採用しました。 導入効果: 一番のメリットは国際版の開発コストを節約できること。 一本の(同一の)バイナリ・コードで多言語対応が可能なため、従来のように各言語版ごとにコード開 発が必要となるものにくらべ、プログラマの負担が軽減し、テスト工程も削減できる。 管理も容易でメンテナンスコストが大幅に削減。 使い勝手の点からみても、Rosette Unicode 対応ライブラリは C runtime library と等価な文字列処理 関数を提供しているので、ソースコードのわずかな変更で、single byte char から Unicode への移行 ができ便利。 内部コードに採用している UCS-2 は2バイト固定長のため、Shift-JIS, EUC などのマルチバイト・ コードに比較して非常に扱いやすく、プログラミングが容易。 サイボウズ様のコメント: 「当社の国際展開に際し、Basis Technology とパートナーを組むことができて大変嬉しく思います。日本で注 目されている弊社のグループウェア製品を、米国をはじめ、他国市場でもどんどん展開していく予定です。 その製品の国際化に際し、Basis Technology の Rosette Unicode 対応ライブラリを利用することにより、常に Unicode の最新標準に追従し、また同時に高品質の製品を提供していくことができます。」 Basis Technology 顧客事例 Rosette®日本語形態素解析システム NTT レゾナント株式会社様 会社概要: NTT レゾナントは、平成16年よりインターネットポータルサイト「goo」を提供開始し、月間 4780 万のユーザが 利用しています。また近年、シームレスなサービス提供に力を入れており、インターネットユーザの幅広い ニーズに応える利便性の高いサービスを提供しています。 Basis Technology 製品導入背景: NTTレゾナントが昨年実施した調査によると、モバイル検索の利用頻度は年々増加傾向にあるものの、その うち満足な検索結果を得られていると回答した人は半数以下に留まっているとの結果でした。それを踏まえ、 新しい検索エンジンの導入によるパフォーマンスの向上と新たな機能の追加により、モバイルでもPCと同様 の検索結果を提供することをねらいとしました。 トランスコーダにてPCサイト内に存在する検索キーワードを抽出し、関連情報を優先順位の高いものから表 示します。PCサイトにおける膨大な情報の中から必要な情報に的確かついち早くアクセスするために、自然 言語処理技術において実績と信頼のある、Basis Technology の Rosette®日本語形態素解析システムを採用しま した。 Rosette® 日本語形態素解析システムは、日本語テキストデータからのキーワードを抽出するために、文を単語 に分割(分かち書き)する自然文解析ライブラリです。豊富な語彙を収録し、タイムリーに新語を追加して提 供する標準辞書、優れた複合語処理、使い勝手のよいユーザー定義辞書などを特長としており、検索・テキス ト処理の精度向上に欠かせないツールです。 導入効果: Basis Technology の Rosette 日本語形態素解析システムを導入することにより、より多くの情報の中から適切 な情報を的確に提供することが可能になりました。モバイル検索の最大の魅力は、場所や状況を問わずに必要 な時に必要な情報へ気軽にアクセスすることができる点です。優れた言語処理技術の導入により、より精度の 高い検索を実現し、ユーザビリティーをさらに向上しました。 コメント: NTT レゾナント株式会社、サーチ事業部ビジネス推進部門、担当課長浜屋氏は次のように述べています。 「現在 弊社で力を入れているモバイル検索の機能拡充に際し、Basis Technology の日本語形態素解析システムを導入 した主な理由は、安定したシステムの開発・運営に欠かせない、優れた技術力による品質のよさとサポートの 充実です。また今回は、開発を海外のパートナー企業の協力のもとに進めたため、形態素解析関連について、 英語等での対応が可能であったことも大変助かりました。今後も、ユーザーのニーズに応えるべく、さらなる サービスの拡充をおこなって参ります。」 Basis Technology 顧客事例 Rosette®日本語形態素解析システム│Rosette®日本語固有表現抽出システム シナジーマーケティング株式会社様 事例概要: シナジーマーケティング株式会社の提供する「iNSIGHTBOX」は、あらゆる業態の組織が保有するコンバージョンデータ や、SNS における書き込みデータ、新聞、雑誌などの公開情報などを取りこみ、最新の社会トレンドをPC上で参照可能と するクラウド型社会知データベースです。「iNSIGHTBOX」の前処理段階であるデータ分析に、的確な日本語処理に欠か せない Basis Technology の分かち書きツール「Rosette 日本語形態素解析システム」とキーワード抽出ツール「Rosette 日 本語固有表現抽出システム」を採用しました。 Basis Technology 製品導入背景: 多種多様な大量の組織データ(ビッグデータ)から、必要な情報だけを効率よく収集し「社会知」のためのデータベースと して顧客に提供するには、日本語テキストを的確に処理するシステムの導入が不可欠です。 「iNSIGHTBOX」に取り込むデータを、あらかじめ Rosette 日本語形態素解析システムにより正確に分かち書きし、さらに Rosette 日本語固有表現抽出システムにより、人名、地名、メールアドレス、URL など適切なキーワードを抽出します。 その後「iNSIGHTBOX」独自のテキストマイニングやスコアリング技術により、効率的にデータ分析が行われます。 構成図: 導入効果: 処理速度が速く安定していることにより、製品の性能向上に役立っています。多様なデータを取り込むために、固有値の 扱いには特段の注意を要するのですが、Rosette 日本語形態素解析システムならびに Rosette 日本語固有表現抽出シス テムにより的確に抽出できるので、プロセスの省力化、効率化にも役立っています。 コメント: シナジーマーケティング株式会社、CRMインサイトラボ フェローの後迫氏のコメント。「大手企業への実績があるという信 頼性と、多言語対応を重視しました。将来 iNSIGHTBOX が多言語対応する際にも活用できると考えています。」 Basis Technology 顧客事例 Rosette®中国語形態素解析システム 株式会社プラスアルファ・コンサルティング様 会社概要: 株式会社プラスアルファ・コンサルティング(www.pa-consul.co.jp)は、『見える化を基軸としたマーケ ティング SaaS 専門会社』として 2006 年に設立。テキストマイニング技術を応用し、様々な情報を「見える 化」することで、顧客のビジネスに+α(プラスアルファ)の価値を創造するための、テキストマイニングソ フトウェアの開発・販売、コンサルティングなどを行っています。 事例の概要: プラスアルファ・コンサルティングのテキストマイニングサービス「見える化エンジン」を Rosette®中国語形 態素解析システムを利用して中国語対応し、「見える化エンジン グローバルオプション」として 2011 年 5 月 よりサービスの提供を開始しました。中国語独自の言語特性に対応した辞書機能等を強化することで、中国市 場で集めたアンケートの自由回答やコールセンターに寄せられる中国語の“顧客の声”を素早く的確に分析す ることを可能にしました。 Basis Technology 製品導入背景: SaaS 型のテキストマイニングサービス「見える化エンジン」は多数の企業に導入され、アンケートやコールロ グ、ブログ、営業日報など様々なデータの分析に利用され、顧客ニーズの把握に役立ってきました。中国市場 に進出している日系企業では、日本市場とは全く異なる環境で事業展開を行なうなかで、現地の顧客ニーズの 把握のため中国語で書かれた“顧客の声”の分析ツールが強く望まれていました。そういった要望に応えるた めに「見える化エンジン」中国語版が企画され、中国語解析処理に Basis Technology の Rosette®中国語形 態素解析システムが採用されました。 導入効果: Basis Technology の Rosette®中国語形態素解析システムは、日本語同様にスペースなしで記述される中国語 の文章を正確に単語に分割し品詞づけするので、キーワードを高精度かつ効率よく抽出でき、「見える化エン ジン」の前処理として十分な機能を提供します。また中国語の2つの字体、簡体字・繁体字の両方に対応して おり、中国語圏のどこの データでも処理が可能で、中国市場で集めたさまざまな“顧客の声”を瞬時に分析で きるようになりました。また、Facebook や ツイッターをはじめとしたソーシャルメディアに流れる中国語情 報を常時モニタリングすることも可能になりました。 コメント: プラスアルファ・コンサルティングの代表取締役 三室克哉氏から次のようにコメントをいただいています。 「日本企業の中国市場進出の増加に伴い、中国市場分析のご要望も急増しています。Rosette® 中国語形態素 解析システムの導入により、弊社の『見える化エンジン』は、このような企業様のニーズにタイムリーにこた え、中国市場ニーズの適切な分析なら びに、中国市場における日本製品のさらなる拡販につないでいただける ようになりました。」