...

Informatica Data Explorer - 9.5.1 - スタートガイド

by user

on
Category: Documents
20

views

Report

Comments

Transcript

Informatica Data Explorer - 9.5.1 - スタートガイド
Informatica Data Explorer
スタートガイド
(参照項目 9.5.1)
Informatica Data Explorer スタートガイド
参照項目 9.5.1
12月 2012
著作権 1998-2012 Informatica. すべての権利を保留する.
本ソフトウェアおよびマニュアルには、Informatica Corporationの所有権下にある情報が収められています。これらは使用および開示の制
限等を定めた使用許諾契約のもとに提供され、著作権法により保護されています。本ソフトウェアのリバースエンジニアリングは禁じられて
います。本マニュアルのいかなる部分も、いかなる手段(電子的複写、写真複写、録音など)によっても、Informatica Corporation の事前
の承諾なしに複製または転載することは禁じられています。このソフトウェアは、米国および/または国際的な特許、およびその他の出願中
の特許によって保護されています。
合衆国政府によるソフトウェアの使用、複製または開示は、DFARS 227.7202-1(a)および227.7702-3(a)(1995年)、DFARS
252.227-7013(C)(1)(ii)(1988年10月)、FAR 12.212(a)(1995年)、FAR 52.227-19、またはFAR 52.227-14(ALT III)に記載されて
いるとおりに、当該ソフトウェア使用許諾契約に定められた制限によって規制されます。
本製品または本書の情報は、予告なしに変更されることがあります。お客様が本製品または本書内に問題を発見された場合は、書面にて当社
までお知らせください。
Informatica、Informatica Platform、Informatica Data Services、PowerCenter、PowerCenterRT、PowerCenter Connect、PowerCenter
Data Analyzer、PowerExchange、PowerMart、Metadata Manager、Informatica Data Quality、Informatica Data Explorer、Informatica
B2B Data Transformation、Informatica B2B Data Exchange、Informatica On Demand、Informatica Identity Resolution、Informatica
Application Information Lifecycle Management、Informatica Complex Event Processing、Ultra Messaging、およびInformatica Master
Data Managementは、Informatica Corporationの米国および世界中の管轄地での商標または登録商標です。その他のすべての企業名および製
品名は、それぞれの企業の商標または登録商標です。
本ソフトウェアまたはドキュメントの一部は、次のサードパーティが有する著作権に従います(ただし、これらに限定されません)。
Copyright DataDirect Technologies.コンテンツの無断複写・転載を禁じます。Copyright (c) Sun Microsystems.コンテンツの無断複写・
転載を禁じます。Copyright (c) RSA Security Inc. All Rights Reserved.Copyright (c) Ordinal Technology Corp. All rights
reserved. Copyright (c) Aandacht c.v. All rights reserved. Copyright Genivia, Inc. All rights reserved. Copyright Isomorphic
Software. コンテンツの無断複写・転載を禁じます。Copyright (c) Meta Integration Technology, Inc. All rights reserved. Copyright
(c) Intalio. コンテンツの無断複写・転載を禁じます。Copyright (c) Oracle. コンテンツの無断複写・転載を禁じます。Copyright (c)
Adobe Systems Incorporated. コンテンツの無断複写・転載を禁じます。Copyright (c) DataArt, Inc. All rights reserved. Copyright
(c) ComponentSource. コンテンツの無断複写・転載を禁じます。Copyright (c) Microsoft Corporation. コンテンツの無断複写・転載を禁
じます。Copyright (C) Rogue Wave Software, Inc. All rights reserved. Copyright (c) Teradata Corporation. コンテンツの無断複
写・転載を禁じます。Copyright (c) Yahoo! Inc. All rights reserved. Copyright (c) Glyph & Cog, LLC. コンテンツの無断複写・転載
を禁じます。Copyright (C) Thinkmap, Inc. All rights reserved. Copyright (C) Clearpace Software Limited. コンテンツの無断複写・
転載を禁じます。Copyright (C) Information Builders, Inc. All rights reserved. Copyright (C) OSS Nokalva, Inc. All rights
reserved. Copyright Edifecs, Inc. All rights reserved. Copyright Cleo Communications, Inc. All rights reserved.Copyright (c)
International Organization for Standardization 1986. コンテンツの無断複写・転載を禁じます。Copyright (C) ej-technologies GmbH.
コンテンツの無断複写・転載を禁じます。Copyright (c) Jaspersoft Corporation. コンテンツの無断複写・転載を禁じます。Copyright
(C) is International Business Machines Corporation. コンテンツの無断複写・転載を禁じます。Copyright (C) yWorks GmbH. コンテン
ツの無断複写・転載を禁じます。Copyright (C) Lucent Technologies.コンテンツの無断複写・転載を禁じます。Copyright (c) University
of Toronto. コンテンツの無断複写・転載を禁じます。Copyright (C) Daniel Veillard. コンテンツの無断複写・転載を禁じます。
Copyright (C) Unicode, Inc. Copyright IBM Corp. All rights reserved. Copyright (C) MicroQuill Software Publishing, Inc. All
rights reserved. Copyright (C) PassMark Software Pty Ltd. All rights reserved. Copyright (C) LogiXML, Inc. All rights
reserved. Copyright (C) 2003-2010 Lorenzi Davide, All rights reserved. Copyright (C) Red Hat, Inc. All rights reserved.
Copyright (c) The Board of Trustees of the Leland Stanford Junior University. コンテンツの無断複写・転載を禁じます。Copyright
(C) EMC Corporation. コンテンツの無断複写・転載を禁じます。Copyright (C) Flexera Software. コンテンツの無断複写・転載を禁じま
す。
本製品には、Apache Software Foundation(http://www.apache.org/)によって開発されたソフトウェア、およびApache License, Version
2.0(「ライセンス」)の下に許諾されたその他のソフトウェアが含まれています。ライセンスのコピーはhttp://www.apache.org/licenses/
LICENSE-2.0から入手することができます。適用法にて要求されないか書面にて合意されない限り、ライセンスの下に配布されるソフトウェ
アは「現状のまま」で配布され、明示的あるいは黙示的かを問わず、いかなる種類の保証も行われません。ライセンス下での許諾および制限
を定める具体的文言については、ライセンスを参照してください。
本製品には、Mozilla(http://www.mozilla.org/)によって開発されたソフトウェア、ソフトウェアcopyright The JBoss Group, LLC, all
rights reserved、ソフトウェアcopyright, Red Hat Middleware, LLC, all rights reserved、Copyright (c) 1999-2006 by Bruno Lowagie
and Paulo SoaresおよびGNU Lesser General Public License Agreement(http://www.gnu.org/licenses/lgpl.htmlを参照)に基づいて許諾
されたその他のソフトウェアが含まれています。資料は、Informaticaが無料で提供しており、一切の保証を伴わない「現状渡し」で提供さ
れるものとし、Informatica Corporationは市場性および特定の目的の適合性の黙示の保証などを含めて、一切の明示的及び黙示的保証の責
任を負いません。
製品には、ワシントン大学、カリフォルニア大学アーバイン校、およびバンダービルト大学のDouglas C.Schmidtおよび同氏のリサーチグル
ープが著作権を持つACE(TM)およびTAO(TM)ソフトウェアが含まれています。Copyright (c) 1993-2006, all rights reserved.
本製品には、OpenSSL Toolkitを使用するためにOpenSSL Projectが開発したソフトウェア(copyright The OpenSSL Project.All Rights
Reserved)が含まれています。また、このソフトウェアの再配布は、http://www.openssl.orgおよびhttp://www.openssl.org/source/
license.htmlにある使用条件に従います。
本ソフトウェアには、CurlソフトウェアCopyright 1996-2007, Daniel Stenberg, <[email protected]>が含まれます。コンテンツの無断複写・
転載を禁じます。本ソフトウェアに関する許諾および制限は、http://curl.haxx.se/docs/copyright.htmlにある使用条件に従います。すべ
てのコピーに上記の著作権情報とこの許諾情報が記載されている場合、目的に応じて、本ソフトウェアの使用、コピー、変更、ならびに配布
が有償または無償で許可されます。
本製品には、ソフトウェアcopyright 2001-2005 (C) MetaStuff, Ltd. All Rights Reserved.が含まれます。本ソフトウェアに関する許諾お
よび制限は、http://www.dom4j.org/license.htmlにある使用条件に従います。
製品には、ソフトウェアcopyright (C) 2004-2007, The Dojo Foundationが含まれます。コンテンツの無断複写・転載を禁じます。本ソフト
ウェアに関する許諾および制限は、http://dojotoolkit.org/licenseにある使用条件に従います。
本製品には、ICUソフトウェアcopyright International Business Machines Corporationおよび他のソフトウェアが含まれます。コンテンツ
の無断複写・転載を禁じます。本ソフトウェアに関する許諾および制限は、http://source.icu-project.org/repos/icu/icu/trunk/
license.htmlにある使用条件に従います。
本製品には、ソフトウェアcopyright (c) 1996-2006 Per Bothnerが含まれます。コンテンツの無断複写・転載を禁じます。お客様がこのよ
うなソフトウェアを使用するための権利は、ライセンスで規定されています。http://www.gnu.org/software/kawa/Software-License.htmlを
参照してください。
本製品には、OSSP UUIDソフトウェアCopyright (C) 2002 Ralf S. Engelschall, Copyright (C) 2002 The OSSP Project Copyright (C)
2002 Cable & Wireless Deutschlandが含まれます。本ソフトウェアに関する許諾および制限は、http://www.opensource.org/licenses/mitlicense.phpにある使用条件に従います。
本製品には、Boost(http://www.boost.org/)によって開発されたソフトウェアまたはBoostソフトウェアライセンスの下で開発されたソフ
トウェアが含まれています。本ソフトウェアに関する許諾および制限は、http://www.boost.org/LICENSE_1_0.txtにある使用条件に従いま
す。
本製品には、ソフトウェアcopyright (c) 1997-2007 University of Cambridgeが含まれます。本ソフトウェアに関する許諾および制限は、
http://www.pcre.org/license.txtにある使用条件に従います。
本製品には、ソフトウェアcopyright (C) 2007 The Eclipse Foundationが含まれます。コンテンツの無断複写・転載を禁じます。本ソフト
ウェアに関する許諾および制限は、http://www.eclipse.org/org/documents/epl-v10.phpにある使用条件に従います。
本製品には、http://www.tcl.tk/software/tcltk/license.html、http://www.bosrup.com/web/overlib/?License、http://www.stlport.org/
doc/license.html、http://www.asm.ow2.org/license.html、http://www.cryptix.org/LICENSE.TXT、http://hsqldb.org/web/
hsqlLicense.html、http://httpunit.sourceforge.net/doc/license.html、http://jung.sourceforge.net/license.txt、http://
www.gzip.org/zlib/zlib_license.html、http://www.openldap.org/software/release/license.html、http://www.libssh2.org、http://
slf4j.org/license.html、http://www.sente.ch/software/OpenSourceLicense.html、http://fusesource.com/downloads/licenseagreements/fuse-message-broker-v-5-3-license-agreement、http://antlr.org/license.html、http://aopalliance.sourceforge.net/、
http://www.bouncycastle.org/licence.html、http://www.jgraph.com/jgraphdownload.html、http://www.jcraft.com/jsch/LICENSE.txt、
http://jotm.objectweb.org/bsd_license.html、http://www.w3.org/Consortium/Legal/2002/copyright-software-20021231、http://
www.slf4j.org/license.html、http://developer.apple.com/library/mac/#samplecode/HelpHook/Listings/HelpHook_java.html、http://
nanoxml.sourceforge.net/orig/copyright.html、http://www.json.org/license.html、http://forge.ow2.org/projects/javaservice/、
http://www.postgresql.org/about/licence.html、http://www.sqlite.org/copyright.html、http://www.tcl.tk/software/tcltk/
license.html、http://www.jaxen.org/faq.html, http://www.jdom.org/docs/faq.html、http://www.slf4j.org/license.html、http://
www.iodbc.org/dataspace/iodbc/wiki/iODBC/License、http://www.keplerproject.org/md5/license.html、http://www.toedter.com/en/
jcalendar/license.html、http://www.edankert.com/bounce/index.html、http://www.net-snmp.org/about/license.html、http://
www.openmdx.org/#FAQ、http://www.php.net/license/3_01.txt、http://srp.stanford.edu/license.txt、http://www.schneier.com/
blowfish.html、http://www.jmock.org/license.html、http://xsom.java.net、http://benalman.com/about/license/に基づいて許諾された
ソフトウェアが含まれています。
本製品には、Academic Free License(http://www.opensource.org/licenses/afl-3.0.php)、Common Development and Distribution
License(http://www.opensource.org/licenses/cddl1.php)、Common Public License(http://www.opensource.org/licenses/
cpl1.0.php)、Sun Binary Code License Agreement Supplemental License Terms、BSD License(http://www.opensource.org/licenses/
bsd-license.php)、MIT License(http://www.opensource.org/licenses/mit-license.php)、およびArtistic License(http://
www.opensource.org/licenses/artistic-license-1.0)に基づいて許諾されたソフトウェアが含まれています。
本製品には、ソフトウェアcopyright (c) 2003-2006 Joe WaInes, 2006-2007 XStream Committersが含まれています。コンテンツの無断複
写・転載を禁じます。本ソフトウェアに関する許諾および制限は、http://j.org/license.htmlにある使用条件に従います。本製品には、
Indiana University Extreme! Labによって開発されたソフトウェアが含まれています。詳細については、http://www.extreme.indiana.edu/
を参照してください。
本ソフトウェアは、米国の特許番号5,794,246、6,014,670、6,016,501、6,029,178、6,032,158、6,035,307、6,044,374、6,092,086、
6,208,990、6,339,775、6,640,226、6,789,096、6,820,077、6,823,373、6,850,947、6,895,471、7,117,215、7,162,643、7,243,110、
7,254,590、7,281,001、7,421,458、7,496,588、7,523,121、7,584,422、7,676,516、7,720,842、7,721,270、および7,774,791、および国際
的な特許、ならびにその他の出願中の特許によって保護されています。
免責: 本文書は、一切の保証を伴わない「現状渡し」で提供されるものとし、Informatica Corporationは他社の権利の非侵害、市場性およ
び特定の目的への適合性の黙示の保証などを含めて、一切の明示的および黙示的保証の責任を負いません。Informatica Corporationでは、
本ソフトウェアまたはドキュメントに誤りのないことを保証していません。本ソフトウェアまたはドキュメントに記載されている情報には、
技術的に不正確な記述や誤植が含まれる場合があります。本ソフトウェアまたはドキュメントの情報は、予告なしに変更されることがありま
す。
特記事項
このInformatica製品(以下「ソフトウェア」)には、Progress Software Corporation(以下「DataDirect」)の事業子会社である
DataDirect Technologiesからの特定のドライバ(以下「DataDirectドライバ」)が含まれています。DataDirectドライバには、次の用語お
よび条件が適用されます。
1.DataDirectドライバは、特定物として現存するままの状態で提供され、商品性の保証、特定目的適合性の保証および法律上の瑕疵担保
責任を含むすべての明示もしくは黙示の保証責任を負わないものとします。国または地域によっては、法律の強行規定により、保証責任
の制限が禁じられる場合、強行規定の制限を受けるものとします。
2.DataDirectまたは第三者は、予見の有無を問わず発生したODBCドライバの使用に関するいかなる直接的、間接的、偶発的、特別、ある
いは結果的損害に対して責任を負わないものとします。本制限事項は、すべての訴訟原因に適用されます。訴訟原因には、契約違反、保
証違反、過失、厳格責任、詐称、その他の不法行為を含みますが、これらに限るものではありません。
Part Number: IN-PGS-95100-0001
目次
序文............................................... v
Informaticaのリソース. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . v
Informaticaカスタマポータル. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . v
Informaticaのマニュアル. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . v
InformaticaのWebサイト. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . v
Informatica How-To Library. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . vi
Informatica Knowledge Base. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . vi
Informatica Multimedia Knowledge Base. . . . . . . . . . . . . . . . . . . . .
vi
Informaticaグローバルカスタマサポート. . . . . . . . . . . . . . . . . . . . . . vi
第 1 章 : スタートガイド概要....................... 1
Informaticaドメインの概要. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
機能の可用性. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
Informatica Analystについて. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
Informatica Developerの概要. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
Informatica Developerのようこそページ. . . . . . . . . . . . . . . . . . . . . . 7
チートシート. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
Data QualityおよびData Explorer. . . . . . . . . . . . . . . . . . . . . . . . . . . 8
チュートリアルの内容. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
チュートリアルの構造. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
チュートリアルの前提条件. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
10
Informatica Analystのチュートリアル. . . . . . . . . . . . . . . . . . . . . . . 10
Informatica Developerツール. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
第 I 部 : Informatica Analystの基本操作.......... 13
第 2 章 : レッスン1. Informatica Analystの設定. . . 14
Informatica Analystの設定の概要. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
タスク1. Informatica Analystへのログイン. . . . . . . . . . . . . . . . . . . . . .
15
タスク2. プロジェクトの作成. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
タスク3. フォルダの作成. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
Informatica Analystの設定のまとめ. . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
第 3 章 : レッスン2. データオブジェクトの作成. . . . 17
データオブジェクトの作成の概要. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
タスク1. フラットファイルデータオブジェクトの作成. . . . . . . . . . . . . . . .
目次
18
i
タスク2. データのプレビュー. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
データオブジェクトの作成のまとめ. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
第 4 章 : レッスン3. クイックプロファイルの作
成................................................ 20
クイックプロファイルの作成の概要. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
タスク1. クイックプロファイルの作成と実行. . . . . . . . . . . . . . . . . . . . . . 21
タスク2. プロファイル結果の表示. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
クイックプロファイルの作成のまとめ. . . . . . . . . . . . . . . . . . . . . . . . . . . 23
第 5 章 : レッスン4. カスタムプロファイルの作
成................................................ 24
カスタムプロファイルの作成の概要. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
タスク1. カスタムプロファイルの作成. . . . . . . . . . . . . . . . . . . . . . . . . . 25
タスク2. プロファイルの実行. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
タスク3. プロファイル結果でのドリルダウン. . . . . . . . . . . . . . . . . . . . . . 26
カスタムプロファイルの作成のまとめ. . . . . . . . . . . . . . . . . . . . . . . . . . . 27
第 6 章 : レッスン5. 式ルールの作成............... 28
式ルールの作成の概要. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
タスク1. 式ルールの作成とプロファイルの実行. . . . . . . . . . . . . . . . . . . . . 29
タスク2. 式ルールの出力の表示. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
タスク3. 式ルールの編集. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
式ルールの作成のまとめ. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
第 7 章 : レッスン6. スコアカードの作成と実行. . . . 32
スコアカードの作成と実行の概要. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
タスク1. プロファイル結果からのスコアカードの作成. . . . . . . . . . . . . . . . 33
タスク2. スコアカードの実行. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
タスク3. スコアカードの表示. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
タスク4. スコアカードの編集. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
タスク5. しきい値の設定. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
タスク6. スコアの傾向グラフの表示. . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
スコアカードの作成と実行のまとめ. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
第 8 章 : レッスン7. プロファイルカラムからの参照
テーブルの作成.................................... 37
プロファイルカラムからの参照テーブルの作成の概要. . . . . . . . . . . . . . . . . 37
タスク1. プロファイルカラムからの参照テーブルの作成. . . . . . . . . . . . . . . 38
タスク2. 参照テーブルの編集. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
プロファイルカラムからの参照テーブルの作成のまとめ. . . . . . . . . . . . . . . . 40
ii
目次
第 9 章 : レッスン8. 参照テーブルの作成........... 41
参照テーブルの作成の概要. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
タスク1. 参照テーブルの作成. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
参照テーブルの作成のまとめ. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
第 II 部 : Informatica Developerの基本操作....... 43
第 10 章 : レッスン1. Informatica Developerの設
定................................................ 44
Informatica Developerの設定の概要. . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
タスク1. Informatica Developerの起動. . . . . . . . . . . . . . . . . . . . . . . . . 45
タスク2. ドメインの追加. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
タスク3. モデルリポジトリの追加. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
タスク4. プロジェクトの作成. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
タスク5. フォルダの作成. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
タスク6. デフォルトのData Integration Serviceの選択. . . . . . . . . . . . . . 47
Informatica Developerの設定のまとめ. . . . . . . . . . . . . . . . . . . . . . . . . . 47
第 11 章 : レッスン2. 物理データオブジェクトのイ
ンポート.......................................... 49
物理データオブジェクトのインポートの概要. . . . . . . . . . . . . . . . . . . . . . . 49
タスク1. Boston_Customersフラットファイルデータオブジェクトのインポー
ト. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
タスク2. LA_Customersフラットファイルデータオブジェクトのインポー
ト. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
タスク3. All_Customersフラットファイルデータオブジェクトのインポー
ト. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
物理データオブジェクトのインポートのまとめ. . . . . . . . . . . . . . . . . . . . . 53
第 12 章 : レッスン3. データのプロファイリン
グ................................................ 54
データのプロファイリングの概要. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
タスク1. 2つのデータソースでの結合分析の実行. . . . . . . . . . . . . . . . . . . . 55
タスク2. 結合分析結果の表示. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
タスク3. データソースでのプロファイルの実行. . . . . . . . . . . . . . . . . . . . . 57
タスク4. カラムプロファイル結果の表示. . . . . . . . . . . . . . . . . . . . . . . . . 57
データのプロファイリングのまとめ. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
付録 A : FAQ(よくある質問)...................... 59
Informatica Administratorに関するFAQ. . . . . . . . . . . . . . . . . . . . . . . . . 59
Informatica AnalystのFAQ. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
目次
iii
Informatica DeveloperのFAQ(よくある質問). . . . . . . . . . . . . . . . . . . . . 61
iv
目次
序文
『Informatica Data Explorer スタートガイド』は、データ品質とデータサービスの開発
者およびアナリストを対象としています。 Informatica DeveloperおよびInformatica
Analystを初めて使用するユーザーのためのチュートリアルを提供します。 本書では、デ
ータ品質の概念、フラットファイルとリレーショナルデータベースの概念、および作業環
境のデータベースエンジンについて理解していることを前提としています。
Informaticaのリソース
Informaticaカスタマポータル
Informaticaのユーザーとして、Informaticaカスタマポータルサイト
(http://mysupport.informatica.com)にアクセスできます。このサイトには、製品情
報、ユーザーグループ情報、ニュースレター、Informaticaカスタマサポート事例管理シス
テム(ATLAS)へのアクセス、Informatica How-To Library、Informatica Knowledge
Base、Informatica Product Documentation、Informaticaユーザーグループコミュニティ
へのアクセスが含まれています。
Informaticaのマニュアル
Informaticaのマニュアルチームは、正確で役に立つマニュアルの作成に努めています。こ
のマニュアルに関する質問、コメント、ご意見の電子メールの送付先は、Informaticaマニ
ュアルチーム([email protected])です。 お客様のフィードバック
は、マニュアルの改良に利用させていただきます。コメントに返信をご希望のお客様は、
その旨をお知らせください。
マニュアルチームは、必要に応じてマニュアルを更新します。製品の最新のマニュアルを
入手するには、http://mysupport.informatica.comから製品マニュアルにアクセスしま
す。
InformaticaのWebサイト
Informatica社のWebサイトは、http://www.informatica.comからアクセスできます。この
サイトでは、Informatica社の概要と沿革、今後のイベント、営業拠点などの情報を提供し
ています。また、製品情報やパートナー情報もあります。サービス関連のページには、テ
v
クニカルサポート、トレーニングと教育、および実装に関するサービスの重要な情報を掲
載しています。
Informatica How-To Library
Informaticaのユーザーとして、Informatica How-To Library
(http://mysupport.informatica.com)にアクセスできます。How-To Libraryは、
Informaticaの製品および機能についての詳細を確認できるリソースのコレクションです。
一般的な問題に対するソリューションを提供したり、機能や動作を比較したり、特定の実
際のタスクを実行するための方法を示したりする記事やインタラクティブなデモンストレ
ーションが含まれています。
Informatica Knowledge Base
Informaticaのユーザーとして、Informatica Knowledge Base
(http://mysupport.informatica.com)にアクセスできます。このKnowledge Baseを利用
して、Informatica製品に関する既知の技術的問題の解決策を検索することができます。ま
た、FAQ(よくある質問)の答え、技術的ホワイトペーパー、技術的なヒントも得られま
す。Knowledge Baseに関する質問、コメント、ご意見の電子メールの送付先は、
Informatica Knowledge Baseチーム([email protected])です。
Informatica Multimedia Knowledge Base
Informaticaのユーザとして、Informatica Multimedia Knowledge Base
(http://mysupport.informatica.com)にアクセスできます。Multimedia Knowledge
Baseは、一般的な概念の理解を助け、具体的な各タスクの実行をガイドする教育用のマル
チメディアファイルの集まりです。 Multimedia Knowledge Baseに関する質問、コメン
ト、ご意見の電子メールの送付先は、Informatica Knowledge Baseチーム
([email protected])です。
Informaticaグローバルカスタマサポート
電話、またはオンラインサポートからカスタマサポートセンターに連絡できます。 オンラ
インサポートのご利用には、ユーザ名とパスワードが必要です。
http://mysupport.informatica.comから、ユーザー名とパスワードが入手できます。
電話によるInformaticaグローバルカスタマサポートへの問い合わせ先は次のとおりです。
北米/南米
ヨーロッパ/中東/アフ
リカ
アジア/オーストラ
リア
フリーダイヤル
フリーダイヤル
フリーダイヤル
ブラジル: 0800 891
0202
フランス: 0805 804632
オーストラリア: 1
800 151 830
メキシコ: 001 888 209
8853
イタリア: 800 915 985
北米: +1 877 463 2435
ドイツ: 0800 5891281
オランダ: 0800 2300001
ポルトガル: 800 208 360
スペイン: 900 813 166
vi
序文
ニュージーランド:
09 9 128 901
北米/南米
ヨーロッパ/中東/アフ
リカ
アジア/オーストラ
リア
スイス: 0800 463 200
有料(標準料金)
英国: 0800 023 4632
インド:+91 80 4112
5738
有料(標準料金)
ベルギー: +31 30 6022
797
フランス: +33 1 4138
9226
ドイツ:+49 1805 702 702
オランダ:+31 306 022
797
英国: +44 1628 511445
まえがき
vii
viii
第 1 章
スタートガイド概要
この章では、以下の項目について説明します。
¨ Informaticaドメインの概要, 1 ページ
¨ Informatica Analystについて, 5 ページ
¨ Informatica Developerの概要, 6 ページ
¨ チュートリアルの内容, 9 ページ
¨ チュートリアルの構造, 9 ページ
Informaticaドメインの概要
Informaticaには、サービス指向のアーキテクチャが備わっています。これにより、サービ
スを拡張し、複数のマシンでリソースを共有することができます。 Informaticaドメイン
は、サービスの管理用の主要な単位です。
Informaticaには、以下のコンポーネントが含まれています。
¨ アプリケーションクライアント: 基本的なInformaticaの機能にアクセスするために使
用するクライアントのグループです。 アプリケーションクライアントは、Service
Managerやアプリケーションサービスに対する要求を作成します。
¨ アプリケーションサービス: サーバーベースの機能を表すサービスのグループです。
Informaticaドメインには、アプリケーションサービスのサブセットを含めることがで
きます。 使用するアプリケーションクライアントで必要なアプリケーションサービス
を設定します。
¨ リポジトリ: アプリケーションクライアントからのユーザー要求の処理に必要なオブジ
ェクトおよびプロセスに関するメタデータを格納するリレーショナルデータベースのグ
ループです。
¨ Service Manager: すべてのドメイン操作を管理するドメインに組み込まれているサー
ビスです。 Service Managerは、アプリケーションサービスを実行し、認証、承認、ロ
ギングなどのドメイン機能を実行します。
Informatica Administrator(Administratorツール)へのログインは、Informaticaのイ
ンストール後に行うことができます。 ドメインを管理したり、他のアプリケーションクラ
イアントにアクセスする前に必須のアプリケーションサービスを設定したりするには、
Administratorツールを使用します。
1
以下の図に、各アプリケーションクライアントがInformaticaドメイン内で使用するアプリ
ケーションサービスとリポジトリを示します。
以下の表に、クライアントで必要なアプリケーションクライアント(Administratorツール
を除く)、アプリケーションサービス、およびリポジトリを一覧表示します。
2
アプリケーションクラ
イアント
アプリケーションサー
ビス
リポジトリ
Data Analyzer
Reporting Service
Data Analyzerリポジト
リ
Informatica Reporting
and Dashboards
Reporting and
Dashboardsサービス
Jaspersoftリポジトリ
Informatica Analyst
- Analyst Service
- Data Integration
Service
- Model Repository
Service
モデルリポジトリ
章 1: スタートガイド概要
アプリケーションクラ
イアント
アプリケーションサー
ビス
リポジトリ
Informatica Developer
- Analyst Service
- Content Management
Service
- Data Integration
Service
- Model Repository
Service
モデルリポジトリ
Metadata Manager
- Metadata Manager
Service
- PowerCenter
Integration Service
- PowerCenterリポジト
リサービス
- Metadata Managerリ
ポジトリ
- PowerCenterリポジト
リ
PowerCenter Client
- PowerCenter
Integration Service
- PowerCenterリポジト
リサービス
PowerCenterリポジトリ
Web Services Hub
Console
- PowerCenter
Integration Service
- PowerCenterリポジト
リサービス
- Web Services Hub
PowerCenterリポジトリ
以下のアプリケーションサービスは、Informaticaアプリケーションクライアントからアク
セスされません。
¨ PowerExchange Listenerサービス。 PowerExchange Listenerでのバルクデータ移動お
よび変更データキャプチャを管理します。PowerCenter Integration Serviceは、
Listenerサービスを介してPowerExchange Listenerに接続します。
¨ PowerExchangeロッガーサービス。 PowerExchangeロッガー(Linux、UNIX、Windows
用)を管理して、変更データをキャプチャし、PowerExchangeロッガーのログファイル
にそのデータを書き込みます。変更データは、DB2リカバリログ、Oracle REDOログ、
Microsoft SQL Server分散データベース、あるいはi5/OSまたはz/OSシステムのデータ
ソースから取得できます。
¨ SAP BWサービス。SAP BIのRFC要求をリスンし、PowerCenter Integration Serviceで
ワークフローを実行してSAP BIから抽出したり、SAP BIにロードしたりするように要求
します。
Informaticaドメインの概要
3
機能の可用性
Informatica 9.5.0製品では、共通のアプリケーションセットが使用されます。 使用でき
る製品機能は、製品ライセンスによって異なります。
次の表に、ライセンスオプションと各オプションで使用可能なアプリケーション機能を示
します。
4
ライセンスオプショ
ン
Informatica Developerの
機能
Informatica Analystの
機能
Data Explorer
- プロファイルモデルの使
用、およびプライマリキ
ー、外部キー、機能依存
性の検出を含むプロファ
イリング
- スコアカードの作成
- プロファイリング
- スコアカードの作成
- プロファイリングルー
ルの作成と実行
- 参照テーブルの管理
Data Quality
- すべてのトランスフォー
メーションを使用したマ
ッピングの作成と実行
- ルールの作成と実行
- プロファイリング
- スコアカードの作成
- PowerCenterへのオブジ
ェクトのエクスポート
-
データサービス
- 論理データオブジェクト
モデルの作成
- データサービストランス
フォーメーションを使用
したマッピングの作成と
実行
- SQLデータサービスの作
成
- Webサービスの作成
- PowerCenterへのオブジ
ェクトのエクスポート
- 参照テーブルの管理
データサービスとプ
ロファイリングオプ
ション
- 論理データオブジェクト
モデルの作成
- データサービストランス
フォーメーションを使用
したマッピングの作成と
実行
- SQLデータサービスの作
成
- Webサービスの作成
- PowerCenterへのオブジ
ェクトのエクスポート
- データサービストランス
フォーメーションを使用
したルールの作成と実行
- プロファイリング
- 参照テーブルの管理
章 1: スタートガイド概要
プロファイリング
スコアカードの作成
参照テーブルの管理
プロファイリングルー
ルの作成
- プロファイル内でのル
ールの実行
- 不良レコードと重複レ
コードの管理
Informatica Analystについて
Informatica Analystは、アナリストがエンタープライズ内のデータを分析、クレンジン
グ、標準化、プロファイル、およびスコアリングするために使用できるWebベースのアプリ
ケーションクライアントです。
ビジネスアナリストおよび開発者は、Informatica Analystをデータドリブンコラボレーシ
ョンに使用します。 カラムプロファイリングとルールプロファイリング、スコアカードの
作成、および不良レコードと重複レコードの管理を実行できます。 データ品質ソリューシ
ョンでは開発者に対して、参照データの管理と提供も行うことができます。
Informatica Analystを使用すると、以下のタスクを実行できます。
¨ データのプロファイリング。 プロファイルを作成および実行して、エンタープライズ
データの構造および内容を分析し、強みと弱みを特定します。 プロファイルを実行し
た後で、選択的にドリルダウンし、プロファイルの結果から基になる行を見つけること
ができます。 スコアカードにカラムを追加し、参照テーブルにカラムの値を追加する
こともできます。
¨ プロファイル内でルールの作成。 プロファイル内でルールを作成して適用します。 ル
ールは、プロファイルの実行時にデータに適用される条件を定義する再利用可能なビジ
ネスロジックです。 ルールを使用して、プロファイル内のデータを詳細に検証した
り、データ品質の進捗を測定します。
¨ データのスコアリング。 スコアカードを作成し、任意のカラムの有効値またはルール
の出力をスコアリングします。 スコアカードには、プロファイル内のカラムの値の頻
度がスコアとして表示されます。 データ品質の進捗を測定して視覚的に表示するに
は、スコアカードを使用します。 傾向グラフを表示して、スコアの履歴を時系列で確
認することもできます。
¨ 参照データの管理。 参照テーブルを使用して、ソースデータ値が正確であり、形式で
正しいことを確認します。フラットファイルおよびデータベースデータから参照テーブ
ルを作成できます。Data Quality Content InstallerでInformatica参照テーブルをイ
ンストールできます。
¨ 不良レコードと重複レコードの管理。 不良レコードを修正し、重複レコードを統合し
ます。
Informatica Analystについて
5
Informatica Developerの概要
Developerツールは、データ品質ソリューションやデータサービスソリューションを設計お
よび実装するために開発者が使用するアプリケーションクライアントです。
以下の図にDeveloperツールを示します。
Developerツールワークベンチに、デフォルトで以下のビューが表示されます。
[Object Explorer]ビュー
プロジェクト、フォルダー、およびプロジェクトとフォルダー内のオブジェクトが表
示されます。Developerツールの左側の領域に表示されます。
[接続エクスプローラ]ビュー
リレーショナルデータベースへの接続が表示されます。Developerツールの右側の領域
に表示されます。
[アウトライン]ビュー
[Object Explorer]ビューで選択したオブジェクトに応じたオブジェクトが表示さ
れます。Developerツールの左下の領域に表示されます。
[プロパティ]ビュー
エディタでフォーカスのあるオブジェクトのプロパティが表示されます。Developerツ
ールの下部の領域に表示されます。
ビューを非表示にしたり、Developerツールのワークベンチ内の別の場所に移動したりする
ことができます。 表示するビューを選択するには、 [ウィンドウ] > [ビューの表示]
をクリックします。
Developerツールワークベンチには、次のビューも表示されます。
6
章 1: スタートガイド概要
[チートシート]ビュー
開いているチートシートが表示されます。チートシートを開くには、 [ヘルプ] >
[チートシート]をクリックし、チートシートを選択します。
ヘルプビュー
状況依存のオンラインヘルプが表示されます。
[進捗状況]ビュー
マッピング実行などのDeveloperツールでの操作の進捗状況を表示します。
[検索]ビュー
検索結果が表示されます。また、検索オプションダイアログボックスを起動すること
もできます。
[タグ]ビュー
ビジネス上の用途に基づいてモデルリポジトリ内のオブジェクトを定義するタグが表
示されます。
[検証ログ]ビュー
オブジェクトの検証エラーが表示されます。
Informatica Developerのようこそページ
Developerツールを初めて開くと、ようこそページが表示されます。 ようこそページを使
用して、Developerツールに関する知識を深め、Developerツールを設定し、Developerツ
ールでの作業を開始します。
ようこそページには次のオプションが表示されます。
¨ 概要: データ品質およびデータサービスソリューションの概要を表示するには、[概
要]ボタンをクリックします。
¨ 最初の手順: Developerツールの設定およびInformatica Data Quality Serviceと
Informatica Data Serviceのレッスンへのアクセスに関する知識を深めるには、[最初
の手順]ボタンをクリックします。
¨ チュートリアル: データ品質およびデータサービスソリューションのチュートリアルレ
ッスンを表示するには、[チュートリアル]ボタンをクリックします。
¨ Webリソース。 mysupport.informatica.comへのリンクにアクセスするには、[Webリ
ソース]ボタンをクリックします。 Informatica How-To Libraryにアクセスできま
す。 Informatica How-To Libraryには、Informatica Data Quality、Informatica
Data Services、および他のInformatica製品に関する記事が掲載されています。
¨ ワークベンチ: Developerツールでの作業を開始するには、[ワークベンチ]ボタンを
クリックします。
Informatica Developerの概要
7
チートシート
Developerツールには、オンラインヘルプの一部としてチートシートが含まれています。
チートシートは段階を追った手引きで、Developerツールで1つまたは複数のタスクを完了
するために役立ちます。
チートシートを完了した後、タスクを完了して結果を確認します。 例えば、チートシート
を完了してリレーショナルデータオブジェクトをインポートおよびプレビューすると、リ
レーショナルデータベーステーブルはインポートされ、Developerツールでのデータはプレ
ビューされています。
チートシートにアクセスするには、 [ヘルプ] > [チートシート]をクリックします。
Data QualityおよびData Explorer
Developerツールのデータ品質機能を使用して、データの内容と構造を分析し、ビジネスニ
ーズに合った方法でデータを強化します。
Developerツールを使用して、次の目標を実現するプロセスを実行します。
¨ データのプロファイリング。 プロファイリングにより、データの内容と構造が明らか
になります。 プロファイリングは、どのようなデータプロジェクトにおいても重要で
す。プロファイリングを実施すると、データの強みと弱みが明らかになり、プロジェク
ト計画の定義に役立つからです。
¨ スコアカードを作成して、データ品質を確認します。 スコアカードは、プロファイル
での品質解析結果を視覚的に表したものす。
¨ データ値の標準化。 データを標準化し、プロファイルを実行したときに見つかるエラ
ーや不整合を除去します。 句読点、形式、およびスペルの差異を標準化できます。例
えば、市区町村、州、および郵便番号の値に整合性を持たせることができます。
¨ レコードの解析。 データレコードを解析してレコード構造を改善し、データから追加
の情報を取り出します。 自由形式のデータを含む単一のフィールドを、さまざまなタ
イプの情報を含む複数のフィールドに分割できます。 レコードに情報を追加すること
もできます。 例えば、顧客レコードに個人顧客または企業顧客のフラグを設定できま
す。
¨ 郵便アドレスの検証。 アドレス検証では、郵便アドレスデータの精度と配信性を評価
および強化します。 アドレス検証では、アドレスレコードと国内の郵便運送業者の参
照データを照合することで、アドレスの誤りを修正し、部分的なアドレスを完全なアド
レスにします。 アドレス検証では、郵便情報を追加して、郵便の配達に要する時間と
コストを削減することもできます。
¨ 重複レコードの検索。 重複レコード分析では、レコードセットのレコードを相互に比
較し、選択したデータカラムの類似した値または一致する値を見つけます。 フィール
ド値間の良好な一致を示す類似性レベルを設定します。 照合計算で各カラムに割り当
てられる相対的なウェイトを設定することもできます。 例えば、名前よりも姓を優先
することができます。
¨ データ品質ルールの作成と実行。 Informaticaには、事前作成されたルールが用意され
ています。このルールは、そのまま実行することも、プロジェクト目標に合わせて編集
することもできます。 Developerツールでルールを作成できます。
8
章 1: スタートガイド概要
¨ Informaticaユーザーとの共同作業。 モデルリポジトリに追加したルールと参照データ
テーブルは、DeveloperツールおよびAnalystツールで使用できます。 ユーザーはプロ
ジェクトを共同で実施できます。また、プロジェクトのさまざまな段階でさまざまなユ
ーザーがオブジェクトの所有権を取得できます。
¨ PowerCenterへのマッピングのエクスポート。PowerCenterにマッピングをエクスポート
して、物理データの統合のためにメタデータを再利用したり、Webサービスを作成した
りできます。
Data Qualityユーザーは、上記のすべてのタスクを実行できます。
Data Explorerユーザーは、プライマリキーと外部キーの分析など、その他のプロファイリ
ング操作をDeveloperツールで実行できます。
チュートリアルの内容
HypoStores Corporationは、本社がBostonで、いくつかの州に店舗を持つ全国的な小売組
織です。 全国の店舗の業務データを本社のデータストアと定期的に統合しています。 最
近、Los Angelesに店舗を開店しました。
本社には、すべてのコンポジットおよびBIアプリケーションに共通のデータサービス層を
提供する、管理者、開発者、およびアーキテクトから成る中央のICCチームがあります。
BIアプリケーションには、請求やマーケティングに使用されるマスター顧客データファイ
ルが含まれるCRMシステムが組み込まれています。
HypoStores Corporationは、データセットを統合する前に、BostonとLos Angelesのデー
タをプロファイルする必要があります。 プロファイル操作により、統合前にHypoStoresが
修正できるデータ品質の問題が特定されます。
チュートリアルの構造
スタートガイドには、レッスンとタスクから構成されるチュートリアルが含まれていま
す。
レッスン
各レッスンでは、タスクを理解してレッスンを完了するために役立つ概念を紹介します。
レッスンでは、内容全体のビジネス要件が示されています。 レッスンの目標では、ビジネ
ス要件を満たすために完了するタスクの概略を説明します。 レッスンごとに、完了までの
推定時間が示されています。 レッスン内のタスクを完了すると、レッスンのサマリを確認
できます。
ツール内の環境が設定されていない場合は、各チュートリアルの最初のレッスンでそれを
行う方法が示されています。
タスク
タスクでは、段階を追った説明が示されています。 示された順序ですべてのタスクを完了
すると、レッスンは完了です。
チュートリアルの内容
9
チュートリアルの前提条件
チュートリアルのレッスンを開始する前に、少なくとも1つのノード設定でInformaticaド
メインが実行されている必要があります。
インストーラには、レッスンを完了するために使用するチュートリアルファイルが含まれ
ています。 すべてのファイルは、クライアントのインストールディレクトリとサーバーの
インストールディレクトリの両方に置かれています。
¨ チュートリアルファイルは、Developerツールのインストールパスの次の場所に置かれ
ています。
<Informatica Installation Directory>\clients\DeveloperClient\Tutorials
¨ チュートリアルファイルは、サービスのインストールパスの次の場所に置かれていま
す。
<Informatica Installation Directory>\server\Tutorials
チュートリアルのレッスンでは次のファイルが必要です。
¨ All_Customers.csv
¨ Boston_Customers.csv
¨ Customer_Order.xsd
¨ LA_customers.csv
¨ orders.csv
Informatica Analystのチュートリアル
このチュートリアルでは、アナリストがAnalystツールへのログイン、プロジェクトとフォ
ルダの作成、プロファイルとルールの作成、データのスコアリング、および参照テーブル
の作成を行います。
実行可能なレッスンは、Informatica Data Quality、Informatica Data Explorer、
Informatica Data Services、PowerCenter製品のどれを所有しているかによって異なりま
す。
以下の表に、所有している製品によって異なる、実行可能なレッスンを示します。
10
レッスン
説明
製品
レッスン1.
Informatica Analystの
設定
Analystツールにログイ
ンし、チュートリアルの
レッスン用のプロジェク
トとフォルダを作成しま
す。
すべて
レッスン2. データオブ
ジェクトの作成
フラットファイルをデー
タオブジェクトとしてイ
ンポートし、データをプ
レビューします。
Data Quality
章 1: スタートガイド概要
Data Explorer
レッスン
説明
製品
レッスン3. クイックプ
ロファイルの作成
クイックプロファイルを
作成して、データ品質を
迅速に把握します。
Data Quality
レッスン4. カスタムプ
ロファイルの作成
カスタムプロファイルを
作成して、カラム、サン
プリングオプション、お
よびドリルダウンオプシ
ョンを設定します。
Data Quality
レッスン5. 式ルールの
作成
式ルールを作成して、カ
ラム値を変更およびプロ
ファイルします。
Data Quality
レッスン6. スコアカー
ドの作成と実行
スコアカードを作成およ
び実行して、長期間にわ
たってデータ品質の進捗
を測定します。
Data Quality
レッスン7. プロファイ
ル結果からの参照テーブ
ルの作成
ソースデータの標準化に
使用できる参照テーブル
を作成します。
Data Quality
レッスン8. 参照テーブ
ルの作成
参照テーブルを作成し
て、ソースデータと有効
な標準値の間にリレーシ
ョンシップを確立しま
す。
すべて
Data Explorer
Data Explorer
Data Explorer
Data Explorer
データサービス
注: このチュートリアルには不良レコードと統合レコードの管理についてのレッスンは含
まれていません。
Informatica Developerツール
このチュートリアルでは、Developerツールを使用していくつかのデータ品質操作を実行し
ます。
Informatica Data QualityユーザーとInformatica Data Explorerユーザーは、Developer
ツールを使用してデータの内容と構造を分析するプロファイルを作成および実行します。
Informatica Data Qualityユーザーは、Developerツールを使用してデータ品質を高める
プロセスを設計および実行します。
データ品質チュートリアルでは、次のレッスンを完了します。
レッスン1. Informatica Developerの設定
ドメイン内でModel Repository Serviceによって管理されるモデルリポジトリへの接続を
作成します。 チュートリアルのレッスンの作業を格納するプロジェクトとフォルダを作成
します。 デフォルトのData Integration Serviceを選択します。
チュートリアルの構造
11
レッスン2. 物理データオブジェクトのインポート
物理データオブジェクトに関連付けられた顧客のデータファイルのデータ品質プロセスを
定義します。
レッスン3. データのプロファイリング
プロファイリングにより、データの内容と構造が明らかになります。
プロファイリングには、結合分析(2つのデータカラム間で有効な結合が可能であるかどう
かを判断する分析の形式)が含まれます。
レッスン4. データの解析
解析により、データレコードが拡充され、レコード構造が改良されます。 データ内の有用
な情報を検出することや、現在のデータから新しい情報を派生させることもできます。
レッスン5. データの標準化
標準化により、プロファイリング中に検出されたデータのエラーや不整合が取り除かれま
す。
レッスン6. 住所データの検証
住所の検証により、郵便の宛先の正確さや配達可能であるかどうかが評価され、住所の誤
りや住所の抜けが修正されます。
12
章 1: スタートガイド概要
パート I: Informatica
Analystの基本操作
この部には、以下の章があります。
¨ レッスン1. Informatica Analystの設定, 14 ページ
¨ レッスン2. データオブジェクトの作成, 17 ページ
¨ レッスン3. クイックプロファイルの作成, 20 ページ
¨ レッスン4. カスタムプロファイルの作成, 24 ページ
¨ レッスン5. 式ルールの作成, 28 ページ
¨ レッスン6. スコアカードの作成と実行, 32 ページ
¨ レッスン7. プロファイルカラムからの参照テーブルの作成, 37 ページ
¨ レッスン8. 参照テーブルの作成, 41 ページ
13
第 2 章
レッスン1. Informatica
Analystの設定
この章では、以下の項目について説明します。
¨ Informatica Analystの設定の概要, 14 ページ
¨ タスク1. Informatica Analystへのログイン, 15 ページ
¨ タスク2. プロジェクトの作成, 15 ページ
¨ タスク3. フォルダの作成, 16 ページ
¨ Informatica Analystの設定のまとめ, 16 ページ
Informatica Analystの設定の概要
このチュートリアルのレッスンを開始する前に、Analystツールを設定する必要がありま
す。 Analystツールを設定するには、Analystツールにログインし、作業内容を格納するプ
ロジェクトおよびフォルダを作成します。
Informaticaドメインは、Informatica環境を定義するノードとサービスの集合です。 ド
メイン内のサービスとして、Analyst ServiceとModel Repository Serviceがあります。
Analyst ServiceはAnalystツールを実行するサービスで、Model Repository Serviceはモ
デルリポジトリを管理するサービスです。 Analystツールでの作業で作成したオブジェク
トは、モデルリポジトリに格納されます。
Analystツールでオブジェクトを作成する前に、プロジェクトを作成する必要があります。
プロジェクトは、Analystツールのオブジェクトを格納します。 プロジェクトには、同じ
ビジネス要件の一部であるオブジェクトなど、関連するオブジェクトを格納するフォルダ
も含まれます。
目標
このレッスンでは、以下の作業を完了します。
¨ Analystツールにログインする。
¨ Analystツールで作成したオブジェクトを格納するプロジェクトを作成する。
¨ プロジェクトに、関連するオブジェクトを格納できるフォルダを作成します。
14
要件
このレッスンを開始する前に、次の要件を確認してください。
¨ 管理者がAdministratorツールでModel Repository ServiceとAnalyst Serviceの設定
を完了している。
¨ Analystツールのホスト名とポート番号がわかっている。
¨ Analyst Serviceにアクセスするためのユーザー名とパスワードがわかっている。 この
情報は管理者から提供されます。
時間
このレッスンの完了には、5~10分見ておいてください。
タスク1. Informatica Analystへのログイン
Analystツールにログインし、チュートリアルを開始します。
1.
Microsoft Internet ExplorerまたはMozilla Firefoxブラウザを起動します。
2.
[アドレス]フィールドに、次に示すInformatica AnalystのURLを入力します。
http[s]://<host name>:<port number>/AnalystTool
3.
ログインページで、ユーザー名とパスワードを入力します。
4.
[ネイティブ]または特定のセキュリティドメインの名前を選択します。
InformaticaドメインにLDAPセキュリティドメインが含まれている場合は、[セキュ
リティドメイン]フィールドが表示されます。ユーザーアカウントが所属するセキュ
リティドメインがわからない場合は、Informaticaドメイン管理者にお問い合わせくだ
さい。
5.
[ログイン]をクリックします。
ようこそ画面が表示されます。
6.
[閉じる]をクリックしてようこそ画面を終了し、Analystツールにアクセスします。
タスク2. プロジェクトの作成
このタスクでは、あなたがAnalystツールで作成したオブジェクトを含むプロジェクトを作
成します。Data Qualityのプロジェクトのフォルダを含むようにチュートリアルのプロジ
ェクトを作成します。
1.
Analyst ツールでは、ナビゲータにプロジェクトフォルダを選択します。
ナビゲータはAnalystツールの左側のペインにあります。
2.
ナビゲータで [アクション] >
> [新規プロジェクト]をクリックします。
[新規プロジェクト]ウィンドウが表示されます。
3.
「Tutorial_あなたの名前」をプロジェクト名として入力します。
タスク1. Informatica Analystへのログイン
15
4.
[OK]をクリックします。
タスク3. フォルダの作成
このタスクでは、関連するオブジェクトを格納するフォルダを作成します。フォルダは、
プロジェクトまたは別のフォルダ内に作成することができます。Data Qualityプロジェク
トに関連するオブジェクトを格納するCustomersという名前のフォルダを作成します。
1.
2.
ナビゲータで、チュートリアルプロジェクトを選択します。
[操作] > [新規][フォルダ]をクリックします。
3.
フォルダ名のためにCustomersを入力してください。
4.
[OK]をクリックします。
フォルダにはチュートリアルのプロジェクトの下に表示されます。
Informatica Analystの設定のまとめ
このレッスンでは、Analystツールではプロジェクトおよびフォルダにオブジェクトが格納
されることを学習しました。 プロジェクトとフォルダはモデルリポジトリに格納されま
す。 Analystツールは、Analyst Serviceで実行されます。 Model Repository Serviceで
は、モデルリポジトリが管理されます。 Analyst ServiceとModel Repository Service
は、Informaticaドメイン内のアプリケーションサービスです。
Analystツールにログインし、プロジェクトとフォルダを作成しました。
これで、Analystツールを使用してこのチュートリアルの他のレッスンを実行できます。
16
章 2: レッスン1. Informatica Analystの設定
第 3 章
レッスン2. データオブジェ
クトの作成
この章では、以下の項目について説明します。
¨ データオブジェクトの作成の概要, 17 ページ
¨ タスク1. フラットファイルデータオブジェクトの作成, 18 ページ
¨ タスク2. データのプレビュー, 19 ページ
¨ データオブジェクトの作成のまとめ, 19 ページ
データオブジェクトの作成の概要
Analystツールで、データオブジェクトはフラットファイルまたはリレーショナルデータベ
ーステーブルに基づいたデータの表現です。 フラットファイルまたはテーブルオブジェク
トを作成し、そのフラットファイルまたはリレーショナルデータベーステーブル内のデー
タに対してプロファイルを実行します。 Analystツール内でフラットファイルデータオブ
ジェクトを作成すると、Analystツールを実行するマシン上のフラットファイルキャッシュ
にファイルをアップロードすることや、フラットファイルが格納されるネットワーク上の
場所を指定することができます。
内容
HypoStoresは、Los Angelesの顧客データをフラットファイルに保存しています。
HypoStoresは、そのデータをプロファイルおよび分析し、データ品質タスクを実行する必
要があります。
目標
このレッスンでは、以下の作業を完了します。
1.
フラットファイルをフラットファイルキャッシュの場所にアップロードし、データオ
ブジェクトを作成します。
2.
フラットファイルデータオブジェクトのデータをプレビューします。
17
要件
このレッスンを開始する前に、次の要件を確認してください。
¨ このチュートリアルのレッスン1を完了している。
¨ LA_Customers.csvフラットファイルがある。 このファイルは、<Installation Root
Directory>\<Release Version>\clients\DeveloperClient\Tutorialsフォルダにあり
ます。
時間
このタスクの完了には、5~10分見ておいてください。
タスク1. フラットファイルデータオブジェ
クトの作成
このタスクでは、フラットファイルの㿽加ウィザードを使用して、LA_Customers、
Customers、Accounts、およびAccount_Customersデータファイルからフラットファイルデ
ータオブジェクトを作成します。
1.
ナビゲータで、チュートリアルプロジェクト内のCustomersフォルダを㿽択します。
注: フラットファイルデータオブジェクトの作成前に、それを作成するプロジェクト
またはフォルダを㿽択する必㿽があります。
2.
[アクション] > [新㿽] > [新しいフラットファイル]をクリックします。
フラットファイルの㿽加ウィザードが表示されます。
3.
[参照およびアップロード]を㿽択し、[参照]をクリックします。
4.
LA_Customers.csvの場所を参照し、[開く]をクリックします。
5.
[次へ]をクリックします。
インポートの種類の㿽択パネルには、[区切り記号付き]および[固定幅]オプショ
ンが表示されます。デフォルトのオプションは[区切り記号付き]です。
6.
[次へ]をクリックします。
7.
[インポートする行を指定します]で、[先頭行からインポート]を㿽択してブラン
ク以外の先頭行のカラム名をインポートします。
8.
[表示]をクリックします。
詳細パネルが更新されて、先頭行のカラムの見出しが表示されます。
9.
[次へ]をクリックします。
カラム属性パネルに、カラムごとのデータ型、精度、スケール、および形式が表示さ
れます。
10.
CreateDateカラムとMiscDateカラムで、[データ型]セルをクリックし、データ型を
datetimeに変更します。
11.
[次へ]をクリックします。
[名前]フィールドにLA_Customersが表示されます。
18
章 3: レッスン2. データオブジェクトの作成
12.
オプションとして、ファイルの名前を変更し、説明を㿽加します。
左ペインの下㿽で、デフォルトでCustomersフォルダが㿽択されています。
13.
[完了]をクリックします。
Customersフォルダのフォルダ内容にデータオブジェクトが表示されます。
14.
手順2から12までを繰り㿽して、Customers、Accounts、およびAccount_Customersデ
ータファイルのフラットファイルデータオブジェクトを作成します。
タスク2. データのプレビュー
このタスクでは、フラットファイルデータオブジェクトのデータをプレビューして、デー
タの構造と内容を確認します。
1.
ナビゲータで、チュートリアルプロジェクト内のCustomersフォルダを選択します。
フォルダの内容がコンテンツパネルに表示されます。
2.
LA_Customersデータオブジェクトをクリックします。
タブにデータオブジェクトが開きます。 Analystツールにより、[データプレビュ
ー]ビューにフラットファイルデータオブジェクトの最初の100行が表示されます。
3.
フラットファイルデータオブジェクトの[プロパティ]ビューをクリックします。
[プロパティ]ビューには、データオブジェクトの名前、説明、および場所が表示さ
れます。 データオブジェクトのカラムとカラムプロパティも表示されます。
データオブジェクトの作成のまとめ
このレッスンでは、データオブジェクトがフラットファイルまたはリレーショナルデータ
ベースソースに基づいたデータの表現であることを学習しました。 フラットファイルデー
タオブジェクトを作成し、その中のデータをプレビューできることを学習しました。
フラットファイルをアップロードしてフラットファイルデータオブジェクトを作成し、デ
ータオブジェクトのデータをプレビューし、データオブジェクトのプロパティを表示しま
した。
データオブジェクトの作成後、レッスン3でデータオブジェクトのクイックプロファイルを
作成し、レッスン4でデータオブジェクトのカスタムプロファイルを作成します。
タスク2. データのプレビュー
19
第 4 章
レッスン3. クイックプロフ
ァイルの作成
この章では、以下の項目について説明します。
¨ クイックプロファイルの作成の概要, 20 ページ
¨ タスク1. クイックプロファイルの作成と実行, 21 ページ
¨ タスク2. プロファイル結果の表示, 22 ページ
¨ クイックプロファイルの作成のまとめ, 23 ページ
クイックプロファイルの作成の概要
プロファイルは、データの内容と構造に基づいたデータ品質の分析です。 クイックプロフ
ァイルは、デフォルトオプションで作成するプロファイルです。 プロファイルにカラムと
オプションを一切設定しないでプロファイル結果を取得するには、クイックプロファイル
を使用します。
データ品質プロジェクトの開始時に、クイックプロファイルを作成および実行してデータ
の品質を分析します。 クイックプロファイルオブジェクトの作成時には、分析するデータ
オブジェクトとデータオブジェクトカラムを選択します。 クイックプロファイルでは、プ
ロファイルカラムとオプションの設定がスキップされます。 Analystツールは、フラット
ファイルデータオブジェクトのステージングされたフラットファイルでプロファイリング
を実行します。
内容
HypoStoresは、新たに確保したLos Angelesオフィスからデータウェアハウスにデータを組
み込む必要があります。 データはデータウェアハウスに組み込む前にクレンジングする必
要があります。 あなたは、データの品質を評価し、そのデータのクレンジングを担当する
開発者に情報を渡すアナリストです。 プロファイル結果を迅速に表示し、データの品質に
ついての基本的な考えを得る必要があります。
20
目標
このレッスンでは、以下の作業を完了します。
1.
LA_Customersフラットファイルデータオブジェクトのクイックプロファイルを作成お
よび実行します。
2.
プロファイル結果を表示します。
要件
このレッスンを開始する前に、次の要件を確認してください。
¨ このチュートリアルのレッスン1から2までを完了している。
時間
このレッスンの完了には、5~10分見ておいてください。
タスク1. クイックプロファイルの作成と実
行
このタスクでは、データオブジェクト内のすべてのカラムのクイックプロファイルを作成
し、デフォルトのサンプリングオプションとドリルダウンオプションを使用します。
1.
ナビゲータで、チュートリアルプロジェクト内のCustomersフォルダを選択します。
2.
目次パネルで、LA_customersデータオブジェクトのリンクの右側をクリックします。
オブジェクトのリンクはクリックしないでください。
3.
[アクション] > [新規] > [新しいプロファイル]をクリックします。
新しいプロファイルウィザードが表示されます。カラムプロファイリングはデフォル
トで選択されています。
4.
[次へ]をクリックします。
5.
[保存]および[実行]をクリックして、プロファイルを作成して実行します。
Analystツールにより、データオブジェクトと同じプロジェクトおよびフォルダ内にプ
ロファイルが作成されます。
プロファイルを保存して実行すると、新しいタブにクイックプロファイルのプロファ
イル結果が表示されます。
タスク1. クイックプロファイルの作成と実行
21
タスク2. プロファイル結果の表示
このタスクでは、LA_Customersプロファイルの[カラムプロファイリング]ビューを使用
して、プロファイル結果の簡単な概要を表示します。
以下の表に、プロファイル内のカラムごとに表示される情報を示します。
プロパティ
説明
名前
プロファイル内のカラムの名前。
一意の値
カラム内の一意の値の数。
一意の行の%
カラム内の一意の値の割合。
Null
カラム内のNULL値の数。
NULLの行の%
NULLであるカラム値の割合。
データ型
カラム内の値から派生するデータ型。 Analystツール
は、カラム値から次のデータ型を派生させることができ
ます。
String
Varchar
Decimal
Integer
Null [-]
推測された値の割合
Analystツールによって推測されたデータ型に一致する
値の割合。
記述されているデー
タ型
プロファイルされたオブジェクト内のカラムに対して宣
言されたデータ型。
最小値
カラム内の最小値。
最大値
カラム内の最大値。
最後のプロファイル
の実行
最後にプロファイルを実行した日時。
ドリルダウン
選択すると、カラムの実データのドリルダウンが有効に
なります。
1.
Null Valuesカラムのヘッダーをクリックして、値をソートします。
Address2、Address3、City2、CreateDate、およびMiscDateカラムに100%のNULL値が
あります。
レッスン4では、カスタムプロファイルを作成してこれらのカラムを除外します。
2.
22
Full Nameカラムをクリックします。 [値]ビューにカラムの値が表示されます。
章 4: レッスン3. クイックプロファイルの作成
名と姓は、別々のカラムに表示されていません。
レッスン5では、名と姓を別々のカラムに分離するルールを作成します。
3.
CustomerTierカラムをクリックします。
CustomerTierの値に整合性がありません。
レッスン6では、CustomerTierの値をスコアリングするためのスコアカードを作成しま
す。 レッスン7では、開発者がCustomerTierの値の標準化に使用できる参照テーブル
を作成します。
4.
Stateカラムをクリックし、[パターン]ビューをクリックします。
483個のカラムに、有効な値を示す、XXのパターンがあります。 17個の値が、有効な
パターンに一致しないため、無効です。
レッスン6では、Stateの値をスコアリングするためのスコアカードを作成します。
クイックプロファイルの作成のまとめ
このレッスンでは、クリックプロファイルを使用すると、プロファイルにカラムと行のサ
ンプリングオプションを一切設定せずにプロファイル結果が表示されることを学習しまし
た。 データ品質プロジェクトの開始時にクイックプロファイルを作成および実行してデー
タの品質を分析することを学習しました。 Analystツールがフラットファイルデータオブ
ジェクトのステージングされたフラットファイルでプロファイリングを実行することも学
習しました。
クリックプロファイルを作成し、プロファイル結果を分析しました。 NULL値やデータ型な
ど、プロファイル内でカラムに関するより多くの情報を取得しました。 また、カラム値と
パターンを使用して、データ品質の問題を特定しました。
クイックプロファイルの結果を分析すると、次のタスクを完了できます。
¨ カスタムプロファイルを作成して、プロファイルからカラムを除外し、関心のあるカラ
ムのみを組み込みます。
¨ 式ルールを作成して仮想カラムを作成し、それらをプロファイルします。
¨ カラムの有効な値を含める参照テーブルを作成します。
クイックプロファイルの作成のまとめ
23
第 5 章
レッスン4. カスタムプロフ
ァイルの作成
この章では、以下の項目について説明します。
¨ カスタムプロファイルの作成の概要, 24 ページ
¨ タスク1. カスタムプロファイルの作成, 25 ページ
¨ タスク2. プロファイルの実行, 26 ページ
¨ タスク3. プロファイル結果でのドリルダウン, 26 ページ
¨ カスタムプロファイルの作成のまとめ, 27 ページ
カスタムプロファイルの作成の概要
プロファイルは、データの内容と構造に基づいたデータ品質の分析です。 カスタムプロフ
ァイルは、プロファイリングを迅速に行うために、カラム、サンプリングオプション、お
よびドリルダウンオプションの設定時に作成するプロファイルです。 フラットファイルの
サンプル行を選択するには、サンプリングオプションを設定します。 プロファイル結果内
のレコードにドリルダウンしたり、ソースデータまたはステージングされたデータ内のデ
ータ行にドリルダウンしたりするには、ドリルダウンオプションを設定します。
データ品質プロジェクトの開始時に、プロファイルを作成および実行してデータの品質を
分析します。 プロファイルオブジェクトを作成するときは、プロファイルするデータオブ
ジェクトとデータオブジェクトカラムを選択し、サンプリングオプションを設定し、ドリ
ルダウンオプションを設定します。
内容
HypoStoresは、新たに確保したLos Angelesオフィスからデータウェアハウスにデータを組
み込む必要があります。 HypoStoresは、LAの顧客データファイル内の顧客層データの品質
にアクセスする必要があります。 あなたは、データの品質を評価し、そのデータのクレン
ジングを担当する開発者に情報を渡すアナリストです。
24
目標
このレッスンでは、以下の作業を完了します。
1.
フラットファイルデータオブジェクトのカスタムプロファイルを作成し、NULL値のカ
ラムを除外します。
2.
プロファイルを実行して、CustomerTierカラムの内容と構造を分析します。
3.
プロファイル結果の行にドリルダウンします。
要件
このレッスンを開始する前に、次の要件を確認してください。
¨ このチュートリアルのレッスン1、2、および3を完了している。
時間
このレッスンの完了には、5~10分見ておいてください。
タスク1. カスタムプロファイルの作成
このタスクでは、新しいプロファイルウィザードを使用してカスタムプロファイルを作成
します。 プロファイルの作成時には、プロファイルするデータオブジェクトとカラムを選
択します。 サンプリングオプションとドリルダウンオプションを設定することもできま
す。
1.
2.
ナビゲータで、チュートリアルプロジェクト内のCustomersフォルダを選択します。
[アクション] > [新規] > [新しいプロファイル]をクリックします。
新しいプロファイルウィザードが表示されます。カラムプロファイリングはデフォル
トで選択されています。
3.
[次へ]をクリックします。
4.
ソースパネルで、LA_Customersデータオブジェクトを選択します。
カラムパネルに、データオブジェクトのカラムが表示されます。
5.
[次へ]をクリックします。
6.
名前にProfile_LA_Customers_Customと入力します。
7.
フォルダパネルで場所を確認します。 その場所に、チュートリアルプロジェクトと
Customersフォルダが表示されます。
プロファイルパネルに、Profile_LA_Customersが表示されます。
8.
[次へ]をクリックします。
9.
カラムパネルで、Address2、Address3、City2、CreateDate、およびMiscDateカラム
をクリアします。
10.
サンプリングオプションパネルで、[すべての行]オプションを選択します。
11.
ドリルダウンオプションパネルで、[ステージングされたデータのドリルダウン]が
選択されていることを確認します。
12.
[次へ]をクリックします。
タスク1. カスタムプロファイルの作成
25
13.
オプションとして、プロファイルのフィルタを定義します。
14.
[保存]をクリックします。
Analystツールによってプロファイルが作成され、別のタブに表示されます。
タスク2. プロファイルの実行
このタスクでは、プロファイルを実行してデータオブジェクトについてプロファイリング
を実行し、プロファイル結果を表示します。 Analystツールは、フラットファイルデータ
オブジェクトのステージングされたフラットファイルでプロファイリングを実行します。
1.
ナビゲータで、チュートリアルプロジェクト内のCustomersフォルダを選択します。
2.
コンテンツパネルで、Profile_LA_Customers_Customリンクをクリックします。
タブにプロファイルが表示されます。
3.
[アクション] > [プロファイルの実行]をクリックします。
Analystツールにより、データオブジェクトについてプロファイルが実行され、プロフ
ァイル結果が表示されます。
タスク3. プロファイル結果でのドリルダウ
ン
このタスクでは、CustomerTierカラムの値でドリルダウンして、プロファイルのデータオ
ブジェクト内の基礎となる行を確認します。
1.
ナビゲータで、チュートリアルプロジェクト内のCustomersフォルダを選択します。
2.
Profile_LA_Customers_Customプロファイルをクリックします。
タブにプロファイルが開きます。
3.
[カラムプロファイリング]ビューで、CustomerTierカラムを選択します。
[値]ビューにカラムの値が表示されます。
4.
Shiftキーを使用して、Diamond、Ruby、Emerald、およびBronzeの値を選択します。
5.
右クリックで[ドリルダウン]を選択します。
値がDiamond、Ruby、Emerald、およびBronzeのカラムの行がドリルダウンパネルに表
示されます。 ドリルダウンパネルに表示されるのは、選択したカラムのみです。ドリ
ルダウンパネルのタイトルバーに、基礎となるカラムで使用される論理が表示されま
す。
26
章 5: レッスン4. カスタムプロファイルの作成
カスタムプロファイルの作成のまとめ
このレッスンでは、プロファイルされるカラムを設定できることと、サンプリングオプシ
ョンとドリルダウンオプションを設定できることを学習しました。 ドリルダウンしてカラ
ム値の基礎となる行を確認できることと、カラム値を表示するときに含まれるカラムを設
定できることを学習しました。
CustomerTierカラムが含まれるカスタムプロファイルを作成し、結果内のCustomerTierカ
ラムの基礎となる行にドリルダウンしました。
このカスタムプロファイルオブジェクトを使用して、レッスン5で式ルールを作成します。
Data QualityまたはData Explorerを所有している場合は、レッスン6でスコアカードを作
成できます。
カスタムプロファイルの作成のまとめ
27
第 6 章
レッスン5. 式ルールの作成
この章では、以下の項目について説明します。
¨ 式ルールの作成の概要, 28 ページ
¨ タスク1. 式ルールの作成とプロファイルの実行, 29 ページ
¨ タスク2. 式ルールの出力の表示, 30 ページ
¨ タスク3. 式ルールの編集, 30 ページ
¨ 式ルールの作成のまとめ, 31 ページ
式ルールの作成の概要
式ルールは、式関数とソースカラムを使用してルールの論理を定義します。 式ルールを作
成して、Analystツールのプロファイルに追加することができます。 式ルールは、1つまた
は複数のプロファイルと関連付けることができます。
式ルールの出力は、プロファイル内の仮想カラムです。 プロファイルを実行すると、
Analystツールによって仮想カラムがプロファイルされます。
式ルールを使用して、ソースカラムを検証したり、ソースカラムの値に基づいて追加のソ
ースカラムを作成したりすることができます。
内容
HypoStoresは、新たに確保したLos Angelesオフィスからデータウェアハウスにデータを組
み込む必要があります。 HypoStoresは、顧客名を分析して、名と姓に分離する必要があり
ます。 HypoStoresは、式ルールを使用して名と姓が含まれるカラムを別々の仮想カラムに
解析し、それらのカラムをプロファイルする必要があります。 HypoStoresは、これらのル
ールの出力を分析する必要のある他のアナリストがそれらのルールを使用できるようにす
る必要もあります。
28
目標
このレッスンでは、以下の作業を完了します。
1.
式ルールを作成して、FullNameカラムを名カラムと姓カラムに分離します。 氏名から
名を分離するルールを作成します。 名から姓を分離するもう1つのルールを作成しま
す。 これらのルールはProfile_LA_Customers_Customプロファイルに対して作成しま
す。
2.
プロファイルを実行し、プロファイル内のルールの出力を表示します。
3.
ルールを編集して、他のAnalystツールユーザーが使用できるようにします。
要件
このレッスンを開始する前に、次の要件を確認してください。
¨ レッスン1、2、3、および4を完了している。
時間
このレッスンの完了には、10~15分見ておいてください。
タスク1. 式ルールの作成とプロファイルの
実行
このタスクでは、2つの正規表現を作成して、FullNameカラムをFirstNameおよびLastName
という名前の2つの仮想カラムに解析します。 FirstNameカラムとLastNameカラムはルール
名です。
1.
コンテンツパネルで、Profile_LA_Customers_Customプロファイルをクリックして開
きます。
タブにプロファイルが表示されます。
2.
[アクション] > [編集] > [カラムプロファイリングルール]をクリックしま
す。
[ルールの編集]ウィンドウが表示されます。
3.
[+]をクリックして新しいルールを作成します。
4.
[ルールの作成]を選択します。
5.
[次へ]をクリックします。
6.
ルール名にFirstNameと入力します。
7.
式パネルで、次の式を入力してNameカラムから名を分離します。
SUBSTR(FullName,1,INSTR(FullName,' ' ,-1,1 ) - 1)
8.
[検証]をクリックします。
9.
[OK]をクリックします。
10.
必要に応じて、[カラムプロファイリング]タブで、カラム、サンプリング、および
ドリルダウンオプションを設定します。
タスク1. 式ルールの作成とプロファイルの実行
29
11.
[保存]をクリックします。
Analystツールによってルールが作成され、[カラムプロファイリング]ビューに表示
されます。
12.
前の手順を繰り返して、LastNameという名前のルールを作成し、次の式を入力して
Nameカラムから姓を分離します。
SUBSTR(FullName,INSTR(FullName,' ',-1,1),LENGTH(FullName))
タスク2. 式ルールの出力の表示
このタスクでは、プロファイルの実行後に名と姓を分離する式ルールの出力を表示しま
す。
1.
[カラムプロファイリング]ビューで、 [アクション] > [プロファイルの実行]
をクリックします。
2.
[アクション] > [編集] > [カラムプロファイリング]をクリックします。
3.
[カラム]パネルで、ツールバーの[名前]の横にあるチェックボックスを選択し
て、すべてのカラムをクリアします。
4.
FullNameカラム、FirstNameルール、およびLastNameルールを選択します。
5.
[保存して実行]をクリックします。
6.
FirstNameルールをクリックします。
[値]ビューに値が表示されます。
7.
[値]ビューで値を選択します。
8.
右クリックで[ドリルダウン]を選択します。
ドリルダウンパネルに、FullNameカラムの値、FirstNameルールの値、および
LastNameルールの値が表示されます。 FullNameカラムが名と姓に分離されています。
タスク3. 式ルールの編集
このタスクでは、すべてのAnalystツールユーザーに対して式ルールを再利用可能および使
用可能にします。
1.
[カラムプロファイリング]ビューで、FirstNameルールを選択します。
2.
[アクション] > [編集] > [カラムプロファイリングルール]をクリックしま
す。
[ルールの編集]ウィンドウが表示されます。
3.
[編集]アイコンをクリックします。
4.
[再利用可能なルールとして保存します]を選択します。
デフォルトでは、Analystツールは現在のプロファイルおよびフォルダにルールを保存
します。
30
章 6: レッスン5. 式ルールの作成
5.
[OK]をクリックします。
6.
LastNameルールを選択し、手順3~5を繰り返します。
AnalystツールユーザーがFrstNameルールとLastNameルールを使用して、名と姓から構成
されるカラムを別々のカラムに分割することができるようになります。
式ルールの作成のまとめ
このレッスンでは、式ルールが式関数とソースカラムを使用してルールの論理を定義する
ことを学習しました。 式ルールの出力はプロファイル内の仮想カラムであることを学習し
ました。 プロファイルを実行すると、Analystツールによって仮想カラムが組み込まれま
す。
2つの式ルールを作成してプロファイルに追加し、そのプロファイルを実行しました。 ル
ールの出力を表示し、それらのルールをすべてのAnalystツールユーザーが使用できるよう
にしました。
式ルールの作成のまとめ
31
第 7 章
レッスン6. スコアカードの
作成と実行
この章では、以下の項目について説明します。
¨ スコアカードの作成と実行の概要, 32 ページ
¨ タスク1. プロファイル結果からのスコアカードの作成, 33 ページ
¨ タスク2. スコアカードの実行, 34 ページ
¨ タスク3. スコアカードの表示, 34 ページ
¨ タスク4. スコアカードの編集, 35 ページ
¨ タスク5. しきい値の設定, 35 ページ
¨ タスク6. スコアの傾向グラフの表示, 35 ページ
¨ スコアカードの作成と実行のまとめ, 36 ページ
スコアカードの作成と実行の概要
スコアカードは、グラフィカル形式のカラムの有効値またはプロファイル結果内のルール
の出力です。 長期間にわたってデータ品質の進捗を測定して監視するには、スコアカード
を使用します。
スコアカードを作成するには、プロファイル内のカラムをメトリックとしてスコアカード
に追加し、メトリックにウェイトを割り当てて、スコアしきい値を設定します。スコアカ
ードを実行するには、メトリックの有効値を選択します。スコアカードを実行して、メト
リックのスコアを確認します。
スコアカードには、プロファイル内のカラムの値の頻度がスコアとして表示されます。 ス
コアにはメトリックの有効値の割合が反映されます。
内容
HypoStoresは、新たに確保したLos Angelesオフィスからデータウェアハウスにデータを組
み込む必要があります。 データをマージする前に、さまざまなの顧客層と状態のデータが
データ品質について分析されることを確認する必要があります。 あなたは、データ品質分
析の実行の進捗を監視するアナリストです。顧客層プロファイルカラムと状態プロファイ
ルカラムからスコアカードを作成し、データ品質のしきい値を設定し、スコアの傾向グラ
32
フを表示して時間の経過とともにスコアがどのように改善するかを確認する必要がありま
す。
目標
このレッスンでは、以下のタスクを完了します。
1.
Profile_LA_Customers_Customプロファイルの結果からスコアカードを作成して、
CustomerTierカラムとStateカラムのスコアを表示します。
2.
スコアカードを実行して、CustomerTierカラムとStateカラムのスコアを生成しま
す。
3.
スコアカードを表示して、各カラムのスコアを確認します。
4.
スコアカードを編集して、スコアのさまざまな有効値を指定します。
5.
スコアのしきい値を設定し、スコアカードを実行します。
6.
スコアの傾向グラフを表示して、時間の経過とともにスコアがどのように改善するか
を確認します。
要件
このレッスンを開始する前に、次の要件を確認してください。
¨ このチュートリアルのレッスン1から5までを完了している。
時間
このレッスンのタスクの完了には、15分見ておいてください。
タスク1. プロファイル結果からのスコアカ
ードの作成
このタスクでは、Profile_LA_Customers_Customプロファイルからスコアカードを作成し
て、CustomerTierカラムとStateカラムの値をスコアリングします。
1.
2.
Profile_LA_Customers_Customプロファイルを開きます。
[アクション] > [スコアカードに追加]をクリックします。
[スコアカードに追加]ウィザードが表示されます。[新しいスコアカード]オプシ
ョンがデフォルトで選択されています。
3.
[次へ]をクリックします。
4.
スコアカード名としてsc_LA_Customerと入力し、スコアカードの場所のCustomersフ
ォルダーに移動します。
5.
[次へ]をクリックします。
6.
スコアカードに追加するCustomerTierカラムとStateカラムを選択します。
7.
[次へ]をクリックします。
8.
[メトリック]パネルでCustomerTierメトリックを選択し、[スコアで使用: 値]パ
ネルですべての値を選択します。
シフトキーを使用して複数の値を選択します。
タスク1. プロファイル結果からのスコアカードの作成
33
9.
[メトリック]パネルでStateメトリックを選択し、次のパネル内の2文字のStateコー
ドを持つ値を選択します([スコアで使用: 値]パネル)。
10.
[メトリック]パネル内のメトリックごとに、[メトリックしきい値]パネルのスコ
アしきい値のデフォルト設定を受け入れます。
11.
[次へ]をクリックします。
12.
メトリックを追加するメトリックグループを選択します。デフォルトでは、メトリッ
クは[デフォルト]メトリックグループに追加されます。
13.
[次へ]をクリックします。
14.
[スコアで使用: 値]パネルで、CustomerTierメトリックの[ウェイト]カラムをダ
ブルクリックします。
15.
CustomerTierメトリックおよびStateメトリックのウェイトを入力します。
16.
[保存]をクリックしてスコアカードを作成するか、[保存して実行]をクリックし
てスコアカードを作成、実行します。
タスク2. スコアカードの実行
このタスクは、sc_LA_Customerスコアカードを実行して、CustomerTierカラムとStateカ
ラムのスコアを生成します。
1.
sc_LA_Customerスコアカードをクリックして開きます。
タブにスコアカードが表示されます。
2.
[アクション] > [スコアカードの実行]をクリックします。
[スコアカード]ビューに、CustomerTierカラムとStateカラムのスコアが表示され
ます。
タスク3. スコアカードの表示
このタスクでは、sc_LA_Customerスコアカードを表示して、CustomerTierカラムとState
カラムのスコアを確認します。
1.
表示するStateスコアが含まれるStateカラムを選択します。
2.
[アクション] > [ドリルダウン]をクリックします。
[有効]ビューにStateカラムの有効なスコアが表示されます。 [無効]をクリック
して、状態カラムの有効ではないスコアを表示します。[メトリック]パネルで、メ
トリック名、メトリックウェイト、およびスコアの割合を確認できます。バーとして
表示されるスコア、スコアの傾向、スコアのデータオブジェクト、およびスコアのソ
ースとソースタイプを確認できます。
3.
CustomerTierカラムに対して、1から2までの手順を繰り返します。
CustomerTierカラムのすべてのスコアが有効です。
34
章 7: レッスン6. スコアカードの作成と実行
タスク4. スコアカードの編集
このタスクでは、sc_LA_Customerスコアカードを編集して、Rubyの値をCustomerTierスコ
アに対して無効なものとして指定します。
1.
[アクション] > [編集]をクリックします。
[スコアカードの編集]ウィンドウが表示されます。
2.
[メトリック]パネルで、CustomerTierスコアを選択します。
3.
[スコアで使用: 値]パネルで、[選択した値]カラムのRubyを[使用可能な値]カ
ラムに移動します。
[メトリックしきい値]パネルのデフォルト設定を受け入れます。
4.
[保存して実行]をクリックし、スコアカードの変更内容を保存して、スコアカード
を実行します。
5.
CustomerTierスコアをもう一度表示します。
タスク5. しきい値の設定
このタスクでは、sc_LA_Customerスコアカード内のStateスコアのしきい値を設定して、
Stateカラムのデータの許容範囲を決定します。 CAなどの2文字のコードの値は許容され、
Califなどの2文字を超えるコードは許容されません。
1.
[スコアカードの編集]ウィンドウで、スコアパネルのStateスコアを選択します。
2.
[メトリックしきい値]パネルで、[正常]スコアに90~100%、[許可不可]スコア
に0~50%、[許可可能]スコアに51%~89%の範囲を入力します。
しきい値は許容可能な範囲と正常な範囲の下方境界を表します。
3.
[保存]をクリックし、スコアカードの変更内容を保存し、実行します。
スコアパネルで、スコアの割合の変更およびバーとして表示されるStateスコアのスコ
アを表示します。
タスク6. スコアの傾向グラフの表示
このタスクでは、Stateスコアの傾向グラフを表示します。 傾向グラフを表示して、スコ
アを時系列で監視することができます。
1.
ナビゲータで、チュートリアルプロジェクト内のCustomersフォルダを選択します。
2.
sc_LA_Customerスコアカードをクリックして開きます。
タブにスコアカードが表示されます。
3.
[スコアカード]ビューで、Stateスコアを選択します。
タスク4. スコアカードの編集
35
4.
[アクション] > [傾向グラフの表示]をクリックします。
[傾向グラフの詳細]ウィンドウが表示されます。 スコアに対して、[正常]、[許
容可能]、および[許容不可]のしきい値を表示できます。 しきい値は、スコアカー
ドでのスコアの値の編集後、スコアカードを実行するたびに変わります。
スコアカードの作成と実行のまとめ
このレッスンでは、プロファイルの結果からスコアカードを作成できることを学習しまし
た。 スコアカードには、プロファイルのカラムが含まれます。 スコアカードを実行して
カラムのスコアを生成できることを学習しました。 スコアカードを編集して有効値を設定
し、スコアのしきい値を設定しました。 スコアの傾向グラフを表示する方法も学習しまし
た。
プロファイル内のCustomerTierカラムとStateカラムからスコアカードを作成して、
CustomerTierカラムとStateカラムのデータ品質を分析しました。 スコアカードを実行し
て、各カラムのスコアを生成しました。 スコアカードを編集して、スコアのさまざまな有
効値を指定しました。 スコアのしきい値を設定し、スコアの傾向グラフを表示しました。
36
章 7: レッスン6. スコアカードの作成と実行
第 8 章
レッスン7. プロファイルカ
ラムからの参照テーブルの作
成
この章では、以下の項目について説明します。
¨ プロファイルカラムからの参照テーブルの作成の概要, 37 ページ
¨ タスク1. プロファイルカラムからの参照テーブルの作成, 38 ページ
¨ タスク2. 参照テーブルの編集, 39 ページ
¨ プロファイルカラムからの参照テーブルの作成のまとめ, 40 ページ
プロファイルカラムからの参照テーブルの作
成の概要
参照テーブルには、ソースデータの標準化に使用できる参照データが含まれます。 参照デ
ータには、有効な標準値を含めることができます。 参照テーブルを作成して、ソースデー
タの値と有効な標準値の間にリレーションを確立します。
参照テーブルは、プロファイルの結果から作成できます。 参照テーブルの作成後、参照テ
ーブルを編集してカラムや行を追加したり、有効な標準値を追加または編集したりするこ
とができます。 参照テーブルに加えた変更は監査証跡で表示できます。
内容
HypoStoresは、データをプロファイルして異常を明らかにしたり、有効値が含まれるデー
タを標準化したりする必要があります。 あなたは、データ内の有効値を標準化するアナリ
ストです。 プロファイルカラムの有効値に基づいて、参照テーブルを作成する必要があり
ます。
37
目標
このレッスンでは、以下の作業を完了します。
1.
カラムの有効値を選択することによって、Profile_LA_Customers_Customプロファイ
ル内のCustomerTierカラムから参照テーブルを作成します。
2.
参照テーブルを編集して、カラムのさまざまな有効値を設定します。
要件
このレッスンを開始する前に、次の要件を確認してください。
¨ このチュートリアルのレッスン1から6までを完了している。
時間
このレッスンのタスクの所要時間は15分です。
タスク1. プロファイルカラムからの参照テ
ーブルの作成
このタスクでは、参照テーブルを作成し、Profile_LA_Customers_Customプロファイルか
らその参照テーブルにCustomerTierカラムを追加します。
1.
Profile_LA_Customers_Customプロファイルをクリックします。
タブにプロファイルが表示されます。
2.
[カラムプロファイリング]ビューで、参照テーブルに追加するCustomerTierカラム
を選択します。
CustomerTierカラムの値とパターンの頻度でドリルダウンして、非標準の顧客カテゴ
リ値を持つレコードを確認することができます。
3.
4.
[値]ビューで、追加する有効な顧客層値を選択します。 CtrlキーまたはShiftキー
を使用して、複数の値(Diamond、Gold、Silver、Bronze、Emerald)を選択します。
[アクション] > [参照テーブルへの追加]をクリックします。
新しい参照テーブルウィザードが表示されます。
5.
[新しい参照テーブルの作成]のオプションを選択します。
6.
[次へ]をクリックします。
7.
テーブル名としてReftab_CustTier_HypoStoresと入力します。
8.
説明を入力し、デフォルト値として0を設定します。
値が含まれていないテーブルレコードにはこのデフォルト値が使用されます。
9.
38
[次へ]をクリックします。
章 8: レッスン7. プロファイルカラムからの参照テーブルの作成
10.
カラム属性パネルで、CustomerTieカラムに次のカラムプロパティを設定します。
プロパティ
説明
名前
CustomerTier
データ型
String
精度
10
スケール
0
説明
参照顧客層の値
11.
必要に応じて、参照テーブルの行の説明カラムを作成します。カラムの名前および精
度を入力します。
12.
プレビューパネルで、CustomerTierカラムの値を確認します。
13.
[次へ]をクリックします。
Reftab_CustomerTier_HypoStoresという参照テーブル名が表示されます。 オプショ
ンの説明を入力できます。
14.
保存先パネルで、参照テーブルを作成するチュートリアルプロジェクトを選択しま
す。
参照テーブル:パネルに、選択した場所の参照テーブルが一覧表示されます。
15.
オプションの監査のメモを入力します。
16.
[完了]をクリックします。
タスク2. 参照テーブルの編集
このタスクでは、Reftab_CustomerTier_HypoStoresテーブルを編集して顧客層の代替値を
追加します。
1.
ナビゲータで、チュートリアルプロジェクト内のCustomersフォルダを選択します。
2.
Reftab_CustomerTier_HypoStores参照テーブルをクリックします。
タブに参照テーブルが開きます。
3.
行を編集するには、行を選択し、 [アクション] > [編集]をクリックするか、
[編集]アイコンをクリックします。
[行の編集]ウィンドウが表示されます。 オプションとして、複数の行を選択して同
じ代替値を各行に追加します。
4.
Diamond、Emerald、Gold、Silver、およびBronze行に、それぞれ代替値1、2、3、4、
5を入力します。
オプションの監査のメモを入力します。
5.
[適用]をクリックして、変更を適用します。
タスク2. 参照テーブルの編集
39
プロファイルカラムからの参照テーブルの作
成のまとめ
このレッスンでは、プロファイルの結果から参照テーブルを作成してソースデータの有効
値を設定する方法を学習しました。
カラムの有効値を選択することによって、プロファイルカラムから参照テーブルを作成し
ました。 参照テーブルを編集して、カラムのさまざまな有効値を設定しました。
40
章 8: レッスン7. プロファイルカラムからの参照テーブルの作成
第 9 章
レッスン8. 参照テーブルの
作成
この章では、以下の項目について説明します。
¨ 参照テーブルの作成の概要, 41 ページ
¨ タスク1. 参照テーブルの作成, 42 ページ
¨ 参照テーブルの作成のまとめ, 42 ページ
参照テーブルの作成の概要
参照テーブルには、ソースデータの標準化に使用できる参照データが含まれます。 参照デ
ータには、有効な標準値を含めることができます。 参照テーブルを作成して、ソースデー
タの値と有効な標準値の間にリレーションを確立します。
参照テーブルは、参照テーブルエディタを使用して手動で作成できます。 参照テーブルを
使用して、ソースデータの定義や標準化を行います。 参照テーブルを開発者と共有して、
Developerツールの標準化トランスフォーメーションやルックアップトランスフォーメーシ
ョンで使用することができます。
内容
HypoStoresは、有効な値が含まれるデータを標準化する必要があります。 あなたは、デー
タ内の有効値を標準化するアナリストです。 参照テーブルを作成して、LAの顧客データを
参照する標準の顧客層コードを定義する必要があります。 それにより、開発者と参照テー
ブルを共有できます。
目標
このレッスンでは、以下のタスクを完了します。
¨ 参照テーブルエディタを使用して参照テーブルを作成し、LAの顧客データを参照する標
準の顧客層コードを定義します。
41
要件
このレッスンを開始する前に、次の要件を確認してください。
¨ このチュートリアルのレッスン1から2までを完了している。
時間
このレッスンのタスクの完了には、10分見ておいてください。
タスク1. 参照テーブルの作成
このタスクでは、Reftab_CustomerTier_Codes参照テーブルを作成して、顧客層データの
有効値を標準化します。
1.
2.
ナビゲータで、参照テーブルを作成する、チュートリアルプロジェクト内のCustomer
フォルダを選択します。
[アクション] > [新しい参照テーブル]をクリックします。
新しい参照テーブルウィザードが表示されます。
3.
[参照テーブルエディタを使用します。]のオプションを選択します。
4.
[次へ]をクリックします。
5.
テーブル名としてReftab_CustomerTier_Codesと入力し、オプションの説明を入力
し、デフォルト値を0に設定します。
値が含まれていないテーブルレコードにはこのデフォルト値が使用されます。
6.
参照テーブルに組み込むカラムごとに、[新しいカラムの追加]アイコンをクリック
し、カラムごとにカラムプロパティを設定します。
カラム名CustomerID、CustomerTier、Statusを追加します。 カラムの順序を変更し
たりカラムを削除したりすることができます。
7.
[完了]をクリックします。
8.
Reftab_CustomerTier_Codes参照テーブルを開き、 [アクション] > [行の追加]
をクリックして、参照テーブルの各カラムに4つの値を入力します。
CustomerID = LA1、LA2、LA3、LA4
CustomerTier = 1、2、3、4、5
Status= Active、Inactive
参照テーブルの作成のまとめ
このレッスンでは、参照テーブルエディタを使用して参照テーブルを作成し、ソースデー
タで使用する標準の有効値を作成する方法を学習しました。
参照テーブルエディタを使用して参照テーブルを作成し、LAの顧客データの顧客層の値を
標準化しました。
42
章 9: レッスン8. 参照テーブルの作成
パート II: Informatica
Developerの基本操作
この部には、以下の章があります。
¨ レッスン1. Informatica Developerの設定, 44 ページ
¨ レッスン2. 物理データオブジェクトのインポート, 49 ページ
¨ レッスン3. データのプロファイリング, 54 ページ
43
第 10 章
レッスン1. Informatica
Developerの設定
この章では、以下の項目について説明します。
¨ Informatica Developerの設定の概要, 44 ページ
¨ タスク1. Informatica Developerの起動, 45 ページ
¨ タスク2. ドメインの追加, 46 ページ
¨ タスク3. モデルリポジトリの追加, 46 ページ
¨ タスク4. プロジェクトの作成, 46 ページ
¨ タスク5. フォルダの作成, 47 ページ
¨ タスク6. デフォルトのData Integration Serviceの選択, 47 ページ
¨ Informatica Developerの設定のまとめ, 47 ページ
Informatica Developerの設定の概要
このチュートリアルのレッスンを開始する前に、Developerツールを起動して設定する必要
があります。 Developerツールを設定するには、ドメインを追加します。 ドメイン内にあ
るモデルリポジトリを追加し、作業を格納するプロジェクトとフォルダを作成します。 デ
フォルトのData Integration Serviceも選択します。
Informaticaドメインは、Informatica環境を定義するノードとサービスの集合です。 ド
メイン内のサービスには、Model Repository ServiceやData Integration Serviceなどが
あります。
Model Repository Serviceでは、モデルリポジトリが管理されます。 モデルリポジトリ
は、Developerツールで作成するプロジェクトのメタデータを格納するリレーショナルデー
タベースです。 プロジェクトには、Developerツールで作成するオブジェクトが格納され
ます。 プロジェクトには、同じビジネス要件の一部であるオブジェクトなど、関連するオ
ブジェクトを格納するフォルダも含まれます。
Data Integration Serviceは、Developerツールでデータ統合タスクを実行します。
44
目標
このレッスンでは、以下の作業を完了します。
¨ Developerツールを起動し、Developerツールのワークベンチに移動します。
¨ Developerツールでドメインを追加します。
¨ プロジェクトを作成できるように、モデルリポジトリを追加します。
¨ Developerツールで作成するオブジェクトを格納するプロジェクトを作成します。
¨ プロジェクトに、関連するオブジェクトを格納できるフォルダを作成します。
¨ デフォルトのData Integration Serviceを選択して、データ統合タスクを実行します。
要件
このレッスンを開始する前に、次の要件を確認してください。
¨ Developerツールをインストールしている。
¨ ドメインに接続するためのドメイン名、ホスト名、およびポート番号がある。 この情
報はドメイン管理者から取得することができます。
¨ ドメイン管理者がAdministratorツールでModel Repository Serviceを設定済みであ
る。
¨ Model Repository Serviceにアクセスするためのユーザー名とパスワードがある。 こ
の情報はドメイン管理者から取得することができます。
¨ ドメイン管理者がData Integration Serviceを設定済みである。
¨ Data Integration Serviceが実行されている。
時間
このレッスンのタスクの完了には、5~10分見ておいてください。
タスク1. Informatica Developerの起動
Developerツールを起動してチュートリアルを開始します。
1.
Developerツールを起動します。
Developerツールの[ようこそ]ページが表示されます。
2.
[ワークベンチ]ボタンをクリックします。
Developerツールのワークベンチが表示されます。
タスク1. Informatica Developerの起動
45
タスク2. ドメインの追加
このタスクでは、Developerツールにドメインを追加して、モデルリポジトリにアクセスし
ます。
1.
[ウィンドウ] > [設定]をクリックします。
[設定]ダイアログボックスが表示されます。
2.
3.
[Informatica] > [ドメイン]を選択します。
[追加]をクリックします。
[新しいドメイン]ダイアログボックスが表示されます。
4.
ドメイン名、ホスト名、およびポート番号を入力します。
5.
[完了]をクリックします。
6.
[OK]をクリックします。
タスク3. モデルリポジトリの追加
このタスクでは、プロジェクトとフォルダの格納に使用するモデルリポジトリを追加しま
す。
1.
[ファイル] > [リポジトリへの接続]をクリックします。
[リポジトリへの接続]ダイアログボックスが表示されます。
2.
[参照]をクリックして、Model Repository Serviceを選択します。
3.
[OK]をクリックします。
4.
[次へ]をクリックします。
5.
ユーザ名とパスワードを入力します。
6.
名前空間を選択します。
7.
[完了]をクリックします。
Object Explorerビューにモデルリポジトリが表示されます。
タスク4. プロジェクトの作成
このタスクでは、Developerツールで作成するオブジェクトを格納するプロジェクトを作成
します。 このガイドのすべてのチュートリアルで使用するプロジェクトを1つ作成しま
す。
1.
2.
[Object Explorer]ビューで、Model Repository Serviceを選択します。
[ファイル] > [新規] > [プロジェクト]をクリックします。
[新規プロジェクト]ダイアログボックスが表示されます。
46
章 10: レッスン1. Informatica Developerの設定
3.
「Tutorial_あなたの名前」をプロジェクト名として入力します。
4.
[完了]をクリックします。
[Object Explorer]ビューの[Model Repository Service]の下にプロジェクトが
表示されます。
タスク5. フォルダの作成
このタスクでは、関連するオブジェクトを格納するフォルダを作成します。 このガイドの
すべてのチュートリアルで使用するフォルダを1つ作成します。
1.
2.
[Object Explorer]ビューで、フォルダの追加先のプロジェクトを選択します。
[ファイル] > [新規] > [フォルダ]をクリックします。
3.
フォルダの名前を入力します。
4.
[完了]をクリックします。
Developerツールは、[Object Explorer]ビューのプロジェクトの下にフォルダを追
加します。 プロジェクトを展開して、フォルダを確認してください。
タスク6. デフォルトのData Integration
Serviceの選択
このタスクでは、マッピングを実行したりデータをプレビューしたりできるように、デフ
ォルトのData Integration Serviceを選択します。
1.
[ウィンドウ] > [設定]をクリックします。
[設定]ダイアログボックスが表示されます。
2.
[Informatica] > [Data Integration Services]を選択します。
3.
ドメインを展開します。
4.
Data Integration Serviceを選択します。
5.
[デフォルトとして設定]をクリックします。
6.
[OK]をクリックします。
Informatica Developerの設定のまとめ
このレッスンでは、InformaticaドメインにModel Repository ServiceとData
Integration Serviceが含まれることを学習しました。 Model Repository Serviceでは、
タスク5. フォルダの作成
47
モデルリポジトリが管理されます。 モデルリポジトリには、プロジェクトとフォルダが含
まれます。 Data Integration Serviceは、データ統合タスクを実行します。
Developerツールを起動し、Developerツールを設定しました。 Developerツールにドメイ
ンを追加し、モデルリポジトリを追加し、プロジェクトとフォルダを作成しました。 デフ
ォルトのData Integration Serviceも選択しました。
これで、Developerツールを使用してこのチュートリアルの他のレッスンを完了することが
できます。
48
章 10: レッスン1. Informatica Developerの設定
第 11 章
レッスン2. 物理データオブ
ジェクトのインポート
この章では、以下の項目について説明します。
¨ 物理データオブジェクトのインポートの概要, 49 ページ
¨ タスク1. Boston_Customersフラットファイルデータオブジェクトのインポー
ト, 50 ページ
¨ タスク2. LA_Customersフラットファイルデータオブジェクトのインポート, 51 ペー
ジ
¨ タスク3. All_Customersフラットファイルデータオブジェクトのインポート, 52 ペ
ージ
¨ 物理データオブジェクトのインポートのまとめ, 53 ページ
物理データオブジェクトのインポートの概要
物理データオブジェクトは、フラットファイルまたはリレーショナルデータベーステーブ
ルに基づいたデータの表現です。 フラットファイルまたはリレーショナルデータベーステ
ーブルを物理データオブジェクトとしてインポートして、マッピングでソースまたはター
ゲットとして使用することができます。
内容
HypoStores Corporationでは、Los AngelesオフィスとBostonオフィスの顧客データをフ
ラットファイルに格納しています。 この顧客データをDeveloperツールで使用したいと考
えています。 そのためには、各フラットファイルを物理データオブジェクトとしてインポ
ートする必要があります。
目標
このレッスンでは、フラットファイルを物理データオブジェクトとしてインポートしま
す。 Data Integration Serviceが正しいディレクトリからソースデータを読み取ること
ができるようにソースファイルディレクトリを設定することもできます。
49
要件
このレッスンを開始する前に、次の要件を確認してください。
¨ このチュートリアルのレッスン1を完了している。
時間
このレッスンのタスクの完了には、10~15分見ておいてください。
タスク1. Boston_Customersフラットファイ
ルデータオブジェクトのインポート
このタスクでは、Bostonオフィスの顧客データが含まれるファイルから、物理データオブ
ジェクトをインポートします。
1.
[Object Explorer]ビューで、チュートリアルプロジェクトを選択します。
2.
[ファイル] > [新規] > [データオブジェクト]をクリックします。
[新規]ダイアログボックスが表示されます。
3.
[物理データオブジェクト] > [フラットファイルデータオブジェクト]を選択
し、[次へ]をクリックします。
[新しいフラットファイルデータオブジェクト]ダイアログボックスが表示されま
す。
4.
[既存のフラットファイルから作成]を選択します。
5.
[参照]をクリックし、次のディレクトリに移動してBoston_Customers.csvを選択し
ます。<Informatica Installation Directory>\clients\DeveloperClient\Tutorials
6.
[開く]をクリックします。
ウィザードによって、データオブジェクトにBoston_Customersという名前が付けられ
ます。
7.
[次へ]をクリックします。
8.
コードページがMS Windows Latin 1(ANSI)、Latin 1のスーパーセットであること
を確認します。
9.
区切り形式であることを確認します。
10.
[次へ]をクリックします。
11.
区切り文字がカンマに設定されていることを確認します。
12.
[1行目からカラム名をインポート]を選択します。
13.
[完了]をクリックします。
Boston_Customers物理データオブジェクトが、チュートリアルプロジェクトの[物理
データオブジェクト]の下に表示されます。
50
14.
[読み取り]ビューをクリックし、出力トランスフォーメーションを選択します。
15.
[プロパティ]ビューで[ランタイム]タブをクリックします。
章 11: レッスン2. 物理データオブジェクトのインポート
16.
17.
[ソースファイルのディレクトリ]をData Integration Serviceマシンの次のディレ
クトリに設定します。<Informatica Installation Directory>\server\Tutorials
[ファイル] > [保存]をクリックします。
タスク2. LA_Customersフラットファイルデ
ータオブジェクトのインポート
このタスクでは、Los Angelesオフィスの顧客データが含まれるフラットファイルから、物
理データオブジェクトをインポートします。
1.
[Object Explorer]ビューで、チュートリアルプロジェクトを選択します。
2.
[ファイル] > [新規] > [データオブジェクト]をクリックします。
[新規]ダイアログボックスが表示されます。
3.
[物理データオブジェクト] > [フラットファイルデータオブジェクト]を選択
し、[次へ]をクリックします。
[新しいフラットファイルデータオブジェクト]ダイアログボックスが表示されま
す。
4.
[既存のフラットファイルから作成]を選択します。
5.
[参照]をクリックし、次のディレクトリのLA_Customers.csvに移動します。
<Informatica Installation Directory>\clients\DeveloperClient\Tutorials
6.
[開く]をクリックします。
ウィザードでデータオブジェクトにLA_Customersという名前が付けられます。
7.
[次へ]をクリックします。
8.
コードページがMS Windows Latin 1(ANSI)、Latin 1のスーパーセットであること
を確認します。
9.
区切り形式であることを確認します。
10.
[次へ]をクリックします。
11.
区切り文字がカンマに設定されていることを確認します。
12.
[1行目からカラム名をインポート]を選択します。
13.
[完了]をクリックします。
LA_Customers物理データオブジェクトが、チュートリアルプロジェクトの[物理デー
タオブジェクト]の下に表示されます。
14.
[読み取り]ビューをクリックし、出力トランスフォーメーションを選択します。
15.
[プロパティ]ビューで[ランタイム]タブをクリックします。
16.
[ソースファイルのディレクトリ]をData Integration Serviceマシンの次のディレ
クトリに設定します。<Informatica Installation Directory>\server\Tutorials
17.
[ファイル] > [保存]をクリックします。
タスク2. LA_Customersフラットファイルデータオブジェクトのインポート
51
タスク3. All_Customersフラットファイルデ
ータオブジェクトのインポート
このタスクでは、Los AngelesオフィスとBostonオフィスの顧客注文データを組み合わせた
フラットファイルから、物理データオブジェクトをインポートします。
1.
[Object Explorer]ビューで、チュートリアルプロジェクトを選択します。
2.
[ファイル] > [新規] > [データオブジェクト]をクリックします。
[新規]ダイアログボックスが表示されます。
3.
[物理データオブジェクト] > [フラットファイルデータオブジェクト]を選択
し、[次へ]をクリックします。
[新しいフラットファイルデータソース]ダイアログボックスが表示されます。
4.
[既存のフラットファイルから作成]を選択します。
5.
[参照]をクリックし、次のディレクトリのAll_Customers.csvに移動します。
<Informatica Installation Directory>\clients\DeveloperClient\Tutorials
6.
[開く]をクリックします。
ウィザードでデータオブジェクトにAll_Customersという名前が付けられます。
7.
[次へ]をクリックします。
8.
コードページがMS Windows Latin 1(ANSI)、Latin 1のスーパーセットであること
を確認します。
9.
区切り形式であることを確認します。
10.
[次へ]をクリックします。
11.
区切り文字がカンマに設定されていることを確認します。
12.
[1行目からカラム名をインポート]を選択します。
13.
[完了]をクリックします。
All_Customers物理データオブジェクトが、チュートリアルプロジェクトの[物理デー
タオブジェクト]の下に表示されます。
14.
[読み取り]ビューをクリックし、出力トランスフォーメーションを選択します。
15.
[プロパティ]ビューで[ランタイム]タブをクリックします。
16.
[ソースファイルのディレクトリ]をData Integration Serviceマシンの次のディレ
クトリに設定します。<Informatica Installation Directory>\server\Tutorials
17.
52
[ファイル] > [保存]をクリックします。
章 11: レッスン2. 物理データオブジェクトのインポート
物理データオブジェクトのインポートのまと
め
このレッスンでは、物理データオブジェクトがフラットファイルまたはリレーショナルデ
ータベーステーブルに基づいたデータの表現であることを学習しました。
フラットファイルから物理データオブジェクトを作成しました。 Data Integration
Serviceが正しいディレクトリからソースデータを読み取ることができるようにソースファ
イルディレクトリを設定することもできます。
作成したデータオブジェクトは、データ品質のレッスンでマッピングソースとして使用し
ます。
物理データオブジェクトのインポートのまとめ
53
第 12 章
レッスン3. データのプロフ
ァイリング
この章では、以下の項目について説明します。
¨ データのプロファイリングの概要, 54 ページ
¨ タスク1. 2つのデータソースでの結合分析の実行, 55 ページ
¨ タスク2. 結合分析結果の表示, 56 ページ
¨ タスク3. データソースでのプロファイルの実行, 57 ページ
¨ タスク4. カラムプロファイル結果の表示, 57 ページ
¨ データのプロファイリングのまとめ, 58 ページ
データのプロファイリングの概要
プロファイルは、データセットの内容と構造を記述する一連のメタデータです。
データプロファイルリングは、多くの場合、プロジェクトの最初の手順です。 プロファイ
ルを実行してデータの構造を評価し、想定する情報のタイプがデータカラムに入力されて
いることを確認することができます。 プロファイルによってデータの問題が明らかになっ
た場合は、それらの問題を修正する手順をプロジェクト内で定義できます。 例えば、想定
された長さを超える値がカラムに含まれていることがプロファイルによって明らかになっ
た場合は、問題の値を削除または修正するようにデータ品質プロセスを設計できます。
選択したカラムのデータ品質を分析するプロファイルは、カラムプロファイルと呼ばれま
す。
注: Developerツールを使用して、プライマリキー、外部キー、および機能依存性リレーシ
ョンを検出することや、データカラムの結合条件を分析することもできます。
カラムプロファイルは、データに関する次のファクトを提供します。
¨ カラムごとの一意の値とNULL値の数。数および割合として表されます。
¨ カラムごとのデータのパターン、およびこれらの値が出現する頻度。
¨ カラム値に関する統計。値の最大長さと最小長さや、各カラムの最初の値と最後の値な
ど。
54
¨ 結合分析プロファイルでの、2つのデータカラム間の重複の度合い。ベン図および割合
値として表示されます。 結合分析プロファイルを使用して、カラムの結合条件で発生
する可能性のある問題を特定します。
カラムプロファイルは、プロジェクトのあらゆる段階で実行して、データ品質を測定した
り、データの変更がプロジェクトの目標にかなっていることを確認したりすることができ
ます。 カラムプロファイルをマッピングのトランスフォーメーションで実行して、そのト
ランスフォーメーションがデータに与える影響を示すことができます。
内容
HypoStoresは、顧客データにエラー、不整合、および重複した情報がないことを確認する
必要があります。 HypoStoresは、データ品質の目標を達成するためのプロセスを設計する
前に、ソースデータファイルの品質を測定し、データを処理する準備ができていることを
確認する必要があります。
目標
このレッスンでは、以下の作業を完了します。
¨ Boston_CustomersデータソースとLA_Customersデータソースで、結合分析を実行します。
¨ 結合分析の結果を表示して、2つのオフィスのデータを正常にマージできるかどうかを
判断します。
¨ All_Customersデータソースで、カラムプロファイルを実行します。
¨ カラムプロファイリングの結果を表示して、データに含まれる値とパターンを確認しま
す。
要件
このレッスンを開始する前に、次の要件を確認してください。
¨ このチュートリアルのレッスン1から2までを完了している。
所要時間
¨ このレッスンの完了には、20分見ておいてください。
タスク1. 2つのデータソースでの結合分析の
実行
このタスクでは、Boston_CustomersおよびLA_Customersデータソースについて結合分析を実行
し、結合条件を表示します。
1.
[Object Explorer]ビューで、チュートリアルプロジェクト内のデータオブジェク
トを参照します。
2.
Boston_CustomersおよびLA_Customersデータソースを選択します。
ヒント: 複数のデータオブジェクトを選択するには、Shiftキーを押しながら選択しま
す。
3.
選択したデータオブジェクト右クリックし、[プロファイル]を選択します。
タスク1. 2つのデータソースでの結合分析の実行
55
新しいプロファイルウィザードが開きます。
4.
[プロファイルモデル]を選択し、[次へ]をクリックします。
5.
[名前]フィールドにTutorial_Modelと入力します。
[次へ]をクリックします。
6.
Boston_CustomersとLA_CustomersがData Objectカラムに表示されていることを確認しま
す。
7.
[完了]をクリックします。
Object Explorerに Tutorial_Modelプロファイルモデルが表示されます。
8.
モデリングキャンバスで、マウスを使用して Boston_CustomersとLA_Customersを選択しま
す。
9.
データオブジェクト名を右クリックし、[結合プロファイル]を選択します。
新しい結合プロファイルウィザードが開きます。
10.
[名前]フィールドにJoinAnalysisと入力します。
11.
Boston_CustomersとLA_Customersがデータオブジェクトとして表示されていることを確認し
ます。
[次へ]をクリックします。
12.
両方のデータソースで、 CustomerIDカラムを選択します。
ウィザードのペインをスクロールダウンして、両方のデータセットのカラムを表示し
ます。
[次へ]をクリックします。
13.
[追加]をクリックして、結合条件を追加します。
[結合条件]ウィンドウが開きます。
14.
[カラム]セクションで、[新規]ボタンをクリックします。
15.
左側のカラムの最初の行をダブルクリックし、 CustomerIDを選択します。
16.
右側のカラムの最初の行をダブルクリックし、 CustomerIDを選択します。
17.
[OK]をクリックし、[完了]をクリックします。
エディタにJoinAnalysisプロファイルが開き、プロファイルが実行されます。
注: プロファイルは閉じないでください。 次のタスクでプロファイル結果を表示します。
タスク2. 結合分析結果の表示
このタスクでは、JoinAnalysisプロファイルの[結合結果]ビューに結合分析結果を表示し
ます。
1.
モデリングキャンバス内の [JoinAnalysis]タブをクリックします。
2.
[結合プロファイル]セクションで、最初の行をクリックします。
[詳細]セクションに、ベン図と結合分析結果の詳細が表示されます。
56
章 12: レッスン3. データのプロファイリング
3.
[行の結合]カラムで、結合が含まれる行の数としてゼロが報告されていることを確
認します。
これは、CustomerIDフィールドのいずれも重複していないことを示し、2つのデータソー
スを正常にマージできることを示しています。
4.
LA_CustomersデータオブジェクトのCustomerID値を表示するには、ベン図内で円形のラベ
ルの付いたLA_Customersをダブルクリックします。
ヒント: これらの項目によって説明されるデータ行を表示するには、ベン図内の円を
ダブルクリックします。 ベン図内で円が交差する場合は、交点をダブルクリックして
両方のデータセットに共通のデータ値を表示します。
データビューアに、LA_Customersデータオブジェクトに含まれるCustomerID値が表示され
ます。
タスク3. データソースでのプロファイルの
実行
このタスクでは、All_Customersデータソースでプロファイルを実行して、データの内容と構
造を表示します。
1.
[Object Explorer]ビューで、チュートリアルプロジェクト内のデータオブジェク
トを参照します。
2.
All_Customersデータソースを選択します。
3.
[ファイル] > [新規] > [プロファイル]をクリックします。
[新しいプロファイル]ウィンドウが表示されます。
4.
[名前]フィールドにAll_Customersと入力します。
5.
[完了]をクリックします。
エディタにAll_Customersプロファイルが開き、プロファイルが実行されます。
タスク4. カラムプロファイル結果の表示
このタスクでは、All_Customersデータオブジェクトのカラムプロファイリング結果を表示
し、データに含まれる値とパターンを確認します。
1.
[ウィンドウ] > [ビューの表示] > [進行状況]をクリックして、All_Customersプ
ロファイルの進行状況を表示します。
進行状況ビューが開きます。
2.
[進行状況]ビューでAll_Customersプロファイルの実行完了が報告されたら、エディタ
で[結果]ビューをクリックします。
3.
[カラムプロファイリング]セクションで、CustomerTierカラムをクリックします。
タスク3. データソースでのプロファイルの実行
57
[詳細]セクションに、CustomerTierカラムに含まれているすべての値が表示され、デ
ータセットに値が出現する頻度に関する情報が表示されます。
4.
[詳細]セクションで、値Rubyをダブルクリックします。
データビューアにより、CustomerTierカラムに値Rubyが含まれるレコードが実行および表
示されます。
5.
[カラムプロファイリング]セクションで、OrderAmountカラムをクリックします。
6.
[詳細]セクションで、[リストを表示]をクリックし、[パターン]を選択しま
す。
[詳細]セクションに、OrderAmountカラムで見つかったパターンが表示されます。
Patternカラム内の文字列9(5)は、5桁の注文金額が含まれるレコードを参照します。 文
字列9(4)は、4桁の金額が含まれるレコードを参照します。
7.
Patternカラムで、文字列9(4)をダブルクリックします。
データビューアにより、OrderAmountカラムに4桁の注文金額が含まれるレコードが実行
および表示されます。
8.
[詳細]セクションで、[リストを表示]をクリックし、[統計]を選択します。
[詳細]セクションには、平均値、標準偏差、最大および最小長さ、一般的な順に5つ
の値、一般的でない順に5つの値など、 OrderAmountカラムの統計が表示されます。
データのプロファイリングのまとめ
このレッスンでは、プロファイルがデータの内容と構造に関する情報を提供することを学
習しました。
2つのデータオブジェクトについて結合分析を実行し、データオブジェクト間の重なりの度
合いを表示できることを学習しました。 データオブジェクトについてカラムプロファイル
を実行し、データオブジェクト内の各カラムに関連する値、パターン、および統計を表示
できることも学習しました。
Boston_CustomersデータオブジェクトのデータをLA_Customersデータオブジェクトのデータとマ
ージできるかどうかを判断するために、 JoinAnalysisプロファイルを作成しました。 このプ
ロファイルの結果を表示し、 CustomerIDカラム内のすべての値が一意であることと、データ
オブジェクトを正常にマージできることを確認しました。
All_Customersプロファイルを作成し、 All_Customersデータオブジェクトについてカラムプロフ
ァイルを実行しました。 All_Customersデータオブジェクト内のカラムの値、パターン、お
よび統計を検出するために、このプロファイルの結果を表示しました。 最後に、データビ
ューアを実行して選択した値とパターンが含まれる行を表示し、データの品質を確認でき
るようになりました。
58
章 12: レッスン3. データのプロファイリング
付録 A
FAQ(よくある質問)
この付録では、以下の項目について説明します。
¨ Informatica Administratorに関するFAQ, 59 ページ
¨ Informatica AnalystのFAQ, 60 ページ
¨ Informatica DeveloperのFAQ(よくある質問), 61 ページ
Informatica Administratorに関するFAQ
ここでは、Informatica Administratorについてのよくある質問とその答えを紹介します。
Informatica AdministratorとPowerCenter Administration Consoleの違いは何ですか?
PowerCenter Administration Consoleは、名前がInformatica Administrator
(Administratorツール)に変更されました。 Administratorツールには、新しいイ
ンタフェースが用意されています。 PowerCenter Administration Consoleのプロパ
ティと設定タスクの中には、Administratorツールの別の場所に移動されたものがあり
ます。 また、Administratorツールも拡張され、新しいサービスやオブジェクトが追
加されています。
1つのユーザーアカウントで、AdministratorツールとDeveloperツールにアクセスするこ
とはできますか?
はい、できます。両方のツールにアクセスするためのユーザー権限を付与することが
できます。 各アプリケーションクライアントに対して個別のユーザーアカウントを作
成する必要はありません。
PowerCenterリポジトリサービスとModel Repository Serviceの違いは何ですか?
PowerCenterアプリケーションサービスおよびPowerCenterアプリケーションクライア
ントは、PowerCenterリポジトリサービスを使用します。 PowerCenterリポジトリ
は、フォルダベースのセキュリティを備えています。
その他のアプリケーションサービス(Data Integration Service、Analyst Service、
Developerツール、Analystツールなど)は、Model Repository Serviceを使用しま
す。 Model Repository Serviceは、プロジェクトベースのセキュリティを備えていま
す。
59
一部のモデルリポジトリオブジェクトは、PowerCenterリポジトリに移行することがで
きます。
Informatica Administratorで作成したデータベース接続はどのツールで使用することが
できますか?
AdministratorツールおよびDeveloperツールでは、データベース接続の作成、表示、
および編集を行うことができます。 Analystツールでは、データベース接続の作成お
よび表示を行うことができます。 また、Administratorツールでは、データベース接
続プールを設定することもできます。
PowerCenter Integration ServiceとData Integration Serviceの違いは何ですか?
PowerCenter Integration Serviceは、セッションおよびワークフローを実行するア
プリケーションサービスです。Data Integration Serviceは、Analystツール、
Developerツール、および外部クライアントのためにデータ統合タスクを実行するアプ
リケーションサービスです。 AnalystツールおよびDeveloperツールは、データ統合
タスクの要求をData Integration Serviceに送信して、データプロファイル、SQLデ
ータサービス、およびマッピングをプレビューまたは実行します。 コマンドラインま
たは外部クライアントからコマンドを実行すると、データ統合タスクの要求がData
Integration Serviceに送信され、SQLデータサービスまたはWebサービスが実行され
ます。
Data Integration ServiceにデプロイされたSQLデータサービスに接続できないのはなぜ
ですか?
SQLデータサービスに接続するためには、SQLデータサービスを含むアプリケーション
が実行されている必要があります。 アプリケーションの起動は、Data Integration
Serviceのアプリケーションビューで行うことができます。
Informatica AnalystのFAQ
Informatica Analystに関する質問に回答したFAQを確認してください。
Analystツールには、どのような製品機能の組み合わせが含まれていますか。
Analystツールには、次の製品の一部の機能が組み込まれています。
¨ Informatica Data Quality
¨ Informatica Data Explorer
¨ Data Quality Assistant
¨ PowerCenter Reference Table Manager
1つのユーザーアカウントで、Administratorツール、Developerツール、およびAnalystツ
ールにアクセスできますか。
はい、できます。3つのツールすべてにアクセスするためのユーザー権限を付与できま
す。 クライアントアプリケーションごとに別々のユーザーアカウントを作成する必要
はありません。
60
付録 A: FAQ(よくある質問)
Reference Table Managerはどうなったのですか。 個人の参照データはどこに格納される
のですか。
Reference Table Managerの機能はDeveloperツールとAnalystツールに含まれていま
す。 参照データの作成や共有には、DeveloperツールとAnalystツールを使用できま
す。 参照データは、Content Management Serviceの作成時に設定した参照データデ
ータベースに格納されます。
Informatica DeveloperのFAQ(よくある質
問)
Informatica Developerに関する質問に回答したFAQ(よくある質問)を確認してくださ
い。
PowerCenterのソースおよびターゲットとDeveloperツールの物理データオブジェクトの違
いは何ですか。
PowerCenterでは、マッピングソースとして含めるソース定義を作成します。 マッピ
ングターゲットとして含めるターゲット定義を作成します。 Developerツールでは、
マッピングソースまたはターゲットとして使用できる物理データオブジェクトを作成
します。
DeveloperツールでのマッピングとPowerCenterでのマッピングの違いは何ですか。
PowerCenterでのマッピングは、ソースとターゲットの間でデータを移動する方法を指
定します。 Developerツールでのマッピングは、マッピング入力とマッピング出力の
間でデータを移動する方法を指定します。
PowerCenterでのマッピングには、1つまたは複数のソース定義、ソース修飾子、およ
びターゲット定義を含める必要があります。 PowerCenterでのマッピングには、ショ
ートカット、トランスフォーメーション、およびマプレットも含めることができま
す。
Developerツールでのマッピングには、マッピング入力とマッピング出力を含める必要
があります。 Developerツールでのマッピングには、トランスフォーメーションとマ
プレットも含めることができます。
Developerツールには次のタイプのマッピングがあります。
¨ ソースとターゲットの間でデータを移動するマッピング。 このタイプのマッピン
グは、ショートカットを使用できず、ソース修飾子が使用されないという点におい
てのみ、PowerCenterでのマッピングと異なります。
¨ 論理データオブジェクトマッピング。 論理データオブジェクトモデル内のマッピ
ング。 論理データオブジェクトマッピングには、マッピング入力として論理デー
タオブジェクトを、マッピング出力としてデータオブジェクトを含めることができ
ます。 または、マッピング入力として1つまたは複数の物理データオブジェクト
を、マッピング出力として論理データオブジェクトを含めることができます。
¨ 仮想テーブルマッピング。 SQLデータサービス内のマッピング。 マッピング入力
としてデータオブジェクトが、マッピング出力として仮想テーブルが含まれます。
Informatica DeveloperのFAQ(よくある質問)
61
¨ 仮想ストアードプロシージャマッピング。 SQLデータサービス内で一連のビジネス
ロジックを定義します。 マッピング入力として入力パラメータトランスフォーメ
ーションまたは物理データオブジェクトが、マッピング出力として出力パラメータ
トランスフォーメーションまたは物理データオブジェクトが含まれます。
PowerCenterでのマプレットとDeveloperツールでのマプレットの違いは何ですか。
PowerCenterでのマプレットとDeveloperツールでのマプレットは、一連のトランスフ
ォーメーションが含まれる再利用可能なオブジェクトです。 複数のマッピングでトラ
ンスフォーメーションロジックを再利用できます。
PowerCenterマプレットには、マプレット入力としてソース定義または入力トランスフ
ォーメーションを含めることができます。 マプレット出力として出力トランスフォー
メーションを含める必要があります。
Developerツールマプレットには、マプレット入力としてデータオブジェクトまたは入
力トランスフォーメーションを含めることができます。 マプレット出力としてデータ
オブジェクトまたは出力トランスフォーメーションを含めることができます。
Developerツールでのマッピングには、次の機能もあります。
¨ マプレットをルールとして検証できます。 プロファイルのルールを使用します。
¨ マプレットには、他のマプレットを含めることができます。
マプレットとルールの違いは何ですか。
マプレットをルールとして検証できます。 ルールは、プロファイルの実行時にソース
データに適用される条件を定義するビジネスロジックです。 マプレットが次の要件を
満たすときは、マプレットをルールとして検証できます。
¨ 入力トランスフォーメーションと出力トランスフォーメーションが含まれている。
¨ マプレットにアクティブなトランスフォーメーションが含まれていない。
¨ 入力グループ間のカーディナリティが指定されていない。
62
付録 A: FAQ(よくある質問)
Fly UP