...

Spectrum™ Technology Platform とは

by user

on
Category: Documents
74

views

Report

Comments

Transcript

Spectrum™ Technology Platform とは
Spectrum™ Technology Platform
バージョン 8.0.0
ユーザ ガイド
© 2012 Pitney Bowes Software Inc. All rights reserved. MapInfo and Group 1 Software are trademarks of Pitney
Bowes Software Inc. All other marks and trademarks are property of their respective holders.
®
USPS Notices
®
Pitney Bowes Inc. holds a non-exclusive license to publish and sell ZIP + 4 databases on optical and magnetic
media. The following trademarks are owned by the United States Postal Service: CASS, CASS Certified, DPV,
Link
Link
eLOT, FASTforward, First-Class Mail, Intelligent Mail, LACS , NCOA , PAVE, PLANET Code, Postal
Link
Service, POSTNET, Post Office, RDI, Suite
, United States Postal Service, Standard Mail, United States
Post Office, USPS, ZIP Code, and ZIP + 4. This list is not exhaustive of the trademarks belonging to the Postal
Service.
®
Link®
Pitney Bowes Inc. is a non-exclusive licensee of USPS for NCOA
processing.
Prices for Pitney Bowes Software's products, options, and services are not established, controlled, or approved
™
by USPS® or United States Government. When utilizing RDI data to determine parcel-shipping costs, the
®
business decision on which parcel delivery company to use is not made by the USPS or United States
Government.
Centrus Notices
Centrus Data Products contained on this media and used within Centrus applications are protected by various
trademarks and by one or more of the following copyrights:
©
Copyright United States Postal Service. All rights reserved.
©
2011 TomTom. All rights reserved. TomTom and the TomTom logo are registered trademarks of TomTom
N.V.
©
Copyright NAVTEQ. All rights reserved
©
Copyright United States Census Bureau
©
Copyright Nova Marketing Group, Inc.
Portions of this program are © Copyright 1993-2007 by Nova Marketing Group Inc. All Rights Reserved
©
Copyright Canada Post Corporation
This CD-ROM contains data from a compilation in which Canada Post Corporation is the copyright owner.
©
2007 Claritas, Inc.
ICU Notices
Copyright © 1995-2011 International Business Machines Corporation and others.
All rights reserved.
Permission is hereby granted, free of charge, to any person obtaining a copy of this software and associated
documentation files (the "Software"), to deal in the Software without restriction, including without limitation the
rights to use, copy, modify, merge, publish, distribute, and/or sell copies of the Software, and to permit persons
to whom the Software is furnished to do so, provided that the above copyright notice(s) and this permission
notice appear in all copies of the Software and that both the above copyright notice(s) and this permission
notice appear in supporting documentation.
THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, EXPRESS OR IMPLIED,
INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABILITY, FITNESS FOR A
PARTICULAR PURPOSE AND NONINFRINGEMENT OF THIRD PARTY RIGHTS. IN NO EVENT SHALL
THE COPYRIGHT HOLDER OR HOLDERS INCLUDED IN THIS NOTICE BE LIABLE FOR ANY CLAIM, OR
ANY SPECIAL INDIRECT OR CONSEQUENTIAL DAMAGES, OR ANY DAMAGES WHATSOEVER
RESULTING FROM LOSS OF USE, DATA OR PROFITS, WHETHER IN AN ACTION OF CONTRACT,
NEGLIGENCE OR OTHER TORTIOUS ACTION, ARISING OUT OF OR IN CONNECTION WITH THE USE
OR PERFORMANCE OF THIS SOFTWARE.
Except as contained in this notice, the name of a copyright holder shall not be used in advertising or otherwise
to promote the sale, use or other dealings in this Software without prior written authorization of the copyright
holder.
GeoNames Notices
The World Geocoding data set contains data licensed from the GeoNames Project (www.geonames.org)
provided under the Creative Commons Attribution License ("Attribution License") located at
http://creativecommons.org/licenses/by/3.0/legalcode. Your use of the GeoNames data (described in the
Spectrum™ Technology Platform User Manual) is governed by the terms of the Attribution License, and any
conflict between your agreement with Pitney Bowes Software, Inc. and the Attribution License will be resolved
in favor of the Attribution License solely as it relates to your use of the GeoNames data.
Pitney Bowes Software
Documentation Team
[email protected]
October 19, 2012
目次
第 I 部 : はじめに...........................................................................13
第 1 章 : の概要 Spectrum™ Technology Platform.............................................15
Spectrum™ Technology Platform とは...........................................................................16
Spectrum™ Technology Platform の処理.......................................................................17
Spectrum™ Technology Platform アーキテクチャ.........................................................20
第 2 章 : Spectrum™ Technology Platform クライアント..................................25
サーバーへの接続..........................................................................................................26
Management Console の概要........................................................................................26
Enterprise Designer の概要...........................................................................................30
Interactive Driver の概要................................................................................................35
クライアント キャッシュのクリア................................................................................38
第 II 部 : データフロー...................................................................39
第 3 章 : データフローの基礎................................................................................41
データフロー タイプ......................................................................................................42
データ モデル.................................................................................................................43
データ タイプ.................................................................................................................45
データフローのインポートとエクスポート...................................................................50
フィールド名の変更.......................................................................................................51
形式に誤りのある入力レコードの管理..........................................................................52
Web サービス オプションの設定...................................................................................53
第 4 章 : ソース......................................................................................................55
入力................................................................................................................................56
Read From DB...............................................................................................................60
Read From File..............................................................................................................66
Read from Variable Format File.....................................................................................78
Read From XML.............................................................................................................86
第 5 章 : 制御ステージ...........................................................................................93
Aggregator.....................................................................................................................94
Broadcaster..................................................................................................................104
Conditional Router.......................................................................................................104
Group Statistics............................................................................................................109
Math.............................................................................................................................119
Query DB.....................................................................................................................126
Record Combiner.........................................................................................................129
Record Joiner...............................................................................................................130
Sorter...........................................................................................................................131
Splitter..........................................................................................................................133
Stream Combiner.........................................................................................................138
Transformer..................................................................................................................139
Unique ID Generator....................................................................................................145
第 6 章 : プライマリ ステージ.............................................................................149
モジュール ステージ....................................................................................................150
サブフロー...................................................................................................................150
第 7 章 : シンク....................................................................................................153
Execute Program.........................................................................................................154
Output..........................................................................................................................154
Terminate Job...............................................................................................................157
Write to DB...................................................................................................................157
Write to File..................................................................................................................163
Write to Null..................................................................................................................171
Write to Variable Format File........................................................................................171
Write to XML................................................................................................................179
6
Spectrum™ Technology Platform 8.0.0
第 8 章 : レポート.................................................................................................185
ジョブへのレポートの追加..........................................................................................186
レポート オプションの設定.........................................................................................186
レポートの表示............................................................................................................187
第 9 章 : データフローのインスペクション.........................................................189
インスペクション データの指定..................................................................................190
インスペクション ポイントの設定..............................................................................190
インスペクション結果の表示......................................................................................191
データの相関................................................................................................................192
埋め込まれたサブフローのインスペクション.............................................................193
インスペクション結果の保存......................................................................................193
データ インスペクション ツールの終了......................................................................194
第 10 章 : ジョブの実行.......................................................................................195
ジョブの検証................................................................................................................196
ジョブのエクスポーズ.................................................................................................196
Enterprise Designer でのジョブの実行.......................................................................196
コマンド ラインからのジョブの実行..........................................................................196
ジョブのスケジューリング..........................................................................................200
電子メール通知............................................................................................................201
実行ステータスと履歴の表示......................................................................................201
ジョブの一時停止........................................................................................................202
ジョブのキャンセル.....................................................................................................202
データフロー オプション............................................................................................202
別のサーバーへの処理のルーティング........................................................................204
実行時パフォーマンス オプションの使用...................................................................206
第 11 章 : サブフローの使用................................................................................207
サブフロー...................................................................................................................208
データフローへのサブフローの追加...........................................................................208
サブフローの変更........................................................................................................208
サブフローの削除........................................................................................................209
ユーザ ガイド
7
サブフローのアンエクスポーズ...................................................................................209
ステージからサブフローへの変換...............................................................................209
第 III 部 : プロセス フロー...........................................................211
第 12 章 : プロセス フローの設計........................................................................213
プロセス フローとは....................................................................................................214
アクティビティ............................................................................................................214
プロセス フロー変数の作成.........................................................................................217
分岐オプションの使用.................................................................................................218
プロセス フローの削除................................................................................................218
第 13 章 : プロセス フローの実行........................................................................221
Enterprise Designer でのプロセス フローの実行........................................................222
コマンド ラインからのプロセス フローの実行...........................................................222
実行ステータスと履歴の表示......................................................................................225
第 IV 部 : 管理..............................................................................227
第 14 章 : データベース リソースの設定.............................................................229
データベース リソースの概要.....................................................................................230
データベース リソースの追加.....................................................................................230
データベース リソースの名前の変更..........................................................................241
データベース リソースの削除.....................................................................................241
第 15 章 : 外部リソースの設定............................................................................243
外部リソースの概要.....................................................................................................244
データベースへの接続.................................................................................................244
ファイル サーバーへの接続.........................................................................................246
外部 Web サービスへのアクセス.................................................................................247
第 16 章 : 実行の管理...........................................................................................251
8
Spectrum™ Technology Platform 8.0.0
サービス.......................................................................................................................252
ジョブとプロセス フロー............................................................................................255
トランザクション履歴.................................................................................................263
リモート サーバー.......................................................................................................263
ソート パフォーマンス................................................................................................268
第 17 章 : システムの監視....................................................................................269
イベント ログ...............................................................................................................270
電子メール通知............................................................................................................271
ライセンス有効期限通知の設定...................................................................................271
バージョン情報の表示.................................................................................................272
ライセンス情報の表示とエクスポート........................................................................272
第 18 章 : セキュリティの管理............................................................................273
ユーザ アカウント.......................................................................................................274
第 V 部 : モジュール....................................................................277
第 19 章 : Address Now モジュール...................................................................279
Address Now モジュールとは.....................................................................................280
Build Global Address....................................................................................................281
Get Global Candidate Addresses................................................................................294
Validate Global Address...............................................................................................302
ACR コード..................................................................................................................318
第 20 章 : Advanced Matching モジュール........................................................323
Advanced Matching モジュールとは...........................................................................324
Best of Breed...............................................................................................................324
Candidate Finder..........................................................................................................334
Duplicate Synchronization...........................................................................................337
Filter.............................................................................................................................341
Interflow Match.............................................................................................................345
Intraflow Match.............................................................................................................359
マッチ分析...................................................................................................................374
ユーザ ガイド
9
Match Key Generator...................................................................................................398
Transactional Match.....................................................................................................400
第 21 章 : Business Steward モジュール...........................................................415
Business Steward モジュールとは..............................................................................416
例外を処理するデータフローの設計...........................................................................416
Business Steward Portal..............................................................................................427
第 22 章 : Data Hub モジュール..........................................................................467
Data Hub モジュールとは............................................................................................468
Write to Hub.................................................................................................................470
Read From Hub............................................................................................................473
Query Hub....................................................................................................................478
Relationship Analysis Client.........................................................................................483
第 23 章 : Data Normalization モジュール.........................................................533
Data Normalization モジュールとは............................................................................534
Advanced Transformer.................................................................................................539
Open Parser.................................................................................................................544
Table Lookup................................................................................................................610
テーブル管理................................................................................................................613
Transliterator................................................................................................................619
第 24 章 : Enterprise Geocoding モジュール....................................................625
Enterprise Geocoding モジュールとは........................................................................626
Geocode Address Global の概要.................................................................................637
Geocode Address World..............................................................................................720
GNAF PID Location Search.........................................................................................743
Reverse Geocode Address Global の概要...................................................................756
国際ジオコーディングの結果コード...........................................................................769
国際ジオコーディング用のカスタム データベース.....................................................774
第 25 章 : Enterprise Routing モジュール.........................................................783
Enterprise Routing モジュールとは.............................................................................784
Get Travel Boundary....................................................................................................784
10
Spectrum™ Technology Platform 8.0.0
Get Travel Cost Matrix.................................................................................................793
Get Travel Directions...................................................................................................802
ルーティング データベース リソース.........................................................................812
第 26 章 : GeoConfidence モジュール...............................................................815
GeoConfidence モジュールとは..................................................................................816
GeoConfidence Surface...............................................................................................817
第 27 章 : Global Sentry モジュール..................................................................821
Global Sentry モジュールとは.....................................................................................822
Global Sentry...............................................................................................................823
第 28 章 : Location Intelligence モジュール......................................................833
Location Intelligence モジュールとは..........................................................................834
Centrus データベース リソース..................................................................................834
Closest Site..................................................................................................................836
Find Nearest.................................................................................................................841
名前付き接続................................................................................................................847
名前付きテーブル........................................................................................................848
Point In Polygon...........................................................................................................850
Query Spatial Data.......................................................................................................859
Read Spatial Data........................................................................................................862
Spatial Calculator.........................................................................................................864
Spatial Union................................................................................................................877
ユーザ定義の Centrus データベース...........................................................................879
MapInfo SQL Language のリファレンス.....................................................................885
第 29 章 : Universal Addressing モジュール.....................................................925
Universal Addressing モジュールとは.........................................................................926
Get Candidate Addresses............................................................................................939
Get City State Province................................................................................................950
Validate Address..........................................................................................................953
Validate Address Global.............................................................................................1022
誤検出........................................................................................................................1044
Validate Address Confidence アルゴリズム..............................................................1047
ユーザ ガイド
11
第 30 章 : Universal Name モジュール.............................................................1053
Universal Name モジュールとは...............................................................................1054
Name Parser..............................................................................................................1054
Name Variant Finder..................................................................................................1073
付録............................................................................................1077
付録 A : モジュール表........................................................................................1079
モジュール、コンポーネント、データベース...........................................................1080
付録 B : 各国の ISO コードとモジュール サポート..........................................1085
各国の ISO コードとモジュール サポート................................................................1086
12
Spectrum™ Technology Platform 8.0.0
第 I 部: はじめに
このセクションの構成
• の概要 Spectrum™ Technology Platform . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .15
• Spectrum™ Technology Platform クライアント . . . . . . . . . . . . . . . . . . . . . . . . . . . . .25
の概要
Technology Platform
Spectrum™
このセクションの構成
• Spectrum™ Technology Platform とは . . . . . . . . . . . . . . .16
• Spectrum™ Technology Platform の処理 . . . . . . . . . . . . .17
• Spectrum™ Technology Platform アーキテクチャ . . . . . .20
1
Spectrum™ Technology Platform とは
Spectrum™ Technology Platform とは
Spectrum™ Technology Platform Spectrum™ Technology Platform は、データの正規化、検証、拡張
(価値向上) の 3 つの側面からデータの完全性、妥当性、一貫性、適時性、および正確性を高めるシス
テムです。 データを正確かつ包括的に、最新の状態に維持することで、顧客への理解を深め、顧客と
より良好な関係を構築できます。
注: Spectrum™ Technology Platform について詳しく知りたい方は、Spectrum™ Technology Platform
のビデオ チュートリアル サイトを訪れてください。
Spectrum™ Technology Platform Spectrum™ Technology Platform は、データの品質を高めるビジネス
ルールの設計と実装を支援するために、以下の機能を提供しています。
• パーシング、名前の正規化、名前のバリデーション(16ページ)
• 一意のエンティティの識別と統合(16ページ)
• 住所検証(16ページ)
• ジオコーディング(17ページ)
• ロケーション インテリジェンス(17ページ)
• 税務管轄区域の割り当て(17ページ)
パーシング、名前の正規化、名前のバリデーション
正規化を特に正確に行うためにデータ列を複数のフィールドに分割しなければならないことがありま
す。Spectrum™ Technology Platform は、個人名、企業名、その他多くの用語や略語をパース (解析)
する高度なパーシング機能を備えています。 また、スキャン/抽出操作のベースとして使用するカスタ
ム用語のリストを独自に作成することもできます。詳細については、Universal Name モジュールと
は(1054ページ)を参照してください。
一意のエンティティの識別と統合
一意のエンティティを識別することで、レコードを統合する、重複レコードを排除する、および "最良
の組み合わせ" レコードを作成できます。 "最良の組み合わせ" (Best-of-Breed) レコードとは、他のレ
コードのデータに基づいて組み立てられた複合的なレコードです。詳細については、Advanced
Matching モジュールとは(324ページ)とData Normalization モジュールとは(534ページ)を参照し
てください。
住所検証
住所検証では、管轄の郵便当局のルールを適用して、住所を標準形式に変換し、その住所が配達可能
な住所であるかどうかを確認します。 住所検証により、郵便料金の割引を受けやすくなり、郵便物の
配達品質を高めることができます。 詳細については、Universal Addressing モジュールとは(926ペー
ジ)およびAddress Now モジュールとは(280ページ)を参照してください。
16
Spectrum™ Technology Platform 8.0.0
第 1 章 : の概要 Spectrum™ Technology Platform
ジオコーディング
ジオコーディングとは、住所を地図上のポイント(緯度と経度)に変換する処理です。 ジオコーディ
ングは、地図製作に使用されますが、それは 1 つの使用例にすぎません。 基盤を成すロケーション
データがあると、ビジネス上の意思決定を行いやすくなります。 処理を逆にすることで、ジオコード
(緯度と経度で表現される地図上のポイント) を入力し、そのジオコードに関する住所情報を取得でき
ます。
詳細については、Enterprise Geocoding モジュールとは(626ページ)を参照してください。
ロケーション インテリジェンス
ロケーション インテリジェンスは、地理関係を調査、評価、分析、およびモデル化して、データに関
する新しい情報を作成します。 ロケーション インテリジェンス処理を使用すると、ロケーションを検
証し、情報を有益なビジネス インテリジェンスに変換できます。 詳細については、Location
Intelligence モジュールとは(834ページ)を参照してください。
税務管轄区域の割り当て
税務管轄区域の割り当てでは、住所の地域に適用される税務管轄区域を判断します。 税務管轄区域を
最も正確に割り当てると、経済上のリスクや、法的義務を軽減できます。
Spectrum™ Technology Platform が提供する Pitney Bowes Software ソフトウェアでは、最新の税務管
轄区域と顧客レコードの正確な住所を統合して正確な州、郡、郡区、市、および特殊な税務管轄区域
の情報をレコードに追加できます。 税務管轄区域の割り当ての使用例を次に示します。
• 売上税と使用税
• 動産税
• 保険料税
詳細については、Enterprise Tax モジュールとはを参照してください。
Spectrum™ Technology Platform の処理
Spectrum™ Technology Platform では、完全かつ包括的なデータ品質処理を作成できます。また、改
善が必要な個々の領域に対象を絞り込むこともできます。 次の図は、ソースからデータを取得し、
データ クレンジング処理の主な手順を経て、最終的にターゲット アプリケーションに引き渡す全体的
な処理を示しています。
ユーザ ガイド
17
Spectrum™ Technology Platform の処理
このアプローチは、次の 8 つの手順で構成されます。
• アクセス(18ページ)
• 解釈(18ページ)
• 正規化(19ページ)
• バリデーション(19ページ)
• 重複の特定(19ページ)
• 統合(19ページ)
• 拡張(20ページ)
• 配信(20ページ)
アクセス
データ品質プロセス フローの最初の手順では、処理するデータにアクセスします。Spectrum™
Technology Platform は、複数のソースのデータに直接接続できます。また、既存のデータ アクセス手
法を組み合わせて接続することもできます。Spectrum™ Technology Platform は、JDBC とフラット
ファイルを利用したデータ アクセスをサポートしています。 さらに、カスタム実装、スタンドアロン
ソリューション、サードパーティ アプリケーション、および Enterprise Application Integration (EAI)
テクノロジを利用したデータ アクセスもサポートしています。
解釈
解釈フェーズでは、Spectrum™ Technology Platform は、パターン マッチングやデータ操作のための
高度な関数を利用して単一のフィールドに含まれる混合データをパースし、それぞれ適切なコンポー
ネントに振り分けます。 その後、誤りがあるデータを切り離して、その結果を以降の処理で認識可能
な形にします。 例えば、住所を USPS の規格に従って正規化するには、通り名、都市名、ZIP コード
®
等の住所要素を特定する必要があります。 Spectrum™ Technology Platformでは、個人名、企業名、
その他多くの用語や略語をパースすることもできます。 さらに、解釈のベースとして使用するカスタ
ム用語のリストを独自に作成することもできます。
このフェーズは、Spectrum™ Technology Platform の Advanced Matching モジュールがサポートして
います。詳細については、Advanced Matching モジュールとは(324ページ)を参照してください。
18
Spectrum™ Technology Platform 8.0.0
第 1 章 : の概要 Spectrum™ Technology Platform
正規化
正規化は、きわめて重要な処理です。これには大きな理由が 2 つあります。 まず、名前および住所
フィールド等、特定のデータ要素を正規化する必要があります。これは、郵便物の配達品質を高め、
郵便料金の割引を受けるために行う処理です。 さらに重要なこととして、すべてのデータ要素を正規
化する必要があります。これは、レコードを照合してレコード間の関係を識別するうえで、最も可能
性が高い結果を得るために行う処理です。
モジュールによっては、複数のタイプの正規化を実行するものもありますが、Spectrum™ Technology
Platform の Data Normalization モジュールは最も包括的な正規化機能セットを備えています。詳細に
ついては、Data Normalization モジュールとは(534ページ)を参照してください。
バリデーション
正規化データは、必ずしも正確なデータではありません。 バリデーション処理では、既知の最新の参
照データと照合して情報の妥当性を確認します。 この処理で使用するソースには、規制機関 (米国郵
政公社等)、サード パーティのデータ プロバイダ (Dun & Bradstreet 等)、企業内の参照ソース (会計
データ等) があります。
このフェーズは、Spectrum™ Technology Platform の次のモジュールがサポートしています。
• Address Now (Address Now モジュールとは(280ページ)を参照)
• Universal Addressing (Universal Addressing モジュールとは(926ページ)を参照)
重複の特定
重複マッチングは、データが実際の名前や住所であるか、他の種類の顧客情報であるかを問わず、重
複レコードの可能性やレコード間の関係を特定します。Spectrum™ Technology Platform では、一貫
性のあるビジネス マッチング ルール セット (boolean 型のマッチング メソッド、スコアリング メソッ
ド、しきい値、アルゴリズム、加重などが使われる) を指定してレコード グループに重複が含まれて
いるかどうかを調べることができます。Spectrum™ Technology Platform は、多種多様なカスタマイ
ズをサポートしているので、固有のビジネス ニーズに合わせてルールを調整できます。
このフェーズは、Advanced Matching モジュールがサポートしています。詳細については、Advanced
Matching モジュールとは(324ページ)を参照してください。
統合
重複レコードを特定した後、冗長な活動を取り除く、コミュニケーションを改善するといった目的の
ためにレコードを統合するとよいでしょう。Spectrum™ Technology Platform では、レコードのリン
ク方法やマージ方法を指定することで、顧客情報のコレクションから正確かつ完全なレコードを作成
することができます。 例えば、ある世帯のすべてのレコードに基づいて、1 つの Best-of-Breed (最良
の組み合わせ) レコードを作成できます。
このフェーズは、Spectrum™ Technology Platform の Advanced Matching モジュールがサポートして
います。詳細については、Advanced Matching モジュールとは(324ページ)を参照してください。
ユーザ ガイド
19
Spectrum™ Technology Platform アーキテクチャ
拡張
解釈、正規化、バリデーション、重複の特定、統合の各フェーズの任意の時点で、顧客レコードに補
足的な情報を付加してデータの拡張 (価値向上) を図ることができます。Spectrum™ Technology Platform
では、次に示すような多様な情報を付加できます。
• ジオコーディング (Enterprise Geocoding モジュールとは(626ページ)を参照)
• 税務管轄区域の割り当て (Enterprise Tax モジュールとはを参照)
• 高度な地理空間インテリジェンス (Location Intelligence モジュールとは(834ページ)を参照)
配信
データ品質処理の最終フェーズでは、データをアプリケーション、データベース、または他のオペレー
ショナル データ ストアに一定の組織化された方法で自動的に配信します。Spectrum™ Technology
Platform では、クレンジング後のデータを次のいくつかの方法で配信できます。
• Spectrum™ Technology PlatformSpectrum™ Technology Platform 固有のデータベース接続ルーチン
• カスタム実装およびスタンドアロン ソリューション
• 抽出、変換加工、ロード (ETL) や Enterprise Application Integration (EAI) テクノロジ等、サード パー
ティ アプリケーション
• フラット ファイル書き込み機能
Spectrum™ Technology Platform アーキテクチャ
Spectrum™ Technology Platform が提供する Pitney Bowes Software ソフトウェアには、いくつかのモ
ジュールをサポートするサーバーが同梱されています。 これらのモジュールは、住所のバリデーショ
ン、ジオコーディング、高度なパーシング等、さまざまな機能を備えています。 次の図に、Spectrum™
Technology Platform のアーキテクチャを示します。
20
Spectrum™ Technology Platform 8.0.0
第 1 章 : の概要 Spectrum™ Technology Platform
サーバー
このサーバーが Spectrum™ Technology Platform の基盤となります。 サーバーは、データ処理、リポ
ジトリ データの同期、およびクライアントと変換モジュールの間での TCP/IP 通信を処理します。 ま
た、ジョブ管理とセキュリティ機能も提供します。
モジュール
モジュールは、特定の機能を実行する機能群です。 例えば、USPS の規格に準拠するように顧客の住
所を正規化する場合は、Universal Addressing モジュールの使用を許可します。 個々の顧客に適用さ
れる税務管轄区域を調べる場合は、Enterprise Tax モジュールの使用を許可します。 特定のニーズに
応じて、1 つのモジュールの使用のみを許可することも、複数のモジュールの使用を許可することも
できます。 ほとんどのモジュールは、"コンポーネント" とデータベースで構成されます。
モジュールとその関連コンポーネントの詳細については、モジュール、コンポーネント、データベー
ス(1080ページ)を参照してください。
ユーザ ガイド
21
Spectrum™ Technology Platform アーキテクチャ
コンポーネント
コンポーネントは、顧客データ品質処理の基本的な構成要素です。 コンポーネントごとに固有の機能
を実行します。 例えば、Enterprise Geocoding モジュールの Geocode US Address コンポーネント
は、住所を地図上のポイント (緯度と経度) に変換して返します。Universal Addressing モジュールの
Get City State Province は、郵便番号が示す都市および州/省を返します。
コンポーネントによっては実行する前に、別のコンポーネントと組み合わせて、ジョブ、サービス、
またはサブフローを作成する必要がある場合もあります。 Enterprise Designer を使用して、ジョブ、
サービス、サブフロー、およびプロセス フローを作成します。 詳細については、Enterprise Designer
(23ページ)を参照してください。
システムで利用できるコンポーネントは、Spectrum™ Technology Platform から Pitney Bowes Software
のどのモジュールのライセンスを取得したかによって異なります。
データベース
一般に、モジュールにはデータベースが付属し、モジュールのコンポーネントに必要なデータが格納
されます。 例えば、Universal Addressing モジュールで、住所を確認して正規化するには、USPS デー
タにアクセスする必要があります。 そのため、Universal Addressing モジュールには、米国郵便デー
タベースが付属しています。 このデータベースは、Spectrum™ Technology Platform システムからア
クセスできる場所にロードしなければなりません。
モジュールには、必須データベースとオプションのデータベースがあります。 オプションのデータ
ベースは、Spectrum™ Technology Platform の処理を大幅に強化する特定の機能のために必要なデー
タを提供します。
Management Console
Management Console は、Spectrum™ Technology Platform を管理する Windows ベースのツールで
す。 Management Console で実行できる操作は、次のとおりです。
• サーバーのアクセス アドレスを指定する。
• コンポーネントのアクセス方法を選択する (ローカルまたはホステッド)
• Spectrum™ Technology Platform のコンポーネントのデフォルト設定を指定する。
• 権限やパスワード等、ユーザ アカウントを管理する。
• ログ、追跡、およびレポートを設定する。
22
Spectrum™ Technology Platform 8.0.0
第 1 章 : の概要 Spectrum™ Technology Platform
Enterprise Designer
Enterprise Designer は、Spectrum™ Technology Platform のジョブ、サービス、サブフロー、および
プロセス フローを作成する Windows ベースのツールです。 ドラッグアンドドロップ インターフェイ
スを利用して、複雑なデータフローをグラフィカルに、容易に作成できます。
ユーザ ガイド
23
Spectrum™ Technology Platform アーキテクチャ
API
Spectrum™ Technology Platform のクライアント API に付属する Spectrum™ Technology Platform API
は、シンプルな統合を提供し、レコード処理を効率化し、将来のバージョンの下位互換性をサポート
することを念頭に置いて設計されています。 Spectrum™ Technology Platform API には、次を通じて
アクセスできます。
•
•
•
•
•
C
C++
COM
Java
.NET
• Web サービス
Spectrum™ Technology Platform API の詳細については、『Spectrum™ Technology Platform API ガイ
ド』を参照してください。 Spectrum™ Technology Platform API ガイド.
24
Spectrum™ Technology Platform 8.0.0
Spectrum™
Technology
Platform クライアント
このセクションの構成
• サーバーへの接続 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .26
• Management Console の概要 . . . . . . . . . . . . . . . . . . . . . . .26
• Enterprise Designer の概要 . . . . . . . . . . . . . . . . . . . . . . . .30
• Interactive Driver の概要 . . . . . . . . . . . . . . . . . . . . . . . . . . .35
• クライアント キャッシュのクリア . . . . . . . . . . . . . . . . . . . .38
2
サーバーへの接続
サーバーへの接続
Spectrum™ Technology Platform サーバーに接続するには
1. [スタート] > [すべてのプログラム] > [Pitney Bowes] > Spectrum™ Technology Platform > [Client
Tools] の順に選択します。
2. 起動するクライアント (Management Console、Enterprise Designer、または Interactive Driver) を
選択します。
3. サーバー名を入力するか、ドロップダウン リストからサーバー名を選択します。
注: Management Console の複数のインスタンスが同じ Spectrum™ Technology Platform サーバー
にアクセスする場合は、あるユーザの行った変更が別のユーザによって上書きされる可能性
があります。 したがって、同じサーバーで Management Console の複数のインスタンスを実
行しないことを推奨します。
4. 必要に応じて、ユーザ名およびパスワードを入力します。 これらの入力が必要となるのは、サー
バーでセキュリティが有効になっている場合のみです。 セキュリティが有効になっていない場合
は、ユーザ名 guest を入力し、パスワード フィールドを空白のままにすることによって、サーバー
にアクセスできます。
5. [ポート] フィールドに、Spectrum™ Technology Platform 通信に使用するように設定されている
サーバーのネットワーク ポートを入力します。 デフォルトのポート番号は 8080 です。
6. クライアントとサーバーの間で HTTPS 接続を使用する場合は、[セキュアな接続を使用] をクリッ
クします。
注: セキュアな接続は、サーバー上で HTTPS 通信が設定されている場合にのみ使用できます。
詳細については、HTTPS 通信の設定を参照してください。
7. [ログイン] をクリックします。
Management Console の概要
Management Console は、Spectrum™ Technology Platform を設定するために使います。 このコンソー
ルを使用すると、次のオプションを指定できます。
• サービスのデフォルト オプション
• データベース リソース
• データ ソース
• ユーザ アカウント管理
• ログ、追跡、およびレポート
特定のサービスに関連するオプションの詳細については、このガイドの「コンポーネント リファレン
ス」パートを参照してください。
26
Spectrum™ Technology Platform 8.0.0
第 2 章 : Spectrum™ Technology Platform クライアント
Management Console のプライマリ ウィンドウ
下図は、Management Console を示しています。
図 1 : Management Console のプライマリ ウィンドウ
コンソール ビュー領域に、コンソール エクスプローラで選択したコンポーネントに基づいて情報が表
示されます。 左側のペインには、サーバー管理機能を含む "ノード" が表示されます。
• [モジュール] ノードでは、サービスを設定します。
• [実行] ノードでは、Spectrum™ Technology Platform で実行されているバッチ ジョブを監視して結
果を表示します。また、レポート オプションも設定します。
• [リソース] ノードでは、接続、ファイル サーバー、および JDBC ドライバを管理します。
• [システム] ノードでは、ホステッド サーバーの有効化、ライセンス情報の表示、通知の作成、サー
バー グループの管理、およびソフトウェア/データベースのバージョン情報の表示を実行します。
• [イベント ログ] ノードでは、ログ オプションを設定します。ログ オプションは、システム全体に対
して設定することも、個々のサービスに対して設定することもできます。
ユーザ ガイド
27
Management Console の概要
• [セキュリティ] ノードでは、セキュリティ、権限、および認証情報を管理します。
• [トランザクション履歴] ノードでは、履歴追跡を設定し、サービスの使用状況に関するレポートを
選択して表示します。
• [カスタム ログ] ノードでは、独自のデータベース テーブルを使用してユーザ定義のログを作成しま
す。
Management Console メニュー
Management Console メニューは、 [ファイル]、[編集]、[表示]、[ツール]、および [ヘルプ] オプション
で構成されます。 ここでは、これらのオプションについて詳しく説明します。
• [ファイル] — [ファイル] メニューには、 [保存] と [終了] の 2 つのオプションがあります。 [保存] オ
プションを使用すると、現在の設定を保存できます。 [終了] オプションは、Management Console
を閉じます。
• [編集] — [編集] メニューには、 [元に戻す] オプションが 1 つあります。 [元に戻す] オプションは、
現在の画面をデフォルト設定に戻します。
• [表示] — [表示] メニューには、 [更新] オプションが 1 つあります。 [更新] オプションは、現在の画
面に設定の変更を反映します。
• [ツール] — [ツール] メニューには、 [オプション] オプションが 1 つあります。 [オプション] オプ
ションには、 [サービス実行の設定] と [実行] の 2 つのタブがあります。 [サービス実行の設定] ダイ
アログ ボックスを下に示します。
[サービス実行の設定] タブには 3 つのフィールドがあります。 これらのフィールドには、次のよう
に入力します。
1. [処理するレコードの最大数] フィールドに、Spectrum™ Technology Platform で処理するレコー
ドの最大数を入力します。
2. [ファイル フィールド区切り文字] フィールドに、適切な文字を入力します。
3. ファイルに含まれるフィールド区切り文字が、一覧に表示される文字と異なる場合は、省略記号
ボタンをクリックして、[フィールド区切り文字の管理] ダイアログ ボックスにアクセスします。
4. [追加] をクリックして、[区切り文字の追加] ダイアログ ボックスにアクセスします。
5. [文字] フィールドに、ファイルで区切り文字として使用する文字を入力します。 また、[文字コー
ド表] ボタンをクリックすると表示される一覧から文字を選択して、文字を入力することもでき
ます。
6. 文字を入力または選択したら、Tab を押します。 [Unicode] フィールドは自動的に完了します。
また、unicode 値を入力することもできます。この場合、[文字] フィールドは自動的に完了しま
す。
7. 必要に応じて、[説明] フィールドに、文字の説明を入力します。 この例では、文字は "&"、説明
には "アンパサンド" と入力しています。 説明を入力しない場合は、使用可能な文字の一覧に、
その文字のみが表示されます。
8. [OK] を 2 回クリックします。
9. Spectrum™ Technology Platform[タイムアウト (秒)] フィールドに、 でジョブ、サービス、また
はサブフローがタイムアウトする時間を秒数で入力します。
28
Spectrum™ Technology Platform 8.0.0
第 2 章 : Spectrum™ Technology Platform クライアント
[実行] タブには 1 つのフィールドがあります。 Management Console のビューの更新間隔を秒
数で入力します。
注: 自動更新間隔は、[実行履歴] ビューにのみ適用されます。
• [ヘルプ] — [ヘルプ] メニューには、 [Spectrum Techniology Platform ヘルプ] と [Management Console
について] の 2 つのオプションがあります。 オンライン ヘルプ システムは、[全般ヘルプ] オプショ
ンから表示します。 [Management Console について] オプションを使用すると、実行中の Management
Console のバージョンが表示されます。
Management Console ツールバー
下表に、Management Console ツールバーを示します。
表 1 : Management Console ツールバー
アイコン
説明
現在のジョブを保存します。
現在の画面をデフォルト設定に戻します。
ビューを更新します。
[オプション] ダイアログ ボックスを表示します。
実行中の Management Console のバージョンを表示します。
注: [ヘルプ] メニューを使用すると、ヘルプ情報をいつでも表示できます。
ユーザ ガイド
29
Enterprise Designer の概要
Enterprise Designer の概要
データフローを作成して Spectrum™ Technology Platform で実行するには、Enterprise Designer を使
用します。 このクライアントを使用すると、次のオプションを指定できます。
• ジョブの作成
• サービスの作成
• サブフローの作成
• プロセス フローの作成
• データの調査
• レポートの生成
特定のサービスに関連するオプションの詳細については、このガイドの「コンポーネント リファレン
ス」パートを参照してください。
Enterprise Designer のプライマリ ウィンドウ
Enterprise Designer のプライマリ ウィンドウの主要な要素を図 2 : Enterprise Designer ウィンドウ
(31ページ)に示します。また、その個々の要素について表 2 : Enterprise Designer のプライマリ
ウィンドウの要素 (31ページ)で説明します。
注: [タスク] ウィンドウ、パレット、および [レポート] ウィンドウは、ドッキング可能なウィンドウ
で、自分の好みで自由に場所を移動して配置を変更できます。
30
Spectrum™ Technology Platform 8.0.0
第 2 章 : Spectrum™ Technology Platform クライアント
図 2 : Enterprise Designer ウィンドウ
表 2 : Enterprise Designer のプライマリ ウィンドウの要素
要素
説明
[タスク] ウィンドウ
開いているデータフローがすべて表示されます。このウィンドウでは、新しい
ジョブ、サービス、サブフロー、およびプロセス フローを作成できます。
サーバ エクスプロー 定義されているサービスがすべて表示されます。サービスは、他のサービスの
ラ
一部として使用できます。 Enterprise Designer の "フォルダ" 機能等がありま
す。
パレット
ステージとレポートが含まれます。これらはすべて、データフローに追加でき
ます。
注意: パレットで使用できるステージは、ライセンスを供与しているオプショ
ンによって異なります。
ユーザ ガイド
31
Enterprise Designer の概要
要素
説明
[レポート] ウィンド
ウ
現在表示中のジョブについて生成されたレポートが表示されます (サービスま
たはサブフローには適用されません)。
[データフロー名] タ
ブ
開いている各データフローの名前が表示されます。 現在作業中のデータフロー
は太字で表示されます。
キャンバス
ステージとチャネルをドラッグしてデータフローを作成するワークエリア。
一度に複数のデータフロー キャンバス (またはジョブ) を開くことができます。
図 2 : Enterprise Designer ウィンドウ(31ページ)の [タスク] ウィンドウには、使用可能なデータ
フローがすべて表示されています。 新しいデータフローを開始するには、[ファイル] > [新規] > [デー
タフロー] をクリックして、[サービス]、[サブフロー]、[ジョブ]、または [テンプレートから作成] を選
択するか、[新規] ボタンを押して、[新しいサービス]、[新しいサブフロー]、[新しいジョブ]、または
[新しいデータフローをテンプレートから作成] を選択します。 パレットには、このジョブで使用でき
るソース、シンク、制御ステージ、およびプライマリ ステージがすべて表示されます。 [データフロー
名] タブ領域で、現在作業中のジョブであることを示すために、"MP LS 5-30 (Job)" は太字で表示され
ます。 キャンバスには、現在のジョブの 3 つの要素として、 入力ソース (Read from File)、展開済み
ステージ (ValidateAddress)、および出力シンク (Write to File) が表示されます。
Enterprise Designer ウィンドウの [サーバ エクスプローラ] セクション (図 2 : Enterprise Designer
ウィンドウ(31ページ)に示す) では、作成するデータフローの階層組織を独自に設計できます。こ
の階層組織は、Management Console のサービスの一覧と [データフロー コンポーネント] ウィンドウ
に反映されます。
• フォルダを作成するには、サーバー名を右クリックして、[新規] > [フォルダ] を選択します。
32
Spectrum™ Technology Platform 8.0.0
第 2 章 : Spectrum™ Technology Platform クライアント
• [サーバ エクスプローラ] 内でファイルを構成するには、フォルダまたはデータフローをドラッグし
て望みの親フォルダにドロップします。 [更新] を押すと、この構成の変更が [データフロー コンポー
ネント] ウィンドウに反映されます。 この新しい構成は Management Console にも表示されます。
Enterprise Designer メニュー
Enterprise Designer メニューは、 [ファイル]、[編集]、[表示]、[実行]、[ツール]、[Window]、および [ヘ
ルプ] オプションで構成されます。 ここでは、これらのオプションについて詳しく説明します。
• [ファイル] — [ファイル] メニューを使用すると、ジョブとワークフローを管理できます。このメ
ニューには、 [新規]、[開く]、[閉じる]、[保存]、[すべて保存]、[名前を付けて保存]、[エクスポーズ/
アンエクスポーズ]、[インポート]、[エクスポート]、[管理]、および [終了] の 11 個のオプションがあ
ります。
• [編集] — [編集] メニューを使用すると、データフロー オプションを変更、データフロー プロパティ
を表示、ジョブ オプションを表示、およびデータフローのタイプを変更できます。このメニューに
は、 [データフロー オプション]、[ジョブ オプション]、[タイプ変換オプション]、[Web サービス オ
プション]、[通知]、[データフロー タイプ]、[プロパティ ]、[コピー]、[貼り付け]、[シンクとして貼
り付け]、および [ソースとして貼り付け] オプションがあります。
• [表示] — [表示] メニューを使用すると、表示する Enterprise Designer ウィンドウのパーツを指定で
きます。このメニューには、 [作業ウィンドウ]、[サーバ エクスプローラ]、[パレット]、[実行履歴]、
および [更新] の 5 つのオプションがあります。
• [実行] — [実行] メニューを使用すると、個々のデータフローをテスト、全データフローのデータを
表示、およびジョブのインスペクションを行ってジョブを実行できます。このメニューには、 [検
証]、[現在のフローを実行]、および [現在のフローのインスペクション] の 3 つのオプションがあり
ます。
• [ツール] — [ツール] メニューを使用すると、現在のサブフローを使用するデータフローを表示、お
よび Enterprise Designer のオプションを設定できます。このメニューには、 [使用箇所] と [オプショ
ン] の 2 つのオプションがあります。
• [ウィンドウ] — [ウィンドウ] メニューを使用すると、開いているすべてのジョブの中から表示する
ジョブを指定したり、ジョブを閉じたりできます。このメニューには、 [すべてのウィンドウを閉じ
る] オプションが 1 つあります。
• [ヘルプ] — [ヘルプ] メニューを使用すると、オンライン ヘルプを参照したり、実行中の Enterprise
Designer のバージョンを表示したりできます。このメニューには、[ Spectrum™ Technology Platform
ヘルプ] と [Enterprise Designer について] の 2 つのオプションがあります。
Enterprise Designer ツールバー
下表に、Enterprise Designer ツールバーを示します。
ユーザ ガイド
33
Enterprise Designer の概要
表 3 : Enterprise Designer ツールバー
アイコン
説明
新しいサービス、サブフロー、ジョブ、またはプロセス フローを編集用
に作成します。
既存のサービス、サブフロー、ジョブ、またはプロセス フローを開きま
す。
現在のジョブを保存します。
ビューを更新します。
現在のデータフローを実行します。
データ インスペクション ツールを起動します。
[データフロー オプション] ダイアログ ボックスを表示します。
エクスポーズ オプションのオン/オフを切り替えます。エクスポーズ オ
プションを使用すると、別のユーザもサービスとサブフローを使用でき
るように設定できます。
注: [ヘルプ] メニューを使用すると、ヘルプ情報をいつでも表示できます。
ツール
Enterprise Designer では、ライセンスが供与されているモジュールに応じて、1 つ以上のツールを使
用できます。 Enterprise Designer では、現在、 マッチ分析 (Match Analysis モジュールに付属) とテー
ブル管理 (Data Normalization モジュールに付属) の 2 つのツールを使用できます。 マッチ分析ツール
の詳細については、マッチ分析(374ページ)を参照してください。 テーブル管理ツールの詳細につい
ては、テーブル管理(613ページ)を参照してください。
34
Spectrum™ Technology Platform 8.0.0
第 2 章 : Spectrum™ Technology Platform クライアント
Interactive Driver の概要
Interactive Driver には "プレビュー" 機能があり、サービス/コンポーネントを実行して結果を確認し、
必要に応じて設定を変更できます。 Interactive Driver では、次の操作を実行できます。
• 入力データを手動で入力する。または、データ ファイルをインポートする。
• 入力データを入力グリッドに表示する。
• サービスを実行する。
• 出力データを出力グリッドに表示する。
• 成功数、失敗数、エラー数等、サマリ指標を表示する。
• 変更されたフィールドの数、空白の入力フィールドの数等、フィールドレベルの指標を表示する。
また、"水平" 表示から "垂直" 表示に変更したり、列の幅を広げたり狭くしたりすることで、データの
表示を変更することもできます。
[オプション] タブ
[オプション] タブでは、サービス/コンポーネントを設定できます。
1. サービスを選択します。 このサービス用のオプションを含む [オプション] タブが表示されます。
次の例では、ValidateAddress を選択しています。
2. 左側のノードをクリックして、右側のオプションを選択します。 これらの設定は、Enterprise
Designer で作成するデータフローのデフォルト設定として使用されます。
ユーザ ガイド
35
Interactive Driver の概要
[プレビュー] タブ
[プレビュー] タブでは、入力と出力をプレビューできます。入力データは、グリッドに直接入力でき
ます。 入力に対応する列の見出し、つまりフィールド ラベルが自動的に表示されます。 フィールド
ラベルは、製品やサービスによって異なります。
注: すべての入力フィールドの詳細については、このガイドのコンポーネントに関するセクションを
参照してください。
1. 1 行目への入力を始めます。 2 行目が自動的に表示されます。 <Tab> を押して、次の行に移動し
ます。
2. 入力レコードを最後の列まで入力します。
3. すべての入力データの入力を続行します。
4. デフォルトでは垂直表示です。 水平表示に変更する場合は、[表示] ボタンをクリックして [水平方
向] を選択します。
5. 住所の出力をプレビューする場合は、[プレビューを実行] ボタンをクリックします。
注: すべての行/列にデータを入力する必要はありません。 行/列は必要に応じて空白にできます。
データのインポート
既存のファイルを入力グリッドにインポートできます。ファイルが正しい形式で指定されていれば、
最大 100 件のレコードをインポートできます。
1. ツールバーの [オプション] ボタンをクリックします。
2. 処理するレコードの最大数を入力 (または選択) します。 最大数は 100 です。
3. ドロップダウン リストから、ファイル フィールド区切り文字 (スペース、タブ、カンマ、ピリオ
ド、セミコロン、パイプ) を選択します。 ファイルに含まれるレコード区切り文字が、一覧に表示
される文字と異なる場合は、次の操作を行います。
a) 省略記号ボタンをクリックして、[フィールド区切り文字の管理] ダイアログ ボックスにアクセ
スします。
b) [追加] をクリックします。
c) [文字] フィールドに、ファイルで区切り文字として使用する文字を入力します。 また、[文字
コード表] を押すと表示される一覧から文字を選択して、文字を入力することもできます。
36
Spectrum™ Technology Platform 8.0.0
第 2 章 : Spectrum™ Technology Platform クライアント
d) 文字を入力または選択したら、Tab を押します。 [Unicode] フィールドは自動的に完了します。
また、unicode 値を入力することもできます。この場合、[文字] フィールドは自動的に完了し
ます。
e) 必要に応じて、[説明] フィールドに、文字の説明を入力します。 例えば、文字に "&"、説明に
"アンパサンド" と入力できます。 説明を入力しない場合は、その文字のみが使用可能な文字の
一覧に表示されます。
f) [OK] を 2 回クリックします。
4. ジョブの実行がタイムアウトする最大時間を秒数で入力 (または選択) します。
5. [OK] をクリックします。
6. [データのインポート] をクリックします。
7. データ ファイルを含むディレクトリに移動して、データ ファイルを選択します。
8. [開く] をクリックします。 データが入力グリッドに表示されます。
9. 垂直表示に変更する場合は、[表示] をクリックして [垂直方向] を選択します。
10. [プレビューを実行] をクリックして結果を表示します。
出力のプレビュー
データの入力後 (入力方法を問わず)、サービスを実行して結果を確認できます。
1. [プレビューを実行] ボタンをクリックします。 しばらくすると、データが出力グリッドに表示さ
れます (データが表示されるまでにかかる時間は、ネットワークの速度によって異なります)。
2. 出力データをプレビューして、適切な結果が得られることを確認します。
ユーザ ガイド
37
クライアント キャッシュのクリア
3. 必要に応じて、サービスの設定を変更します。 その後、[プレビューを実行] を再度クリックしま
す (データを再度入力する必要はありません)。
4. より詳細な情報を [プレビュー情報] セクションに表示する場合は、[プレビューを実行] ボタンをク
リックします。
クライアント キャッシュのクリア
3 つのクライアント ツール (Enterprise Designer、Management Console、Interactive Driver) では、
Spectrum™ Technology Platform サーバーからダウンロードしたファイルのローカル キャッシュが使
われます。 予期せぬ動作が生じた場合は、これらのファイルのキャッシュをクリアして問題が解決す
るか確認するとよいでしょう。 キャッシュをクリアすると、次にクライアントを起動したときクライ
アントがサーバーからファイルを再度ダウンロードします。
注: いずれかのクライアントのキャッシュをクリアすると、コンピュータにインストールされている
すべてのクライアントのキャッシュがクリアされます。
キャッシュをクリアするには
1. [ツール] > [オプション] を選択します。
2. [詳細設定] タブをクリックします。
3. [キャッシュをクリア] をクリックします。
4. クライアントを再起動します。
38
Spectrum™ Technology Platform 8.0.0
第 II 部: データフロー
このセクションの構成
• データフローの基礎 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .41
• ソース . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .55
• 制御ステージ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .93
• プライマリ ステージ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .149
• シンク . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .153
• レポート . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .185
• データフローのインスペクション . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .189
• ジョブの実行 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .195
• サブフローの使用 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .207
データフローの基礎
このセクションの構成
• データフロー タイプ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .42
• データ モデル . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .43
• データ タイプ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .45
• データフローのインポートとエクスポート . . . . . . . . . . . . .50
• フィールド名の変更 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .51
• 形式に誤りのある入力レコードの管理 . . . . . . . . . . . . . . . . .52
• Web サービス オプションの設定 . . . . . . . . . . . . . . . . . . . . .53
3
データフロー タイプ
データフロー タイプ
ジョブ
Spectrum™ Technology Platform のジョブは、バッチ処理を行うデータフローです。 ジョブは、1 つ
以上のファイルやデータベースからデータを読み込み、そのデータを処理し、1 つ以上のファイルや
データベースに結果を書き込みます。 ジョブは、Enterprise Designer では手動で実行できます。ま
た、Job Executor を使用してコマンド ラインから実行することもできます。
次のデータフローはジョブです。 Read from File ステージを入力に使用し、2 つの Write to File ステー
ジを出力として使用しています。
サービス
サービスは、Spectrum™ Technology Platform を使用してアクセス可能な処理機能です。 Spectrum™
Technology Platform API を使用してサービスを呼び出し、レコードを Spectrum™ Technology Platform
に引き渡すことができます。 レコードを処理する際のオプションを指定することもできます。 サービ
スはデータを処理し、API によって返されるレスポンスを通してデータを返します。
一部のサービスは、モジュールをインストールしたときに使用可能になります。 例えば、Universal
Addressing モジュールをインストールすると、お使いのシステム上で ValidateAddress サービスが使
用可能になります。 Enterprise Designer でサービスを作成し、そのサービスをシステム上でユーザ定
義サービスとしてエクスポーズしなければならない場合もあります。 例えば、Location Intelligence モ
ジュールのステージは、このモジュールのステージを使用するサービスをまず作成しなければ、サー
ビスとして使用できません。
Enterprise Designer で独自のカスタム サービスを設計することもできます。 例えば、以下のデータフ
ローでは入力に Input ステージを、出力に Output ステージを使用し、ジオコーディングを実行しま
す。
42
Spectrum™ Technology Platform 8.0.0
第 3 章 : データフローの基礎
注: サービス名、オプション名、フィールド名は、最終的に XML 要素となるため、XML 要素名とし
て無効な文字を含んではいけません (例えば、空白は無効です)。 詳細については、XML の仕様 (
www.w3.org/TR/REC-xml/#NT-Name ) を参照してください。 この要件を満たさないサービス
は、サービスとしては機能しますが、Web サービスとしてエクスポーズすることはできません。
サブフロー
サブフローは、他のデータフローで再利用できるデータフローです。 データフロー コンポーネントの
[ユーザ定義ステージ] フォルダに表示されるサブフローは、保存してエクスポーズできます。[展開
済みステージ] フォルダに表示されるステージは、システムによって展開されるステージです。
データ モデル
Spectrum™ Technology Platform Spectrum™ Technology Platform は、フラット データと階層データ
をサポートしています。 一般に、データフローの入力および出力としては、フラット データと階層
データのどちらも使うことができます。 多くはありませんが、Enterprise Routing モジュールのいく
つかのステージで、データを階層的な形式にする必要があります。
フラット データ
フラット データは、1 行に 1 つのレコードと、各レコードのフィールドで構成されます。 フィールド
は特殊文字で区切るか、行に対して定義された位置に配置します。 例えば、カンマ区切りフィールド
を持つフラット データを以下に示します。
Sam,43,United States
Jeff,32,Canada
Mary,61,Ireland
フラット データをデータフローに読み込むには、Read from File、Read from DB、Input のいずれかの
ステージを使います。 フラット データをデータフローから書き出して出力するには、Write to File、
Write to DB、Output のいずれかのステージを使います。
ユーザ ガイド
43
データ モデル
階層データ
階層データとは、親子関係にあるデータ要素で構成されるツリー状の構造のことです。Spectrum™
Technology Platform は、XML 形式の階層データを読み書きできます。 例を次に示します。
<customers>
<customer>
<name>Sam</name>
<age>43</age>
<country>United States</country>
</customer>
<customer>
<name>Jeff</name>
<age>32</age>
<country>Canada</country>
</customer>
<customer>
<name>Mary</name>
<age>61</age>
<country>Ireland</country>
</customer>
</customers>
この例は、<customer> が 1 つのレコードを表し、各レコードが単純 XML 要素 (<name>、<age>、
および <country>) で構成される構造を示しています。
階層データをデータフローに読み込むには、Read from XML ステージを使います。 階層データをデー
タフローから出力して書き出すには、Write to XML ステージを使います。
データの変換
多くの場合、フラット データから階層データ、または階層データからフラット データに変換する必要
があります。 例えば、データ フロー入力が階層形式で、そのデータ フローをフラット データとして
出力する場合などです。 特定のステージ (特に Location Intelligence モジュールのステージ) 用にフラッ
ト入力データを階層データに変換してから、出力用としてデータをフラット データに再変換する必要
がある場合などもあります。
フラット データを階層データに変換するには、次の方法があります。
• プロセス リスト ツール
• データフローの Aggregator ステージ
階層データをフラット データに変換するには、Splitter ステージを使います。
プロセス リスト
プロセス リストは、サービスまたはサブフロー内で、データをフラット化してリストに変換するため
のツールです。 これは Location Intelligence モジュールなどのように、リスト入力が必要なステージ
がデータフローに含まれる場合に役立ちます。
1. 既存のデータフローで、出力をリストに変換するステージを右クリックします。 Input、Output 以
外の任意のステージを使用できます。
2. [プロセス リスト] を選択します。 ステージの背景に青い正方形が表示されます。
44
Spectrum™ Technology Platform 8.0.0
第 3 章 : データフローの基礎
3. ステージをプロセス リストの中に、またはプロセス リストから外に移動するには、Shift キーを押
しながらステージをドラッグします。
注: データをプロセス リストで処理する必要のあるステージが複数ある場合は、サブフローを作
成し、それをデータフローに組み込み、プロセス リスト機能をサブフロー全体に適用します。
4. プロセス リストの入力および出力フィールドは "ListField" という名前です。 [フィールドの名前変
更] 機能を使用して、Input ステージのフィールドを入力チャネルの "ListField" にマップし、"ListField"
を Output ステージのフィールドにマップする必要があります。 詳細については、フィールド名の
変更(51ページ)を参照してください。
5. リストのデータを入力と同じ順序にする場合は、プロセス リスト ボックスを右クリックして、[オ
プション] を選択します。 [ソート順序を維持する] ボックスを選択します。
6. 次のステージへのデータ入力がリストの形式になっていることを確認するには、データフローを検
証またはインスペクションします。 データのインスペクションの詳細については、データフロー
のインスペクション(189ページ)を参照してください。
データ タイプ
Spectrum™ Technology Platform Spectrum™ Technology Platform では、さまざまな数値、文字列、お
よび複合データ タイプがサポートされています。 実行する処理の種類に応じて、これらのデータ タ
イプを使用できます。 住所検証データフローの場合は、文字列データ タイプだけで済ますこともでき
ます。 算術計算を含むデータフローの場合は、数値または Boolean データ タイプを使用できます。
空間処理を実行するデータフローの場合は、複合データ タイプを使用できます。 これらを組み合わせ
たデータフローの場合は、さまざまなデータ タイプを使用できます。
Spectrum™ Technology Platform Spectrum™ Technology Platform では、次の表に示すデータ タイプ
がサポートされています。
データ タイプ
AccessibleNode
説明
等時線または等距離線によってアクセス可能な各ノードに対して 1 つのポ
イントを持つ MultiPoint を返すデータ タイプ。 ノードは、交差点、または
重要なジオメトリ フィーチャーのいずれかです。
注: このタイプは、Location Intelligence モジュールにおいてのみ使用可能
です。
boolean
double
true と false の 2 つの 値を持つ論理タイプ。
-1074
正と負の倍精度数を含む数値データ タイプ。値の範囲は、2
〜
-52
1023
(2-2 )×2
。 指数表記すると、値の範囲は、4.9E-324 〜
1.7976931348623157E308 となります。 指数表記については、次のサイト
を参照してください。
http://en.wikipedia.org/wiki/Scientific_notation#E_notation
ユーザ ガイド
45
データ タイプ
データ タイプ
float
説明
-149
正と負の単精度数を含む数値データ タイプ。値の範囲は、2
〜
23
127
(2-2 )×2 。 指数表記すると、値の範囲は、1.4E-45 〜 3.4028235E38 と
なります。 指数表記については、次のサイトを参照してください。
http://en.wikipedia.org/wiki/Scientific_notation#E_notation
ジオメトリ
等時線または等距離線によって到達可能な領域を表す MultiPolygon を返す
データ タイプ。
注: このタイプは、Location Intelligence モジュールにおいてのみ使用可能
です。
integer
リスト
31
正と負の整数を含む数値データ タイプ。値の範囲は、-2 (-2,147,483,648)
31
〜 2 -1 (2,147,483,647)。
厳密に言えば、リストはデータ タイプではありません。 しかし、フィール
ドが階層データを含む場合、"リスト" フィールドとして扱われます。
Spectrum™ Technology Platform では、リストは複数の値で構成されるデー
タのコレクションです。 例えば、Names フィールドには名前の値のリスト
を含めることができます。 これは、XML 構造では次のように表すことがで
きます。
<Names>
<Name>John Smith</Name>
<Name>Ann Fowler</Name>
</Names>
XML のリスト データ タイプが複数の値で構成される単純データ タイプで
あるのに対し、Spectrum™ Technology Platform のリスト データ タイプは
XML の複合データ タイプに似ているという点で、Spectrum™ Technology
Platform のリスト データ タイプは XML スキーマのリスト データ タイプと
異なることに注意してください。
63
long
正と負の自然数を含む数値データ タイプ。値の範囲は、-2
63
(-9,223,372,036,854,775,808) 〜 2 -1 (9,223,372,036,854,775,807)。
RouteCostMatrix
個々のルートの合計時間および距離。
注: このタイプは、Location Intelligence モジュールにおいてのみ使用可能
です。
string
文字列
フィールドのデータ タイプの指定
次の場合にフィールドのデータ タイプを指定できます。
46
Spectrum™ Technology Platform 8.0.0
第 3 章 : データフローの基礎
• ソース ステージ (Read from File、Read from DB、および Input): データフローの開始時にデータ
タイプを設定し、後のデータフローでデータ タイプを変換する必要がないようにできます。 Read
from DB の場合はデータ タイプは自動的に選択されて変更できないことに注意してください。
• シンク ステージ (Write to File、Write to DB、および Output): データ タイプを指定すると、デー
タフローによって返されるデータ フォーマットを制御できます。 Write to DB の場合はデータ タイ
プは自動的に選択されて変更できないことに注意してください。
• Transformer ステージ: カスタム スクリプトを使用する場合、このステージでデータ タイプを指定
できます。
• Math ステージおよび Group Statistics ステージ: これらのステージでは算術計算が実行されるの
で、特定の数値データ タイプの使用を選択すると、除算演算の精度など、計算の結果に影響する場
合があります。 ステージへの入力フィールドのデータ タイプとは異なるデータ タイプをフィール
ドに対して指定した場合、自動データ タイプ変換(47ページ)で説明するように、下流のチャネル
でフィールドが指定のタイプに自動的に変換されます。
注: 各ステージは異なるデータ タイプをサポートします。 各ステージでサポートされるデータ タイ
プの詳細については、ステージのドキュメントを参照してください。
自動データ タイプ変換
ステージに提示されたデータのタイプが適切でないとき、Spectrum™ Technology Platform では、場
合によってデータを自動的に適切なタイプに変換できます。 例えば、Validate Address は文字列デー
タだけを入力として受け付けます。 PostalCode 入力フィールドが整数タイプの場合、Spectrum™
Technology Platform は自動的にフィールドを文字列に変換し、PostalCode を正しく処理できます。
同様に、Math ステージでは、データは数値データ タイプである必要があります。 入力データが文字
列タイプの場合、Spectrum™ Technology Platform は Math ステージの [フィールド] タブで指定されて
いるデータ タイプにデータを変換できます。 データ タイプの変換は、データフローのチャネルで行
われます。 チャネルでデータ タイプが変換される場合、チャネルの中央に青い点が表示されます。
チャネルをダブルクリックすると、行われるデータ タイプ変換を確認できます。 次の例の場合、文字
列データが整数データに変換されています。
ユーザ ガイド
47
データ タイプ
このダイアログ ボックスでは自動データ タイプ変換のデータ タイプを変更できないことに注意して
ください。 出力データ タイプは、下流ステージでの設定によって決まります。
Spectrum™ Technology Platform フィールドのデータ タイプに適合する有効な値がフィールドに含ま
れている限り、Spectrum™ Technology Platform は文字列フィールドを Boolean データ タイプと数値
データ タイプに変換できます (また、Boolean フィールドと数値フィールドを文字列に変換できます)。
フィールドに含まれる値が無効な場合、変換は失敗し、タイプ変換オプションで指定したアクション
が Spectrum™ Technology Platform により実行されます。 次の表に、各データ タイプの有効な値を示
します。
表 4 : データ タイプの値
タイプ
説明
boolean
true と false の 2 つの 値を持つ論理タイプ。 Boolean 変数は、条件文
で処理の流れを制御するために使用できます。 次のコードは、Boolean
式の例を示したものです。
if(x && y)
z=1;
else if(x)
z=2;
else if(y)
z=3;
else
z=4;
double
-1074
正と負の倍精度数を含む数値データ タイプ。値の範囲は、2
-52
(2-2
48
〜
1023
)×2
。 指数表記すると、値の範囲は、4.9E-324 〜
Spectrum™ Technology Platform 8.0.0
第 3 章 : データフローの基礎
タイプ
説明
1.7976931348623157E308 となります。 指数表記については、次のサ
イトを参照してください。
http://en.wikipedia.org/wiki/Scientific_notation#E_notation
float
-149
正と負の単精度数を含む数値データ タイプ。値の範囲は、2
23
〜
127
(2-2 )×2
。 指数表記すると、値の範囲は、1.4E-45 〜 3.4028235E38
となります。 指数表記については、次のサイトを参照してください。
http://en.wikipedia.org/wiki/Scientific_notation#E_notation
integer
31
正と負の自然数を含む数値データ タイプ。値の範囲は、-2
31
(-2,147,483,648) 〜 2 -1 (2,147,483,647)。
63
long
正と負の自然数を含む数値データ タイプ。値の範囲は、-2
63
(-9,223,372,036,854,775,808) 〜 2 -1 (9,223,372,036,854,775,807)。
有効な値が入っていないフィールドは、Spectrum™ Technology Platform では変換できません。 タイ
プ変換オプションを使用することで、このような場合の Spectrum™ Technology Platform の処理を指
定できます。 グローバルなデフォルト設定とデータフロー固有の設定を指定できます。 詳細について
は、デフォルトのタイプ変換オプションの設定(49ページ)と データフローのタイプ変換オプション
の設定(50ページ)を参照してください。
デフォルトのタイプ変換オプションの設定
タイプ変換オプションでは、Spectrum™ Technology Platform がフィールドのデータ タイプをステー
ジで必要とされるデータ タイプに変換できないときの処理を指定します。ステージに提示されたデー
タのタイプが適切でないとき、Spectrum™ Technology Platform は自動的にデータ タイプ変換を試み
ます。 詳細については、自動データ タイプ変換(47ページ)を参照してください。
Management Console でデフォルトのタイプ変換オプションを指定すると、すべてのデータフローに
対するシステムでのデフォルトの動作を定義できます。 Enterprise Designer では、必要に応じて個別
のデータフローのデフォルト動作をオーバーライドできます。 詳細については、データフローのタイ
プ変換オプションの設定(50ページ)を参照してください。
1. Management Console を開きます。
2. [実行] メニューから [タイプ変換オプション] をクリックします。
3. 次のオプションのいずれかを選択します。
•
データフローの処理に失敗する — Spectrum™ Technology Platform が変換できないフィールド
を検出した場合、データフローは失敗します。
•
レコードの処理に失敗する — Spectrum™ Technology Platform が変換できないフィールドを検
出した場合、レコードの処理は失敗しますが、データフローの実行は続行されます。
ユーザ ガイド
49
データフローのインポートとエクスポート
•
フィールドをデフォルト値で初期化する — Spectrum™ Technology Platform が変換できない
フィールドを検出した場合、フィールドの値はここで指定する値に置き換えられます。 一部の
レコードに不正なデータが含まれることがわかっていて、不正なデータをデフォルト値に置き
換える場合、このオプションが役に立ちます。 各データ タイプの値を指定します。
データフローのタイプ変換オプションの設定
タイプ変換オプションでは、Spectrum™ Technology Platform がフィールドのデータ タイプをステー
ジで必要とされるデータ タイプに変換できないときの処理を指定します。ステージに提示されたデー
タのタイプが適切でないとき、Spectrum™ Technology Platform は自動的にデータ タイプ変換を試み
ます。 詳細については、自動データ タイプ変換(47ページ)を参照してください。
デフォルトでは、データ タイプ変換が失敗すると、データフローは Management Console で指定され
ているデフォルトのタイプ変換オプションを使用します (システムのデフォルトのタイプ変換オプショ
ンの設定方法については、デフォルトのタイプ変換オプションの設定(49ページ)を参照)。ただし、
以下の手順に従うことで、ジョブまたはサービスに対するデフォルトのオプションをオーバーライド
できます。
注: サブフローは、属しているデータフローからタイプ変換設定を継承します。 サブフローのタイプ
変換設定を指定することはできません。
データフローのタイプ変換設定を指定するには
1. Enterprise Designer でデータフローを開きます。
2. [編集] > [タイプ変換オプション] を選択します。
3. 次のオプションのいずれかを選択します。
•
グローバル オプションを使用 — Management Console で指定されているシステム デフォルト
を使用します。 現在のデフォルト設定が表示されます。
•
データフローの処理に失敗する — Spectrum™ Technology Platform が変換できないフィールド
を検出した場合、データフローは失敗します。
•
レコードの処理に失敗する — Spectrum™ Technology Platform が変換できないフィールドを検
出した場合、レコードの処理は失敗しますが、データフローの実行は続行されます。
•
フィールドをデフォルト値で初期化する — Spectrum™ Technology Platform が変換できない
フィールドを検出した場合、フィールドの値はここで指定する値に置き換えられます。 一部の
レコードに不正なデータが含まれることがわかっていて、不正なデータをデフォルト値に置き
換える場合、このオプションが役に立ちます。 各データ タイプの値を指定します。
データフローのインポートとエクスポート
インポート機能とエクスポート機能を使用して、他の Enterprise Designer ユーザとデータフローを交
換できます。
50
Spectrum™ Technology Platform 8.0.0
第 3 章 : データフローの基礎
注: データフローの交換は、同じバージョンの Spectrum™ Technology Platform の間でのみ行うこと
ができます。
•
データフローをエクスポートするには、[ファイル] > [エクスポート] を選択します。 サービスおよ
びジョブの名前の定義では、特殊文字を使用しないでください。 使用するとエクスポートでエラー
が発生する場合があります。
•
プロセス フローをインポートするには、[ファイル] > [インポート] > [プロセス フロー] を選択しま
す。
•
データフローをインポートするには、[ファイル] > [インポート] > [データフロー] を選択します。
データフローをインポートする前に、データフローのステージがシステムで使用できる状態になっ
ている必要があります。 インポートするデータフローに使用できないステージが含まれていると、
エラーが発生します。
•
サーバーに既に存在するデータフローと同じ名前のデータフローをインポートする場合は、イン
ポートしたデータフローで既存のデータフローを上書きするかどうかを指定できます。
フィールド名の変更
さまざまな状況で、データフロー内のフィールドの名前を変更しなければならないことがあります。
例:
• あるステージの入力で必要とされるフィールドの名前が、前のステージの出力で使われているフィー
ルドの名前と異なる場合
• あるステージで同じ名前のフィールドが出力されるとき、フィールド内のデータを保持したい場合
注: フィールド名を変更すると、以降のステージでは古い名前を使用できなくなります。
1. データフローで、2 つのステージの間のチャネルをダブルクリックします。 [Field Transform オ
プション] ダイアログ ボックスが表示されます。
2. 必要に応じてフィールド名を変更します。 例えば、後のステージでは "AddressLine3" というフィー
ルド名が必要で、前のステージでは "FirmName" というフィールド名が使用されているものとしま
す。 この場合、[出力フィールド名] として AddressLine3 に対応する [入力フィールド名] のドロッ
プダウン矢印をクリックして、"FirmName" を選択します。
出力フィールド名と出力データ タイプの色が緑に変わります。 マッピングする必要のないフィー
ルド (前のステージと次のステージに同じフィールドが存在する場合) は、グレーの背景で示され
ます。 リストから別のフィールドを選択することで、これをオーバーライドできます。
ほとんどのデータ タイプは、古いフィールド名と新しいフィールド名で同じである必要がありま
す。ただし、Polygon タイプおよび MultiPolygon タイプは Geometry タイプにマップできます。リ
スト タイプはリスト タイプにマップする必要があり、カスタム タイプはカスタム タイプにマップ
する必要があります。 データフローに同じ名前でデータ タイプが異なるフィールドがある場合は、
警告が表示されます。 データ タイプが変更されると、2 つのステージの間のチャネル上の円が青
に変わります。 詳細については、自動データ タイプ変換(47ページ)を参照してください。
3. [OK] をクリックします。 出力ファイルには、新しい名前のフィールドが含まれます。
ユーザ ガイド
51
形式に誤りのある入力レコードの管理
形式に誤りのある入力レコードの管理
形式に誤りのあるレコードとは、Spectrum™ Technology Platform がパースできないレコードのこと
です。 Spectrum™ Technology Platform は、形式に誤りのあるレコードを検出すると、次の 1 つ以上
の処理を行います。
• ジョブを停止する
• 処理を続行する
• 不正なレコードが一定の数だけ検出されるまで処理を続行する
• 不正なレコードを (オプションのシンク ステージによって) ログ ファイルに書き出して処理を続行す
る
注: 形式に誤りのあるレコードに対する機能は、サーバー上にあるファイルを読み込み、ソートが設
定されていないソースに対してのみ適用されます。 ソースにリモート ファイルが設定されている
か、ソート フィールドが設定されている場合は、形式に誤りのあるレコードが検出されると、形
式に誤りのあるレコードに対する設定に関わらず、ジョブは失敗します。
形式に誤りのあるレコードを管理するには
1. 形式に誤りのあるレコード シンクをデータフローに追加します。
a) 入力ファイルおよびソース ステージを定義し、データフローにサービスおよびサブフローを追
加することにより、ジョブを作成します。
b) 以下のいずれかの方法を実行します。
• データフローのソース ステージのオプションの出力ポートに、シンク ステージを接続しま
す。 オプションのポートとは、ソース ステージの黒い出力ポートのすぐ下にある白抜きの出
力ポートのことです。 このポート上にマウスを合わせると、"error_port" と記されたツール
チップが表示されます。 形式に誤りのあるレコードは、このシンクに書き出されます。
• データフローのソース ステージのオプションの出力ポートに何も接続しません。この場合、
Spectrum™ Technology Platform は形式に誤りのあるレコードを無視します。
完成したデータフローは次のようになります。
ジョブを実行すると、[実行履歴] にはジョブの実行中に検出された形式に誤りのあるレコードの数
を示す列が表示されます。
2. デフォルトでは、Spectrum™ Technology Platform は形式に誤りのあるレコードを検出するとジョ
ブを中止します。 この設定を変更するには、以下の手順に従います。
52
Spectrum™ Technology Platform 8.0.0
第 3 章 : データフローの基礎
a) 開いているジョブ内で、 [編集] > [ジョブ オプション] を選択します。
b) [形式に誤りのあるレコードでジョブを停止しない] を選択するか、または [形式に誤りのあるレ
コードを次の個数検出した時点でジョブを停止] を選択して、ジョブを停止するまでに検出し
てもよい形式に誤りのあるレコードの数を入力します。
Web サービス オプションの設定
Web サービス オプションを使用すると、Simple Object Access Protocol (SOAP) または Representational
State Transfer (REST) を介して、サービスを Web サービスとしてエクスポーズするかどうかを指定
できます。
Spectrum™ Technology Platform に展開されているサービスも Web サービスとして発行されます。
Web サービスとは、アプリケーション間でのデータ交換に使用するプロトコルと標準規格のコレク
ションです。 各種のプログラミング言語で記述され、各種のプラットフォームで実行されるソフト
ウェア アプリケーションでは、Web サービスを利用することにより、インターネット等のコンピュー
タ ネットワーク上でデータを交換できます。Spectrum™ Technology Platform の Web サービスを利用
するには、HTTP 上の Simple Object Access Protocol (SOAP) と Representational State Transfer (REST)
を使用します。
Spectrum™ Technology Platform サーバーでは、SOAP Web サービスをドキュメント/リテラル モー
ドで使用して、Spectrum™ Technology Platform サービスにアクセスできます。 この方法では、xml
スキーマを作成して、クライアントとサーバーの間でのやり取りを強化できます。 ドキュメント/リテ
ラル Web サービスは、WS-I 準拠形式の Web サービスです。
この機能を使用すると、次のことができます。
• 標準的な Web サービス インターフェイスを介してサービスを呼び出す。
• 指定されたメタデータに基づいて動的に生成される Web サービス インターフェイスを使用する。
• データをサービスに引き渡して応答として返す。
注: このインターフェイスを介してサーバーにアクセスする方法では、パフォーマンスを重視してい
ません。 パフォーマンスが重要で、かつ HTTP が必要な場合は、Spectrum™ Technology Platform
独自の XML over HTTP プロトコルを使用して、サービスをサードパーティ アプリケーションか
ら呼び出した方が適切であると考えられます。 ただし、独自の XML には階層タイプのサポート
に制限があり、すべてのフィールドを文字列形式にする必要があります。
1. Enterprise Designer を開きます。
2. [編集] メニューから、[Web サービス オプション] をクリックします。
3. 次のオプションのいずれかを選択します。
•
SOAP — 拡張 SOAP を介してサービスをエクスポーズします。拡張 SOAP は、フォールトや
基本認証等、多数のオプションを備えています。
•
REST — REST を介してサービスをエクスポーズします。
ユーザ ガイド
53
Web サービス オプションの設定
サービスをエクスポーズした後、URL を介してそのサービスにアクセスできます。 下に示す場所は、
SOAP、Legacy SOAP、および Rest のアドレスを示しています。[サービス名] は、アクセスするサー
ビスを表します。
• http://localhost:8080/soap/[サービス名]?wsdl
• http://localhost:8080/rest/[サービス名]?_wadl&_type=xml
例えば、SOAP を使用して Validate Address にアクセスするには、次のアドレスに移動します。
http://localhost:8080/soap/ValidateAddress?wsdl
54
Spectrum™ Technology Platform 8.0.0
ソース
ソースは、ジョブ内の最初のステージです。 ソースは、処理する入力データを
定義します。 ジョブ内では、入力データは、ファイルまたはデータベースから
入力できます。
注: ジョブを設計するときは、形式に誤りのある入力レコードが含まれる可能
性を考慮してください。 形式に誤りのあるレコードとは、Spectrum™
Technology Platform が提供するパーサー クラスでパースできないレコー
ドです。 形式に誤りのあるレコードの処理については、形式に誤りのある
入力レコードの管理(52ページ)を参照してください。
このセクションの構成
• 入力 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .56
• Read From DB . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .60
• Read From File . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .66
• Read from Variable Format File . . . . . . . . . . . . . . . . . . . . .78
• Read From XML . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .86
4
入力
入力
Input ステージは、サービスまたはサブフローの入力フィールドを定義します。 また、データ インス
ペクションで使用するテスト データを定義します。
入力フィールドの定義
1. 入力アイコンをキャンバス上にドラッグし、ダブルクリックします。 [入力オプション] ダイアログ
ボックスが表示されます。
2. 入力として使用するフィールドを選択します。 表示されるフィールドの一覧は、Input ステージが
接続されているステージによって異なります。
3. 新しいフィールドをフィールド リストに追加するには、[追加] をクリックします。[カスタム フィー
ルドの追加] ダイアログ ボックスが表示されます。 また、カスタム フィールドを変更または削除
することもできます。
4. [追加] を再度クリックします。
5. フィールド名をテキスト ボックスに入力します。
6. [データ タイプ] を選択し、[OK] を押します。 次のデータ タイプがサポートされています。
データ タイプ
AccessibleNode
説明
等時線または等距離線によってアクセス可能な各ノードに対して 1 つの
ポイントを持つ MultiPoint を返すデータ タイプ。 ノードは、交差点、ま
たは重要なジオメトリ フィーチャーのいずれかです。
注: このタイプは、Location Intelligence モジュールにおいてのみ使用可
能です。
boolean
double
true と false の 2 つの 値を持つ論理タイプ。
-1074
正と負の倍精度数を含む数値データ タイプ。値の範囲は、2
-52
(2-2
〜
1023
。 指数表記すると、値の範囲は、4.9E-324 〜
)×2
1.7976931348623157E308 となります。 指数表記については、次のサ
イトを参照してください。
http://en.wikipedia.org/wiki/Scientific_notation#E_notation
float
-149
正と負の単精度数を含む数値データ タイプ。値の範囲は、2
23
〜
127
(2-2 )×2
。 指数表記すると、値の範囲は、1.4E-45 〜 3.4028235E38
となります。 指数表記については、次のサイトを参照してください。
http://en.wikipedia.org/wiki/Scientific_notation#E_notation
56
Spectrum™ Technology Platform 8.0.0
第 4 章 : ソース
データ タイプ
ジオメトリ
説明
等時線または等距離線によって到達可能な領域を表す MultiPolygon を返
すデータ タイプ。
注: このタイプは、Location Intelligence モジュールにおいてのみ使用可
能です。
integer
31
正と負の整数を含む数値データ タイプ。値の範囲は、-2 (-2,147,483,648)
31
〜 2 -1 (2,147,483,647)。
リスト
厳密に言えば、リストはデータ タイプではありません。 しかし、フィー
ルドが階層データを含む場合、"リスト" フィールドとして扱われます。
Spectrum™ Technology Platform では、リストは複数の値で構成される
データのコレクションです。 例えば、Names フィールドには名前の値
のリストを含めることができます。 これは、XML 構造では次のように
表すことができます。
<Names>
<Name>John Smith</Name>
<Name>Ann Fowler</Name>
</Names>
XML のリスト データ タイプが複数の値で構成される単純データ タイプ
であるのに対し、Spectrum™ Technology Platform のリスト データ タイ
プは XML の複合データ タイプに似ているという点で、Spectrum™
Technology Platform のリスト データ タイプは XML スキーマのリスト
データ タイプと異なることに注意してください。
long
63
正と負の自然数を含む数値データ タイプ。値の範囲は、-2
63
(-9,223,372,036,854,775,808) 〜 2 -1 (9,223,372,036,854,775,807)。
RouteCostMatrix
個々のルートの合計時間および距離。
注: このタイプは、Location Intelligence モジュールにおいてのみ使用可
能です。
string
文字列
You can also add a new, user-defined data type if necessary, and that new type can be a list of any
defined data type. For example, you could define a list of names (string), or a new data type of
addresses that includes AddressLine1 (string), City (string), StateProvince(string) and PostalCode
(string). After you create the field, you can view the data type by accessing the Input Options dialog
and pressing the button in the Data Type column. The [データ タイプ詳細] ダイアログ ボックスが
表示され、フィールドの構造が示されます。
7. [OK] を再度クリックします。
ユーザ ガイド
57
入力
8. [エクスポーズ] の横にあるチェック ボックスをクリックして、フィールド リストに含まれるフィー
ルドすべてのチェック ボックスを選択します。 フィールド リストからフィールドを選択して、
フィールドをステージ操作用としてデータフローにエクスポーズします。 チェック ボックスを再
度クリックして、リストに含まれるフィールドすべてのチェック ボックスをクリアします。 フィー
ルド リストに含まれる 1 つ以上のフィールドのチェック ボックスをクリアし、[OK] をクリックす
ると、フィールドがフィールド リストから削除されます。
注: 入力フィールドで階層データを定義した場合は、データをインポートしたり、データを垂直に表
示したりすることはできません。
Web サービス データ タイプの定義
[データ タイプ名] フィールドにより、作成しているサービスの WSDL (SOAP) および WADL (REST)
インターフェイスの制御が可能です。 Rows 要素の名前は、サービス内のこのステージに付けた名前
によって決まり、Row 要素の名前は、ここに入力したテキストによって決まります。
注: WSDL の場合は要求と応答の両方に影響しますが、WADL の場合は応答のみに影響が生じます。
このステージに名前を付け、このフィールドにテキストを入力する前のコードの例を、次に示します。
<Rows>
<Row>
<FirstName>John</FirstName>
<LastName>Doe</LastName>
</Row>
<Row>
<FirstName>Jane</FirstName>
<LastName>Doe></LastName>
</Row>
</Rows>
このステージに名前を付け、このフィールドにテキストを入力した後、コードは次のようになります。
<Names>
<Name>
<FirstName>John</FirstName>
<LastName>Doe</LastName>
</Name>
<Name>
<FirstName>Jane</FirstName>
<LastName>Doe></LastName>
</Name>
</Names>
インスペクション データの定義
データ インスペクションを使用するには、以下の手順に従ってテスト データを入力する必要がありま
す。
注: [インスペクション データ] タブでは、データ インスペクション ツールで使用するテスト入力レ
コードを指定できます。 データ インスペクションの詳細については、データフローのインスペク
ション(189ページ) を参照してください。
58
Spectrum™ Technology Platform 8.0.0
第 4 章 : ソース
1. 入力アイコンをキャンバス上にドラッグし、ダブルクリックします。 [入力オプション] ダイアログ
ボックスが表示されます。
2. [インスペクション入力] タブをクリックします。
3. 次のいずれかの方法によって、インスペクション データを入力します。
注: 最大 50 個のレコードを指定できます。 また、一部のフィールド タイプには、インスペクション
使用時の制約があります。
データ タイプ
説明
double と float
数値データのみ処理可能です。最大で 16 桁、小数点以下 6 桁までサ
ポートします。 指数表記はサポートしません。
integer と long
数値データのみ処理可能です。
• データを手動で入力する — インスペクションに数個のレコードのみを使用する場合は、データを手
動で入力できます。1 行に 1 レコードずつ入力します。
• データをファイルからインポートする — CSV または TXT ファイルのデータがある場合は、[データ
のインポート] をクリックすることによってデータをインポートできます。 データには、次のいず
れかの区切り文字を使用する必要があります。
•
•
•
•
\t
|
,
;
• データをコピーして貼り付ける — 他のアプリケーションからの区切り文字で区切られたデータをコ
ピーし、インスペクション データ エディタに貼り付けることができます。
以下に示すように、[インスペクション入力] タブでは、フィールド名を括弧で囲むことによってパス
スルー データを示します。
ユーザ ガイド
59
Read From DB
Read From DB
Read From DB ステージでは、データフローへの入力として、データベース テーブルまたはビューか
らデータを読み込みます。 ジョブとサブフローについては Read From DB を利用できますが、サービ
スでは利用できません。
[一般] タブ
フィールド名
説明
接続
使用するデータベース接続を選択します。 使用できるデータベース接
続は、Management Console の Connection Manager に定義されてい
る接続によって異なります。 新しいデータベース接続を作成、あるい
は既存のデータベース接続を変更または削除する必要がある場合は、
[管理] をクリックします。
データベース接続を追加または変更する場合は、次のフィールドに必
要な値を指定します。
接続名
接続の名前を入力します。 任意の名前にするこ
とができます。
データベース ドラ 適切なデータベース タイプを選択します。
イバ
60
Spectrum™ Technology Platform 8.0.0
第 4 章 : ソース
フィールド名
説明
接続オプション
SQL
データベースへの接続に使用するホスト、ポー
ト、インスタンス、ユーザ名、およびパスワー
ドを指定します。
このフィールドに、データフローに読み込むデータベース内のレコー
ドを特定するための SQL クエリを入力します。 手動で SQL クエリを
入力することも、[SQL の作成] をクリックして Visual Query Builder
でクエリを作成することもできます。 詳細については、Visual Query
Builder(62ページ)を参照してください。
SQL クエリに一致するレコードのサンプルを表示するには、[プレ
ビュー] をクリックします。
Read from DB でサポートされるデータ タイプ
Read from DB では、次のデータ タイプがサポートされています。
データ タイプ
説明
boolean
true と false の 2 つの 値を持つ論理タイプ。
double
-1074
正と負の倍精度数を含む数値データ タイプ。値の範囲は、2
-52
(2-2
〜
1023
。 指数表記すると、値の範囲は、4.9E-324 〜
)×2
1.7976931348623157E308 となります。 指数表記については、次のサイト
を参照してください。
http://en.wikipedia.org/wiki/Scientific_notation#E_notation
float
-149
正と負の単精度数を含む数値データ タイプ。値の範囲は、2
23
〜
127
(2-2 )×2
。 指数表記すると、値の範囲は、1.4E-45 〜 3.4028235E38 と
なります。 指数表記については、次のサイトを参照してください。
http://en.wikipedia.org/wiki/Scientific_notation#E_notation
integer
31
正と負の整数を含む数値データ タイプ。値の範囲は、-2 (-2,147,483,648)
31
〜 2 -1 (2,147,483,647)。
long
63
正と負の整数を含む数値データ タイプ。値の範囲は、-2
63
(-9,223,372,036,854,775,808) 〜 2 -1 (9,223,372,036,854,775,807)。
string
文字列
これらのデータ タイプと Spectrum™ Technology Platform データ タイプとの対応を次に示します。
ユーザ ガイド
61
Read From DB
データ タイプ
サポートされるデータ タイプ
文字列タイプ
CHAR
string
CLOB
string
DATE
string
LONGVARCHAR
string
NCHAR
string
NVARCHAR
string
TIME
string
TIMESTAMP
string
VARCHAR
string
数値タイプ
BIGINT
long
DECIMAL
double
DOUBLE
double
FLOAT
double
INTEGER
integer
NUMERIC
double
REAL
float
SMALLINT
integer
TINYINT
integer
Boolean タイプ
BIT
boolean
BOOLEAN
boolean
Visual Query Builder
Visual Query Builder は、Read from DB ステージで複雑な SQL クエリを作成するための視覚的なイン
ターフェイスを備えています。 Visual Query Builder を使用するには、SQL の概念に関する基礎知識
が必要です。
Visual Query Builder にアクセスするには、Read from DB で [SQL の作成] ボタンをクリックします。
クエリ ビルダのメイン ウィンドウは次の 2 つの部分に分かれています。
62
Spectrum™ Technology Platform 8.0.0
第 4 章 : ソース
• [Query Building] 領域は、クエリの視覚的表現が表示されるメイン領域です。 この領域を使用し
て、ソース データベース オブジェクトやそれらのオブジェクト間のリンクを定義したり、テーブル
とリンクのプロパティを設定したりできます。
• [Columns] ウィンドウは、クエリ作成領域の下にあります。 この領域を使用して、クエリ出力列お
よび式に関して必要なすべての操作を実行します。 この領域では、フィールドのエイリアスの定義、
ソートおよびグループ化、条件の定義を行うことができます。
• クエリ作成領域の上のページ コントロールを使用して、メイン クエリとサブクエリを切り替えるこ
とができます。
クエリの作成
Visual Query Builder を使用して、複雑な SQL クエリを視覚的に作成できます。 異なる結合タイプを
持つクエリや、ソート、グループ化、複合条件を持つクエリ、 およびサーバー固有のさまざまなオプ
ションを持つクエリを作成できます。
クエリへのオブジェクトの追加
オブジェクトをクエリに追加するには、データベース オブジェクトを表示するツリーを使用します。
ツリー内のオブジェクトは、データベース、スキーマ、およびタイプごとにグループ化されます。 追
加するオブジェクトを表示し、ダブルクリックして、クエリ作成領域に追加します。
オブジェクトのエイリアスの設定
クエリ内のオブジェクトまたは派生テーブルのエイリアスを設定するには、オブジェクトをダブルク
リックして、[プロパティ] を選択します。 [Datasource Properties] ダイアログが表示されます。 こ
のダイアログには、他のサーバー固有のデータソース オプションが表示されることがありますが、[エ
イリアス] プロパティはすべてのデータベース サーバーに対して同一です。
テーブルの結合
外部キー関係で参照される 2 つのオブジェクトをクエリに追加すると、これらのオブジェクトは INNER
JOIN で自動的に結合されます。 JOIN 句をサポートしていないサーバーの場合、クエリ ビルダはクエ
リの WHERE 部に条件を追加します。
2 つのオブジェクトを手動で結合するには、オブジェクトをもう一方のオブジェクトにリンクする
フィールドを選択して、もう一方のオブジェクトの対応するフィールドにドラッグします。 ドラッグ
が完了すると、リンクされたフィールドを接続する線が表示されます。 対応する関係がデータベース
内に存在する場合は、キー カーディナリティ記号がリンクの両端に配置されます。
ユーザ ガイド
63
Read From DB
オブジェクト間のリンクを削除するには、リンクの線をダブルクリックして、[削除] を選択します。
結合タイプを変更するには、リンクの線をダブルクリックします。
出力フィールドの選択
クエリ出力フィールドの一覧にフィールドを追加するには、[Query Building] 領域のデータソース
フィールド一覧でフィールド名の左側にあるボックスをオンにします。 オブジェクトのすべてのフィー
ルドを含めるには、データソース フィールド一覧でアスタリスク項目の左側にあるボックスをオンに
します。 [Query Building] 領域から [Columns] ウィンドウにフィールドをドラッグすることによっ
ても、同じ結果が得られます。
クエリ データソースからフィールドを選択しない場合、作成されるクエリの SELECT リストにアスタ
リスク項目が追加されます ("Select * From ...")。 これは、大部分のデータベース サーバーでは、列を
指定しない SELECT クエリがエラーになるためです。 フィールドを選択するか、クエリに出力式を追
加した場合、アスタリスク項目は削除されます。
ヒント: フィールドを追加するもう 1 つの方法は、[Columns] ウィンドウの [Expression] 列のドロッ
プダウン リストからフィールド名を選択することです。 [Columns] ウィンドウの [Expression]
列に有効な式を入力することもできます。 [Columns] ウィンドウに空の行を挿入するには、
Alt キーと Insert キーを同時に押します。
[Columns] ウィンドウからフィールドを削除するには、[Query Building] 領域のフィールド名の左に
あるチェック ボックスをオフにするか、[Columns] ウィンドウで Alt キーと Delete キーを同時に押し
ます。
行を上に移動するには、Alt キーと Up キーを同時に押します。 行を下に移動するには、Alt キーと
Down キーを同時に押します。
クエリの SELECT リストから式を削除するには、[Output] 列のチェック ボックスをオフにします。
64
Spectrum™ Technology Platform 8.0.0
第 4 章 : ソース
式のエイリアスを設定するには、[Alias] 列にエイリアスを入力します。 エイリアスは、生成される
データセットの列の見出しになります。
データセットのソート
生成されるデータセットをソートするには、[Columns] ウィンドウの [Sort Type] 列と [Sort Order] 列
を使用します。 [Sort Type] 列を使用すると、昇順または降順でソートできます。 [Sort Order] 列を使
用すると、複数のフィールドをソートする場合に、フィールドをソートする順序を設定できます。
フィールドによるソートを無効にするには、そのフィールドの [Sort Type] 列をオフにします。
条件の定義
条件を定義するには、[Columns] ウィンドウの [Criteria] 列と [Or] 列を使用します。 これらの列に条
件を入力する場合、式そのものは省略します。 例えば、クエリに次の条件を指定するには、
WHERE
(Field1 >= 10) AND (Field1 <= 20)
Field1 の式の [Criteria] セルに以下を入力します。
>= 10 AND <= 20
[Or] 列に配置された条件は、AND 演算子を使用して列ごとにグループ化されてから、OR 演算子を使
用して WHERE (または HAVING) 句内に連結されます。 例えば、以下に示す条件によって、次の SQL
文が生成されます。 Field1 に対する条件が [Criteria] 列と [Or] 列の両方に配置されることに注意して
ください。
WHERE (Field1= 10) AND ((Field2 < 0) OR (Field2 > 10))
EXISTS 句など、一部の式は Boolean タイプであることがあります。 その場合は、そのような式の
[Criteria] 列に "= True" と入力するか、式の前に NOT 演算子を配置する場合は "= False" と入力する必
要があります。
出力フィールドのグループ化
グループ化を使用するクエリを作成するには、[Grouping] チェック ボックスを使用してグループ化す
る式をマークします。
グループ化を使用するクエリでは、グループ化または集計する式のみを SELECT リストに表示できま
す。 したがって、クエリ ビルダを使用すると、式をグループ化および集計する [Output] チェック ボッ
クスをオンにできます。 グループ化または集計関数が設定されていない列に対してこのチェック ボッ
クスをオンにしようとした場合、[Grouping] チェック ボックスが自動的にオンになり、生成される
SQL クエリの妥当性が維持されます。
[Columns] ウィンドウに [Grouping] チェック ボックスがオンの列が含まれる場合、[Criteria for] と
いう新しい列がグリッドに表示されます。 この列は、条件を式グループまたはその値に適用します。
ユーザ ガイド
65
Read From File
例えば、Aggregate 関数 "Avg" が設定された列 "Quantity" がクエリにあり、[Criteria] 列に > 10 と入
力します。 [Criteria for] 列に "for groups" 値を設定すると、生成されるクエリには、平均数量が 10 よ
り大きいグループのみが含まれ、クエリの HAVING 句に "Avg(Quantity) > 10" という条件が含まれる
ようになります。 [Criteria for] 列に "for values" 値を設定すると、生成されるクエリは Quantity 値が
10 より大きいレコードに対してのみ Average 集計関数を計算し、クエリの WHERE 句に "Quantity >
10" という条件が含まれるようになります。
SQL クエリ プロパティの定義
[Query Building] 領域のコンテキスト ポップアップ メニューを使用して、データベース サーバーに
固有のオプションを定義できます。
Read From File
Read from File ステージでは、ジョブまたはサブフローの入力ファイルを指定します。 これをサービ
スで使うことはできません。
注: データフローの入力として XML ファイルを使いたい場合は、Read from File ではなく Read from
XML ステージを使用してください。
[ファイル プロパティ] タブ
フィールド名
説明
サーバ名
[ファイル名] フィールドで選択したファイルが Enterprise Designer を
実行しているコンピュータ上にあるか、Spectrum™ Technology
Platform サーバー上にあるかを示します。 ローカル コンピュータ上
のファイルを選択した場合、サーバー名はマイ コンピュータになりま
す。 サーバー上のファイルを選択した場合、サーバー名は Spectrum™
Technology Platform になります。
ファイル名
ファイルへのパスを指定します。 省略記号ボタン (...) をクリックし、
必要なファイルを参照して選択します。
注: なお、Spectrum™ Technology Platform サーバーを実行している
プラットフォームが Unix または Linux の場合、これらのプラッ
トフォームでファイル名およびパスの大文字と小文字が区別され
ることに注意してください。
レコード タイプ
66
ファイル内のレコードのフォーマット。 次のいずれかです。
Spectrum™ Technology Platform 8.0.0
第 4 章 : ソース
フィールド名
説明
行順次
ファイル内の各レコードが復帰/改行 (CR/LF) などの行
末 (EOL) 文字で区切られ、レコード内の各フィールド
の開始文字位置と終了文字位置が固定しているテキスト
ファイル。
固定長
ファイル内の各レコードの長さ (文字数) が一定で、レ
コード内の各フィールドの開始文字位置と終了文字位置
が固定しているテキスト ファイル。
区切り記号 ファイル内の各レコードが復帰/改行 (CR/LF) などの行
付き
末 (EOL) 文字で区切られ、レコード内の各フィールド
がカンマ (,) などの特定の文字で区切られているテキス
ト ファイル。
文字エンコーディング
テキスト ファイルのエンコーディング。 次のいずれかです。
UTF-8
すべての Unicode 文字をサポートし、かつ ASCII との
下位互換性があります。 UTF の詳細については、
unicode.org/faq/utf_bom.html を参照してください。
UTF-16
すべての Unicode 文字をサポートします。しかし、
ASCII との下位互換性はありません。 UTF の詳細につ
いては、unicode.org/faq/utf_bom.html を参照してく
ださい。
US-ASCII
英語のアルファベット順に従う文字エンコーディング。
UTF-16BE
ビッグエンディアン UTF-16 エンコーディング (下位ア
ドレスが上位バイトとなるようにシリアル化)。
UTF-16LE
リトルエンディアン UTF-16 エンコーディング (下位ア
ドレスが下位バイトとなるようにシリアル化)。
ISO-8859-1 主として西ヨーロッパの言語で使われる ASCII 準拠の
文字エンコーディング。 Latin-1 とも呼ばれます。
ユーザ ガイド
CP850
西ヨーロッパの言語を書くための ASCII コード ペー
ジ。
CP500
西ヨーロッパの言語を書くための EBCDIC コード ペー
ジ。
Shift_JIS
日本語のための文字エンコーディング。
67
Read From File
フィールド名
説明
フィールド区切り文字
区切り記号付きファイル内のフィールドを区切るのに使用する文字を
指定します。 例えば、次のレコードでは (|) 記号がフィールド区切り
文字として使われています。
7200 13TH ST|MIAMI|FL|33144
デフォルトで、フィールド区切り文字として定義できるのは次の文字
です。
• スペース
• タブ
• カンマ (,)
• ピリオド (.)
• セミコロン (;)
• パイプ (|)
これ以外の文字がフィールド区切り文字として使われているファイル
については、省略記号ボタン (...) をクリックし、別の文字を区切り文
字として選択してください。
テキスト修飾子
区切り記号付きファイル内のテキスト値を囲むのに使用する文字。 例
えば、次のレコードでは二重引用符 (") がテキスト修飾子として使わ
れています。
"7200 13TH ST"|"MIAMI"|"FL"|"33144"
デフォルトで、テキスト修飾子として定義できるのは次の文字です。
• 一重引用符 (')
• 二重引用符 (")
これ以外の文字がテキスト修飾子として使われているファイルについ
ては、省略記号ボタン (...) をクリックし、別の文字をテキスト修飾子
として選択してください。
レコード区切り文字
順次ファイルまたは区切り記号付きファイル内のレコードを区切るの
に使用する文字を指定します。 [デフォルトの EOL を使用] チェック
ボックスをオンにすると、このフィールドは使用できません。 デフォ
ルトで使用できるレコード区切り文字の設定は次のとおりです。
Unix (U+000A)
68
改行 (LF) 文字でレコードを区切ります。 これは
Unix システムの標準のレコード区切り文字です。
Spectrum™ Technology Platform 8.0.0
第 4 章 : ソース
フィールド名
説明
Macintosh
(U+000D)
復帰 (CR) 文字でレコードを区切ります。 これは
Macintosh システムの標準のレコード区切り文字
です。
Windows
(U+000D
U+000A)
復帰改行 (CR+LF) でレコードを区切ります。 こ
れは Windows システムの標準のレコード区切り文
字です。
これ以外の文字がレコード区切り文字として使われているファイルに
ついては、省略記号ボタン (...) をクリックし、別の文字をレコード区
切り文字として選択してください。
デフォルトの EOL を使用
Spectrum™ Technology Platform サーバーが実行されているオペレー
ティング システムのデフォルトの行末 (EOL) 文字をファイルのレコー
ド区切り文字として使用します。
ファイルの EOL 文字がサーバーのオペレーティング システムで使わ
れているデフォルトの EOL 文字と異なる場合は、このオプションを
オンにしないでください。 例えば、ファイルで Windows の EOL が使
われていて、サーバーの動作プラットフォームが Linux の場合は、こ
のオプションをオンにしないでください。 代わりに、[レコード区切
り文字] フィールドで [Windows] オプションを選択します。
レコード長
固定長ファイルでは、個々のレコードの文字数を指定します。
行順次ファイルでは、ファイル内の最も長いレコードの長さ (文字数)
を指定します。
最初の行はヘッダ レコード
区切り記号付きファイルの先頭レコードの内容がデータではなくヘッ
ダ情報であるかどうかを指定します。 次は、先頭レコードのヘッダ行
の例です。
"AddressLine1"|"City"|"StateProvince"|"PostalCode"
"7200 13TH ST"|"MIAMI"|"FL"|"33144"
"One Global View"|"Troy"|"NY"|12180
フィールド数が定義よりも少 区切り記号付きファイルのレコードのうち、[フィールド] タブに定義
ないレコードを、形式誤りと されている数よりもフィールド数が少ないレコードを形式に誤りのあ
みなす
るレコードとみなします。 形式に誤りのあるレコードの詳細について
は、形式に誤りのある入力レコードの管理(52ページ)を参照してく
ださい。
ユーザ ガイド
69
Read From File
フィールド名
説明
インポート
このオプションでは、以前作成した xml ファイルから、[ファイル プ
ロパティ] タブ (サーバー名とファイル名を除く)、[フィールド] タブ、
および [ソート フィールド] タブのすべての設定を取得できます。 こ
れは、同じ入力ファイル、または現在操作しているファイルと同じ特
性を持つファイルを使用する別の Read from File ステージまたは Write
to File ステージから設定をエクスポートすることによって作成される
ファイルです。
エクスポート
このオプションでは、[ファイル プロパティ] タブ (サーバー名とファ
イル名を除く)、[フィールド] タブ、および [ソート フィールド] タブ
のすべての設定を xml ファイルに保存できます。 その後、同じ入力
ファイル、または現在操作しているファイルと同じ特性を持つファイ
ルを使用する他の Read from File ステージまたは Write to File ステー
ジにこれらの設定をインポートできます。
XML のインポート/エクスポート
Read from File ステージまたは Write to File ステージから設定をエクスポートすると、データは XML
ファイルに保存されます。 その XML ファイルのスキーマを以下に示します。 XML ファイル内の各要
素はタイプを持ちます。そのタイプが文字列または整数以外の場合、許容できる値が表示されていま
す。 これらの値は、そのステージのダイアログ ボックスのオプションに直接対応しています。 例え
ば、FileTypeEnum 要素は [ファイル プロパティ] タブの [レコード タイプ] フィールドに対応してお
り、 linesequential、fixedwidth、delimited という 3 つの値がスキーマに表示されます。
注: LineSeparator フィールド、FieldSeparator フィールド、または TextQualifier フィールドに対し
て "custom" と入力した場合、対応するカスタム要素 (例えば
"CustomLineSeparator"、"CustomFieldSeparator"、"CustomTextQualifier" など) も使用する文字
または文字列を表す 16 進数とともに含める必要があります。
<?xml version="1.0" encoding="utf-8"?>
<xs:schema elementFormDefault="qualified"
xmlns:xs="http://www.w3.org/2001/XMLSchema">
<xs:element name="FileSchema" nillable="true" type="FileSchema" />
<xs:complexType name="FileSchema">
<xs:sequence>
<xs:element
minOccurs="0"
maxOccurs="1"
default="linesequential"
name="Type"
type="FileTypeEnum" />
<xs:element
minOccurs="0"
maxOccurs="1"
default="UTF-8" name="Encoding" type="xs:string" />
<xs:element
70
Spectrum™ Technology Platform 8.0.0
第 4 章 : ソース
minOccurs="0"
maxOccurs="1"
name="RecordLength"
type="xs:int" />
<xs:element
minOccurs="0"
maxOccurs="1"
default="default"
name="LineSeparator"
type="LineSeparatorEnum" />
<xs:element
minOccurs="0"
maxOccurs="1"
name="CustomLineSeparator"
type="xs:string" />
<xs:element
minOccurs="0"
maxOccurs="1"
default="comma"
name="FieldSeparator"
type="FieldSeparatorEnum" />
<xs:element
minOccurs="0"
maxOccurs="1"
name="CustomFieldSeparator"
type="xs:string" />
<xs:element
minOccurs="0"
maxOccurs="1"
default="none"
name="TextQualifier"
type="TextQualifierEnum" />
<xs:element
minOccurs="0"
maxOccurs="1"
name="CustomTextQualifier"
type="xs:string" />
<xs:element
minOccurs="0"
maxOccurs="1"
default="false"
name="HasHeader"
type="xs:boolean" />
<xs:element
minOccurs="0"
maxOccurs="1"
default="true"
name="EnforceColumnCount"
type="xs:boolean" />
<xs:element
minOccurs="0"
maxOccurs="1"
name="Fields"
type="ArrayOfFieldSchema" />
</xs:sequence>
</xs:complexType>
<xs:simpleType name="FileTypeEnum">
<xs:restriction base="xs:string">
<xs:enumeration value="linesequential" />
<xs:enumeration value="fixedwidth" />
<xs:enumeration value="delimited" />
ユーザ ガイド
71
Read From File
</xs:restriction>
</xs:simpleType>
<xs:simpleType name="LineSeparatorEnum">
<xs:restriction base="xs:string">
<xs:enumeration value="default" />
<xs:enumeration value="windows" />
<xs:enumeration value="unix" />
<xs:enumeration value="mac" />
<xs:enumeration value="custom" />
</xs:restriction>
</xs:simpleType>
<xs:simpleType name="FieldSeparatorEnum">
<xs:restriction base="xs:string">
<xs:enumeration value="comma" />
<xs:enumeration value="tab" />
<xs:enumeration value="space" />
<xs:enumeration value="semicolon" />
<xs:enumeration value="period" />
<xs:enumeration value="pipe" />
<xs:enumeration value="custom" />
</xs:restriction>
</xs:simpleType>
<xs:simpleType name="TextQualifierEnum">
<xs:restriction base="xs:string">
<xs:enumeration value="none" />
<xs:enumeration value="single" />
<xs:enumeration value="double" />
<xs:enumeration value="custom" />
</xs:restriction>
</xs:simpleType>
<xs:complexType name="ArrayOfFieldSchema">
<xs:sequence>
<xs:element
minOccurs="0"
maxOccurs="unbounded"
name="Field"
nillable="true"
type="FieldSchema" />
</xs:sequence>
</xs:complexType>
<xs:complexType name="FieldSchema">
<xs:sequence>
<xs:element
minOccurs="0"
maxOccurs="1"
name="Name"
type="xs:string" />
<xs:element
minOccurs="0"
maxOccurs="1"
default="string"
name="Type"
type="xs:string" />
<xs:element
minOccurs="1"
maxOccurs="1"
name="Position"
type="xs:int" />
<xs:element
minOccurs="0"
maxOccurs="1"
72
Spectrum™ Technology Platform 8.0.0
第 4 章 : ソース
name="Length"
type="xs:int" />
<xs:element
minOccurs="0"
maxOccurs="1"
default="false"
name="Trim"
type="xs:boolean" />
<xs:element
minOccurs="0"
maxOccurs="1"
default="none"
name="Order"
type="SortOrderEnum" />
</xs:sequence>
</xs:complexType>
<xs:simpleType name="SortOrderEnum">
<xs:restriction base="xs:string">
<xs:enumeration value="none" />
<xs:enumeration value="ascending" />
<xs:enumeration value="descending" />
</xs:restriction>
</xs:simpleType>
</xs:schema>
[フィールド] タブ
[フィールド] タブでは、ファイル内の各フィールドの名前と位置を定義します。また、固定長ファイ
ルと行順次ファイルについては、さらにフィールドの長さを定義します。 詳細については、以下を参
照してください。
区切り記号付き入力ファイルのフィールドの定義(74ページ)
行順次ファイルまたは固定長ファイルのフィールドの定義(75ページ)
[ソート フィールド] タブ
[ソート フィールド] タブでは、データフローに送出される前の入力レコードのソートに使うフィール
ドを定義します。 ソートを行うかどうかはオプションです。 詳細については、入力レコードのソート
(77ページ)を参照してください。
[実行時] タブ
フィールド名
説明
ファイル名
[ファイル プロパティ] タブで定義したファイルです。
開始レコード
レコードをデータフローに読み込むときファイルの先頭部分にあるレ
コードをスキップしたければ、読み込みたい最初のレコードを指定し
ます。 例えば、最初の 50 個のレコードをスキップする場合は 51 と
指定します。 これで 51 番目のレコードがデータフローに読み込まれ
る最初のレコードとなります。
ユーザ ガイド
73
Read From File
フィールド名
説明
すべてのレコード
[開始レコード] フィールドで指定したレコードからファイルの最後ま
でのレコードをすべて読み込む場合は、このオプションをオンにしま
す。
最大レコード数
[開始レコード] フィールドで指定したレコードを起点にそこから一定
の数のレコードを読み込む場合は、このオプションをオンにします。
例えば、最初の 100 個のレコードを読み込みたい場合は、このオプ
ションをオンにして 100 と入力します。
区切り記号付き入力ファイルのフィールドの定義
Read from File ステージで、[フィールド] タブを使い、ファイル内の各フィールドの名前と位置、ま
たファイルの種類によっては、さらにフィールドの長さを定義します。
1. [ファイル プロパティ] タブで入力ファイルを定義します。
2. 入力ファイルにヘッダ レコードが含まれている場合は、[再生成] をクリックするだけでフィール
ドを簡単に定義できます。 入力ファイルにヘッダ レコードが含まれていない場合、またはフィー
ルドを手動で定義したい場合は、以下のステップを続けます。
3. [追加] をクリックします。
4. [名前] フィールドで、追加したいフィールドを選択します。
5. [タイプ] フィールドで、フィールドのデータ タイプを選択します。
Spectrum™ Technology Platform は、string タイプのデータの他に、以下のデータ タイプをサポー
トしています。
表 5 : データ タイプの値
74
タイプ
説明
boolean
true と false の 2 つの 値を持つ論理タイプ。 Boolean 変数は、条件
文で処理の流れを制御するために使用できます。 次のコードは、
Boolean 式の例を示したものです。
if(x && y)
z=1;
else if(x)
z=2;
else if(y)
z=3;
else
z=4;
Spectrum™ Technology Platform 8.0.0
第 4 章 : ソース
タイプ
double
説明
-1074
正と負の倍精度数を含む数値データ タイプ。値の範囲は、2
〜
-52
1023
(2-2 )×2
。 指数表記すると、値の範囲は、4.9E-324 〜
1.7976931348623157E308 となります。 指数表記については、次の
サイトを参照してください。
http://en.wikipedia.org/wiki/Scientific_notation#E_notation
float
-149
正と負の単精度数を含む数値データ タイプ。値の範囲は、2
〜
23
127
(2-2 )×2 。 指数表記すると、値の範囲は、1.4E-45 〜
3.4028235E38 となります。 指数表記については、次のサイトを参
照してください。
http://en.wikipedia.org/wiki/Scientific_notation#E_notation
31
integer
正と負の自然数を含む数値データ タイプ。値の範囲は、-2
31
(-2,147,483,648) 〜 2 -1 (2,147,483,647)。
long
正と負の自然数を含む数値データ タイプ。値の範囲は、-2
63
(-9,223,372,036,854,775,808) 〜 2 -1 (9,223,372,036,854,775,807)。
63
6. [位置] フィールドで、レコード内のこのフィールドの位置を入力します。
例えば、この入力ファイルで、AddressLine1 は位置 1、City は位置 2、StateProvince は位置 3、
PostalCode は位置 4 です。
"AddressLine1"|"City"|"StateProvince"|"PostalCode"
"7200 13TH ST"|"MIAMI"|"FL"|"33144"
"One Global View"|"Troy"|"NY"|12180
7. フィールドの文字列の先頭と末尾から余分なスペース文字を削除するには、[空白をトリム] チェッ
ク ボックスを選択します。
8. [追加] をクリックします。
行順次ファイルまたは固定長ファイルのフィールドの定義
Read from File ステージで、[フィールド] タブを使い、ファイル内の各フィールドの名前と位置、ま
たファイルの種類によっては、さらにフィールドの長さを定義します。
1. [ファイル プロパティ] タブで入力ファイルを定義します。
2. [プレビュー] で、フィールドの先頭をクリックして左へドラッグすると、次のようにフィールドが
ハイライト表示されます。
ユーザ ガイド
75
Read From File
3. [名前] フィールドで、追加したいフィールドを選択します。
4. [タイプ] フィールドで、フィールドのデータ タイプを選択します。
Spectrum™ Technology Platform は、string タイプのデータの他に、以下のデータ タイプをサポー
トしています。
表 6 : データ タイプの値
タイプ
説明
boolean
true と false の 2 つの 値を持つ論理タイプ。 Boolean 変数は、条件
文で処理の流れを制御するために使用できます。 次のコードは、
Boolean 式の例を示したものです。
if(x && y)
z=1;
else if(x)
z=2;
else if(y)
z=3;
else
z=4;
double
-1074
正と負の倍精度数を含む数値データ タイプ。値の範囲は、2
〜
-52
1023
(2-2 )×2
。 指数表記すると、値の範囲は、4.9E-324 〜
1.7976931348623157E308 となります。 指数表記については、次の
サイトを参照してください。
http://en.wikipedia.org/wiki/Scientific_notation#E_notation
float
-149
正と負の単精度数を含む数値データ タイプ。値の範囲は、2
〜
23
127
(2-2 )×2 。 指数表記すると、値の範囲は、1.4E-45 〜
3.4028235E38 となります。 指数表記については、次のサイトを参
照してください。
http://en.wikipedia.org/wiki/Scientific_notation#E_notation
integer
76
31
正と負の自然数を含む数値データ タイプ。値の範囲は、-2
31
(-2,147,483,648) 〜 2 -1 (2,147,483,647)。
Spectrum™ Technology Platform 8.0.0
第 4 章 : ソース
タイプ
説明
long
正と負の自然数を含む数値データ タイプ。値の範囲は、-2
63
(-9,223,372,036,854,775,808) 〜 2 -1 (9,223,372,036,854,775,807)。
63
5. [開始位置] フィールドと [長さ] フィールドは、ファイル プレビューでの選択操作に応じて自動的
に設定されます。
6. フィールドの文字列の先頭と末尾から余分なスペース文字を削除するには、[空白をトリム] チェッ
ク ボックスを選択します。
7. [OK] をクリックします。
入力レコードのソート
Read from File ステージで、[ソート フィールド] タブを使い、データフローに送出される前の入力レ
コードのソートに使うフィールドを定義します。 ソートを行うかどうかはオプションです。
1. Read from File で、[ソート フィールド] タブをクリックします。
2. [追加] をクリックします。
3. [フィールド名] 列のドロップダウン矢印をクリックし、ソートに使うフィールドを選択します。
選択できるフィールドは、この入力ファイルに定義されているフィールドによって異なります。
4. [順序] 列で、昇順または降順を選択します。
5. ソートに使用するすべての入力フィールドを追加するまでこれを繰り返します。 ソート順序を変
更するには、移動するフィールドの行をハイライト表示して、[上へ] または [下へ] をクリックし
ます。
6. システムのデフォルトのソート パフォーマンス オプションの設定は、Management Console で行
います。 システムのデフォルトのソート パフォーマンス オプションをオーバーライドする場合
は、[詳細設定] をクリックします。 [詳細オプション] ダイアログ ボックスには、次のソート パ
フォーマンス オプションがあります。
•
メモリ内レコードの上限値 — ソートでメモリ内に保持できるデータ行の最大数を指定します。
この上限を越えると、ディスクにページングします。 複数のジョブを同時並行で実行する環境
では、[メモリ内レコードの上限値] の設定を増やすと、メモリ不足になる可能性が高くなりま
す。
•
使用する一時ファイルの最大数 — ソート プロセスで使用できる一時ファイルの最大数を指定
します。
•
圧縮を有効にする — 一時ファイルをディスクに書き込むときに圧縮します。
注: 最適なソート パフォーマンスの設定は、サーバーのハードウェア構成によって異なります。
それでも一般には、次の式で妥当なソート パフォーマンスが得られます。
(InMemoryRecordLimit × MaxNumberOfTempFiles ÷ 2) >= TotalNumberOfRecords
ユーザ ガイド
77
Read from Variable Format File
Read from Variable Format File
Read from Variable Format File は、さまざまなレイアウトのレコードを含むファイルからデータを読
み込みます。 各レコードは、リスト フィールドとして読み込まれます。 親レコード タイプを示すタ
グを指定でき、それ以外のすべてのレコード タイプが親の下のリスト フィールドになります。
可変フォーマット ファイルには、次の特性があります。
• ファイル内のレコードは、異なるフィールド、および異なる数のフィールドを持つことができる。
• すべてのレコードの先頭フィールドには、レコードのタイプを識別するタグ (通常は数字) を含める
必要がある。
• レコード内のフィールドは、カンマなどの区切り文字で区切る必要がある。
• 階層的な関係をサポートしている。
• すべてのレコードにレコード区切り文字 (通常は CRLF) がある。
可変フォーマット ファイルの例
次の例は、2 人の顧客 Joe Smith と Anne Johnson のアカウント確認アクティビ
ティに関する情報を含む、可変フォーマット ファイルを示しています。
001
100
200
001
100
200
200
Joe,Smith,M,100 Main St,555-234-1290
CHK12904567,12/2/2007,6/1/2012,CHK
1000567,1/5/2012,Fashion Shoes,323.12
Anne,Johnson,F,1202 Lake St,555-222-4932
CHK238193875,1/21/2001,4/12/2012,CHK
1000232,3/5/2012,Blue Goose Grocery,132.11
1000232,3/8/2012,Trailway Bikes,540.00
各レコードの先頭フィールドには、レコードのタイプ、およびレコードのフォー
マットを識別するタグが含まれています。
• 001: 顧客レコード
• 100: アカウント レコード
• 200: アカウント トランザクション レコード
注: 区切り記号付きファイルにおいて、上の例に示すように、タグ値 (001、100、
200) をレコード先頭の固定長バイトに含めることは一般的です。
各レコードには独自のフォーマットがあります。
• 001: FirstName、LastName、Gender、Address、PhoneNumber
• 100: AccountID、DateOpened、ExpirationDate、TypeOfAccount
• 200: TransactionID、DateOfTransaction、Vendor、Amount
レコード フォーマット 100 (アカウント レコード) と 200 (アカウント トランザ
クション レコード) は、前のレコード 001 (顧客レコード) の子です。 したがっ
て、例のファイルでは、Joe Smith のアカウント CHK12904567 に Fashion Shoes
78
Spectrum™ Technology Platform 8.0.0
第 4 章 : ソース
で 2012/1/5 に数量 323.12 のトランザクションが発生していました。 同様に、
Anne Johnson のアカウント CHK238193875 には、Blue Goose Grocery で
2012/3/5 に 1 つ、Trailway Bikes で 2012/3/8 に 1 つのトランザクションが発生
していました。
[ファイル プロパティ] タブ
オプション名
説明
サーバ名
[ファイル名] フィールドで選択したファイルが Enterprise Designer を
実行しているコンピュータ上にあるか、Spectrum™ Technology
Platform サーバー上にあるかを示します。 ローカル コンピュータ上
のファイルを選択した場合、サーバー名はマイ コンピュータになりま
す。 サーバー上のファイルを選択した場合、サーバー名は Spectrum™
Technology Platform になります。
ファイル名
ファイルへのパスを指定します。 省略記号ボタン (...) をクリックし、
必要なファイルを参照して選択します。
注: なお、Spectrum™ Technology Platform サーバーを実行している
プラットフォームが Unix または Linux の場合、これらのプラッ
トフォームでファイル名およびパスの大文字と小文字が区別され
ることに注意してください。
ルート タグ名
他のレコード タイプの親であるレコードに対して使用するタグ。 例
えば、3 つのレコード タイプ 001、100、200 があり、レコード タイ
プ 100 および 200 がレコード タイプ 001 の子である場合、001 はルー
ト タグです。
固定長タグを使用
レコード タグを配置する各レコードの先頭に固定長スペースを割り当
てるかどうかを指定します。 例えば、以下は、固定長フィールドにタ
グ 001、100、200 を持つファイルを示しています。
001
100
200
タグ長
ユーザ ガイド
Joe,Smith,M,100 Main St,555-234-1290
CHK12904567,12/2/2007,6/1/2012,CHK
1000567,1/5/2012,Mike's Shoes,323.12
[固定長タグを使用] ボックスをオンにした場合、各レコードの先頭で
タグに対して割り当てるスペースの数を指定します。 例えば、7 を指
定した場合は、各レコードの最初の 7 つのスペースがタグに対して予
約されます。 指定する値は、最も長いタグ名の文字の数以上でなけれ
ばなりません。
79
Read from Variable Format File
オプション名
説明
[ルート タグ名] フィールドのタグ名を長くした場合、[タグ長] フィー
ルドの値は自動的に増えます。
最大タグ長は 1024 です。
文字エンコーディング
テキスト ファイルのエンコーディング。 次のいずれかです。
UTF-8
すべての Unicode 文字をサポートし、かつ ASCII との
下位互換性があります。 UTF の詳細については、
unicode.org/faq/utf_bom.html を参照してください。
UTF-16
すべての Unicode 文字をサポートします。しかし、
ASCII との下位互換性はありません。 UTF の詳細につ
いては、unicode.org/faq/utf_bom.html を参照してく
ださい。
US-ASCII
英語のアルファベット順に従う文字エンコーディング。
UTF-16BE
ビッグエンディアン UTF-16 エンコーディング (下位ア
ドレスが上位バイトとなるようにシリアル化)。
UTF-16LE
リトルエンディアン UTF-16 エンコーディング (下位ア
ドレスが下位バイトとなるようにシリアル化)。
ISO-8859-1 主として西ヨーロッパの言語で使われる ASCII 準拠の
文字エンコーディング。 Latin-1 とも呼ばれます。
フィールド区切り文字
CP850
西ヨーロッパの言語を書くための ASCII コード ペー
ジ。
CP500
西ヨーロッパの言語を書くための EBCDIC コード ペー
ジ。
Shift_JIS
日本語のための文字エンコーディング。
区切り記号付きファイル内のフィールドを区切るのに使用する文字を
指定します。 例えば、次のレコードでは (|) 記号がフィールド区切り
文字として使われています。
7200 13TH ST|MIAMI|FL|33144
デフォルトで、フィールド区切り文字として定義できるのは次の文字
です。
• スペース
• タブ
• カンマ (,)
80
Spectrum™ Technology Platform 8.0.0
第 4 章 : ソース
オプション名
説明
• ピリオド (.)
• セミコロン (;)
• パイプ (|)
これ以外の文字がフィールド区切り文字として使われているファイル
については、省略記号ボタン (...) をクリックし、別の文字を区切り文
字として選択してください。
テキスト修飾子
区切り記号付きファイル内のテキスト値を囲むのに使用する文字。 例
えば、次のレコードでは二重引用符 (") がテキスト修飾子として使わ
れています。
"7200 13TH ST"|"MIAMI"|"FL"|"33144"
デフォルトで、テキスト修飾子として定義できるのは次の文字です。
• 一重引用符 (')
• 二重引用符 (")
これ以外の文字がテキスト修飾子として使われているファイルについ
ては、省略記号ボタン (...) をクリックし、別の文字をテキスト修飾子
として選択してください。
レコード区切り文字
順次ファイルまたは区切り記号付きファイル内のレコードを区切るの
に使用する文字を指定します。 [デフォルトの EOL を使用] チェック
ボックスをオンにすると、このフィールドは使用できません。 デフォ
ルトで使用できるレコード区切り文字の設定は次のとおりです。
Unix (U+000A)
改行 (LF) 文字でレコードを区切ります。 これは
Unix システムの標準のレコード区切り文字です。
Macintosh
(U+000D)
復帰 (CR) 文字でレコードを区切ります。 これは
Macintosh システムの標準のレコード区切り文字
です。
Windows
(U+000D
U+000A)
復帰改行 (CR+LF) でレコードを区切ります。 こ
れは Windows システムの標準のレコード区切り文
字です。
これ以外の文字がレコード区切り文字として使われているファイルに
ついては、省略記号ボタン (...) をクリックし、別の文字をレコード区
切り文字として選択してください。
ユーザ ガイド
81
Read from Variable Format File
オプション名
説明
デフォルトの EOL を使用
Spectrum™ Technology Platform サーバーが実行されているオペレー
ティング システムのデフォルトの行末 (EOL) 文字をファイルのレコー
ド区切り文字として使用します。
ファイルの EOL 文字がサーバーのオペレーティング システムで使わ
れているデフォルトの EOL 文字と異なる場合は、このオプションを
オンにしないでください。 例えば、ファイルで Windows の EOL が使
われていて、サーバーの動作プラットフォームが Linux の場合は、こ
のオプションをオンにしないでください。 代わりに、[レコード区切
り文字] フィールドで [Windows] オプションを選択します。
フィールド数が定義よりも少 このオプションを有効にすると、完全なレコードより少ない数のフィー
ないレコードを、形式誤りと ルドを含む子レコードは形式誤りと見なされます。 次のルート タグ
みなす
までの処理で形式誤りレコードが発生すると、その間にあるすべての
子タグが無視されます。 例外は、行番号とともに、形式誤りの子レ
コードについての情報を格納するログに書き出されます。 次の場合、
レコードは形式誤りと見なされます。
注: このオプションが有効かどうかにかかわらず、次の場合にはレ
コードは常に形式誤りと見なされます。
• タグが不明である
• 行が空である
• データを持たないタグがある
[フィールド] タブ
[フィールド] タブでは、ファイルから読み込む各フィールドをどのように扱うかを指定します。
表 7 : [フィールド] タブ
82
オプション名
説明
フィルタ
参照のしやすさを考慮してフィールドの一覧をフィルタリングしま
す。 フィルタを設定しても、どのフィールドがデータフローに読み込
まれるかには影響しません。 参照のしやすさを考慮してフィールドの
一覧をフィルタリングするだけです。
再生成
クリックすると、[ファイル プロパティ] タブで指定したファイルの
フィールドがフィールド一覧に設定されます。 最初の 50 個のレコー
Spectrum™ Technology Platform 8.0.0
第 4 章 : ソース
オプション名
説明
ドがフィールド一覧の生成に使用されます。 フィールド一覧を生成す
るため、入力ファイルには少なくとも 2 つのルート タグを含める必要
があります。
子フィールドは、すべてのルート タグの子タグを結合したものを使用
して識別されます。 例えば、最初のルート タグに子タグ Tag1 と Tag2
があり、2 つ目のルート タグに子タグ Tag1 と Tag 3 がある場合、
フィールド一覧には子フィールドとして Tag1、Tag2、Tag3 が表示さ
れます。
親タグ
フィールドを表示するレコード タイプを示す、入力ファイルのタグ。
フィールド
データフローでフィールドのために使われる名前。 デフォルトでは、
親タグのレコード タイプに存在するフィールドには Column1、
Column2 のような名前が与えられます。
フィールド名を変更するには、ダブルクリックして新しいフィールド
名を入力します。 通常は、デフォルト名をフィールド内のデータを表
す意味のある名前で置き換えます。 例えば、次の入力データを考えて
みましょう。
001
Joe,Smith,M,100 Main St,555-234-1290
このレコードには親タグ 001 があり、デフォルトでは次のフィールド
名が作成されます。
Column1: Joe
Column2: Smith
Column3: M
Column4: 100 Main St
Column5: 555-234-1290
名前がデータを説明するように、フィールド名を変更します。 例:
FirstName: Joe
LastName: Smith
Gender: M
AddressLine1: 100 Main St
PhoneNumber: 555-234-1290
注: リスト フィールド名は変更できません。 リスト フィールドには
指定されたレコード タイプのすべてのフィールドが含まれるた
め、フィールド名として常に入力ファイルのタグ名が使用されま
す。 タグ名が数値の場合、フィールド名の先頭に NumericTag_
ユーザ ガイド
83
Read from Variable Format File
オプション名
説明
というテキストが追加されます。 例えば、タグ 001 の名前は
NumericTag_001 となります。
タイプ
フィールドのデータ タイプ。 次のいずれかです。
データ タイプ
説明
boolean
true と false の 2 つの 値を持つ論理タイプ。
double
正と負の倍精度数を含む数値データ タイプ。値の
-1074
-52
1023
範囲は、2
〜 (2-2 )×2
。 指数表記すると、
値の範囲は、4.9E-324 〜 1.7976931348623157E308
となります。 指数表記については、次のサイトを
参照してください。
http://en.wikipedia.org/wiki/Scientific_notation#E_notation
float
正と負の単精度数を含む数値データ タイプ。値の
-149
23
127
範囲は、2
〜 (2-2 )×2 。 指数表記すると、
値の範囲は、1.4E-45 〜 3.4028235E38 となりま
す。 指数表記については、次のサイトを参照して
ください。
http://en.wikipedia.org/wiki/Scientific_notation#E_notation
integer
正と負の整数を含む数値データ タイプ。値の範囲
31
31
は、-2 (-2,147,483,648) 〜 2 -1 (2,147,483,647)。
long
正と負の整数を含む数値データ タイプ。値の範囲
63
63
は、-2 (-9,223,372,036,854,775,808) 〜 2 -1
(9,223,372,036,854,775,807)。
string
文字列
この他に、リスト タイプがあります。 リスト フィールドは、データ
内の子レコード タイプを表します。 厳密に言えば、リストはデータ
タイプではありません。 しかし、フィールドが階層データを含む場
合、"リスト" フィールドとして扱われます。
84
Spectrum™ Technology Platform 8.0.0
第 4 章 : ソース
[実行時] タブ
フィールド名
説明
ファイル名
[ファイル プロパティ] タブで定義したファイルです。
開始レコード
レコードをデータフローに読み込むときファイルの先頭部分にあるレ
コードをスキップしたければ、読み込みたい最初のレコードを指定し
ます。 例えば、最初の 50 個のレコードをスキップする場合は 51 と
指定します。 これで 51 番目のレコードがデータフローに読み込まれ
る最初のレコードとなります。
すべてのレコード
[開始レコード] フィールドで指定したレコードからファイルの最後ま
でのレコードをすべて読み込む場合は、このオプションをオンにしま
す。
最大レコード数
[開始レコード] フィールドで指定したレコードを起点にそこから一定
の数のレコードを読み込む場合は、このオプションをオンにします。
例えば、最初の 100 個のレコードを読み込みたい場合は、このオプ
ションをオンにして 100 と入力します。
可変フォーマット データのフラット化
多くの場合、可変フォーマット ファイル データには、1 つのレコード タイプがその他すべてのレコー
ド タイプの親となっている、階層的関係を持つレコードが含まれます。 レコードをデータフロー内で
処理するためにフラット化できます。 例えば、次の入力データを考えてみましょう。
001
100
200
001
100
200
200
Joe,Smith,M,100 Main St,555-234-1290
CHK12904567,12/2/2007,6/1/2012,CHK
1000567,1/5/2012,Fashion Shoes,323.12
Anne,Johnson,F,1202 Lake St,555-222-4932
CHK238193875,1/21/2001,4/12/2012,CHK
1000232,3/5/2012,Blue Goose Grocery,132.11
1000232,3/8/2012,Trailway Bikes,540.00
トランザクションごとに 1 レコードとなるように、レコードをフラット化できます。 上記の例では、
トランザクション レコード (タグ 200 のレコード) を受け入れ、アカウント所有者情報 (タグ 001 のレ
コード) とアカウント詳細 (タグ 100 のレコード) を含めるようにフラット化することを意味します。
次の手順は、Splitter ステージを使用してレコードをフラット化する方法を説明したものです。
1. Read from Variable Format File ステージをデータ フローに追加して、設定します。 詳細について
は、Read from Variable Format File(78ページ)を参照してください。
2. Splitter ステージを追加して、Read from Variable Format File に接続します。
3. 入力データ内の子レコード タイプごとに 1 つの Splitter ステージとなるように、必要に応じて
Splitter ステージを追加します。
ユーザ ガイド
85
Read From XML
4. すべての Splitter ステージを接続します。
データ フローは次のようになっているはずです。
5. 最初の Splitter ステージをダブルクリックして、ステージのオプション を開きます。
6. [分割位置] フィールドで、いずれかの子レコード タイプを選択します。
7. [OK] をクリックします。
8. 追加した Splitter ステージをそれぞれ設定し、各 Splitter の [分割位置] フィールドで異なる子レコー
ド タイプを選択します。
Read From XML
Read from XML ステージでは、XML ファイルがジョブまたはサブフローに読み込まれます。 ここで
は、ファイルのパスとデータ フォーマット (XML スキーマとデータ要素の詳細など) が定義されます。
単純 XML 要素はフラット フィールドに変換され、次のステージに渡されます。 単純 XML データは、
データのみを含み、子要素を含まない XML 要素からなるレコードで構成されます。 例えば、以下は単
純 XML データ ファイルです。
<customers>
<customer>
<name>Sam</name>
<gender>M</gender>
<age>43</age>
<country>United States</country>
</customer>
<customer>
<name>Jeff</name>
<gender>M</gender>
<age>32</age>
<country>Canada</country>
</customer>
<customer>
<name>Mary</name>
<gender>F</gender>
<age>61</age>
<country>Australia</country>
</customer>
</customers>
この例では、各レコードに <name>、<gender>、<age>、<country> などの単純 XML 要素が含ま
れています。 子要素を含んでいる要素はありません。
86
Spectrum™ Technology Platform 8.0.0
第 4 章 : ソース
大部分のステージではフラット形式のデータが必要とされるので、Read from XML ステージはこのよ
うな単純データを自動的にフラット化します。 階層構造を保持する場合は、Read from XML ステージ
の後で Aggregator ステージを使用して、データを階層データに変換します。
複合 XML 要素は階層形式のままで、リスト フィールドとして渡されます (リスト フィールドについ
ては、データ タイプ(45ページ)を参照してください)。多くのステージではフラット形式のデータ
が必要とされるので、下流のステージでデータを使えるようにするために複合 XML 要素をフラット化
しなければならないことがあります。 詳細については、複合 XML 要素のフラット化(90ページ)を
参照してください。
注: Read From XML は、XML タイプ xs:anyType および xs:anySimpleType をサポートしてい
ません。
[ファイル プロパティ] タブ
表 8 : [ファイル プロパティ] タブ
オプション名
説明
スキーマ ファイル
XSD スキーマ ファイルへのパスを指定します。 省略記号ボタン (...)
をクリックし、必要なファイルを参照して選択します。 データ ファ
イルがスキーマに照らして検証されるようにするためには、スキーマ
ファイルをサーバー上に置いておかなければなりません。 スキーマ
ファイルがサーバー上に存在しないと検証が無効になります。
別のやり方として、XSD ファイルの代わりに XML ファイルを指定し
てもかまいません。 XML ファイルを指定した場合は、その XML ファ
イルの構造に基づいてスキーマが推定されます。 XSD ファイルの代
わりに XML ファイルを使用する場合は、次のような制限があります。
• XML ファイルは 1 MB 以下でなければなりません。 XML ファイル
のサイズが 1 MB を越える場合は、XML の構造を維持しつつ、デー
タの一部の削除を試みてください。
• データ ファイルは推定されるスキーマに照らして検証されません。
注: なお、Spectrum™ Technology Platform サーバーを実行している
プラットフォームが Unix または Linux の場合、これらのプラッ
トフォームでファイル名およびパスの大文字と小文字が区別され
ることに注意してください。
データ ファイル
XML データ ファイルへのパスを指定します。 省略記号ボタン (...) を
クリックし、必要なファイルを参照して選択します。
注: なお、Spectrum™ Technology Platform サーバーを実行している
プラットフォームが Unix または Linux の場合、これらのプラッ
ユーザ ガイド
87
Read From XML
オプション名
説明
トフォームでファイル名およびパスの大文字と小文字が区別され
ることに注意してください。
プレビュー
スキーマまたは XML ファイルのプレビューを表示します。 XSD ファ
イルを指定すると、選択した XSD がツリー構造に反映されます。 ス
キーマ ファイルとデータ ファイルの両方を指定したら、太字のスキー
マ要素をクリックして、その要素に含まれるデータのプレビューを見
ることができます。
[フィールド] タブ
表 9 : [フィールド] タブ
オプション名
説明
フィルタ
参照のしやすさを考慮して要素や属性の一覧をフィルタリングしま
す。 フィルタを設定しても、どのフィールドが出力されるかには影響
しません。 あくまでも参照のために要素や属性の一覧をフィルタリン
グするだけです。
XPath
XPath 列には要素または属性の XPath 式が表示されます。 これは専
ら情報表示のためのものです。 XPath の詳細については、
www.w3schools.com/xpath/ を参照してください。
フィールド
データフローで要素または属性のために使われる名前。 フィールド名
を変更するには、ダブルクリックして新しいフィールド名を入力しま
す。
タイプ
フィールドで使用するデータ タイプ。
データ タイプ
説明
boolean
true と false の 2 つの 値を持つ論理タイプ。
double
正と負の倍精度数を含む数値データ タイプ。値の
-1074
-52
1023
範囲は、2
〜 (2-2 )×2
。 指数表記すると、
値の範囲は、4.9E-324 〜 1.7976931348623157E308
となります。 指数表記については、次のサイトを
参照してください。
88
Spectrum™ Technology Platform 8.0.0
第 4 章 : ソース
オプション名
説明
データ タイプ
説明
http://en.wikipedia.org/wiki/Scientific_notation#E_notation
float
正と負の単精度数を含む数値データ タイプ。値の
-149
23
127
範囲は、2
〜 (2-2 )×2 。 指数表記すると、
値の範囲は、1.4E-45 〜 3.4028235E38 となりま
す。 指数表記については、次のサイトを参照して
ください。
http://en.wikipedia.org/wiki/Scientific_notation#E_notation
integer
正と負の整数を含む数値データ タイプ。値の範囲
31
31
は、-2 (-2,147,483,648) 〜 2 -1 (2,147,483,647)。
long
正と負の整数を含む数値データ タイプ。値の範囲
63
63
は、-2 (-9,223,372,036,854,775,808) 〜 2 -1
(9,223,372,036,854,775,807)。
string
含める
文字列
このフィールドをデータフローで使えるようにするか除外するかを指
定します。
例: 簡単な XML ファイル
この例では、次のファイルをデータフローに読み込みます。
<addresses>
<address>
<addressline1>One Global View</addressline1>
<city>Troy</city>
<state>NY</state>
<postalcode>12128</postalcode>
</address>
<address>
<addressline1>1825B Kramer Lane</addressline1>
<city>Austin</city>
<state>TX</state>
<postalcode>78758</postalcode>
</address>
</addresses>
この例で、<addressline1>、<city>、<state>、および <postalcode> を
含めたとします。 その場合は、<address> 要素ごとに 1 つのレコードが生成さ
れます。<address> が <addressline1>、<city>、<state>、および
<postalcode> の共通の親要素だからです。
ユーザ ガイド
89
Read From XML
複合 XML 要素のフラット化
複合 XML 要素は、他の要素または属性を含む要素です。 例えば、次のデータ ファイルでは、
<address> 要素と <account> 要素は複合 XML 要素です。
<customers>
<customer>
<name>Sam</name>
<gender>M</gender>
<age>43</age>
<country>United States</country>
<address>
<addressline1>1253 Summer St.</addressline1>
<city>Boston</city>
<stateprovince>MA</stateprovince>
<postalcode>02110</postalcode>
</address>
<account>
<type>Savings</type>
<number>019922</number>
</account>
</customer>
<customer>
<name>Jeff</name>
<gender>M</gender>
<age>32</age>
<country>Canada</country>
<address>
<addressline1>26 Wellington St.</addressline1>
<city>Toronto</city>
<stateprovince>ON</stateprovince>
<postalcode>M5E 1S2</postalcode>
</address>
<account>
<type>Checking</type>
<number>238832</number>
</account>
</customer>
<customer>
<name>Mary</name>
<gender>F</gender>
<age>61</age>
<country>Australia</country>
<address>
<addressline1>Level 7, 1 Elizabeth Plaza</addressline1>
<city>North Sydney</city>
<stateprovince>NSW</stateprovince>
<postalcode>2060</postalcode>
</address>
<account>
<type>Savings</type>
<number>839938</number>
</account>
</customer>
</customers>
次の手順は、Splitter ステージを使用して、複数の複合 XML 要素を含む XML データをフラット化する
方法を説明したものです。
90
Spectrum™ Technology Platform 8.0.0
第 4 章 : ソース
注: データに 1 つの複合 XML 要素が含まれる場合は、1 つの Splitter ステージを使用して、Read from
XML ステージを Splitter ステージに接続するだけで、データをフラット化できます。 1 つの複合
XML 要素を含むデータ ファイルに対しては、この手順で説明するように Broadcaster ステージと
Record Combiner ステージを使用する必要はありません。
1. Read from XML ステージをデータ フローに追加して、設定します。 詳細については、Read From
XML(86ページ)を参照してください。
2. Broadcaster ステージを追加して、Read from XML ステージを接続します。
3. データ内の複合 XML 要素ごとに Splitter ステージを追加します。
4. Broadcaster ステージを各 Splitter に接続します。
5. Record Combiner ステージを追加して、各 Splitter を接続します。
データ フローは次のようになっているはずです。
6. 最初の Splitter ステージをダブルクリックして、ステージのオプション を開きます。
7. [分割位置] フィールドで、いずれかの複合フィールドを選択します。 上記の例のデータ ファイル
では、address フィールドを選択できます。
8. [OK] をクリックします。
9. 追加した Splitter ステージをそれぞれ設定し、各 Splitter の [分割位置] フィールドで異なる複合
XML 要素を選択します。
データ フローは、複合 XML 要素を持つレコードを含む XML 入力を受け入れ、データをフラット化す
るように設定されました。 Record Combiner から生成されるレコードは、フラット データを必要とす
るすべてのステージに送ることができます。 例えば、Record Combiner ステージを Validate Address
ステージに接続して、住所を検証できます。
ユーザ ガイド
91
制御ステージ
制御ステージでは、レコードをデータフロー内の異なるパスに引き渡したり、
ソートしたり、変換したりする等の一般的なタスクを実行します。
このセクションの構成
•
•
•
•
•
•
•
•
•
•
•
•
•
Aggregator . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .94
Broadcaster . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .104
Conditional Router . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .104
Group Statistics . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .109
Math . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .119
Query DB . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .126
Record Combiner . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .129
Record Joiner . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .130
Sorter . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .131
Splitter . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .133
Stream Combiner . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .138
Transformer . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .139
Unique ID Generator . . . . . . . . . . . . . . . . . . . . . . . . . . . . .145
5
Aggregator
Aggregator
Aggregator は、フラット データを階層データに変換します。 Aggregator は、単一のソースから入力
データ行を取得し、フィールド値に基づいてデータをグループ化して、それらのグループのリストを
スキーマの中に作成することにより、スキーマ (データの構造的階層) を作成します。 Aggregator ス
テージには、Aggregator に接続された 1 つのステージ入力ポートと、Aggregator から次のステージへ
とデータを送信する 1 つのステージ出力ポートがあります。
注: データの中に、それによってデータをグループ化するフィールド (ID フィールドなど) がある場合
は、Aggregator に引き渡す前にデータをソートする必要があります。 データのソートは、データ
をデータフローに引き渡す前にソートしておくか、Enterprise Designer 内で入力ファイルをソー
トするか (ジョブまたはサブフローの場合、サービスには適用不可)、データフローに Sorter ス
テージを追加することによって行うことができます (ジョブ、サービス、サブフローの場合)。
Aggregator ステージの使用
1. [制御ステージ] の下で [Aggregator] をクリックして、キャンバスまでドラッグし、データフロー
内の配置したい位置にドロップして、入力および出力ステージに接続します。
2. [Aggregator] をダブルクリックします。 [Aggregator オプション] ダイアログ ボックスが表示さ
れ、[グループ化] コントロールがハイライト表示されます。
3. [追加] をクリックします。または、[グループ化] コントロールをダブルクリックすることもできま
す。 [グループ化] ダイアログ ボックスが表示されます。
4. リストに追加するデータを含むフィールドをドロップダウン リストから選択し、[OK] をクリック
します。 エントリと共にファイルの種類についての説明が表示されます。 このステップを必要な
だけ繰り返して、[グループ化] のフィールドを複数選択することができます。 Aggregator ステー
ジでは、フィールド名に無効な XML 文字を使用できないことに注意してください。使用できるの
は、英数字、ピリオド (.)、アンダースコア (_)、およびハイフン (-) です。
注: [グループ化] ドロップダウン リストに表示される使用可能フィールドは、Aggregator の入力
ポートに接続されているステージで使用されているフィールドによって決まります。 例えば、
データフローでジオコーディング ステージを使用している場合は、使用可能なフィールドに
は、AddressLine1、City、StateProvince といった住所要素が含まれることになります。
5. 次に、Aggregator で生成する出力を選択します。 [出力リスト] をクリックして、[追加] をクリッ
クします。または、[出力リスト] コントロールをダブルクリックすることもできます。 [フィール
ド オプション] ダイアログ ボックスが表示されます。
6. 以下の項目によって、フィールド情報を設定します。
• [既存フィールド]: [入力フィールド] ドロップダウン リストからフィールドを選択します。 この
リストも、Aggregator の入力ポートに接続されているステージから入力されるフィールドによっ
て決まります。
94
Spectrum™ Technology Platform 8.0.0
第 5 章 : 制御ステージ
• [新しいデータ タイプ]: このフィールドに格納される情報の種類を表す名前を入力します
("CustomerID"、"AltID"、など)。
• [テンプレート]: [下流フィールド] ドロップダウン リストからフィールドを選択します。 このオ
プションにより、Aggregator の出力ポートに接続されているステージのデータに基づくフィー
ルドを追加できます。 前出の例では、使用可能なオプションは、"RouteDirections" と "RoutePoints"
になります。
7. [リスト] ボックスがオンでない場合はこれをクリックすると、出力がリスト形式で表示されます。
8. [名前] テキスト ボックスにフィールドの名前を入力するか、自動的に表示された名前でよい場合
はそのままにします。
9. [OK] をクリックします。 エントリと共にファイルの種類についての説明が表示されます。 親要素
とともに子要素が表示される場合は、それらのエントリに、情報のソースとファイルの種類の説明
が表示されます。 このステップを必要なだけ繰り返して、[出力リスト] のフィールドを複数選択す
ることができます。
10. [出力リスト] の親項目に子エントリを追加する必要がある場合は、[追加] をクリックして、ステッ
プ 5 〜 9 を繰り返します。
注: フィールド グループを変更するには、行をハイライト表示して、[変更] をクリックします。
フィールド グループを削除するには、行をハイライト表示して、[削除] をクリックします。
また、フィールドを選択してから [上へ移動] または [下へ移動] をクリックすることによって、
フィールドの順序を変更できます。
Aggregator の例
Aggregator の機能が適用できる具体的な例としては、通りの住所のグループから
道順を得る場合が挙げられます。 始点と終点という 2 つの地点、またはルート内
の複数の通過点に対し、この機能を適用できます。 このような種類の機能を実行
するデータフローの例を次に示します。
このデータフローは、次のように機能を実行します。
1. Read from File ステージでは、通りの住所がフラット ファイルに格納されて
います。 このファイルには、次のようなフィールドがあります。
• ID: ファイル内の住所を一意に識別するためのフィールドです。
• Type: 住所が差出住所と宛先住所のどちらであるかを表します。
• AddressLine1: 通りの住所を格納します。
• LastLine: 都市、州、および郵便番号などの情報を格納します。
ユーザ ガイド
95
Aggregator
2. Read from File ステージと Math ステージの間の Field Transform は、ID
フィールドのフォーマットを string タイプから double タイプに変換します。
Math ステージが、string タイプのデータを入力として受け取ることができな
いためです。
96
Spectrum™ Technology Platform 8.0.0
第 5 章 : 制御ステージ
3. Math ステージは、データフローの下流で使用するグループ ID (GroupID) フィー
ルドを計算する式を作成します。 この例では、ID フィールドの値を 2 で割っ
た数以下の最大の整数、つまり小数点以下を切り捨てた数を、グループ ID と
します。 つまり、ID が 3 の場合、式は 3/2 となり、解は 1.5 となります。
1.5 の小数点以下を切り捨てて、グループ ID は 1 となります。 ID が 2 の場
合は、式は 2/2、解は 1 となり、小数点以下を切り捨てる必要はありません。
したがって、ID が 2 の場合も 3 の場合もグループ ID は同じ 1 になります。
4. Geocode US Address は、各住所の緯度と経度を取得します。 Geocode US
Address の詳細については、ここをクリックしてください。
5. Aggregator ステージは、データを GroupID フィールドによってグループ化
し、出力リストに緯度と経度に基づくルート ポイント (RoutePoints) が含ま
れるようにします。
以下に、このデータフロー用の Aggregator ステージを手動で設定する方法を
示します。
• [Aggregator] ステージをダブルクリックし、[グループ化] をダブルクリック
します。
• [GroupID] フィールドを選択し、[OK] をクリックします。
ユーザ ガイド
97
Aggregator
このフィールドを使用することによって、データフローにおける次のステー
ジのためのルート ポイントを含めることができるようになります。 ルート
ポイントは、データフローで道順を生成するために必須です。
• [出力リスト] をダブルクリックします。 [フィールド オプション] ダイアロ
グ ボックスが表示されます。
• RoutePoint データのタイプで構成される RoutePoints という名前の [新
しいデータ タイプ] を作成します。 デフォルトで、これはリストであり、
変更できません。したがって、チェック ボックスは無効になっています。
• [OK] をクリックします。
• [RoutePoints] をクリックし、[追加] をクリックします。[フィールド オプ
ション] ダイアログ ボックスが再度表示されます。
• ルート ポイントは、緯度と経度で構成されているため、まず [既存フィール
ド] で、既存の入力フィールド "Latitude" を追加する必要があります。
[名前] フィールドの値は自動的に入力されます。
98
Spectrum™ Technology Platform 8.0.0
第 5 章 : 制御ステージ
"Longitude" に対して、このステップを繰り返します。
完成した Aggregator ステージは、次のように表示されます。
ユーザ ガイド
99
Aggregator
次に、 テンプレート タイプを使用して、このデータフロー用に Aggregator
ステージを設定する手順を示します。
• [Aggregator] ステージをダブルクリックし、[グループ化] をダブルクリック
します。
• [GroupID] フィールドを選択し、[OK] をクリックします。
• [出力リスト] をダブルクリックします。 [フィールド オプション] ダイアロ
グ ボックスが表示されます。
• 下流フィールドから [テンプレート] タイプを作成します。 Get Travel
Directions は、ルート ポイントを使用して機能を実行するため、
[RoutePoints] を選択します。 [名前] フィールドの値は自動的に入力さ
れます。 デフォルトで、これはリストであり、変更できません。したがっ
て、チェック ボックスは無効になっています。
• [OK] をクリックします。 完成した Aggregator ステージは、次のように表
示されます。
100
Spectrum™ Technology Platform 8.0.0
第 5 章 : 制御ステージ
6. Get Travel Directions は、ポイント ID 0、2、4 からポイント ID 1、3、5 ま
での道順をそれぞれ提供します。
7. Splitter ステージでは、このデータフローの出力として道順 (RouteDirections)
を選択し、出力に含めるフィールドを選択できます。
ユーザ ガイド
101
Aggregator
8. Write to File ステージは、ステップ 7 の出力を収集し、道順を出力します。
102
Spectrum™ Technology Platform 8.0.0
第 5 章 : 制御ステージ
次の図は、このデータフローのインスペクション結果の一部を示したもので
す。
個々の行のツリーを展開すると、インスペクションに使用されたデータが表
示されます。この場合のデータは、道順のルート ポイントの緯度と経度です。
ユーザ ガイド
103
Broadcaster
Broadcaster
Broadcaster は、レコードを 2 つ以上のステージに送信します。 Broadcaster には、ステージ入力が
1 つ接続され、入力情報を 2 つ以上のステージに送信します。
[制御ステージ] の下で [Broadcaster] をクリックして、キャンバスまでドラッグし、データフロー内の
配置したい位置にドロップします。
Broadcaster には変更する設定はありません。
Conditional Router
Conditional Router は、指定された条件に基づいて、レコードを各種ステージ (またはファイル) に送
信します。 Conditional Router は、定義方法によっては、1 つ以上の出力ポートを使用できます。 出
力ポートには、1 から順に番号が付けられます (以下 "ポート" と表記)。 出力ポートは、データの送信
先となる様々なステージに接続されます。データがどのステージに送信されるかは、条件によって異
なります。 例えば、あるレコード群をポート 1 の "successful match" 出力ファイルに送信し、別のレ
コード群をポート 2 の "failed match" 出力ファイルに送信できます。
1. [制御ステージ] の下で [Conditional Router] をクリックして、キャンバスまでドラッグし、データ
フロー内の配置したい位置にドロップします。
2. ルータをキャンバス上の他のステージに接続します。
注: 設定を定義する前に、このステップを完了しないと、ポートを編集用として使用できません。
3. [Conditional Router] をダブルクリックします。 [Conditional Router オプション] ダイアログ ボッ
クスが表示されます。
4. ポートの "条件/式" の下にある四角形のボタンをクリックします。 [Expression Editor] ダイ
アログ ボックスが表示されます。
5. [式タイプの選択] フィールドで、次のいずれかを選択します。
104
Spectrum™ Technology Platform 8.0.0
第 5 章 : 制御ステージ
• カスタム式 — このオプションは、Groovy スクリプトを使用して式を記述する場合に選択しま
す。 詳細については、「Groovy スクリプトの使用」を参照してください。
• デフォルト式 — このオプションは、レコードをデフォルトでこのポートに送信する場合に選択
します。 他のポートのどの式ともマッチしないレコードは、このポートに送信されます。 "デ
フォルト" の出力ポートを式として使用して、ルータからすべての行が書き込まれるようにして
ください。
• Expression Builder で作成した式 — このオプションは、基本式を作成する場合に選択します。
このオプションを選択する場合は、次の操作を行います。
6. [式の結合方法] フィールドで、すべての式が真として評価される場合にのみ、このポートにレコー
ドを送信するときは [すべて] を選択し、1 つ以上の式が真として評価される場合に、このポート
にレコードを送信するときは [いずれか] を選択します。
7. [追加] をクリックし、テストするフィールド、演算子、および値を指定します。 演算子を次の表に
示します。
表 10 : Expression Builder の演算子
演算子
説明
が次の値と同じ
フィールドの値が指定された値とマッチするかどうかを確認します。
boolean、double、float、integer、long、および string データ タイプをサ
ポートしています。
が次の値と異なる
フィールドの値が指定された値とマッチしないかどうかを確認します。
boolean、double、float、integer、long、および string データ タイプをサ
ポートしています。
が NULL である
フィールドが NULL 値かどうかを確認します。
boolean、double、float、integer、long、および string データ タイプをサ
ポートしています。
が NULL でない
フィールドが NULL 値でないかどうかを確認します。
boolean、double、float、integer、long、および string データ タイプをサ
ポートしています。
空
フィールドが NULL かどうか、または長さ 0 の文字列かどうかを確認しま
す。
string データ タイプをサポートします。
ユーザ ガイド
105
Conditional Router
演算子
説明
空でない
フィールドが NULL でないかどうか、または長さ 0 の文字列でないかどう
かを確認します。
string データ タイプをサポートします。
が次の値より小さい
フィールドの数値が指定された値未満かどうかを確認します。
double、float、integer、long、および string データ タイプをサポートして
います。
が次の値以下
フィールドの数値が指定された値以下かどうかを確認します。
double、float、integer、long、および string データ タイプをサポートして
います。
が次の値より大きい
フィールドの数値が指定された値よりも大きいかどうかを確認します。
double、float、integer、long、および string データ タイプをサポートして
います。
が次の値以上
フィールドの数値が指定された値以上かどうかを確認します。
double、float、integer、long、および string データ タイプをサポートして
います。
が次の文字から始まる
フィールドが指定された文字で始まっているかどうかを確認します。
string データ タイプをサポートします。
で始まらない
フィールドが指定された文字で始まっていないかどうかを確認します。
string データ タイプをサポートします。
が次の文字を含む
フィールドに指定された文字列が含まれているかどうかを確認します。
string データ タイプをサポートします。
含まない
フィールドに指定された文字列が含まれていないかどうかを確認します。
string データ タイプをサポートします。
が次の値で終わる
フィールドが指定された文字で終了しているかどうかを確認します。
string データ タイプをサポートします。
106
Spectrum™ Technology Platform 8.0.0
第 5 章 : 制御ステージ
演算子
説明
で終わらない
フィールドが指定された文字で終了しているかどうかを確認します。
string データ タイプをサポートします。
正規表現と一致
フィールドを、対象テキストの文字列 (特定の文字、単語、文字のパターン
等) を識別する正規表現と照合します。 値フィールドには、有効な正規表
現パターンが含まれる必要があります。
string データ タイプをサポートします。
Groovy スクリプトの使用
各出力ポートに Groovy 式を関連付けることができます。 Groovy スクリプトの詳細な情報について
は、次の Web サイトを参照してください。
groovy.codehaus.org
Groovy 式は、レコードをポートに書き込む必要があるかどうかを示す boolean 値 (真または偽) とし
て評価する必要があります。 レコードは、式が真として評価された最初の出力ポートに送信されま
す。
例えば、バリデーションの確信レベルが 85 以上のレコードをあるステージに送信し、バリデーション
の確信レベルが 85 未満のレコードを別のステージに送信するとします。この場合、使用可能なフィー
ルドから [Confidence] を選択します。また、ポート 1 の条件/式は、次のようになります。
row.get('Confidence') >=85
また、ポート 2 の条件/式は、次のようになります。
row.get('Confidence') <85
ルータは、Confidence フィールドの値を条件と照合して、レコードの送信先出力ポートを決定しま
す。
Conditional Router は、データを引き渡すときにデータを変更しません。したがって、どうしても必要
でない限り、ルータのスクリプト内で set() メソッドを呼び出さないでください。
注: データはプライマリ文字列データで、入力する式に影響することがあります。
フィールドに単一の値があるかどうかを確認する
次の式は、Status フィールドの値が 'F' の場合に真として評価されます。 完全一
致が要求されるため、フィールドの値が 'f' の場合は真として評価されません。
return data['Status'] == 'F';
ユーザ ガイド
107
Conditional Router
フィールドに複数の値があるかどうかを確認する
次の式は、Status フィールドの値が 'F' または 'f' の場合に真として評価されます。
boolean returnValue = false;
if (data['Status'] == 'F' || data['Status'] == 'f')
{
returnValue = true;
}
return returnValue;
フィールドの長さを評価する
次の式は、PostalCode フィールドの文字数が 6 文字以上の場合に真として評価
されます。
return data['PostalCode'].length() > 5;
フィールド値に含まれる文字を確認する
次の式は、PostalCode フィールドにダッシュが含まれている場合に真として評価
されます。
boolean returnValue = false;
if (data['PostalCode'].indexOf('-') != -1)
{
returnValue = true;
}
return returnValue;
一般的な誤り
次に、スクリプトを使用するときの一般的な誤りを示します。
次の式は誤りです。PostalCode (列名) は、単一引用符または二重引用符で囲む必要があります。
return data[PostalCode];
次の式は誤りです。列が指定されていません。
return data[];
次の式は誤りです。row.set() は Boolean 値を返しません。 row.set() は常に偽として評価されます。
また、row.set() は、PostalCode フィールドを 88989 に変更します。
return row.set('PostalCode', '88989');
ファイルの設定には単一引用符を使用し、フィールドの値の確認には二重引用符を使用します。
108
Spectrum™ Technology Platform 8.0.0
第 5 章 : 制御ステージ
Group Statistics
Group Statistics ステージでは、分析対象のグループに分割された複数のデータ行に対し、統計操作を
実行できます。 グループが定義されていない場合、すべての行が 1 つのグループに含まれるものとし
て処理されます。
グループは、複数のデータ行にわたって同じ値を持つ 1 つまたは複数のフィールドによって定義され
ます。 例えば、次の表のデータは、地域、州、またはその両方でグループ化できます。
地域
州
東部
MD (メリーランド州)
東部
MD (メリーランド州)
東部
CT (コネチカット州)
西部
CA (カリフォルニア州)
西部
CA (カリフォルニア州)
地域によってグループ化する場合は、東部および西部に分類されます。 州によってグループ化する場
合は、カリフォルニア州、コネチカット州、メリーランド州に分類されます。 地域および州によって
グループ化する場合は、東部/メリーランド州、東部/コネチカット州、西部/カリフォルニア州に分類
されます。
入力
Group Statistics ステージは、任意のフィールドを入力として受け取ります。 グループ化は、数値また
は文字列データに対して行うことができます。 操作は、数値入力データに対してのみ行うことができ
ます。
オプション
表 11 : [操作] タブ
オプション名
説明
入力フィールド
レコードのグループ化や計算に使えるデータフロー内のフィールドを表示
します。
注: 操作は、数値データに対してのみ適用できます。
ユーザ ガイド
109
Group Statistics
オプション名
説明
行
計算のカテゴリとして使いたい 1 つまたは複数のフィールドを指定します。
例えば、手持ちのデータに [地域] フィールドが含まれていて、地域別の総
人口を計算したいようなときは、[地域] フィールドでグループ化を行いま
す。
フィールドを追加するには、[入力フィールド] リスト内で目的のフィール
ドを選択し、[>>] をクリックします。
列
これはオプションです。 ピボット テーブルを作成する場合、クロス集計用
の列の値として取り込むフィールドを指定します。 例えば、手持ちのデー
タに地域と出荷日の情報が含まれていて、各州の毎日の出荷件数を集計し
たいようなとき、州フィールドを行、出荷日フィールドを列として指定し
ます。
フィールドを追加するには、[入力フィールド] リスト内で目的のフィール
ドを選択し、[>>] をクリックします。
操作
各グループに対して実行する計算を指定します。 操作を追加するには、[入
力フィールド] リスト内で操作に使いたいフィールドを選択し、[>>] をク
リックします。
対応しているのは、次の計算です。
110
平均
グループごとに、指定されたフィールドの平均値を計算しま
す。 例えば、ある一群のレコードの特定のフィールドに値
10、12、1、600 が含まれているとき、そのグループについ
てのそのフィールドの平均値は (10+12+1+600)÷4 = 155.75
と計算されます。
最大値
グループごとに、指定されたフィールドの最大値を返します。
例えば、ある一群のレコードの特定のフィールドに値 10、
12、1、600 が含まれているとき、そのグループについてのそ
のフィールドの最大値は 600 となります。
最小値
グループごとに、指定されたフィールドの最小値を返します。
例えば、ある一群のレコードの特定のフィールドに値 10、
12、1、600 が含まれているとき、そのグループについてのそ
のフィールドの最小値は 1 となります。
Percent
Rank
グループ内のレコードごとに、指定されたフィールド内の値
をグループ内の他のレコードと比較したときの百分位数ラン
クを計算します。 百分位数ランクは、そのフィールドについ
てそれよりも小さな値を持つレコードがグループ内の何パー
セントを占めるかを表します。
Spectrum™ Technology Platform 8.0.0
第 5 章 : 制御ステージ
オプション名
説明
百分位数 グループごとに、特定のフィールドについて指定した百分位
(Percentile) 数 (0 - 100) を表す値を計算します。 百分位数は、それよりも
スコアの小さいレコードが全体の何パーセントを占めるかを
表します。 例えば、ある一群のレコードが値 22、26、74 を
持つとき、第 60 百分位数を指定して百分位数計算を実行す
ると、値 35.6 が返されます。 これは、そのフィールドの値
が 35.6 であるレコードはグループ内で第 60 百分位数のレ
コードに属することを意味します。
タイプ
標準偏差
グループごとに、指定されたフィールドの標準偏差を計算し
ます。 標準偏差は、グループ内の値のばらつき度合いを表し
ます。 標準偏差が小さいほど、より多くの値が平均値のまわ
りに集中し、値のばらつきが小さくなります。 逆に、標準偏
差が大きいほど、値のばらつきが大きくなります。 標準偏差
はデータと同じ単位で表現されます。 標準偏差は、分散の平
方根です。
合計
グループごとに、指定されたフィールドの値の合計を計算し
ます。
分散
グループごとに、指定されたフィールドの分散を計算します。
分散は、グループ内の値のばらつき度合いを表します。 標準
偏差を 2 乗したものです。
ZScore
グループ内のレコードごとに、ZScore を返します。 ZScore
は、値がグループの平均値から標準偏差のいくつ分だけ離れ
ているかを示します。
入力フィールドと出力フィールドについて、データ タイプを指定します。
次のいずれかです。
integer
31
正と負の整数を含む数値データ タイプ。値の範囲は、-2
31
(-2,147,483,648) 〜 2 -1 (2,147,483,647)。
long
63
正と負の整数を含む数値データ タイプ。値の範囲は、-2
63
(-9,223,372,036,854,775,808) 〜 2 -1
(9,223,372,036,854,775,807)。
float
-149
正と負の単精度数を含む数値データ タイプ。値の範囲は、2
23
127
(1.4E-45) 〜 (2-2 )×2
ユーザ ガイド
(3.4028235E38)。
111
Group Statistics
オプション名
説明
double
正と負の倍精度数を含む数値データ タイプ。値の範囲は、
-1074
1023
2
(4.9E-324) 〜 (2-2-52)×2
(1.7976931348623157E308)。
注: integer タイプおよび long タイプを使用する場合に、演算の入力値や
計算値に小数データが含まれていると、データが失われることがあり
ます。
表 12 : [フィールド] タブ
オプション
説明
[フィールド] タブは、ピボット テーブルを作成するとき使います。 詳細については、ピボット テー
ブルの作成(116ページ)を参照してください。
表 13 : [出力] タブ
オプション
説明
グループごとに 1 行を返す
行グループごとに、グループ内のすべての行についての集計データを
含む 1 行だけを返します。 個別の行は削除されます。 このオプショ
ンがオフの場合は、すべての行が返されます。 どのデータも削除され
ません。
Percent Rank または ZScore 操作では、このオプションは使えませ
ん。
各グループの行数を返す
各グループの行数を返します。 行数が設定されるデフォルトの出力
フィールド名は GroupCount です。
各グループに対し、一意の ID 各行グループのユニーク ID を返します。 ID は 1 から始まり、追加の
を返す
グループが見つかるたびに 1 ずつ増加します。 デフォルトのフィール
ド名は、GroupID です。
112
Spectrum™ Technology Platform 8.0.0
第 5 章 : 制御ステージ
Output
表 14 : Group Statistics 出力
フィールド名
説明/有効値
<操作>Of<入力フィールド名 計算の結果が入ります。 Group Statistics では、操作ごとに 1 つの
>
フィールドが作成され、操作とフィールドに基づいてフィールドの名
前が付けられます。 例えば、"Population" というフィールドに対して
合計操作を実行した場合のデフォルトのフィールド名は
SumOfPopulation となります。
<値>_<操作>
ピボットの結果が入ります。ここで、<Value> はピボット列内のいず
れかの値、<Operation> はその列に対して実行される操作です。 詳細
については、ピボット テーブルの作成(116ページ)を参照してくださ
い。
GroupCount
グループ内のレコード数を示します。
GroupID
各グループに順番に割り当てられる一意の番号。 最初のグループの
GroupID は値 1、その次は値 2 などとなります。
Status
Group Statistics 計算の成功または失敗を報告します。
Status.Code
NULL
成功
F
失敗
失敗の原因 (ある場合)。 次のいずれかです。
UnableToDoGroupStatistics Group Statistics ステージで計算を実行
できませんでした。
百分位数の計算でエラーが発 指定された入力データで百分位数を計
生しました
算できませんでした。
Status.Description
エラーの詳細な説明。
入力フィールドの値を
フィールド タイプに変換で
きませんでした。 桁あふれ
の可能性があります!
ユーザ ガイド
入力フィールドの値がデータ タイプの
可能な値を超えています。 double など
の、より大きな値をサポートしている
データ タイプに変換してみてくださ
い。
113
Group Statistics
Group Statistics の例
次の入力データは、郡内の顧客数を示しています。 このデータは、郡の位置する
米国の州 (MD、VA、CA、NV) と地域 (East または West) も示しています。 最初
の行はヘッダ レコードです。
Region|State|County|Customers
East|MD|Calvert|25
East|MD|Calvert|30
East|MD|Prince Georges|30
East|MD|Montgomery|20
East|MD|Baltimore|25
East|VA|Fairfax|45
East|VA|Clarke|35
West|CA|Alameda|74
West|CA|Los Angeles|26
West|NV|Washoe|22
各地域の顧客総数を計算したければ、[操作] タブの行として [地域] フィールドを
定義します。 操作については、[顧客] フィールドに対して合計操作を実行しま
す。
次の結果が得られます。
Region|SumOfCustomers
East|210.0
West|122.0
注: この例は、行だけでデータを集計する基本的な Group Statistics 操作を示し
ています。 ピボット テーブルを作成すれば、[操作] タブでグループ化に使
う列を指定して行と列の両方で集計することもできます。 ピボット テーブ
ルの作成の詳細については、ピボット テーブルの作成(116ページ)を参照
してください。
114
Spectrum™ Technology Platform 8.0.0
第 5 章 : 制御ステージ
ピボット テーブル
ピボット テーブルとは、データを視覚的に分析しやすくするように、データフロー内の列の値を集計
したり入れ換えたりするものです。 ピボットを使うと、入力の列をクロス集計の形式で整理して行、
列、および集計値を生成できます。 また、フィールドを入力として使用できますが、表示することは
できません。 ピボットの使い方には、2 次元のピボットと、1 次元の集計データのグループ化があり
ます。
この例は、シャツの売上データを示しています。
表 15 : 入力データ
ユーザ ガイド
地域
性別
スタイル
出荷日
East
男児
T シャツ
East
男児
East
数量
価格
原価
1/31/2010 12
11.04
10.42
ゴルフ
6/31/2010 12
13.00
10.60
男児
ファン
シー
2/25/2010 12
11.96
11.74
East
女児
T シャツ
1/31/2010 10
11.27
10.56
East
女児
ゴルフ
6/31/2010 10
12.12
11.95
East
女児
ファン
シー
1/31/2010 10
13.74
13.33
West
男児
T シャツ
1/31/2010 11
11.44
10.94
West
男児
ゴルフ
2/25/2010 11
12.63
11.73
West
男児
ファン
シー
2/25/2010 11
12.06
10.51
West
女児
T シャツ
2/25/2010 15
13.42
13.29
West
女児
ゴルフ
6/31/2010 15
11.48
10.67
North
男児
T シャツ
2/25/2010 17
16.04
10.42
North
男児
ファン
シー
2/25/2010 12
11.56
12.42
North
女児
T シャツ
2/25/2010 16
12.32
18.42
North
男児
ゴルフ
1/31/2010 18
11.78
13.23
North
女児
T シャツ
2/25/2010 12
18.45
11.64
North
女児
ゴルフ
2/25/2010 14
11.23
19.85
115
Group Statistics
地域
性別
スタイル
出荷日
North
男児
ファン
シー
North
女児
South
数量
価格
原価
1/31/2010 16
12.54
13.42
T シャツ
2/25/2010 17
181.73
15.83
男児
ファン
シー
1/31/2010 19
14.15
13.42
South
女児
T シャツ
2/25/2010 11
11.85
12.92
South
女児
ファン
シー
1/31/2010 13
11.54
14.35
South
男児
T シャツ
2/25/2010 15
14.14
14.73
South
男児
ゴルフ
2/25/2010 16
17.83
17.83
South
女児
ファン
シー
6/31/2010 11
18.24
12.35
South
女児
T シャツ
1/31/2010 20
19.94
12.95
South
男児
ゴルフ
2/25/2010 12
21.25
19.56
出荷日ごとに各地域で販売した数量を調べたいと思います。 これを行うには、ピ
ボットを使って次のテーブルを生成します。
表 16 : ピボット テーブル
地域
1/31/2010_ShipDate 2/25/2010_ShipDate 6/31/2010_ShipDate
East
32
12
North
34
88
South
52
54
11
West
11
37
15
22
この例で、列は出荷日、行は地域、表示したいデータは数量です。 ここでは合計
操作による集計値で出荷数量の総数が表示されます。
ピボット テーブルの作成
ピボット テーブルとは、入力データに基づいてテーブルの行と列のカテゴリを作成することで、デー
タを分析しやすいように集約するものです。 詳細については、ピボット テーブル(115ページ)を参
照してください。
1. Group Statistics ステージをデータフローに追加します。
116
Spectrum™ Technology Platform 8.0.0
第 5 章 : 制御ステージ
2. Group Statistics ステージで、[操作] タブをクリックします。
3. [入力フィールド] フィールドで、ピボット テーブルの行ラベルとして使いたいデータが含まれて
いるフィールドを選択し、[行] フィールドの横の [>>] ボタンをクリックします。
4. [入力フィールド] フィールドで、ピボット テーブルの列として使いたいデータが含まれている
フィールドを選択し、[列] フィールドの横の [>>] ボタンをクリックします。
ヒント: この段階で、インスペクションを実行して現在の選択の結果を確認します。 選択した行
と列によるクロス集計の結果を、これで具体的に目に見えるようにすることができます。
インスペクションの手順については、インスペクション ポイントの設定(190ページ)と
インスペクション結果の表示(191ページ)を参照してください。
5. [フィールド] タブをクリックします。
6. ピボット テーブルの各列に使うフィールドを定義します。
ヒント: フィールドを正確に定義するために、インスペクションを実行して現在のデータで生成
される列の名前を確認してください。 インスペクションの手順については、インスペク
ション ポイントの設定(190ページ)とインスペクション結果の表示(191ページ)を参照
してください。
a) [追加] をクリックします。
[フィールドを追加] ウィンドウが表示されます。
b) [フィールドを追加] ウィンドウの最初のフィールドの名前は、[操作] タブの [列] フィールドで
選択したデータによって決まります。 この最初のフィールドに、インスペクションで表示され
た列の見出しのいずれかと完全に同じものを値として入力します。
例えば、列に対して ShipDate という入力フィールドを選択した場合は、[フィールドを追加]
ウィンドウの最初のフィールドのラベルが ShipDate となります。 [ShipDate] フィールドで、
データフローの入力データの [ShipDate] フィールドに入れる値 (10/01/31 など) を入力します。
c) [操作] フィールドで、そのフィールドが表す操作を選択します。 なお、選択した操作はフィー
ルド名にのみ作用します。 実際の計算には影響しません。 操作自体を変更するには、[操作] タ
ブの [操作] フィールドを使います。
d) [追加] をクリックします。
最初のフィールドおよび [操作] フィールドの現在の選択内容に基づいて、新しいフィールド名
が <Data>_<Operation> という形式で作成されます。ここで、<Data> は最初のフィールドで指
定した値、<Operation> は [操作] フィールドで選択した操作です。
e) インスペクションで表示された列ごとに、この操作を繰り返します。
7. [OK] をクリックします。
ピボット テーブルの例
次のデータはサービス業務部門から得られる出荷情報を示しています。
Region,State,County,ShipDate,Unit
East,MD,Calvert,1/31/2010,212
East,MD,Calvert,6/31/2010,212
East,MD,Calvert,1/31/2010,633
East,MD,Calvert,6/31/2010,234
East,MD,Prince Georges,2/25/2010,112
East,MD,Montgomery,1/31/2010,120
East,MD,Baltimore,6/31/2010,210
ユーザ ガイド
117
Group Statistics
East,VA,Fairfax,1/31/2010,710
West,CA,SanJose,1/31/2010,191
West,CA,Alameda,2/25/2010,411
West,CA,Los Angeles,2/25/2010,311
West,CA,Los Angeles,2/25/2010,215
West,CA,Los Angeles,6/31/2010,615
West,CA,Los Angeles,6/31/2010,727
州ごとに毎日の出荷数を示すピボット テーブルを作成することを考えます。 こ
れを行うには、Group Statistics ステージを次のように設定します。
フィールドの設定は次のようになります。 なお、フィールド名の最初の部分は、
データフローの入力データの [ShipDate] フィールドに現れる日付と完全に同じも
のでなければなりません。
118
Spectrum™ Technology Platform 8.0.0
第 5 章 : 制御ステージ
これからは、次の出力が得られます。 最初の行はヘッダ レコードです。
State|1/31/2010_GroupCount|2/25/2010_GroupCount|6/31/2010_GroupCount
VA|1||
CA|1|3|2
MD|3|1|3
Math
Math ステージは、単一のデータ行に対する算術演算を処理します。1 つ以上の式を使用する、様々な
算術関数を実行できます。 データは文字列として入力されますが、値は数値または Boolean (データ
に対して実行する演算の種類によります) である必要があります。
1. [制御ステージ] の下で [Math] ステージをクリックして、キャンバスまでドラッグし、データフロー
内の配置したい位置にドロップします。
2. ステージをキャンバス上の他のステージに接続します。
3. [Math] ステージをダブルクリックします。 [Math オプション] ダイアログ ボックスの [式] タブが
表示されます。 このタブには、[入力フィールド]、[Calculator]、[式] キャンバスが表示されます。
または、[関数] タブをクリックして、Calculator の代わりに関数を使用することもできます。
[入力フィールド] コントロールには、入力ポートに存在する有効なフィールドの一覧が表示されます。
フィールド名の構文は、非常に柔軟性の高いものですが、Groovy スクリプトの規則に基づく一部の制
ユーザ ガイド
119
Math
約があります。 Groovy スクリプトの詳細な情報については、次の Web サイトを参照してください。
groovy.codehaus.org
Calculator の使用
[Calculator] コントロールには、数値定数や演算子を式に挿入するためのボタンがあります。 フィール
ド、定数、演算子、関数をダブルクリックすることにより、それらを式に挿入できます。
表 17 : Calculator の演算子
120
演算子
説明
Backspace
式の中で 1 文字分後退します。
pi
pi は円の直径に対する円周の割合 (円周率) を表す数学定数です。
e
オイラー数。自然対数の底を表す数学定数です。
/
除算
*
乗算
+
加算
-
減算
x^y
累乗 (例えば、x^2 は x の 2 乗)
Mod
モジュロ。演算の剰余です。
;
セミコロン。式の末尾に使用します。
=
代入演算子
()
括弧。式の演算の優先順位を指定します。
.
小数点
if\else
条件文。条件が真の場合は処理を実行し、条件が偽の場合は別の処理を
実行します。
if\else if\else
複数の条件文。条件が真の場合は処理を実行し、条件が偽の場合は別の
処理を実行します。
==
算術関数の等号
!=
不等号
&&
論理積
||
論理和
>
より大きい
Spectrum™ Technology Platform 8.0.0
第 5 章 : 制御ステージ
演算子
説明
>=
以上
<
より小さい
<=
以下
関数と定数の使用
Math ステージには、式で使用できるいくつかの関数が用意されています。 関数の一般的な形式は、
関数(パラメータ)、関数(パラメータ,パラメータ)、関数(パラメータ,...) です。ここで、"パラメータ"
は、数値定数、変数、または数式です。 関数は別の数式と共に使用できます (例えば、x=Sin(y)*Cos(z))。
定数、変換、算術演算、および三角関数があります。 次に、サポートされている各関数をカテゴリ別
に示します。
表 18 : サポートされている関数
関数
説明
定数
e
自然対数の底である数学定数です。
false
値 false を表す Boolean 定数です。
Infinity
無限大を表す数学定数です。
NaN
数値ではない値を表す数学定数です。
Pi
円の直径に対する円周の割合 (円周率) を表す数学定数です。
true
値 true を表す Boolean 定数です。
変換
Abs (値)
パラメータを 1 つ指定します。
指定された値の絶対値を返します。
Ceil (値)
パラメータを 1 つ指定します。
端数を切り上げた値を返します (例えば、Ceil(5.5) は 6 を返します)。
DegToRad (値)
パラメータを 1 つ指定します。
指定された値を角度からラジアンに変換します。
Floor (値)
パラメータを 1 つ指定します。
端数を切り捨てた値を返します (例えば、Ceil(5.5) は 5 を返します)。
ユーザ ガイド
121
Math
関数
説明
RadToDeg (値)
パラメータを 1 つ指定します。
指定された値をラジアンから角度に変換します。
Round (値)
パラメータを 1 つ指定します。
四捨五入した値を返します。
Math
Avg (値, 値,...)
パラメータを 1 つ以上指定します。
指定された値の平均値を返します。
Exp (値)
パラメータを 1 つ指定します。
オイラー数の累乗を返します。
Fac (値)
パラメータを 1 つ指定します。
指定された値の階乗を返します (例えば、Fac(6) は 6*5*4*3*2*1 を意味
し、720 を返します)。
Ln (値)
パラメータを 1 つ指定します。
指定された値の自然対数 (底 e) を返します。
Log (値)
パラメータを 1 つ指定します。
指定された値の自然対数 (底 10) を返します。
Max (値, 値,...)
パラメータを 1 つ以上指定します。
引き渡された値の最大値を返します。
Min (値, 値,...)
パラメータを 1 つ以上指定します。
引き渡された値の最小値を返します。
Sqrt (値)
パラメータを 1 つ以上指定します。
引き渡された値の平方根を返します。
Sum (値)
パラメータを 1 つ指定します。
指定された値の合計を返します。
三角関数
ArcCos (値)
パラメータを 1 つ指定します。
値の逆余弦を返します。
ArcSin (値)
122
パラメータを 1 つ指定します。
Spectrum™ Technology Platform 8.0.0
第 5 章 : 制御ステージ
関数
説明
値の逆正弦を返します。
ArcTan (値)
パラメータを 1 つ指定します。
値の逆正接を返します。
Cos (値)
パラメータを 1 つ指定します。
値の余弦を返します。
Ln (値)
パラメータを 1 つ指定します。
指定された値の自然対数 (底 e) を返します。
Sin (値)
パラメータを 1 つ指定します。
値の正弦を返します。
Tan (値)
パラメータを 1 つ指定します。
値の正接を返します。
条件文の使用
条件文を使用すると、各種条件が真または偽のいずれであるかに応じて処理を実行できます。 括弧 (
と ) を使用してグループ化することにより、さらに複雑な条件を指定できます。
表 19 : 条件
条件
説明
等しい
式==式
等しくない
式 != 式
より大きい
式>式
以上
式 >= 式
より小さい
式<式
以下
式 <= 式
条件が偽
! 条件
And
条件 && 条件
Or
条件 || 条件
ユーザ ガイド
123
Math
If 文
if(condition)
{
actions to take if condition is true
}
中括弧は、"if" の後で複数の文を実行する場合のみ必要です。
If-Else If 文
if(condition)
{
actions to take if condition is true
}
else if(condition)
{
actions to take if condition is true
}
else if...
if(SideLength != NaN)
{
AreaOfPolygon=
((SideLength^2)*NumberOfSides)/
(4*Tan(pi/NumberOfSides));
}
else if(Radius != NaN)
{
AreaOfPolygon=
(Radius^2)*NumberOfSides*Sin((2*pi)/NumberOfSides)/2;
}
else if 文は複数指定できます。 中括弧は、"if-else- if-else" の後で複数の文を実行する場合にのみ必要
です。
Else-If 文
if(condition)
{
actions to take if condition is true
}
else if(condition)
{
actions to take if condition is true
}
else if...
else
{
actions to take if no conditions are met
}
Expressions コンソールの使用
Expressions コンソールは、Math ステージで評価する数式を入力するために使用します。 [入力フィー
ルド]、[Calculator]、[関数] コントロールを使用して、このコンソールに値を挿入します。 式は手動で
入力することもできます。 式は、定数、変数、または算術演算の形式で指定し、数値定数と変数で構
成します。 数値定数は、整数または小数で、符号を付けることができます。 変数は入力行からのデー
124
Spectrum™ Technology Platform 8.0.0
第 5 章 : 制御ステージ
タを表します。例えば、フィールド x、y、z が入力に定義されている場合、x、y、z を式で使用でき
ます。 変数は、実行時にフィールドの値で置き換えられます。
また、Math ステージでは、グループ化した式も使用できます。グループ化した式は括弧でくくられ、
演算子の優先順位よりも優先されます。 例えば、2*5^2 は 50 ですが、(2*5)^2 は 100 になります。
注: 式の末尾には必ずセミコロンを付けます。
また、条件文を Expressions コンソールで使用すると、各種条件が真または偽のいずれであるかに応
じて処理を実行できます。 条件文の詳細については、条件文の使用(123ページ) を参照してくださ
い。
Math ステージでは主に、式の結果を変数に代入する代入式を扱います。 このステージでは複数の代
入演算がサポートされているため、以前の代入演算の結果を使用できます。
代入式の例
次の例では、x=10、z=1000 となります。
x=5+5
z=x*100
次の例では、ポリゴンの面積を一辺の長さと辺の数に基づいて計算します。
AreaOfPolygon=
((SideLength^2)*NumberOfSides)/
(4*Tan(pi/NumberOfSides));
[フィールド] コントロールの使用
[フィールド] コントロールでは、入力および出力フィールドのタイプを変更できます。 このコントロー
ルでは、フィールドのタイプを変更できます。その場合は、[タイプ] 列のドロップダウン矢印をクリッ
クし、一覧から次のいずれかのオプションを選択します。
表 20 : データ タイプの値
タイプ
説明
boolean
true と false の 2 つの 値を持つ論理タイプ。 Boolean 変数は、条件文
で処理の流れを制御するために使用できます。 次のコードは、Boolean
式の例を示したものです。
if(x && y)
z=1;
else if(x)
z=2;
else if(y)
z=3;
else
z=4;
ユーザ ガイド
125
Query DB
タイプ
double
説明
-1074
正と負の倍精度数を含む数値データ タイプ。値の範囲は、2
-52
(2-2
〜
1023
。 指数表記すると、値の範囲は、4.9E-324 〜
)×2
1.7976931348623157E308 となります。 指数表記については、次のサ
イトを参照してください。
http://en.wikipedia.org/wiki/Scientific_notation#E_notation
float
-149
正と負の単精度数を含む数値データ タイプ。値の範囲は、2
23
〜
127
(2-2 )×2
。 指数表記すると、値の範囲は、1.4E-45 〜 3.4028235E38
となります。 指数表記については、次のサイトを参照してください。
http://en.wikipedia.org/wiki/Scientific_notation#E_notation
integer
31
正と負の自然数を含む数値データ タイプ。値の範囲は、-2
31
(-2,147,483,648) 〜 2 -1 (2,147,483,647)。
long
63
正と負の自然数を含む数値データ タイプ。値の範囲は、-2
63
(-9,223,372,036,854,775,808) 〜 2 -1 (9,223,372,036,854,775,807)。
[プレビュー] コントロールの使用
[プレビュー] コントロールでは、数式をテストできます。 [入力データ] エリアに、フィールドが一覧
表示されます。式に引き渡す値を指定すると、その出力が [入力データ] の下の [結果] エリアに表示さ
れます。
数値フィールドは 0 (double タイプの場合は 0.000) に初期化され、Boolean タイプ フィールドは False
に初期化されます。 double タイプおよび float タイプ フィールドでは、小数点以下の桁数が 4 桁に制
限され、integer タイプおよび long タイプ フィールドでは小数点は使用しません。
Query DB
Query DB ステージでは、データベース クエリのパラメータとしてフィールドを使用できます。 例え
ば、フラット ファイルから "AddressLine1" フィールドを読み込んだ場合、"AddressLine1" の値をパ
ラメータ値としてデータベースを検索するクエリを作成できます。 次のデータ タイプがサポートさ
れています。
126
データ タイプ
説明
boolean
true と false の 2 つの 値を持つ論理タイプ。
Spectrum™ Technology Platform 8.0.0
第 5 章 : 制御ステージ
データ タイプ
double
説明
-1074
正と負の倍精度数を含む数値データ タイプ。値の範囲は、2
-52
(2-2
〜
1023
。 指数表記すると、値の範囲は、4.9E-324 〜
)×2
1.7976931348623157E308 となります。 指数表記については、次のサイト
を参照してください。
http://en.wikipedia.org/wiki/Scientific_notation#E_notation
float
-149
正と負の単精度数を含む数値データ タイプ。値の範囲は、2
23
〜
127
(2-2 )×2
。 指数表記すると、値の範囲は、1.4E-45 〜 3.4028235E38 と
なります。 指数表記については、次のサイトを参照してください。
http://en.wikipedia.org/wiki/Scientific_notation#E_notation
integer
31
正と負の整数を含む数値データ タイプ。値の範囲は、-2 (-2,147,483,648)
31
〜 2 -1 (2,147,483,647)。
long
63
正と負の整数を含む数値データ タイプ。値の範囲は、-2
63
(-9,223,372,036,854,775,808) 〜 2 -1 (9,223,372,036,854,775,807)。
string
文字列
データベースのタイプと Spectrum™ Technology Platform との対応を次に示します。
データ タイプ
サポートされるデータ タイプ
文字列タイプ
CHAR
string
CLOB
string
DATE
string
LONGVARCHAR
string
NCHAR
string
NVARCHAR
string
TIME
string
TIMESTAMP
string
VARCHAR
string
数値タイプ
BIGINT
long
DECIMAL
double
DOUBLE
double
ユーザ ガイド
127
Query DB
データ タイプ
サポートされるデータ タイプ
FLOAT
double
INTEGER
integer
NUMERIC
double
REAL
float
SMALLINT
integer
TINYINT
integer
Boolean タイプ
BIT
boolean
BOOLEAN
boolean
注: 空間データベースに対してクエリを実行する場合は、Query DB の代わりに Query Spatial Data
を使用してください。
クエリ データベースを定義するには
1. [制御ステージ] の下で [Query DB] をクリックして、キャンバスまでドラッグし、データフロー内
の配置したい位置にドロップします。
2. アイコンをダブルクリックします。 [Query DB オプション] ダイアログ ボックスが表示されます。
3. [接続] フィールドで、使用するデータベース接続を選択します。 使用できるデータベース接続は、
Management Console の Connection Manager に定義されている接続によって異なります。 新し
いデータベース接続を作成する必要がある場合は、[管理] をクリックします。 詳細については、
Database Connection Manager を参照してください。
4. 参照ボタン ([...]) をクリックしてデータベースに移動するか、使用するデータベースを表示します。
5. "WHERE" を使用する場合は、[WHERE] フィールドにそれを入力します (文の中に "WHERE" とい
う語を入力してはいけないことに注意してください)。 "WHERE" 文は、入力レコードにフィルタ
を適用します。 "WHERE" 文を入力したら、[プレビュー] をクリックし、定義した条件に基づいて
データをプレビューします (最初の 50 件のレコードがプレビューされます)。
6. デフォルトで、[結果のないレコードを返す] がオンになっています。 これは、クエリが結果を返
さなかった場合でも、Query DB によってレコードが返されることを意味します。 このチェック
ボックスをオフにすると、レコードは返されず、つまり失われることになります。 このオプショ
ンをオンのままにしておくことを推奨します。
7. フィールド テーブルで、フィールドの横にある [含める] ボックスをクリックして、条件フィール
ドを選択します。
8. フィールドの値に基づいて、レコードをソートする場合は、[ソート] タブをクリックし、ソートす
るフィールドを指定します。
9. [OK] をクリックします。 キャンバスに戻ります。
128
Spectrum™ Technology Platform 8.0.0
第 5 章 : 制御ステージ
Database Connection Manager
Database Connection Manager ツールを使用すると、登録されているデータベース接続を管理できま
す。 接続を追加、変更、削除、およびテストするには
1. [Query DB オプション] ダイアログ ボックスで、[管理] をクリックします。
2. [追加]、[変更]、または [削除] をクリックします。
3. データベース接続を追加または変更する場合は、次のフィールドに必要な値を指定します。
• 接続名 — 新しい接続の名前を入力します。
• データベース ドライバ — 適切なデータベースの種類を選択します。
• 接続オプション — ホスト、ポート、インスタンス、ユーザ名、およびパスワードを指定します。
注: 接続をテストするには、[テスト] をクリックします。
4. データベース接続を削除する場合は、削除する接続を選択し、[削除] をクリックします。
Record Combiner
Record Combiner は、複数のステージからの 2 つ以上のレコードを単一のレコードに結合します。
Record Combiner は、1 つまたは複数のステージ入力ポートを持つように定義できます。 入力ポート
には、0 から始まる連続した番号が付けられ、それが "ポート" として表示されます。 Record Combiner
には通常、ステージ入力ポートが接続されます。Record Combiner はレコードを結合し、処理し、1
つのシンク (出力) ファイルに出力します。 例えば、1 つのステージ入力ファイル (ポート) から 1 つの
レコードのグループを受信し、2 つめのステージ入力ファイル (ポート 2) から別のレコードのグルー
プを受信して、それらのレコードを単一のレコードに結合することができます。 中間のステージを削
除しても、ポート番号が連番になるように再度割り当てられることはありません。
注: Record Combiner は、すべての入力ポートがレコードを受信するまで、レコードを出力しませ
ん。 すべての入力ポートのレコードを結合してから、レコードを出力します。
1. [制御ステージ] の下で [Record Combiner] をクリックして、キャンバスまでドラッグし、データフ
ロー内の配置したい位置にドロップします。
2. [Record Combiner] をダブルクリックします。 [Record Combiner オプション] ダイアログ ボック
スが表示されます。 このダイアログ ボックスには複数のレコードの間の不整合が表示され、どの
ポートを優先するかを指定するか、独自の式を入力することによってそれらを解決することができ
ます。
3. 必要な操作が終了したら、[OK] をクリックします。
ユーザ ガイド
129
Record Joiner
Record Joiner
Record Joiner は、SQL クエリスタイルのロジックを使用して、レコードのストリーム (ファイル、
データベース テーブル、またはステージ出力からの) 内の列間の関係に基づいて、これらのストリー
ムを結合します。 このクエリは、1 つのストリーム内のフィールドを別のストリーム内のフィールド
と比較して、指定された結合のタイプに基づいて行、つまりレコードを返します。
結合のタイプには 3 種類があります。
• 内部 — ドライビング ポートと他のポートの間で一致する行をすべて返します。 例えば、4 つの入
力ソースがあり、ポート 1 (以下 "ポート" と表記) をドライビング ポートとします。この場合、INNER
JOIN は、ポートとポート 2 の間、ポートとポート 3 の間、およびポートとポート 4 の間で、一致
するフィールドを持つ行をそれぞれ返します。
• 左内部 — 内部結合の実行結果と、ドライビング ポートの残りすべての行を (ドライビング ポートの
フィールドの値はそのまま、他のポートのフィールドの値は "null" として) 返します。
• 完全 — 内部結合の実行結果、ドライビング ポートの残りすべての行 (他のポートのフィールドの値
を "null" として)、および他のポートの残りすべての行 (ドライビング ポートのフィールドの値を
"null" として) を返します。
Record Joiner には、2 つ以上のステージ入力ポートが必要です。 これらのステージ入力ポートは
Record Joiner に接続されます。Record Joiner は、クエリに基づいてレコードを分析し、それらのレ
コードを 1 つのシンク (出力) ファイルまたはテーブルに送信します。
Record Joiner ステージを設定するには
1. [制御ステージ] の下で [Record Joiner] をクリックして、キャンバスまでドラッグし、データフ
ロー内の配置したい位置にドロップします。
2. 入力ファイルを接続します。
3. [Record Joiner] をダブルクリックします。 [Record Joiner オプション] ダイアログ ボックスが表
示されます。
4. [ドライビング ポート] フィールドで、照合するソース データがあるポートを選択します。 ドライ
ビング ポートを選択すると、[結合の定義] ボックスに、ドライビング ポートと他の各ポートの間
のアソシエーションが表示されます。
5. [結合タイプ] フィールドで、ドライビング ポートに対して実行する結合のタイプを選択します。
6. [結合フィールド] フィールドで、結合を実行するフィールドを選択します。 ドライビング ポート
の入力ファイルのフィールドはすべて使用できます。
7. ドライビング ポートの入力ファイルのデータが既にソート済みの場合は、[入力データをソート]
チェック ボックスをクリックします。
8. [結合の定義] ボックスで、フィールドに指定する定義をクリックし、[変更] をクリックします。
[結合の指定] ダイアログ ボックスが表示されます。
130
Spectrum™ Technology Platform 8.0.0
第 5 章 : 制御ステージ
注: 1 番目のドロップダウン ボックスは無効です。ドライビング ポート フィールドを変更する場
合は、[Record Joiner オプション] ダイアログ ボックスに戻って、[結合フィールド] フィー
ルドで変更する必要があります。
9. 2 番目のドロップダウン ボックスで、ドライビング ポートのフィールドに対応するフィールドを
他のポートから選択し、[OK] をクリックします。
10. [列の解決] に、2 つの入力から検出されたフィールドと、そのフィールドの出力に表示されるデー
タのデフォルトのポート番号が表示されます。 出力に別のポートのフィールド データを含める場
合は、ポート番号をクリックして別のポートを選択することで、ポートを変更できます。
11. 必要な操作が終了したら、[OK] をクリックします。
結合の定義を変更するには
1. 変更する結合の定義をクリックし、[変更] をクリックします。
2. 必要に応じて、ドライビング ポート以外のポートの結合フィールドを変更します。
3. 必要に応じて、[入力データをソート] チェック ボックスをクリックします。
4. [OK] をクリックします。
Sorter
Sorter は、データをフィールドでソートします。 Sorter には、ステージ入力ポートが 1 つ接続され、
指定されたフィールドに基づいてレコードをソートします。 例えば、レコードを名前、都市、または
データフロー内のその他のフィールドでソートできます。
1. [制御ステージ] の下で [Sorter] をクリックして、キャンバスまでドラッグし、データフロー内の配
置したい位置にドロップします。
2. [Sorter] をダブルクリックします。 [Sorter オプション] ダイアログ ボックスが表示されます。 こ
のダイアログ ボックスでは、ソートするフィールドの設定、フィールドのソート順序の指定、お
よび出力内でのフィールドの順序の指定を実行できます。
3. [追加] をクリックします。空白のフィールド行がソート テーブルに表示されます。
4. [フィールド名] 列の下矢印をクリックして、ソートするフィールドを選択します。
注: 使用可能なフィールドの一覧は、データフロー内のステージによって異なります。
5. フィールドを昇順または降順のいずれの順序でソートするかを指定し、[順序] 列から適切なオプ
ションを選択します。
6. フィールドのデータ タイプを指定し、[タイプ] 列から適切なオプションを選択します。 次のよう
なオプションがあります。
データ タイプ
説明
boolean
true と false の 2 つの 値を持つ論理タイプ。
ユーザ ガイド
131
Sorter
データ タイプ
double
説明
-1074
正と負の倍精度数を含む数値データ タイプ。値の範囲は、2
-52
(2-2
〜
1023
。 指数表記すると、値の範囲は、4.9E-324 〜
)×2
1.7976931348623157E308 となります。 指数表記については、次のサ
イトを参照してください。
http://en.wikipedia.org/wiki/Scientific_notation#E_notation
float
-149
正と負の単精度数を含む数値データ タイプ。値の範囲は、2
23
〜
127
(2-2 )×2
。 指数表記すると、値の範囲は、1.4E-45 〜 3.4028235E38
となります。 指数表記については、次のサイトを参照してください。
http://en.wikipedia.org/wiki/Scientific_notation#E_notation
integer
31
正と負の整数を含む数値データ タイプ。値の範囲は、-2 (-2,147,483,648)
31
〜 2 -1 (2,147,483,647)。
long
63
正と負の整数を含む数値データ タイプ。値の範囲は、-2
63
(-9,223,372,036,854,775,808) 〜 2 -1 (9,223,372,036,854,775,807)。
string
文字列
Note that if your incoming data is not in string format, the [タイプ] 列は無効になります。
7. ソートの前に、値の前後にある空白スペースを削除するには、[トリム] 列のボックスをチェックし
ます。 トリム オプションを使用しても、フィールドの値は変更されません。 このオプションは、
ソートのためにのみ、値をトリムします。 入力データが文字列形式でない場合は、[トリム] 列は
無効になります。
8. ステップ 3 〜 7 を繰り返して、ソートするすべてのフィールドを追加します。
9. [上へ] または [下へ] をクリックして、フィールドの順序を必要に応じて変更します。
10. 追加のソート パフォーマンス オプションを指定するには、[詳細設定] をクリックして、[詳細オプ
ション] ダイアログ ボックスを開きます。 [詳細オプション] ダイアログ ボックスには、次のソー
ト パフォーマンス オプションがあります。
• ソート パフォーマンス オプションをオーバーライド — これらのオプションをデフォルトのソー
ト パフォーマンス オプションよりも優先します。
• メモリ内レコードの上限値 — ソートでメモリ内に保持できるデータ行の最大数を指定します。
この上限を越えると、ディスクにページングします。
• 使用する一時ファイルの最大数 — ソート プロセスで使用できる一時ファイルの最大数を指定し
ます。
• 圧縮を有効にする — 一時ファイルをディスクに書き込むときに圧縮します。
注: ソートを最も効率的に実行できるソート パフォーマンス オプション設定の組み合わせは、
サーバーのハードウェア構成によって異なります。 ただし、次の一般的なガイドラインに従
うと、良好なパフォーマンスでソートを実行できることが確認されています。 (メモリ内レ
コードの上限値 × 使用する一時ファイルの最大数 ÷ 2) >= ソートする行数の合計。複数のジョ
132
Spectrum™ Technology Platform 8.0.0
第 5 章 : 制御ステージ
ブを同時並行で実行する環境では、[メモリ内レコードの上限値] の設定を増やすと、メモリ不
足になる可能性が高くなります。
追加のソート パフォーマンス オプションを指定したら、[OK] をクリックします。
11. [OK] をクリックします。
注: 必要に応じて、ソート条件を削除するには、行をハイライト表示し、[削除] をクリックしま
す。
Splitter
Splitter では階層データがフラット データに変換されます。 Splitter には 1 つの入力ポートと、Splitter
から次のステージへとデータを送信する 1 つの出力ポートがあります。
Splitter の機能を使用する一例として、情報の一覧をファイルで受け取って、その情報の各項目を個々
のデータ行として抽出することがあります。 具体的には、例えば、緯度/経度ポイントで表す一定の距
離内に配置された複数のランドマークを入力として引き渡し、それらのランドマークを Splitter によっ
て個々のデータ行に分割できます。 また、他の例として、ドライブの道順を含むルーティング ステー
ジから出力を受け取って、各道順 (またはリスト項目) をデータ行に分割できます。 このような種類の
機能を実行するデータフローの例を次に示します。
このデータフローは、次のように機能を実行します。
1. Read from File ステージには、個々のポイントの識別を容易にする緯度、経度、および入力キー
値が含まれます。
ユーザ ガイド
133
Splitter
2. Aggregator ステージでは、Read from File ステージからのデータに基づいてスキーマ (データの構
造的階層) を作成し、緯度と経度のグループをルート ポイントの一覧として識別します。このス
テップは、次のステップを適切に実行するために必要なステップです。
3. Location Intelligence モジュールの Get Travel Directions ステージでは、ステップ 2 からのルート
ポイントを使用して、ある場所から別の場所への道順を作成します。
134
Spectrum™ Technology Platform 8.0.0
第 5 章 : 制御ステージ
4. Splitter ステージでは、データを RouteDirections フィールドで分割し、出力リストに Get Travel
Directions ステージから使用可能なフィールドをすべて取り込む必要があります。
ユーザ ガイド
135
Splitter
スキーマは、次のように構成されます。RouteDirections と RoutePoints は、このジョブで使用で
きるリスト タイプです。
5. Write to File ステージは、ステップ 4 の出力を収集します。
136
Spectrum™ Technology Platform 8.0.0
第 5 章 : 制御ステージ
次の図は、このデータフローのインスペクション結果の一部を示したものです。
個々の行のツリーを展開すると、インスペクションに使用されたデータが表示されます。この場合
のデータは、道順のルート ポイントの緯度と経度です。
ユーザ ガイド
137
Stream Combiner
Splitter ステージの使用
1. [制御ステージ] の下で [Splitter] をクリックして、キャンバスまでドラッグし、データフロー内の
配置したい位置にドロップして、入力および出力ステージに接続します。
2. [Splitter] をダブルクリックします。 [Splitter オプション] ダイアログ ボックスが表示されます。
3. [分割位置] ドロップダウンをクリックして、このステージで使用できる別のリスト タイプを表示
します。 Splitter で作成するリスト タイプをクリックします。 [Splitter オプション] ダイアログ
ボックスは、選択内容に応じて調整され、そのリスト タイプで使用できるフィールドが表示され
ます。
また、[分割位置] ドロップダウンの横にある省略記号 (...) ボタンをクリックすることもできます。
[フィールド スキーマ] ダイアログ ボックスが表示され、Splitter に入力されるデータのスキーマが
示されます。 リスト タイプは太字で示され、その後に続いて、各タイプの個々のリストが表示さ
れます。 また、これらのフィールドの形式も表示されます (string、double 等)。 Splitter で作成す
るリスト タイプをクリックし、[OK] をクリックします。 [Splitter オプション] ダイアログ ボック
スは、選択内容に応じて調整され、そのリスト タイプで使用できるフィールドが表示されます。
4. Splitter で出力に含めるフィールドを選択します。そのためには、該当するフィールドの [含める]
ボックスをクリックします。
5. [OK] をクリックします。
Stream Combiner
Stream Combiner は、複数のステージからのレコードで構成される 2 つ以上のリストを結合します。
Stream Combiner は、定義方法によっては、1 つ以上のステージ入力ポートを使用できます。 入力ポー
トには、ゼロ (0) から順に番号が付けられます。 一般に、入力ポートは Stream Combiner に接続され
ます。Stream Combiner は、レコードを結合および処理して、1 つのシンク (出力) ファイルに送信し
ます。 例えば、あるステージ入力ファイル (port[0]) からのレコード群と、別のステージ入力ファイル
(port[1]) からのレコード群があり、それらのレコードを単一レコードに結合できます。
[制御ステージ] の下で [Stream Combiner] をクリックして、キャンバスまでドラッグし、データフロー
内の配置したい位置にドロップします。
Stream Combiner には変更する設定はありません。
138
Spectrum™ Technology Platform 8.0.0
第 5 章 : 制御ステージ
Transformer
Transformer ステージは、フィールドの値と書式を変更します。 トランスフォームを使用するには、
ジョブに少なくとも、定義済みの入力、ステージ、および定義済みの出力が必要です。 入力フィール
ドと出力フィールドの名前が同じであれば、フィールドに対して実行するトランスフォームを複数選
択できます。
注: 1 つのフィールドを 2 つの異なる出力フィールドにマップ (例えば、ValidateAddress.City を
Output.City1 と Output.City2 にマップ) して、各フィールドにトランスフォームを追加する場合
は、2 番目のフィールドのトランスフォームを最初に実行する必要があります。 したがって、2
番目のフィールドのトランスフォーム (Output.City2) を最初に実行するように、トランスフォー
ムの実行順序を変更する必要があります。 詳細については、トランスフォームの順序の変更
(140ページ)を参照してください。
表 21 : 一般トランスフォーム
オプション名
説明
フィールド作成
定数値と入力フィールドを "テンプレート" に基づいて追加、連結しま
す。 "トランスフォーマによる値の作成" と "連結機能" トランスフォー
マの両方の機能を単一のトランスフォームに備えています。
コピー
フィールド間で値をコピーします。
カスタム
単純なスクリプトを使用して、カスタマイズしたトランスフォームを
定義します。 詳細については、カスタム トランスフォーム(141ペー
ジ)を参照してください。
ステータス
[ステータス] フィールドの値を [成功] または [失敗] に変更します。 [失
敗] に設定されている場合は、オプションの [説明] と [コード] も設定
できます。
表 22 : トランスフォームの書式設定
オプション名
説明
大文字小文字
大文字または小文字を変更します。
ユーザ ガイド
139
Transformer
オプション名
説明
マスク
文字をフィールドに適用します。または、文字をフィールドから削除
します。
パディング
フィールド値の左側または右側に文字を追加します。
表 23 : 文字列関係のトランスフォーム
オプション名
説明
前後の空白削除
フィールドの先頭と末尾にある空白を削除します。 また、一連の空白
(複数の連続する空白等) を単一の空白文字に置き換えます。
部分文字列の削除
文字列をフィールドからすべて削除します。 例えば、"CA" を
StateProvince フィールドから削除します。
部分文字列
一連の連続する文字をフィールド間でコピーします。
トリム
フィールドの左側、右側、または両側から、指定された文字を削除し
ます。 このトランスフォームは、大文字と小文字を区別します。
切り捨て
フィールドの左側、右側、または両側から、指定された文字数だけ文
字を削除します。
トランスフォームの順序の変更
複数のトランスフォームを特定の出力フィールドで実行する場合は、トランスフォームの実行順序を
定義したり、実行順序を変更したりできます。
1. [Transformer] ステージをダブルクリックします。 [Transformer オプション] ダイアログ ボックス
が表示されます。
2. トランスフォームを選択し、[上へ移動] および [下へ移動] ボタンを使用してトランスフォームの順
序を変更します。 一番上のトランスフォームが最初に実行されます。
注: 従属トランスフォームをプライマリ トランスフォームの上に移動することはできません (プラ
イマリ トランスフォームは、従属トランスフォームが依存するトランスフォームです)。
3. [OK] をクリックします。
140
Spectrum™ Technology Platform 8.0.0
第 5 章 : 制御ステージ
カスタム トランスフォーム
Transformer ステージには、あらかじめトランスフォームがいくつか定義されており、データの変換
ニーズのほとんどに対応します。 これらのトランスフォームだけではニーズに十分対応できない場合
は、Groovy スクリプトを使用してカスタム トランスフォームを作成できます。 Groovy スクリプトの
詳細な情報については、次の Web サイトを参照してください。
groovy.codehaus.org
Groovy を使用してカスタム トランスフォームを作成する場合は、次の点に注意してください。
• Groovy スクリプトでは、論理分岐構造を使用できます。 特によく使われるのは if 文と switch 文で
す。 詳細については、Groovy.codehaus.org/Logical+Branching を参照してください。
• 普通必要になるループ構造は for ループだけでしょう。 ループ処理または構文の詳細については、
Groovy.codehaus.org/Looping を参照してください。
• [フルスクリーン] ボタンをクリックして、スクリプト エディタを全画面モードで開きます。 これ
で、大きくて複雑なスクリプトを楽に操作できるようになります。
次に、よく使われる文字列操作をいくつか示します。 文字列操作の詳細、およびその他の操作につい
ては、java.sun.com/j2se/1.4.2/docs/api/index.html で java.lang.String クラスを参照するか、
http://Groovy.codehaus.org/groovy-jdk/ で Groovy java.lang.String クラスを参照してください。
注: String タイプのオブジェクトは不変、つまり変更できません。
表 24 : 文字列操作
操作
説明
length() : int
文字列の文字数を取得します。
startsWith(文字列値) : boolean
文字列の 1 文字目が指定された文字と一致するか
どうかを示します。
endsWith(文字列値) : boolean
文字列の最後の文字が指定された文字と一致する
かどうかを示します。
toUpperCase() : String
文字列の文字をすべて大文字にして返します。 文
字列の値そのものは変更されません。
toLowerCase() : String
文字列の文字をすべて小文字にして返します。 文
字列の値そのものは変更されません。
substring(int startIndex, int
endIndex) : String
startIndex から endIndex-1 までの文字を含む部分
文字列を返します。
ユーザ ガイド
141
Transformer
フィールド値の取得
フィールド値を取得するには、フィールド (列) 名を使用します。 data[String 列] : def
フィールド値の設定
フィールド値を設定するには、フィールド (列) 名を使用します。 data[String 列]=def 値 :
void
注: これまで、String タイプのデータの取得と設定には行変数を使用しましたが、行変数は廃止され
ました。 データ変数は、サポートされているすべてのデータ タイプで使用できます。したがっ
て、上記のとおり、行変数ではなく、データ変数を使用することを推奨します。
Mask Transform の使用
削除と適用の 2 種類の マスクがあります。
Remove Mask (削除マスク) では、文字列から文字パターンが抽出されます。 例えば、
入力が (800)368 5806 で、
マスクが (###)### #### の場合、
出力は 8003685806 です。 8003685806
"(" および ")" と <スペース> はリテラルなので削除されます。 # はマスク文字なので、数字はすべて
残ります。
もう 1 つ例を示します。
入力が (800)368 5806 で、
マスクが *###*###*#### の場合、
出力は (800)368 5806
です。この例のマスクにはリテラルがないので何も削除されません (マスク文字 * は何を表すのにも使
用できます)。
Apply Mask (適用マスク) では、文字列に書式が適用されます。 例えば、
入力が 8003685806
マスクが (###)### #### の場合、
出力は (800)368 5806 です。
です。この例で "(" および ")" と <スペース> はリテラルなので出力に追加されます。 # はマスク文字
なので、数字はすべて残ります。
マスク文字は、入力文字列の特定の位置にある有効な文字を示します。 例えば、入力の 1 文字目が数
字の場合、最初のマスク文字は # にする必要があります。 入力内の要素のうち、このマスク文字と一
致する要素のみが出力に残ります。
マスクでは、 マスク文字とリテラルの 2 種類の文字を使用します。
142
Spectrum™ Technology Platform 8.0.0
第 5 章 : 制御ステージ
表 25 : マスク文字
文字
定義
#
任意の有効な数字。Character.isDigit を使用します。
'
エスケープ文字。特殊な書式文字をエスケープします。
U
任意の文字 (Character.isLetter)。 すべての小文字を大文字にマップします。
L
任意の文字 (Character.isLetter)。 すべての大文字を小文字にマップします。
A
任意の文字または数字 (Character.isLetter または Character.isDigit)。
?
任意の文字 (Character.isLetter)。
*
任意。
H
16 進文字 (0-9、a-f、または A-F)。
上記以外にも、マスクではリテラルを使用できます。 リテラルは、文字列内の実際の文字を表しま
す。 Remove Mask Transform を使用するときは、入力文字は、マスクのリテラル文字と正確に一致
している必要があります。 正確に一致していれば、リテラル文字は入力から削除されます。 同様に、
Apply Mask Transform では、リテラル文字は、マスク定義によって指定される入力内の位置に追加さ
れます。 リテラルには、(、- 等があります。
一般的な誤りを次に示します。
• Remove Mask で、入力の文字数がマスク文字の文字数と一致しない場合は、トランスフォームは失
敗します。 例えば、
入力が 21045 で、
マスクが #####-#### の場合、
出力は 21045 です。 21045
Mask Transform は失敗します。 Mask Transform を正しく実行するには、入力の桁数がマスクの #
文字の数と一致し、リテラル "-" とも一致する必要があります。
• Apply Mask で、入力の文字数がマスク文字の文字数と一致しない場合は、予期しない結果が生成さ
れる可能性があります。 例えば、
入力が 21045 で、
マスクが #####-#### の場合、
出力は "21045- " です。
ユーザ ガイド
143
Transformer
Mask Transform は失敗しません。 21045 がマスクと一致しなくても、本来の結果を生成するよう
に試行されます。 この場合、結果は "21045- " です (ダッシュの後に 4 つのスペースが追加されま
す)。
フィールドの連結
この例では、FirstName フィールドと LastName フィールドを 1 つの値に連結し、その値を FullName
フィールドに格納します。
String fullname = data['FirstName'] + ' ' + data['LastName'];
data['FullName']=fullname;
連結は、次の方法でも実行できます。
Input:
Field 1: AddressLine1
Field 2: AddressLine2
Output: Address
Script:
address1 = data['AddressLine1'];
address2 = data['AddressLine2'];
data['Address']=address1+ ',' + address2;
フィールドのパーシング
この例では、PostalCode フィールドが 6 文字以上の場合は、フィールドを 5 桁の ZIP コードと +4 番
号に分割し、それぞれの番号を出力行の各フィールドに書き込みます。
if (data.get['PostalCode'].length() > 5)
{
String postalCode = data['PostalCode'];
int separatorPosition = postalCode.indexOf('-');
String zip = postalCode.substring(0, separatorPosition);
String plusFour = postalCode.substring(
separatorPosition + 1,
postalCode.length();
data['Zip']=zip;
data['PlusFour']=plusFour;
}
条件付き処理
この例では、AddressCity フィールドを最初の住所行に設定し、都市が Austin の場合は都市名も設定
します。
Input
Field 1: City
Field 2: AddressLine1
Output: AddressCity
Condition: If City is Austin
Script:
city = data['City'];
address1 = data['AddressLine1']
if(city.equals('Austin'))
data['AddressCity']=address1 +',' + city;
144
Spectrum™ Technology Platform 8.0.0
第 5 章 : 制御ステージ
データの追加
次のスクリプトは、"Incorporated" という単語を FirmName フィールドの末尾に追加します。
Input
Field 1: FirmName
Output: FirmName
Script:
firmname = data['FirmName'];
constant = 'Incorporated';
if(firmname.length() > 0)
data['FirmName']=firmname + ' ' + constant;
Unique ID Generator
Unique ID Generator ステージでは、特定のレコードの識別に使用するユニーク キーを作成します。
ユニーク ID は、トランザクションで名前および住所データをすべて送信するとは限らないが、トラン
ザクションを同じレコード/連絡先に帰する必要があるデータ ウェアハウス イニシアチブではきわめ
て重要です。 ユニーク ID は、個人、世帯、企業、および敷地レベルで実装されることがあります。
Unique ID Generator は、ユニーク ID を作成する各種アルゴリズムを備えています。
ユニーク ID は、順番数字または日付/時間スタンプのいずれかに基づきます。 アルゴリズムと入力ソー
ス ファイルに基づくカスタム ビジネス ルールを ID に追加できます。 順番数字または日付/時間スタ
ンプ ID は必須で、生成された ID から削除できません。
次の例では、入力の各レコードに出力で順番レコード ID を割り当てます。
レコード
レコード ID
John Smith
1
Mary Smith
2
Jane Doe
3
John Doe
4
オプション
ユニーク ID の定義
1. キャンバスで、Unique ID Generator のインスタンスをダブルクリックします。 [Unique ID Generator
のオプションを表示] ダイアログ ボックスが表示されます。
注: ユニーク キーは常に異なる色で表示され、削除できません。
ユーザ ガイド
145
Unique ID Generator
2. 既存のユニーク キーを選択し、[変更] ボタンをクリックします。 [ユニーク キー] ダイアログ ボッ
クスが表示されます。
3. 目的のユニーク キー オプションを選択します。 次のオプションがあります。
•
Sequential Numeric Tag (順番数字タグ) — 各レコードに数字の増分値を割り当てます。 [開始
位置] フィールドに、順番の開始番号を入力します。
•
Date/Time Stamp (日付/時間スタンプ) — 日付/時間スタンプに基づくユニーク キーを作成しま
す。
4. [OK] をクリックします。
[ユニーク ID] フィールドの追加
[ユニーク ID] フィールド オプションを使用すると、いくつかのアルゴリズムと入力ソース フィールド
から選択して、順番数字または日付/時間スタンプ レコード ID にデータを追加できます。
1. [追加] ボタンをクリックします。 [ユニーク ID フィールド オプション] ダイアログが表示されま
す。
2. [アルゴリズム] ドロップ ダウン ボックスをクリックして、適切なアルゴリズムを選択します。 ア
ルゴリズムの詳細については、Match Key Generator(398ページ)を参照してください。
3. [フィールド名] ドロップ ダウン ボックスをクリックして、入力ソースからフィールドを選択しま
す。
4. 選択したフィールド内での開始位置を指定します。
5. 開始位置から含める文字の数を指定します。
注: すべてのアルゴリズムで、開始位置と長さを指定できるとは限りません。
6. ユニーク ID の作成にアルゴリズムが適用される前に、前処理が発生します。
注: 前処理のためにソート入力を選択していると、Metaphone および Soundex アルゴリズムは、
Unique ID Generator によって非アクティブになります。
• ノイズ文字の削除: ハイフン、空白、その他の特殊文字等、英数字以外の文字を入力フィールド
からすべて削除します。
• ソート入力: 入力フィールド内の文字または語をすべてアルファベット順にソートします。
• 文字: ユニーク ID を作成する前に、入力フィールドの文字値をソートします。
• 語: ユニーク ID を作成する前に、入力フィールドの各語値をソートします。
7. [OK] をクリックして、設定を保存します。
8. ステップ 1 〜 7 を繰り返して、ユニーク ID にフィールドを追加します。
146
Spectrum™ Technology Platform 8.0.0
第 5 章 : 制御ステージ
出力
表 26 : Unique ID Generator 出力
フィールド名
説明/有効値
RecordID
レコードを識別する一意の番号を割り当てます。
ユーザ ガイド
147
プライマリ ステージ
プライマリ ステージは、データフローの中心的なステージです。 プライマリ
ステージでは、一般に、住所の正規化、ジオコーディング、名前の正規化等、
特定のビジネス目標を達成するために必要な処理を実行します。
このセクションの構成
• モジュール ステージ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .150
• サブフロー . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .150
6
モジュール ステージ
モジュール ステージ
Spectrum™ Technology Platform のモジュールは、住所検証、ジオコーディング、マッチングなど、
さまざまなデータ品質処理機能を備えています。 これらのいずれかのモジュールのライセンスを供与
すると、モジュールのステージを Enterprise Designer のプライマリ ステージ フォルダで使用できま
す。 これらのステージのいずれかを使用するには、ステージをパレットからキャンバスにドラッグし
ます。各ステージについては、モジュール(277ページ)を参照してください。
サブフロー
サブフローは、複数のデータフローで再使用できるデータフローです。 データフロー コンポーネント
の [ユーザ定義ステージ] フォルダに表示されるサブフローは、保存してエクスポーズできます。[展
開済みステージ] フォルダに表示されるステージは、システムによって展開されるステージです。 サ
ブフローの作成および管理については、サブフロー(43ページ)を参照してください。
サブフローを追加するには
1. データフローを開きます。
2. [ユーザ定義ステージ] で、サブフローをキャンバスの目的のデータフローにドロップします。
3. ソースとシンクをドラッグしてサブフローに接続します。
サブフローのエクスポーズ
[ファイル] > [エクスポーズ/アンエクスポーズして保存] を選択するか、[エクスポーズ] ボタン (電球)
をクリックします。 そのサブフローを他のデータフローで使用できるようになります。
注: サーバーのアップグレードの間にその時点でシステムに格納されているすべてのサブフローはエ
クスポーズとマークされて、アップグレード前と同じ動作がサブフローに提供されます。 アップ
グレードの前にエクスポートされたサブフローには、エクスポーズ フラグは設定されません。 し
たがって、これらのサブフローをシステムにインポートして戻すときは、インポートされたサブ
フローを手動でエクスポーズする必要があります。
サブフローの変更
サブフローを変更するときは、そのサブフローを使用するデータフローに対する影響を検討します。
サブフローを使用しているデータフローを確認するには、サブフローを開き、 [ツール] > [使用箇所]
を選択します。
150
Spectrum™ Technology Platform 8.0.0
第 6 章 : プライマリ ステージ
入力または出力を削除したり、新しい入力または出力を追加したりすると、他のデータフローがサブ
フローを使用していることを伝える警告メッセージが表示され、サブフローを使用しているデータフ
ローを確認できます。 再利用可能なステージの保存を続行すると、サブフローによって使用されてい
るすべてのデータフローがアンエクスポーズされます。
ファイル名やステージ設定の変更など、それ以外の変更をサブフローに対して行うと、他のデータフ
ローがサブフローを使用していることを伝える警告メッセージが表示され、サブフローを使用してい
るデータフローを確認できます。 この場合のデータフローはアンエクスポーズしないで続行できま
す。
注: サブフローを変更したときは、ビューを更新して、親データフローに変更を反映する必要があり
ます。
サブフローの削除
エクスポーズしたサブフローを削除しようとした場合は、削除しようとしているサブフローを他のデー
タフローが使用していることを伝える警告メッセージが表示されます。 サブフローの削除を続行する
と、接続されているすべてのデータフローがアンエクスポーズされます。
サブフローのアンエクスポーズ
サブフローをアンエクスポーズするには、 [ファイル] > [エクスポーズ/アンエクスポーズして保存] を
選択するか、[エクスポーズ] ボタン (電球) をクリックします。
サブフローをアンエクスポーズするとき、変更しようとしているサブフローを他のデータフローが使
用していることを伝える警告メッセージが表示されます。 サブフローのアンエクスポーズを続行する
と、そのサブフローを使用しているすべてのデータフローがアンエクスポーズされます。
ステージからサブフローへの変換
1. 新しいジョブ、サービス、またはサブフローを作成します。
2. ジョブ、サービス、またはサブフローに組み込むステージを追加します。
3. この時点でステージを設定する場合は、ステージを右クリックして [オプション] を選択します。
必要に応じてステージのオプションを設定した後、[OK] をクリックします。
4. 変換するステージを右クリックし、[ステージをサブフローに変換] を選択します。 [名前を付けて
保存] ダイアログ ボックスが表示されます。
5. サブフローの名前を入力して [OK] をクリックした後、サービスを保存します。 システムでユニー
クな名前を指定する必要があります。 次の 3 つのことが行われます。
• 次のものが含まれる新しいサブフローが作成されます。
• ユーザが選択したステージ
• ステージの各入力ポートに対するデータフロー入力
• ステージの各出力ポートに対するデータフロー出力
• ステージとその入力および出力の間の接続
ユーザ ガイド
151
サブフロー
• ユーザが選択したステージが新しいサブフローに置き換えられます。
• 新しいサブフローがエクスポーズされます。 結果は、サーバ エクスプローラおよびツールボッ
クスの [ユーザ定義ステージ] セクションで確認できます。
サブフローを作成し、それを他のデータフローで使用した後は、サブフローを使用している他のデー
タフローを確認できます。 サブフローを開き、 [ツール] > [使用箇所] を選択します。 (または、Server
Explorer でサブフローを右クリックし、[使用箇所] を選択します。) 現在のサブフローを使用している
データフローのリストが表示され、現在のサブフローを変更した場合に影響を受けるデータフローを
確認できます。
152
Spectrum™ Technology Platform 8.0.0
シンク
シンクは、ジョブの最後のステージです。 シンクでは、出力の処理方法 (ファ
イルまたはデータベースへの書き込み) を定義します。また、最後に、あるいは
データフローで、プログラムを実行する等の他のアクションを実行することも
できます。
このセクションの構成
•
•
•
•
•
•
•
•
Execute Program . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .154
Output . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .154
Terminate Job . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .157
Write to DB . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .157
Write to File . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .163
Write to Null . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .171
Write to Variable Format File . . . . . . . . . . . . . . . . . . . . . .171
Write to XML . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .179
7
Execute Program
Execute Program
Execute Program ステージは、レコードを受け取ると、プログラムやコマンド ライン コマンド等の実
行可能ファイルを呼び出します。 Execute Program ステージをデータフローで使用するには
1. Execute Program ステージをクリックして、キャンバスにドラッグします。
2. [Execute Program] ステージをダブルクリックします。
3. [コマンド ライン] フィールドに実行可能ファイルの名前と引数 (適用可能な場合) を入力します。
引数には、データフロー内で使用可能なデータを指定できます。 そのデータにアクセスするには、
[...] (参照) ボタンをクリックします。 現在のジョブ ID、現在のジョブ名、または現在のユーザ名
の 3 つの コンテキストから選択できます。 使用可能なフィールドから選択することもできます。
例えば、 JobStatus や JobComment を選択できます。
4. タイムアウト制限を設定する場合は、[タイムアウト (ミリ秒)] をクリックし、タイムアウト制限と
して設定する時間をミリ秒で入力します。
5. 必要に応じて環境変数を追加します。
6. [追加] をクリックします。
7. [キー] フィールドに適切なキーワードを入力します。 例えば、"JAVA_HOME" と入力します。
8. [値] フィールドに適切な値を入力します。 例えば、C:\ j2sdk1.4.2_04 と入力します。 また
は、[...] (参照) ボタンをクリックすることにより、[フィールド リスト] ダイアログ ボックスから
フィールドを選択することもできます。 現在のジョブ ID、現在のジョブ名、または現在のユーザ
名の 3 つの コンテキストから選択できます。 使用可能なフィールドから選択することもできま
す。 例えば、 JobStatus や JobComment を選択できます。
Output
Output ステージでは、サービスまたはサブフローが返す出力フィールドを定義します。 次のステップ
に従って、サービス出力を定義します。
1. キャンバス上の出力アイコンをダブルクリックします。 [出力オプション] ダイアログ ボックスが
表示されます。 [出力オプション] ダイアログ ボックスを初めて開く場合は、入力に定義されてい
るフィールドのリストが表示されます。
2. 新しいフィールドをフィールド リストに追加するには、[追加] をクリックします。[カスタム フィー
ルドの追加] ダイアログ ボックスが表示されます。 また、カスタム フィールドを変更または削除
することもできます。
3. [追加] を再度クリックします。
4. フィールド名をテキスト ボックスに入力します。
5. [データ タイプ] を選択し、[OK] を押します。 次のデータ タイプがサポートされています。
154
Spectrum™ Technology Platform 8.0.0
第 7 章 : シンク
データ タイプ
AccessibleNode
説明
等時線または等距離線によってアクセス可能な各ノードに対して 1 つの
ポイントを持つ MultiPoint を返すデータ タイプ。 ノードは、交差点、ま
たは重要なジオメトリ フィーチャーのいずれかです。
注: このタイプは、Location Intelligence モジュールにおいてのみ使用可
能です。
boolean
double
true と false の 2 つの 値を持つ論理タイプ。
-1074
正と負の倍精度数を含む数値データ タイプ。値の範囲は、2
-52
(2-2
〜
1023
。 指数表記すると、値の範囲は、4.9E-324 〜
)×2
1.7976931348623157E308 となります。 指数表記については、次のサ
イトを参照してください。
http://en.wikipedia.org/wiki/Scientific_notation#E_notation
float
-149
正と負の単精度数を含む数値データ タイプ。値の範囲は、2
23
〜
127
(2-2 )×2
。 指数表記すると、値の範囲は、1.4E-45 〜 3.4028235E38
となります。 指数表記については、次のサイトを参照してください。
http://en.wikipedia.org/wiki/Scientific_notation#E_notation
ジオメトリ
等時線または等距離線によって到達可能な領域を表す MultiPolygon を返
すデータ タイプ。
注: このタイプは、Location Intelligence モジュールにおいてのみ使用可
能です。
integer
31
正と負の整数を含む数値データ タイプ。値の範囲は、-2 (-2,147,483,648)
31
〜 2 -1 (2,147,483,647)。
リスト
厳密に言えば、リストはデータ タイプではありません。 しかし、フィー
ルドが階層データを含む場合、"リスト" フィールドとして扱われます。
Spectrum™ Technology Platform では、リストは複数の値で構成される
データのコレクションです。 例えば、Names フィールドには名前の値
のリストを含めることができます。 これは、XML 構造では次のように
表すことができます。
<Names>
<Name>John Smith</Name>
<Name>Ann Fowler</Name>
</Names>
XML のリスト データ タイプが複数の値で構成される単純データ タイプ
であるのに対し、Spectrum™ Technology Platform のリスト データ タイ
ユーザ ガイド
155
Output
データ タイプ
説明
プは XML の複合データ タイプに似ているという点で、Spectrum™
Technology Platform のリスト データ タイプは XML スキーマのリスト
データ タイプと異なることに注意してください。
long
63
正と負の自然数を含む数値データ タイプ。値の範囲は、-2
63
(-9,223,372,036,854,775,808) 〜 2 -1 (9,223,372,036,854,775,807)。
RouteCostMatrix
個々のルートの合計時間および距離。
注: このタイプは、Location Intelligence モジュールにおいてのみ使用可
能です。
string
文字列
You can also add a new, user-defined data type if necessary, and that new type can be a list of any
defined data type. For example, you could define a list of names (string), or a new data type of
addresses that includes AddressLine1 (string), City (string), StateProvince (string) and PostalCode
(string). After you create the field, you can view the data type by accessing the Input Options dialog
and pressing the button in the Data Type column. The [データ タイプ詳細] ダイアログ ボックスが
表示され、フィールドの構造が示されます。
6. [OK] を再度クリックします。
7. [エクスポーズ] の横にあるチェック ボックスをクリックして、フィールド リストに含まれるフィー
ルドすべてのチェック ボックスを選択します。 フィールド リストからフィールドを選択して、
フィールドをステージ操作用としてデータフローにエクスポーズします。 チェック ボックスを再
度クリックして、リストに含まれるフィールドすべてのチェック ボックスをクリアします。 フィー
ルド リストに含まれる 1 つ以上のフィールドのチェック ボックスをクリアし、[OK] をクリックす
ると、フィールドがフィールド リストから削除されます。
注: 入力フィールドに階層データを定義している場合は、データをインポートしたり、データを
垂直方向に表示したりできません。
8. [OK] をクリックして、キャンバスに戻ります。
Web サービス データ タイプの定義
[データ タイプ名] フィールドにより、作成しているサービスの WSDL (SOAP) および WADL (REST)
インターフェイスの制御が可能です。 Rows 要素の名前は、サービス内のこのステージに付けた名前
によって決まり、Row 要素の名前は、ここに入力したテキストによって決まります。
注: WSDL の場合は要求と応答の両方に影響しますが、WADL の場合は応答のみに影響が生じます。
このステージに名前を付け、このフィールドにテキストを入力する前のコードの例を、次に示します。
<Rows>
<Row>
<FirstName>John</FirstName>
<LastName>Doe</LastName>
156
Spectrum™ Technology Platform 8.0.0
第 7 章 : シンク
</Row>
<Row>
<FirstName>Jane</FirstName>
<LastName>Doe></LastName>
</Row>
</Rows>
このステージに名前を付け、このフィールドにテキストを入力した後、コードは次のようになります。
<Names>
<Name>
<FirstName>John</FirstName>
<LastName>Doe</LastName>
</Name>
<Name>
<FirstName>Jane</FirstName>
<LastName>Doe></LastName>
</Name>
</Names>
Terminate Job
Terminate Job ステージでは、レコードが特定の条件を満たすと、ジョブは終了します。
注: Terminate Job は、サービスやサブフローでは使用できません。
1. コンディショナル ルータをデータフローに追加します。
2. Terminate Job ステージをデータフローに追加します。
3. ステージを接続し、コンディショナル ルータを設定します。 コンディショナル ルータの設定に
は、ジョブの終了条件を指定してください。 条件を満たすレコードが見つかると、そのレコード
は、終了ステージに引き渡されて、ジョブが終了し、 ステージによるジョブの終了を示すメッセー
ジが生成されます。 完成したデータフローは次のようになります。
Write to DB
Write to DB ステージでは、ジョブの出力がデータベースに書き出されます。
ユーザ ガイド
157
Write to DB
注: Write to DB の複数の実行時インスタンスを使用することで、パフォーマンスを大きく改善できま
す。 複数の実行時インスタンスを指定するには、[実行時] ボタンをクリックします。 Write to DB
のパフォーマンスの最適化の詳細については、『 Spectrum™ Technology Platform パフォーマン
ス チューニング ガイド』を参照してください。.
[全般] タブ
オプション名
説明
接続
[接続] フィールドで、使用するデータベースへの接続を選択します。
新しいデータベース接続を作成するには、[管理] をクリックします。
データベース接続の作成の詳細については、Database Connection
Manager を参照してください。
テーブル/ビュー
接続を選択した後、出力先のテーブルまたはビューを指定します。 参
照ボタン ([...]) をクリックして使用するテーブルまたはビューに移動
するか、[テーブルの作成] をクリックしてデータベースに新しいテー
ブルを作成します。
注: SQL データベースに出力する場合は、複数のテーブルを参照する
ビューには出力できません。 これは SQL Server の制限によりま
す。
[テーブルの作成] をクリックした場合は、[テーブルの所有者] フィー
ルドでテーブルの所有者を選択し、[テーブル名] フィールドで新しい
テーブルの名前を指定します。 また、[含める] 列のボックスをオンに
して、新しいテーブルを出力先とするフィールドを指定します。 [出
力フィールド] 列の値を変更することによって、列名を編集できます。
[テーブルの作成] ボタンは、次のデータベースでのテーブル作成をサ
ポートしています。
•
•
•
•
•
•
•
•
•
•
•
•
158
Axion
DB2[db2]
Derby/Cloudscape
Firebird
HSQLDB
Interbase
MaxDB/SapDB
McKoi
MySQL
Oracle
PostgreSQL
SQL Server[sqlserver]
Spectrum™ Technology Platform 8.0.0
第 7 章 : シンク
オプション名
説明
• Sybase
注: DB2 データベースでは、テーブルを作成しようとして、ページ
サイズがすべての文字列の列の長さの合計より小さい場合、"コ
ンテンツから本体を作成できません。 シリアル化可能クラスはブ
ローカに使用できません" というエラーが表示されます。
ステージ フィールド
[ステージ フィールド] 列で、[データベース フィールド] 列に表示され
るデータベース フィールドを出力先とするフィールドを指定できま
す。
含める
[含める] 列で出力先のフィールドを選択できます。
注: パフォーマンスが低下するのを防ぐため、データベース テーブル
にはソートされたインデックスまたはキーが必要です。
Database Connection Manager
Database Connection Manager を使用すると、登録されているデータベース接続を管理できます。 接
続を追加、変更、削除、およびテストするには、次の操作を行います。
1. [Write To DB オプション] ダイアログ ボックスで、[管理] をクリックします。
2. [追加]、[変更]、または [削除] をクリックします。
3. データベース接続を追加または変更する場合は、次のフィールドに必要な値を指定します。
• 接続名 — 新しい接続の名前を入力します。
• データベース ドライバ — 適切なデータベースの種類を選択します。
• 接続オプション — すべてのオプション (通常はホスト、ポート、インスタンス、ユーザ名、およ
びパスワード) を指定します。
注: 接続をテストするには、[テスト] をクリックします。
4. データベース接続を削除する場合は、削除する接続を選択し、[削除] をクリックします。
[実行時] タブ
オプション名
説明
書き込みモード
データベース書き込みのアクションの種類を指定します。 次のいずれ
かです。
ユーザ ガイド
159
Write to DB
オプション名
説明
挿入
新しいレコードをデータベースに挿入します。既存のレ
コードは更新しません。 これがデフォルト設定です。
更新
データベース内の既存のレコードを更新します。新しい
レコードは挿入しません。
注: [更新] を選択する場合は、入力テーブルで使用され
ているプライマリ キー列の名前が、出力テーブルで
のプライマリ キー列の名前と一致している必要があ
ります。 プライマリ キー列の名前が入力と一致し
ていないテーブル、またはプライマリ キー列が定義
されていないテーブルを更新しようとした場合、更
新は行われません。
更新でき
ない場合
は挿入
該当レコードが存在しない場合は、新しいレコードをデー
タベースに挿入し、存在する場合は既存のレコードを更
新します。
一括確定
このオプションをオンにすると、所定の数のレコードが処理されたと
き、データベースへの変更が確定されます。 デフォルトでは、このオ
プションはオフになっていて、1 レコード処理されるごとに変更が確
定されます。 このオプションをオンにすると、Write to DB ステージ
のパフォーマンスが大きく向上します。
バッチ サイズ
[一括確定] オプションをオンにする場合、データベースへの変更を一
括で確定するときのレコード数を指定します。 デフォルト値は 1,000
です。 7.0 およびそれ以前の Spectrum™ Technology Platform で作成
されたデータフローの場合、デフォルト値は 100 です。
バッチ サイズを大きくしてもロード パフォーマンスは必ずしも改善
しません。 バッチ サイズの設定に当たっては、次の要因を検討して
ください。
• Write To DB ステージへのデータ到着速度: データの到着速度がデー
タベースの処理速度よりも遅い場合は、バッチ サイズを変更しても
データフローの全般的なパフォーマンスは改善しません。 例えば、
データフローで住所検証またはジオコーディングが行われている場
合は、バッチ サイズを大きくしても効果が得られないことがありま
す。
• ネットワーク トラフィック: 低速のネットワークでは、バッチ サイ
ズを中程度 (1,000 〜o 10,000) まで大きくすると、パフォーマンス
が改善します。
160
Spectrum™ Technology Platform 8.0.0
第 7 章 : シンク
オプション名
説明
• データベースの負荷や処理速度: データベースの処理能力が高い場
合は、バッチ サイズを大きくすると、パフォーマンスが改善しま
す。
• 複数の実行時インスタンス: Write to DB の複数の実行時インスタン
スを使用している場合、バッチ サイズを大きくすると大量のメモリ
が消費されるので、小または中程度のバッチ サイズ (100 〜 10,000)
を使用してください。
• 32 ビット システム: 32 ビット システムでは、小さいバッチ サイズ
(100 〜 1,000) を使用してください。
• データベース ロールバック: いずれかの文が失敗すると、バッチ全
体がロールバックされます。 バッチ サイズを大きくすると、ロー
ルバックの実行時間が長くなります。
データを挿入する前にテーブ このオプションをオンにすると、データベースへの書き込みの前に
ルを切り捨てる
テーブル内のデータがすべてクリアされます。
サポートされるデータ タイプ
注: Spectrum™ Technology Platform ジオメトリ データ タイプは Write to DB でサポートされていま
せん。
データ タイプ
説明
boolean
true と false の 2 つの 値を持つ論理タイプ。
double
-1074
正と負の倍精度数を含む数値データ タイプ。値の範囲は、2
-52
(2-2
〜
1023
。 指数表記すると、値の範囲は、4.9E-324 〜
)×2
1.7976931348623157E308 となります。 指数表記については、次のサイト
を参照してください。
http://en.wikipedia.org/wiki/Scientific_notation#E_notation
float
-149
正と負の単精度数を含む数値データ タイプ。値の範囲は、2
23
〜
127
(2-2 )×2
。 指数表記すると、値の範囲は、1.4E-45 〜 3.4028235E38 と
なります。 指数表記については、次のサイトを参照してください。
http://en.wikipedia.org/wiki/Scientific_notation#E_notation
integer
31
正と負の整数を含む数値データ タイプ。値の範囲は、-2 (-2,147,483,648)
31
〜 2 -1 (2,147,483,647)。
ユーザ ガイド
161
Write to DB
データ タイプ
説明
long
正と負の整数を含む数値データ タイプ。値の範囲は、-2
63
63
(-9,223,372,036,854,775,808) 〜 2 -1 (9,223,372,036,854,775,807)。
string
文字列
サポートされる Spectrum™ Technology Platform データ タイプとその他のデータ タイプとの対応を次
に示します。
データ タイプ
サポートされるデータ タイプ
文字列タイプ
CHAR
string
CLOB
string
DATE
string
LONGVARCHAR
string
NCHAR
string
NVARCHAR
string
TIME
string
TIMESTAMP
string
VARCHAR
string
数値タイプ
BIGINT
long
DECIMAL
double
DOUBLE
double
FLOAT
double
INTEGER
integer
NUMERIC
double
REAL
float
SMALLINT
integer
TINYINT
integer
Boolean タイプ
162
BIT
boolean
BOOLEAN
boolean
Spectrum™ Technology Platform 8.0.0
第 7 章 : シンク
Write to File
Write to File は、データフロー出力をフラット ファイルに書き出します。 すべてのレコードが同じ
フィールドを含みます。 異なるフォーマットのレコードを書き出す場合は、Write to Variable Format
File(171ページ)を参照してください。 レコードを XML ファイルに書き出す場合は、Write to XML
(179ページ)を参照してください。
ヒント: ソースをコピーして、シンクにデータフローとして貼り付けると、ファイルをすばやく設定
し、ソースに定義したフィールドと同じフィールドを使用できます。
[ファイル プロパティ] タブ
フィールド名
説明
サーバ名
[ファイル名] フィールドで選択したファイルが Enterprise Designer を
実行しているコンピュータ上にあるか、Spectrum™ Technology
Platform サーバー上にあるかを示します。 ローカル コンピュータ上
のファイルを選択した場合、サーバー名はマイ コンピュータになりま
す。 サーバー上のファイルを選択した場合、サーバー名は Spectrum™
Technology Platform になります。
ファイル名
ファイルへのパスを指定します。 省略記号ボタン (...) をクリックし、
必要なファイルを参照して選択します。
注: なお、Spectrum™ Technology Platform サーバーを実行している
プラットフォームが Unix または Linux の場合、これらのプラッ
トフォームでファイル名およびパスの大文字と小文字が区別され
ることに注意してください。
レコード タイプ
ファイル内のレコードのフォーマット。 次のいずれかです。
行順次
ファイル内の各レコードが復帰/改行 (CR/LF) などの行
末 (EOL) 文字で区切られ、レコード内の各フィールド
の開始文字位置と終了文字位置が固定しているテキスト
ファイル。
固定長
ファイル内の各レコードの長さ (文字数) が一定で、レ
コード内の各フィールドの開始文字位置と終了文字位置
が固定しているテキスト ファイル。
区切り記号 ファイル内の各レコードが復帰/改行 (CR/LF) などの行
付き
末 (EOL) 文字で区切られ、レコード内の各フィールド
ユーザ ガイド
163
Write to File
フィールド名
説明
がカンマ (,) などの特定の文字で区切られているテキス
ト ファイル。
文字エンコーディング
テキスト ファイルのエンコーディング。 次のいずれかです。
UTF-8
すべての Unicode 文字をサポートし、かつ ASCII との
下位互換性があります。 UTF の詳細については、
unicode.org/faq/utf_bom.html を参照してください。
UTF-16
すべての Unicode 文字をサポートします。しかし、
ASCII との下位互換性はありません。 UTF の詳細につ
いては、unicode.org/faq/utf_bom.html を参照してく
ださい。
US-ASCII
英語のアルファベット順に従う文字エンコーディング。
UTF-16BE
ビッグエンディアン UTF-16 エンコーディング (下位ア
ドレスが上位バイトとなるようにシリアル化)。
UTF-16LE
リトルエンディアン UTF-16 エンコーディング (下位ア
ドレスが下位バイトとなるようにシリアル化)。
ISO-8859-1 主として西ヨーロッパの言語で使われる ASCII 準拠の
文字エンコーディング。 Latin-1 とも呼ばれます。
フィールド区切り文字
CP850
西ヨーロッパの言語を書くための ASCII コード ペー
ジ。
CP500
西ヨーロッパの言語を書くための EBCDIC コード ペー
ジ。
Shift_JIS
日本語のための文字エンコーディング。
区切り記号付きファイル内のフィールドを区切るのに使用する文字を
指定します。 例えば、次のレコードでは (|) 記号がフィールド区切り
文字として使われています。
7200 13TH ST|MIAMI|FL|33144
デフォルトで、フィールド区切り文字として定義できるのは次の文字
です。
• スペース
• タブ
• カンマ (,)
• ピリオド (.)
164
Spectrum™ Technology Platform 8.0.0
第 7 章 : シンク
フィールド名
説明
• セミコロン (;)
• パイプ (|)
これ以外の文字がフィールド区切り文字として使われているファイル
については、省略記号ボタン (...) をクリックし、別の文字を区切り文
字として選択してください。
テキスト修飾子
区切り記号付きファイル内のテキスト値を囲むのに使用する文字。 例
えば、次のレコードでは二重引用符 (") がテキスト修飾子として使わ
れています。
"7200 13TH ST"|"MIAMI"|"FL"|"33144"
デフォルトで、テキスト修飾子として定義できるのは次の文字です。
• 一重引用符 (')
• 二重引用符 (")
これ以外の文字がテキスト修飾子として使われているファイルについ
ては、省略記号ボタン (...) をクリックし、別の文字をテキスト修飾子
として選択してください。
レコード区切り文字
順次ファイルまたは区切り記号付きファイル内のレコードを区切るの
に使用する文字を指定します。 [デフォルトの EOL を使用] チェック
ボックスをオンにすると、このフィールドは使用できません。 デフォ
ルトで使用できるレコード区切り文字の設定は次のとおりです。
Unix (U+000A)
改行 (LF) 文字でレコードを区切ります。 これは
Unix システムの標準のレコード区切り文字です。
Macintosh
(U+000D)
復帰 (CR) 文字でレコードを区切ります。 これは
Macintosh システムの標準のレコード区切り文字
です。
Windows
(U+000D
U+000A)
復帰改行 (CR+LF) でレコードを区切ります。 こ
れは Windows システムの標準のレコード区切り文
字です。
これ以外の文字がレコード区切り文字として使われているファイルに
ついては、省略記号ボタン (...) をクリックし、別の文字をレコード区
切り文字として選択してください。
デフォルトの EOL を使用
ユーザ ガイド
Spectrum™ Technology Platform サーバーが実行されているオペレー
ティング システムのデフォルトの行末 (EOL) 文字をファイルのレコー
ド区切り文字として使用します。
165
Write to File
フィールド名
説明
ファイルの EOL 文字がサーバーのオペレーティング システムで使わ
れているデフォルトの EOL 文字と異なる場合は、このオプションを
オンにしないでください。 例えば、ファイルで Windows の EOL が使
われていて、サーバーの動作プラットフォームが Linux の場合は、こ
のオプションをオンにしないでください。 代わりに、[レコード区切
り文字] フィールドで [Windows] オプションを選択します。
レコード長
固定長ファイルでは、個々のレコードの文字数を指定します。
行順次ファイルでは、ファイル内の最も長いレコードの長さ (文字数)
を指定します。
最初の行はヘッダ レコード
区切り記号付きファイルの先頭レコードの内容がデータではなくヘッ
ダ情報であるかどうかを指定します。 次は、先頭レコードのヘッダ行
の例です。
"AddressLine1"|"City"|"StateProvince"|"PostalCode"
"7200 13TH ST"|"MIAMI"|"FL"|"33144"
"One Global View"|"Troy"|"NY"|12180
フィールド数が定義よりも少 区切り記号付きファイルのレコードのうち、[フィールド] タブに定義
ないレコードを、形式誤りと されている数よりもフィールド数が少ないレコードを形式に誤りのあ
みなす
るレコードとみなします。 形式に誤りのあるレコードの詳細について
は、形式に誤りのある入力レコードの管理(52ページ)を参照してく
ださい。
166
インポート
このオプションでは、以前作成した xml ファイルから、[ファイル プ
ロパティ] タブ (サーバー名とファイル名を除く)、[フィールド] タブ、
および [ソート フィールド] タブのすべての設定を取得できます。 こ
れは、同じ入力ファイル、または現在操作しているファイルと同じ特
性を持つファイルを使用する別の Read from File ステージまたは Write
to File ステージから設定をエクスポートすることによって作成される
ファイルです。
エクスポート
このオプションでは、[ファイル プロパティ] タブ (サーバー名とファ
イル名を除く)、[フィールド] タブ、および [ソート フィールド] タブ
のすべての設定を xml ファイルに保存できます。 その後、同じ入力
ファイル、または現在操作しているファイルと同じ特性を持つファイ
ルを使用する他の Read from File ステージまたは Write to File ステー
ジにこれらの設定をインポートできます。
Spectrum™ Technology Platform 8.0.0
第 7 章 : シンク
[フィールド] タブ
[フィールド] タブでは、ファイル内の各フィールドの名前と位置を定義します。また、固定長ファイ
ルと行順次ファイルについては、さらにフィールドの長さを定義します。 詳細については、以下を参
照してください。
区切り記号付き出力ファイルのフィールドの定義(167ページ)
行順次ファイルまたは固定長ファイルのフィールドの定義(168ページ)
[ソート フィールド] タブ
[ソート フィールド] タブでは、出力ファイルに書き出される前の出力レコードのソートに使うフィー
ルドを定義します。 ソートを行うかどうかはオプションです。 詳細については、出力レコードのソー
ト(170ページ)を参照してください。
[実行時] タブ
オプション名
説明
ファイル名
[ファイル プロパティ] タブで定義したファイルです。
書き込みモード
データフローの出力をファイルの最後に追加するか、ファイル内の既
存のデータを削除してから出力を書き出すかを指定します。 次のいず
れかを選択します。
上書き
データフローが実行されるごとに、出力ファイル内の既
存のデータを置き換えます。
追加
データフローの出力をファイルの最後に追加します。
ファイルの既存のデータは消去しません。
区切り記号付き出力ファイルのフィールドの定義
Write to File File ステージで、[フィールド] タブを使い、ファイルの各フィールドの名前と位置、また
ファイルの種類によっては、さらにフィールドの長さを定義します。
1. 出力ファイルにヘッダ レコードが含まれている場合は、[再生成] をクリックするだけでフィール
ドを簡単に定義できます。 出力ファイルにヘッダ レコードが含まれていない場合、またはフィー
ルドを手動で定義したい場合は、以下のステップを続けます。
2. フィールドの位置、長さ、およびデータ タイプにデフォルト値を設定してフィールドを定義する
には、[クイック追加] をクリックし、追加するフィールドを選択します。
3. フィールドを手動で定義するには:
a) [追加] をクリックします。
b) [名前] フィールドで、追加したいフィールドを選択します。
ユーザ ガイド
167
Write to File
c) [タイプ] フィールドで、フィールドのデータ タイプを選択します。
Spectrum™ Technology Platform は、string タイプのデータの他に、以下のデータ タイプをサ
ポートしています。
表 27 : データ タイプの値
タイプ
説明
boolean
true と false の 2 つの 値を持つ論理タイプ。 Boolean 変数は、条
件文で処理の流れを制御するために使用できます。 次のコード
は、Boolean 式の例を示したものです。
if(x && y)
z=1;
else if(x)
z=2;
else if(y)
z=3;
else
z=4;
double
-1074
正と負の倍精度数を含む数値データ タイプ。値の範囲は、2
-52
1023
〜 (2-2 )×2
。 指数表記すると、値の範囲は、4.9E-324 〜
1.7976931348623157E308 となります。 指数表記については、次
のサイトを参照してください。
http://en.wikipedia.org/wiki/Scientific_notation#E_notation
float
-149
正と負の単精度数を含む数値データ タイプ。値の範囲は、2
〜
23
127
(2-2 )×2 。 指数表記すると、値の範囲は、1.4E-45 〜
3.4028235E38 となります。 指数表記については、次のサイトを
参照してください。
http://en.wikipedia.org/wiki/Scientific_notation#E_notation
31
integer
正と負の自然数を含む数値データ タイプ。値の範囲は、-2
31
(-2,147,483,648) 〜 2 -1 (2,147,483,647)。
long
正と負の自然数を含む数値データ タイプ。値の範囲は、-2
63
(-9,223,372,036,854,775,808) 〜 2 -1
(9,223,372,036,854,775,807)。
63
d) [追加] をクリックします。
行順次ファイルまたは固定長ファイルのフィールドの定義
Write to File ステージで、[フィールド] タブを使い、ファイルの各フィールドの長さと位置、またファ
イルの種類によっては、さらにフィールドの長さを定義します。
168
Spectrum™ Technology Platform 8.0.0
第 7 章 : シンク
1. フィールドの位置、長さ、およびデータ タイプにデフォルト値を設定してフィールドを定義する
には、[クイック追加] をクリックし、追加するフィールドを選択します。
2. データフローで使われているフィールドのリストからフィールドを手動で追加するには:
a) [追加] をクリックします。
b) [名前] フィールドで、追加したいフィールドを選択します。
c) [タイプ] フィールドで、フィールドのデータ タイプを選択します。
Spectrum™ Technology Platform は、string タイプのデータの他に、以下のデータ タイプをサ
ポートしています。
表 28 : データ タイプの値
タイプ
説明
boolean
true と false の 2 つの 値を持つ論理タイプ。 Boolean 変数は、条
件文で処理の流れを制御するために使用できます。 次のコード
は、Boolean 式の例を示したものです。
if(x && y)
z=1;
else if(x)
z=2;
else if(y)
z=3;
else
z=4;
double
-1074
正と負の倍精度数を含む数値データ タイプ。値の範囲は、2
-52
1023
〜 (2-2 )×2
。 指数表記すると、値の範囲は、4.9E-324 〜
1.7976931348623157E308 となります。 指数表記については、次
のサイトを参照してください。
http://en.wikipedia.org/wiki/Scientific_notation#E_notation
float
-149
正と負の単精度数を含む数値データ タイプ。値の範囲は、2
〜
23
127
(2-2 )×2 。 指数表記すると、値の範囲は、1.4E-45 〜
3.4028235E38 となります。 指数表記については、次のサイトを
参照してください。
http://en.wikipedia.org/wiki/Scientific_notation#E_notation
31
integer
正と負の自然数を含む数値データ タイプ。値の範囲は、-2
31
(-2,147,483,648) 〜 2 -1 (2,147,483,647)。
long
正と負の自然数を含む数値データ タイプ。値の範囲は、-2
63
(-9,223,372,036,854,775,808) 〜 2 -1
(9,223,372,036,854,775,807)。
63
d) [開始位置] フィールドと [長さ] フィールドは、データフロー内のデータと、追加してあるフィー
ルドの数に応じて自動的に設定されます。
e) [追加] をクリックします。
ユーザ ガイド
169
Write to File
また、最初にフィールドの開始位置と長さを定義してフィールドを追加することもできます。 こ
れを行うには、サンプル ファイルで、フィールドを開始したい位置をクリックして左へドラッグ
します。これで次のようにフィールドがハイライト表示されます。
3.
出力レコードのソート
Write to File ステージで、[ソート フィールド] タブを使い、出力ファイルに書き出される前の出力レ
コードのソートに使うフィールドを定義します。 ソートを行うかどうかはオプションです。
1. Write to File で、[ソート フィールド] タブをクリックします。
2. [追加] をクリックします。
3. [フィールド名] 列のドロップダウン矢印をクリックし、ソートに使うフィールドを選択します。
選択できるフィールドは、データフロー内のフィールドによって異なります。
4. [順序] 列で、昇順または降順を選択します。
5. ソートに使用するすべての出力フィールドを追加するまでこれを繰り返します。 ソート順序を変
更するには、移動するフィールドの行をハイライト表示して、[上へ] または [下へ] をクリックし
ます。
6. システムのデフォルトのソート パフォーマンス オプションの設定は、Management Console で行
います。 システムのデフォルトのソート パフォーマンス オプションをオーバーライドする場合
は、[詳細設定] をクリックします。 [詳細オプション] ダイアログ ボックスには、次のソート パ
フォーマンス オプションがあります。
•
メモリ内レコードの上限値 — ソートでメモリ内に保持できるデータ行の最大数を指定します。
この上限を越えると、ディスクにページングします。 複数のジョブを同時並行で実行する環境
では、[メモリ内レコードの上限値] の設定を増やすと、メモリ不足になる可能性が高くなりま
す。
•
使用する一時ファイルの最大数 — ソート プロセスで使用できる一時ファイルの最大数を指定
します。
•
圧縮を有効にする — 一時ファイルをディスクに書き込むときに圧縮します。
注: 最適なソート パフォーマンスの設定は、サーバーのハードウェア構成によって異なります。
それでも一般には、次の式で妥当なソート パフォーマンスが得られます。
(InMemoryRecordLimit × MaxNumberOfTempFiles ÷ 2) >= TotalNumberOfRecords
170
Spectrum™ Technology Platform 8.0.0
第 7 章 : シンク
Write to Null
Write to Null ステージでは、レコードをごみ箱に似たシンクに移します。 レコードはカウントされま
すが、破棄されます。 このステージは、特定の州や ZIP コード等を含むレコードを対象から除外する
場合に使用することがあります。
Null ステージを使用するには
1. コンディショナル ルータをデータフローに追加します。
2. Write to Null ステージをデータフローに追加します。
3. ステージを接続し、コンディショナル ルータを設定してレコードを Write to Null ステージに転送
します。 完成したデータフローは次のようになります。
Write to Variable Format File
Write to Variable Format File は、さまざまなレイアウトのレコードをファイルに書き出します。
可変フォーマット ファイルには、次の特性があります。
• ファイル内のレコードは、異なるフィールド、および異なる数のフィールドを持つことができる。
• すべてのレコードの先頭フィールドには、レコードのタイプを識別するタグ (通常は数字) を含める
必要がある。
• レコード内のフィールドは、カンマなどの区切り文字で区切る必要がある。
• 階層的な関係をサポートしている。
• すべてのレコードにレコード区切り文字 (通常は CRLF) がある。
可変フォーマット ファイルの例
次の例は、2 人の顧客 Joe Smith と Anne Johnson のアカウント確認アクティビ
ティに関する情報を含む、可変フォーマット ファイルを示しています。
001
100
200
001
100
ユーザ ガイド
Joe,Smith,M,100 Main St,555-234-1290
CHK12904567,12/2/2007,6/1/2012,CHK
1000567,1/5/2012,Fashion Shoes,323.12
Anne,Johnson,F,1202 Lake St,555-222-4932
CHK238193875,1/21/2001,4/12/2012,CHK
171
Write to Variable Format File
200
200
1000232,3/5/2012,Blue Goose Grocery,132.11
1000232,3/8/2012,Trailway Bikes,540.00
各レコードの先頭フィールドには、レコードのタイプ、およびレコードのフォー
マットを識別するタグが含まれています。
• 001: 顧客レコード
• 100: アカウント レコード
• 200: アカウント トランザクション レコード
注: 区切り記号付きファイルにおいて、上の例に示すように、タグ値 (001、100、
200) をレコード先頭の固定長バイトに含めることは一般的です。
各レコードには独自のフォーマットがあります。
• 001: FirstName、LastName、Gender、Address、PhoneNumber
• 100: AccountID、DateOpened、ExpirationDate、TypeOfAccount
• 200: TransactionID、DateOfTransaction、Vendor、Amount
レコード フォーマット 100 (アカウント レコード) と 200 (アカウント トランザ
クション レコード) は、前のレコード 001 (顧客レコード) の子です。 したがっ
て、例のファイルでは、Joe Smith のアカウント CHK12904567 に Fashion Shoes
で 2012/1/5 に数量 323.12 のトランザクションが発生していました。 同様に、
Anne Johnson のアカウント CHK238193875 には、Blue Goose Grocery で
2012/3/5 に 1 つ、Trailway Bikes で 2012/3/8 に 1 つのトランザクションが発生
していました。
[ファイル プロパティ] タブ
オプション名
説明
サーバ名
[ファイル名] フィールドで選択したファイルが Enterprise Designer を
実行しているコンピュータ上にあるか、Spectrum™ Technology
Platform サーバー上にあるかを示します。 ローカル コンピュータ上
のファイルを選択した場合、サーバー名はマイ コンピュータになりま
す。 サーバー上のファイルを選択した場合、サーバー名は Spectrum™
Technology Platform になります。
ファイル名
ファイルへのパスを指定します。 省略記号ボタン (...) をクリックし、
必要なファイルを参照して選択します。
注: なお、Spectrum™ Technology Platform サーバーを実行している
プラットフォームが Unix または Linux の場合、これらのプラッ
トフォームでファイル名およびパスの大文字と小文字が区別され
ることに注意してください。
172
Spectrum™ Technology Platform 8.0.0
第 7 章 : シンク
オプション名
説明
ルート タグ名
他のレコード タイプの親であるレコードに対して使用するタグ。 例
えば、3 つのレコード タイプ 001、100、200 があり、レコード タイ
プ 100 および 200 がレコード タイプ 001 の子である場合、001 はルー
ト タグです。
固定長タグを使用
レコード タグを配置する各レコードの先頭に固定長スペースを割り当
てるかどうかを指定します。 例えば、以下は、固定長フィールドにタ
グ 001、100、200 を持つファイルを示しています。
001
100
200
タグ長
Joe,Smith,M,100 Main St,555-234-1290
CHK12904567,12/2/2007,6/1/2012,CHK
1000567,1/5/2012,Mike's Shoes,323.12
[固定長タグを使用] ボックスをオンにした場合、各レコードの先頭で
タグに対して割り当てるスペースの数を指定します。 例えば、7 を指
定した場合は、各レコードの最初の 7 つのスペースがタグに対して予
約されます。 指定する値は、最も長いタグ名の文字の数以上でなけれ
ばなりません。 タグ名については、タグ名(178ページ)を参照してく
ださい。
指定された値より長い名前を持つフィールドを [フィールド] タブに追
加した場合、[タグ長] フィールドの値は自動的に増えます。
最大タグ長は 1024 です。
文字エンコーディング
ユーザ ガイド
テキスト ファイルのエンコーディング。 次のいずれかです。
UTF-8
すべての Unicode 文字をサポートし、かつ ASCII との
下位互換性があります。 UTF の詳細については、
unicode.org/faq/utf_bom.html を参照してください。
UTF-16
すべての Unicode 文字をサポートします。しかし、
ASCII との下位互換性はありません。 UTF の詳細につ
いては、unicode.org/faq/utf_bom.html を参照してく
ださい。
US-ASCII
英語のアルファベット順に従う文字エンコーディング。
UTF-16BE
ビッグエンディアン UTF-16 エンコーディング (下位ア
ドレスが上位バイトとなるようにシリアル化)。
UTF-16LE
リトルエンディアン UTF-16 エンコーディング (下位ア
ドレスが下位バイトとなるようにシリアル化)。
173
Write to Variable Format File
オプション名
説明
ISO-8859-1 主として西ヨーロッパの言語で使われる ASCII 準拠の
文字エンコーディング。 Latin-1 とも呼ばれます。
フィールド区切り文字
CP850
西ヨーロッパの言語を書くための ASCII コード ペー
ジ。
CP500
西ヨーロッパの言語を書くための EBCDIC コード ペー
ジ。
Shift_JIS
日本語のための文字エンコーディング。
区切り記号付きファイル内のフィールドを区切るのに使用する文字を
指定します。 例えば、次のレコードでは (|) 記号がフィールド区切り
文字として使われています。
7200 13TH ST|MIAMI|FL|33144
デフォルトで、フィールド区切り文字として定義できるのは次の文字
です。
• スペース
• タブ
• カンマ (,)
• ピリオド (.)
• セミコロン (;)
• パイプ (|)
これ以外の文字がフィールド区切り文字として使われているファイル
については、省略記号ボタン (...) をクリックし、別の文字を区切り文
字として選択してください。
テキスト修飾子
区切り記号付きファイル内のテキスト値を囲むのに使用する文字。 例
えば、次のレコードでは二重引用符 (") がテキスト修飾子として使わ
れています。
"7200 13TH ST"|"MIAMI"|"FL"|"33144"
デフォルトで、テキスト修飾子として定義できるのは次の文字です。
• 一重引用符 (')
• 二重引用符 (")
これ以外の文字がテキスト修飾子として使われているファイルについ
ては、省略記号ボタン (...) をクリックし、別の文字をテキスト修飾子
として選択してください。
174
Spectrum™ Technology Platform 8.0.0
第 7 章 : シンク
オプション名
説明
レコード区切り文字
順次ファイルまたは区切り記号付きファイル内のレコードを区切るの
に使用する文字を指定します。 [デフォルトの EOL を使用] チェック
ボックスをオンにすると、このフィールドは使用できません。 デフォ
ルトで使用できるレコード区切り文字の設定は次のとおりです。
Unix (U+000A)
改行 (LF) 文字でレコードを区切ります。 これは
Unix システムの標準のレコード区切り文字です。
Macintosh
(U+000D)
復帰 (CR) 文字でレコードを区切ります。 これは
Macintosh システムの標準のレコード区切り文字
です。
Windows
(U+000D
U+000A)
復帰改行 (CR+LF) でレコードを区切ります。 こ
れは Windows システムの標準のレコード区切り文
字です。
これ以外の文字がレコード区切り文字として使われているファイルに
ついては、省略記号ボタン (...) をクリックし、別の文字をレコード区
切り文字として選択してください。
デフォルトの EOL を使用
Spectrum™ Technology Platform サーバーが実行されているオペレー
ティング システムのデフォルトの行末 (EOL) 文字をファイルのレコー
ド区切り文字として使用します。
ファイルの EOL 文字がサーバーのオペレーティング システムで使わ
れているデフォルトの EOL 文字と異なる場合は、このオプションを
オンにしないでください。 例えば、ファイルで Windows の EOL が使
われていて、サーバーの動作プラットフォームが Linux の場合は、こ
のオプションをオンにしないでください。 代わりに、[レコード区切
り文字] フィールドで [Windows] オプションを選択します。
[フィールド] タブ
[フィールド] タブは、出力ファイルに含めるデータフローのフィールドを制御します。
オプション名
説明
追加
クリックして、出力にフィールドを追加します。
Write to Variable Format File で使用するデータフロー フィールドの作
成については、可変フォーマット ファイルへのフラット データの書
き出し(176ページ)を参照してください。
ユーザ ガイド
175
Write to Variable Format File
オプション名
説明
変更
クリックして、ルート タグの名前を変更します。 このボタンが有効
になるのは、ルート タグが選択されている場合のみです。 これは、
[ファイル プロパティ] タブの [ルート タグ名] フィールドの値の変更
と同じ影響を与えます。 [固定長タグを使用] オプションを [ファイル
プロパティ] タブで有効にすると、それより長いタグ名を入力した場
合にタグ長が自動的に調整されます。
削除
選択されたフィールドを出力から削除します。 リスト フィールドを
削除する場合、子フィールドもすべて削除されます。 子フィールドを
削除する場合、選択された子フィールドのみがリスト フィールドから
削除されます。
すべて削除
すべてのフィールドを出力から削除します。
上へ移動/下へ移動
選択されたフィールドの順序を変更します。
[実行時] タブ
オプション名
説明
ファイル名
[ファイル プロパティ] タブで定義したファイルです。
書き込みモード
データフローの出力をファイルの最後に追加するか、ファイル内の既
存のデータを削除してから出力を書き出すかを指定します。 次のいず
れかを選択します。
上書き
データフローが実行されるごとに、出力ファイル内の既
存のデータを置き換えます。
追加
データフローの出力をファイルの最後に追加します。
ファイルの既存のデータは消去しません。
可変フォーマット ファイルへのフラット データの書き出し
Spectrum™ Technology Platform データフローでは、各レコードは同じフィールドを持ちます。 ただ
し、可変フォーマット ファイルでは、すべてのレコードが同じフィールドを含むわけではありませ
ん。 データフローのフラット データを可変フォーマット ファイルに書き出すには、データフロー内
の各レコードを分割し、各レコードのフィールドを可変フォーマット ファイルで使用するレコード タ
イプに対応するリスト フィールドにグループ化します。 リスト フィールドは、フィールドのコレク
176
Spectrum™ Technology Platform 8.0.0
第 7 章 : シンク
ションです。 例えば、フィールド FirstName、LastName、Gender、Address、および Phone は、
AccountOwner というリスト フィールドにグループ化できます。
フラット データを可変フォーマット ファイルに書き出すには、Aggregator ステージを使用して、可
変フォーマット ファイルに書き出すレコード タイプに対応するリスト フィールドにフィールドをグ
ループ化します。 そのためには、次の手順を実行します。
1. データフロー内の Write to Variable Format File ステージより上流の任意の場所に Aggregator ス
テージを配置します。
2. Aggregator ステージをダブルクリックして、オプション ウィンドウを開きます。
3. [グループ化方法] を選択し、[追加] をクリックします。
4. [グループ化方法] フィールドで、関連データの識別に使用できる一意の識別子を含むフィールドを
選択します。 このフィールドの値は、フラット データ内のレコード間で一意でなければなりませ
ん。 例えば、アカウント番号、社会保障番号、または電話番号などです。
注: 選択したフィールドはソートされている必要があります。 ソートされていない場合は、Sorter
ステージを使用して、レコードをそのフィールドでソートします。
5. [OK] をクリックします。
6. [出力リスト] を選択し、[追加] をクリックします。
各出力リストは、可変フォーマット ファイル内の 1 つのレコード タイプを表します。
7. [新しいデータ タイプ] を選択し、[タイプ名] フィールドに、このデータ タイプに含める情報のタ
イプを指定します。 これが可変フォーマット ファイル内のレコード タイプになります。 例えば、
このデータ タイプがアカウント トランザクションに関連するレコードを含む場合、タイプに
"AccountTransaction" という名前を付けることができます。
8. [名前] フィールドに、このフィールドに付与する名前を入力します。 これは、[タイプ名] フィー
ルドで指定した名前と同じ名前にすることができます。
9. [OK] をクリックします。
10. 作成したデータ タイプを選択し、[追加] をクリックします。
11. [既存フィールド] オプションをオンのままにして、このデータ タイプに含めるいずれかのフィー
ルドを選択し、[OK] をクリックします。 これが可変フォーマット ファイル内のレコード タイプ
になることに注意してください。 この操作を繰り返して、その他のフィールドをこのレコード タ
イプに追加します。
12. 可変フォーマット ファイルに含めるレコード タイプごとに、追加の出力リストを作成します。 完
了したら、[OK] をクリックして Aggregator オプションを閉じます。
Aggregator ステージから出力されるフィールドが、可変フォーマット ファイル出力に含めるレコード
タイプに対応するリスト フィールドにグループ化されるようになります。
例えば、次のフラット データがあるとします。
FIRSTNAME,LASTNAME,ADDRESS,ACCOUNTNUMBER,DATE_OPENED,TRANSACTION_NUMBER,TRANSACTION_DATE,AMOUNT
Joe,Smith,100 Main St,CHK12904567,12/2/2007,1000567,1/5/2012,323.12
ユーザ ガイド
177
Write to Variable Format File
このデータを、可変フォーマット ファイル内で次のように変換するものとします。
AccountOwner
AccountInformation
Transaction
Joe,Smith,100 Main St
CHK12904567,12/2/2007
1000567,1/5/2012,323.12
この処理を行うには、次のように設定された Aggregator ステージを作成します。
タグ名
可変フォーマット ファイルでは、出力ファイル内の各レコードがレコード タイプを示すタグを持ちま
す。 Write To Variable Format File では、フィールド名が出力ファイルのタグ名として使用されます。
例えば、次のフィールドを考えてみましょう。
178
Spectrum™ Technology Platform 8.0.0
第 7 章 : シンク
これらのフィールドは、次のようにファイルに書き出されます。 この例では、アカウントに 2 つの
AccountTransaction レコードがあることに注意してください。
AccountOwner
Anne,Johnson,F,1202 Lake St,555-222-4932
AccountDetails
CHK238193875,1/21/2001,4/12/2012,CHK
AccountTransaction
1000232,3/5/2012,Blue Goose Grocery,132.11
AccountTransaction
1000232,3/8/2012,Trailway Bikes,540.00
注: 文字列などの単純フィールドを含むリスト フィールドのみが、出力ファイルに書き出されます。
リスト フィールドが他のリスト フィールドでのみ構成される場合は、出力ファイルに書き出され
ません。 上の例では、AccountActivity タグを持つレコードは出力ファイルに書き出されません。
なぜなら、AccountActivity は他のリスト フィールド (AccountOwner、AccountDetails、および
AccountTransaction) でのみ構成されるからです。
Write to XML
Write to XML ステージは、ジョブまたはサブフローの出力を XML ファイルに書き出します。
ユーザ ガイド
179
Write to XML
[ファイル プロパティ] タブ
フィールド名
説明
データ ファイル
出力 XML ファイルへのパスを指定します。 省略記号ボタン (...) をク
リックし、必要なファイルを参照して選択します。
注: なお、Spectrum™ Technology Platform サーバーを実行している
プラットフォームが Unix または Linux の場合、これらのプラッ
トフォームでファイル名およびパスの大文字と小文字が区別され
ることに注意してください。
実ファイル
[フィールド] タブで指定された構造を表示します。 要素をクリック
し、[データ ファイル] フィールドで指定されたファイルがその要素を
含む場合、データのプレビューが表示されます。 プレビューには単純
要素のデータのみ表示できることに注意してください。
[フィールド] タブ
[フィールド] タブでは、出力 XML ファイルに含めるフィールドを定義します。 フィールドを追加す
ると、そのフィールドがツリー構造に表示されます。 ツリーには、XML ファイルに書き出される要素
または属性の名前が表示されます。 要素/属性名の後ろの括弧内は、データフロー フィールド名とそ
のデータ タイプです。 例:
これは、4 つの要素と 1 つの属性が XML ファイルに書き出されることを示します。 属性は、赤い "@"
記号で示されます。
要素 State は StateProvince フィールドのデータを含み、文字列データであることに注意してくださ
い。 同様に、要素 ZIP は PostalCode フィールドのデータを含み、文字列データです。 XML ファイル
は次のようになります。
<XmlRoot>
<Customer Status="0">
<AddressLine1>7713 Mullen Dr</AddressLine1>
<City>Austin</City>
<State>TX</State>
<ZIP>78757-1346</ZIP>
</Customer>
<Customer Status="0">
<AddressLine1>1825B Kramer Ln</AddressLine1>
<City>Austin</City>
<State>TX</State>
180
Spectrum™ Technology Platform 8.0.0
第 7 章 : シンク
<ZIP>78758-4260</ZIP>
</Customer>
</XmlRoot>
注: ルート要素名 (この例では <XmlRoot>) が [ファイル プロパティ] タブで指定されています。
次の表は、[フィールド] タブのオプションについて説明したものです。
オプション名
説明
追加
クリックして、出力にフィールドを追加します。
変更
クリックして、フィールドを XML に書き出す方法を変更します。 次
のオプションを指定できます。
要素
このオプションを選択すると、フィールドのデータが XML
要素に書き出されます。 [要素名] フィールドで使用する
要素名を指定します。
属性
フィールドのデータが親要素の属性に書き出されます。
[属性名] フィールドで使用する属性名を指定します。
注: [データフロー フィールド] には、データが要素または属性に書き
出されるフィールドが表示されます。 これは、要素名または属性
名を異なる名前に変更した場合に、その要素または属性に含まれ
るフィールドのデータを引き続き確認できるようにするためで
す。
削除
選択されたフィールドを出力から削除します。 リスト フィールドを
削除する場合、子フィールドもすべて削除されます。 子フィールドを
削除する場合、選択された子フィールドのみがリスト フィールドから
削除されます。
すべて削除
すべてのフィールドを出力から削除します。
上へ移動/下へ移動
選択されたフィールドの順序を変更します。
単純要素を複合要素内に移動することはできないことに注意してくだ
さい 複合要素内の要素を変更する場合は、データフローの Aggregator
ステージを変更して、複合要素に含めるデータフロー フィールドを含
める必要があります。 詳細については、フラット データからの複合
XML の作成(182ページ)を参照してください。
再生成
ユーザ ガイド
現在定義されているフィールドを、上流のチャネルから Write to XML
に出力されるフィールドで置き換えます。
181
Write to XML
フラット データからの複合 XML の作成
多くの場合、データフローは、単純 XML 要素として XML に書き出されるフラット フィールドを含む
レコードを生成します。 フラット フィールドを複合 XML 要素に構成して階層データを生成する場合
は、1 つ以上の Aggregator ステージを使用してこれを行うことができます。
例えば、先頭行がヘッダ レコードである次のフラット データがあるとします。
addressline1,age,city,country,gender,name,number,postalcode,stateprovince,type
1253 Summer St.,43,Boston,United States,M,Sam,019922,02110,MA,Savings
以下に示すように、住所に関連するデータ フィールドと、アカウントに関連するフィールドを、
<Address> および <Account> という複合 XML 要素にグループ化できます。
<CustomerRecord>
<name>Sam</name>
<age>43</age>
<gender>M</gender>
<country>United States</country>
<Address>
<addressline1>1253 Summer St.</addressline1>
<city>Boston</city>
<stateprovince>MA</stateprovince>
<postalcode>02110</postalcode>
</Address>
<Account>
<number>019922</number>
<type>Savings</type>
</Account>
</CustomerRecord>
1. 複合要素を作成するデータフロー内の位置に Aggregator ステージを追加します。
2. Aggregator ステージをダブルクリックして、ステージのオプション を開きます。
3. [グループ化方法] を選択し、[追加] をクリックします。
4. アカウント番号など、各レコードに対して一意の値を含むフィールドを選択して、[OK] をクリッ
クします。
5. 他の単純フィールドも通過させる場合は、[グループ化方法] を選択し、再度 [追加] をクリックし
て、含める単純フィールドをすべて追加します。
例えば、この場合は、各レコードに 5 つの単純フィールド number、name、age、gender、country
を含めます。
182
Spectrum™ Technology Platform 8.0.0
第 7 章 : シンク
6. [出力リスト] を選択し、[追加] をクリックします。
7. [新しいデータ タイプ] を選択します。 これによって、新しい複合要素が定義されます。 この複合
要素が含むデータの種類の説明を入力します。 例えば、複合 XML 要素を作成しているの
で、"Complex" と入力することができます。 データ タイプは、任意の名前にすることができます。
8. [名前] フィールドに、フィールドに対して使用する名前を入力します。 これが XML 要素名にもな
ります。
9. [OK] をクリックします。
10. 作成したフィールドを選択し、[追加] をクリックします。
11. [既存フィールド] がオンの状態で、子フィールドとして複合要素に追加するフィールドを選択し、
[OK] をクリックします。
12. 前の 2 つのステップを繰り返して、その他のフィールドを複合要素に追加します。
13. 必要に応じて、その他の複合フィールドを追加します。
注: Aggregator ステージの詳細については、Aggregator(94ページ)を参照してください。
ユーザ ガイド
183
Write to XML
完了したら、各レコードに含める各単純フィールドおよび複合フィールドを一覧表示する Aggregator
ステージができているはずです。 例:
14. [OK] をクリックします。
184
Spectrum™ Technology Platform 8.0.0
レポート
このセクションの構成
• ジョブへのレポートの追加 . . . . . . . . . . . . . . . . . . . . . . . . .186
• レポート オプションの設定 . . . . . . . . . . . . . . . . . . . . . . . .186
• レポートの表示 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .187
8
ジョブへのレポートの追加
ジョブへのレポートの追加
1. 追加したいレポートを、[レポート] パレットからキャンバス上にドラッグします。 レポート アイ
コンを何かに接続する必要はありません。
2. レポートをダブルクリックして表示し、ジョブ レベルでオプションを設定します。 [ステージ] タ
ブが開きます。
3. レポートの作成に使用するすべてのステージをクリックします。
4. [パラメータ] タブをクリックします。
5. [デフォルトのレポート オプションを使用] ボックスをオフにし、PDF 以外のフォーマット (html
や txt など) を指定する場合は、適切な出力フォーマットを選択します。
レポート オプションの設定
レポート オプションは、次の 3 種類の方法で設定できます。
• Management Console での設定が最も高いレベルの設定になります。ここでは、デフォルトのオプ
ションを設定します。
• Enterprise Designer によるジョブ レベルの設定が中間レベルの設定になります。 ここで設定したオ
プションは、特定のジョブ内のすべてのレポートに適用されます。
• データフロー内のレポート アイコンによるレポート レベルの設定が最も低いレベルの設定になりま
す。 ここで設定したオプションは、特定のジョブのみに適用されます。
•
Management Console レベルでのオプションの設定
a) [実行] を展開し、[レポート オプション] をクリックします。
b) html、pdf、または txt を選択して、出力フォーマットを指定します。
c) [レポート スナップショットの保存] ボックスをオンにすると、実際のレポート スナップショッ
トとともにレポートが登録されていることを示す情報が保存されます。
d) レポート スナップショットを保存する場合は、[レポートのアーカイブ] ボックスをオンにしま
す。
e) 新しいレポートで前のレポートを置き換える場合は、[既存のレポートを上書き] をオンにしま
す。
f) 名前付けテンプレートを完成させて、レポートの命名方法を指定します。
g) アーカイブされたレポートを保存する場所を入力するか、参照して選択します。
注: これらの設定をオーバーライドしないジョブは、上記の設定に従って実行されます。
•
ジョブ レベルでのオプションの設定
a) 開いているジョブに対して、[編集] > [ジョブ オプション] を選択し、[レポート] タブをクリッ
クします。
186
Spectrum™ Technology Platform 8.0.0
第 8 章 : レポート
b) [グローバル レポート オプションを使用] チェック ボックスをオフにして、オプションを設定
します。 レポート フォーマットや、レポート テンプレートで定義されているその他の各種パ
ラメータを変更できます。 アーカイブ レポートのテンプレートに付ける名前については、ス
テージで独自のレポートを生成して完成したレポートをサーバーに登録する場合にだけそのス
テージの名前を使用でき、ステージでのレポートの生成を Spectrum™ Technology Platform に
任せる場合はステージの名前を使用できません。
c) [OK] をクリックします。
•
レポート レベルでのオプションの設定
a) 開いているジョブ内で、作成したいレポートのアイコンを、[レポート] パレットからドラッグ
します。
b) レポート アイコンをダブルクリックします。
c) このレポートを実行するステージを選択します。 1 つのレポートに対し、1 つのステージのみ
選択できます。
d) [パラメータ] タブをクリックします。
e) [デフォルトのレポート オプションを使用] チェック ボックスをオフにして、オプションを設定
します。
f) [OK] をクリックします。
ジョブを実行すると、そのジョブに関連するレポートがあるかどうかを示す列が [実行履歴] に表示さ
れます。 空のアイコンはレポートが存在しないことを表し、ドキュメントを 1 つ含むアイコンはレ
ポートが 1 つ存在することを表し、ドキュメントを複数含むアイコンは複数のレポートが存在するこ
とを表します。 [ジョブの詳細] で、レポートを表示、保存、印刷することができます。
注: レポートを削除するには、キャンバス上のレポート アイコンを右クリックし、[削除] を選択しま
す。
レポートの表示
レポートを表示するには、ジョブを実行してから、次のいずれかの操作を行います。
•
ジョブを実行すると、Enterprise Designer で [実行の詳細] ウィンドウが表示されます。 表示する
レポートを選択します。
•
Management Console の [実行] ノードで、[履歴] をクリックし、レポートを表示するジョブを選択
して [詳細] をクリックします。
ユーザ ガイド
187
データフローのインスペク
ション
データ インスペクション ツールにより、データフローの特定のポイントで入力
データがどのように変更されたかを確認できます。 データ インスペクションで
は、問題の切り分けや不具合を含むレコードの特定が可能です。 通常は、デー
タフロー上の外側のポイントをまず検査し、内側へと検査を進めて問題の箇所
を絞り込んでいきます。
注: Spectrum™ Technology Platform Spectrum™ Technology Platform では、
インスペクション入力とインスペクション出力で階層的なデータをサポー
トしています。
このセクションの構成
• インスペクション データの指定 . . . . . . . . . . . . . . . . . . . . .190
• インスペクション ポイントの設定 . . . . . . . . . . . . . . . . . . .190
• インスペクション結果の表示 . . . . . . . . . . . . . . . . . . . . . . .191
• データの相関 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .192
• 埋め込まれたサブフローのインスペクション . . . . . . . . . .193
• インスペクション結果の保存 . . . . . . . . . . . . . . . . . . . . . . .193
• データ インスペクション ツールの終了データ インスペクショ
ン終了 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .194
9
インスペクション データの指定
インスペクション データの指定
データ インスペクションの最初のステップは、データフローを通過させるデータの指定です。 実際の
データを代表するデータ、または特定の問題をトラブルシューティングする場合はその問題の原因で
あるデータを指定する必要があります。
インスペクションに使用するデータを指定する方法は 2 種類あり、インスペクション対象のデータフ
ローが Input ステージを使用するものか、それとも Read From File または Read From DB ステージを
使用するものかによって異なります。
ジョブのインスペクションを行うとき、インスペクションに使用するデータは、Read From File ステー
ジまたは Read From DB ステージで指定されているデータです。 データ インスペクション ツールは
最大 50 レコードを処理でき、デフォルトでは入力ファイルまたはデータベースの最初の 50 レコード
です。 最初以外のレコードからジョブを開始するには、[Read From File] ステージをダブルクリック
し、[実行時] タブの [開始レコード] フィールドを指定します。 50 レコードしか読み込まないため、
ファイルへの書き込みの結果はデータフローを実行したときとは異なります。
Input ステージを使用するデータフローは、データフローを編集するときにデータにアクセスしませ
ん。 このようなデータフローの場合は、Input ステージでインスペクション データを定義する必要が
あります。 インスペクション データを定義する方法については、インスペクション データの定義
(58ページ)を参照してください。
インスペクション ポイントの設定
インスペクション ポイントは、データフロー内でデータを表示するポイントを示します。 インスペク
ション ポイントを追加するには、チャネルで [名前の変更] ノードの左側を右クリックし、[インスペク
ション ポイントの追加] を選択します。 追加できるインスペクション ポイントは 2 個までです。
ポイントがジョブに追加されます。
注: インスペクション ポイントに名前を割り当てるには、[ポイント] の内部をクリックして名前を変
更します。 名前の変更は、キャンバスおよび [インスペクション結果] ウィンドウに反映されま
す。
インスペクション ポイントを移動するには、ドラッグして別のチャネルにドロップします。 インスペ
クション データが自動的に更新されます。
190
Spectrum™ Technology Platform 8.0.0
第 9 章 : データフローのインスペクション
インスペクション ポイントを削除するには、ポイントを右クリックして [インスペクション ポイント
の削除] を選択します。 それに従ってインスペクション データが更新されます。
インスペクション結果の表示
インスペクション結果を表示するには、[実行] > [現在のフローのインスペクション] を選択するか、
またはツールバーの [現在のフローのインスペクション] ボタンをクリックします。 [インスペクショ
ン結果] ウィンドウが画面の下部に開き、インスペクションされたデータが水平に表示されます。 こ
のウィンドウに含まれるツールバーを使用すると、データを更新し、情報の表示方法を変更すること
もできます。
次の表では、[インスペクション結果] ツールバーについて説明します。
表 29 : [インスペクション結果] ツールバー
アイコン
説明
データを更新します。
垂直に 2 つのウィンドウに分割します。
水平に 2 つのウィンドウに分割します。
データを横に表示します。
データを縦に表示します。
注: インスペクション データが階層的な場合は、縦に表示することはできません。
ユーザ ガイド
191
データの相関
データフローを更新または変更した場合は、[更新] ボタンをクリックしてインスペクション データを
更新します。 ステージの削除や追加などの特定の変更を行うと、インスペクション データが "古く"
なって、データフローを表さなくなります。 古いデータを引き続き使用することも、[実行] > [現在の
フローのインスペクション] を選択してインスペクション データを更新することもできます。
注: インスペクション データがインスペクション対象のデータフローを表さなくなると、インスペク
ション グリッドのデータはグレー表示になり、ドッキング ウィンドウのタイトルは [インスペク
ション結果 (データフローが変更されています。更新してください)] に変わります。
データの相関
データフロー内に 2 つのインスペクション ポイントがある場合、2 つのポイントのデータを比較でき
ます。 これにより、特定のレコードがデータフローを移動したときの変化を簡単に確認できます。
1. 2 つのインスペクション ポイントを追加します。
2. [実行] > [現在のフローのインスペクション] を選択するか、またはツールバーの [現在のフローの
インスペクション] ボタンをクリックします。 [インスペクション結果] ウィンドウが画面の下部に
開き、インスペクションされたデータが 2 つのウィンドウに表示されます。 左のウィンドウには
上流のデータ (ジョブで左側にあるインスペクション ポイント) が表示され、右のウィンドウには
下流のデータ (ジョブで右側にあるインスペクション ポイント) が表示されます。
上流データの列は、アルファベット順になっています。 下流列の順序は、デフォルトでは上流デー
タの列の順序に基づきます。 新しい列は、アルファベット順で保持されている列の後に表示され
ます。
3. 左側のウィンドウで行をクリックします。 右側のウィンドウで対応する行がハイライト表示され
ます (同様に、右のウィンドウで行をクリックすると、左のウィンドウで対応する行がハイライト
表示されます)。 次のことに注意してください。
• 一方のウィンドウを手動でスクロールすると、もう一方のウィンドウのデータも自動的にスク
ロールします。 上流のデータをスクロールすると、上流データで最初に表示されているレコー
ドに対応する下流データのレコードにスクロールします。 同様に、下流のデータをスクロール
すると、下流データで最初に表示されているレコードに対応する上流データのレコードにスク
ロールします。
• 第 2 のインスペクション ポイントに追加されたレコードは、リストの最後に表示されます (第 1
のインスペクション ポイントに対応するレコードがないため)。
192
Spectrum™ Technology Platform 8.0.0
第 9 章 : データフローのインスペクション
• インスペクション ポイントの間でパススルー フィールドをオフにしてステージを作成し、新し
い行が作成された場合、相関は存在しません (データは存在します)。
• データをソートするには、どちらかのウィンドウでフィールド名をクリックします。 データは
昇順または降順にソートされ、もう一方のウィンドウでも、最初のウィンドウと同じレコード順
序で自動的にデータがソートされます。 相関されていないレコードは最後に追加されます。
• 表示するフィールドを選択するには、フィールド名の左側にあるフィールド選択アイコンをク
リックします。
• 列の順序を変更するには、列の見出しをドラッグして目的の位置にドロップします。 両方のグ
リッドで列の順序が更新されます。
• フィールドの値に基づいてレコードにフィルタを適用するには、フィールド名の右側にある漏斗
アイコンをクリックして、表示するデータを選択します (郵便番号、州、市など)。
埋め込まれたサブフローのインスペクション
ジョブまたはサービスに埋め込まれたサブフローのインスペクションを行うには、次の図のように、
サブフローのステージを右クリックして、[このデータフローのインスペクション] を選択します。 入
力データ (ジョブの場合) またはインスペクション データ (サービスの場合) がサブフローに自動的に渡
されるので、サブフローの Input ステージでインスペクション データを入力する必要はありません。
インスペクション結果の保存
1. インスペクション結果グリッドで、データを保存する行を選択します。 いずれかのウィンドウで
右クリックして [すべて選択] をクリックすると、すべてのデータを選択できます。
2. コンテキスト メニューの [コピー] を選択するか、<Ctrl-C> を押して、データをコピーします。
3. データを保存するアプリケーション (Excel、メモ帳など) を開きます。
4. [編集] > [貼り付け] を選択するか、<Ctrl-V> を押して、データを貼り付けます。
ユーザ ガイド
193
データ インスペクション ツールの終了
5. カンマ区切り (.csv)、.xls、.txt など、役に立つ形式でファイルを保存します。
データ インスペクション ツールの終了
[インスペクション結果] ウィンドウを閉じると、インスペクション データは失われます。 同様に、
ジョブを閉じても、インスペクション ポイントとインスペクション データは失われます。
注: Excel やメモ帳などの別のプログラムにデータを保存できます。 保存の詳細については、インス
ペクション結果の保存(193ページ)を参照してください。
194
Spectrum™ Technology Platform 8.0.0
ジョブの実行
このセクションの構成
• ジョブの検証 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .196
• ジョブのエクスポーズ . . . . . . . . . . . . . . . . . . . . . . . . . . . .196
• Enterprise Designer でのジョブの実行 . . . . . . . . . . . . . .196
• コマンド ラインからのジョブの実行 . . . . . . . . . . . . . . . . .196
• ジョブのスケジューリング . . . . . . . . . . . . . . . . . . . . . . . . .200
• 電子メール通知 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .201
• 実行ステータスと履歴の表示 . . . . . . . . . . . . . . . . . . . . . . .201
• ジョブの一時停止 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .202
• ジョブのキャンセル . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .202
• データフロー オプション . . . . . . . . . . . . . . . . . . . . . . . . . .202
• 別のサーバーへの処理のルーティング . . . . . . . . . . . . . . . .204
• 実行時パフォーマンス オプションの使用 . . . . . . . . . . . . .206
10
ジョブの検証
ジョブの検証
実行の前にデータフローの検証を行い、エラーが存在しないことを確認します。 データフローが正し
いことを確認するには、[実行] > [検証] を選択します。
ジョブのエクスポーズ
ジョブをエクスポーズすると、そのジョブをプロセス フローやコマンド ライン実行で使用できるよう
になります。 ジョブをエクスポーズするには、[ファイル] > [エクスポーズ] を選択するか、エクスポー
ズ ボタン (電球のアイコン) をクリックします。
注: サーバー アップグレード中にシステムに保存されたジョブは、アップグレード前と同じように動
作するように、エクスポーズのフラグが設定されます。 アップグレード前にエクスポートされた
ジョブには、エクスポーズ フラグは設定されません。 このため、これらのジョブをシステムにイ
ンポートし直す際には、インポートしたジョブを手動でエクスポーズする必要があります。
Enterprise Designer でのジョブの実行
ジョブは、入力ファイル全体に対して実行するか、または一部のレコード セットに対して実行できま
す (部分的なジョブの実行については、Read From File(66ページ) を参照してください)。 また、
出力の設定時には、ファイル内の既存データを上書きするか、既存データの後ろに追加するかも選択
できます (Write to File(163ページ)を参照)。
[実行] > [現在のフローを実行] を選択します。 [実行の詳細] ウィンドウが表示されます。 このウィン
ドウで、ジョブの実行を管理できます。
コマンド ラインからのジョブの実行
コマンド ラインからジョブを実行するには、使用するシステムに Job Executer をダウンロードして保
存します。 Job Executor は Spectrum™ Technology Platform サーバー上の Spectrum™ Technology
Platform Welcome ページ (例えば、http://myserver:8080) にあります。
Job Executor の使用方法は次のとおりです。
java -jar jobexecutor.jar [arguments]
196
Spectrum™ Technology Platform 8.0.0
第 10 章 : ジョブの実行
例えば、ジョブ名、ユーザ名、パスワードを指定する基本的なコマンド ライン入力は次のようになり
ます。
java -jar jobexecutor.jar -j Job1 -u Bob1234 -p ""
次の例では、上の例と同じ情報に加えて、その他の引数を指定しています。
java -jar jobexecutor.jar -j validateAddressJob1 -u Bob1234 -p "" -h
server.mydomain.com -s 8888 -w -d "%" -i 1 -t 9999
Job Executor の引数の一覧を以下の表に示します。
表 30 : Job Executor の引数
プロパティ=<引数>
説明
-?
使用方法を出力します。
-d=<区切り文字>
インスタンス/ステータス区切り文字を設定します。 これは、同期出
力にのみ表示されます。
-e
Spectrum™ Technology Platform サーバーとの通信にセキュアな SSL
接続を使用します。
-f=<プロパティ ファイルへの ジョブ プロパティ ファイルへのパスを指定します。 ジョブ プロパ
パス>
ティ ファイルの詳細については、ジョブ プロパティ ファイルの作成
(200ページ)を参照してください。
-h=<ホスト名>
Spectrum™ Technology Platform サーバーの名前または IP アドレスを
指定します。
-i=<ポーリング間隔>
完了したジョブを確認する間隔を秒数で指定します。 これは、同期
モードにのみ適用されます。
-j=<ジョブ 1,ジョブ 2...>
実行するジョブをカンマで区切って指定します。 ジョブ名は大文字と
小文字が区別されます。 ジョブは、列挙された順序で開始されます。
-n <電子メール リスト>
ジョブ通知設定に対する追加の電子メール アドレスをカンマで区切っ
て指定します。
-o=<プロパティ ファイルへの データフロー オプション プロパティ ファイルへのパスを指定します。
パス>
例えば、Assign GeoTAX Info のデータフロー オプション プロパティ
ファイルは次のようなものになります。
OutputCasing=U
UseStreetLevelMatching=N
ユーザ ガイド
197
コマンド ラインからのジョブの実行
プロパティ=<引数>
説明
TaxKey=T
Database.GTX=gsl
データフロー オプションの詳細については、データフロー オプショ
ンの作成(203ページ)を参照してください。
-p=<パスワード>
-r
ユーザのパスワードを指定します。
標準出力に出力されるジョブに関する以下の情報を、区切り文字で区
切って返します。
• 位置 1— ジョブの名前
• 位置 2— ジョブ プロセス ID
• 位置 3— ステータス
• 位置 4— 開始日時 (MM/DD/YYYY HH:MM:SS)
• 位置 5— 終了日時 (MM/DD/YYYY HH:MM:SS)
• 位置 6— 成功したレコードの数
• 位置 7— 失敗したレコードの数
• 位置 8— 形式に誤りのあるレコードの数
• 位置 9— 現在未使用
情報は、-d 引数で指定された区切り文字で区切られて出力されます。
例を次に示します。
MySimpleJob|4|succeeded|10/04/09 14:50:47|10/04/09
14:50:47|100|0|0|
198
-s=<ポート>
Spectrum™ Technology Platform サーバーが実行されているソケット
(ポート)。 デフォルト値は 8080 です。
-t=<タイムアウト秒数>
同期モードに対するタイムアウト (秒) を設定します。 デフォルト値
は 3600 です。 これは、すべてを合わせたグローバルなタイムアウト
値で、spawn されたすべてのジョブが完了するまでの最大待機時間を
表します。
-u=<ユーザ名>
ユーザのログイン名を指定します。
-v
詳細な出力を返します。
-w
同期モードにおいてジョブの完了を待つように指定します。
Spectrum™ Technology Platform 8.0.0
第 10 章 : ジョブの実行
プロパティ=<引数>
説明
ステージ名=ファイル名
ジョブで指定されている入力または出力ファイルをオーバーライドし
ます。 詳細については、Read from File と Write to File の場所のオー
バーライド(199ページ)を参照してください。
以下は、コマンド ラインによる起動とその出力の例です。
D:\g1\job-executor>java -jar jobexecutor.jar -u guest -p "" -j
validateAddressJob1 -h g1server.mydomain.com -s 8888 -w -d "%" -i
1 -t 9999
validateAddressJob1%105%succeeded
この例の出力からは、'validateAddressJob1' という名前のジョブ (識別子 105) がエラーを生じること
なく実行したことがわかります。 その他の実行結果としては、"失敗" と "実行中" があります。
Read from File と Write to File の場所のオーバーライド
Read from File または Write to File の場所をオーバーライドするには、Read from File ステージまたは
Write from File ステージの名前と、その入力ファイルまたは出力ファイルを最後の引数として指定し
ます。
stagename=filename
例を次に示します。
java -jar jobexecutor.jar -j Job1 -u Bob1234 -p "" -h server.mydomain.com s 8888 -w -d "%" -i 1 -t 9999 "Read from File"="file:C:/myfile_input.txt"
"Write to File"="file:C:/myfile_output.txt"
注: ファイル パスには、バックスラッシュではなくスラッシュ (/) を使用する必要があります。
コマンド ラインで指定するステージ名は、データフロー内のステージのアイコンの下に表示されるス
テージ ラベルと一致する必要があります。 例えば、入力ステージのラベルが "Read From File" である
場合は、次のように指定します。
"Read From File"="file:C:/inputfile.txt"
入力ステージのラベルが "Illinois Customers" である場合は、次のように指定します。
"Illinois Customers"="file:C:/inputfile.txt"
Read from File または Write to File の場所をオーバーライドするときは、次のようにプロトコルを指定
する必要があります。
• ファイルが Spectrum™ Technology Platform サーバーと同じコンピュータに存在する場合は、パス
の先頭に "file:" プロトコルを付けます 。 例えば、Windows では、"file:C:/myfile.txt" と指定
し、Unix または Linux では、"file:/testfiles/myfile.txt" と指定します。
• ファイルが Job Executor と同じコンピュータに存在する場合は、パスの先頭に "esclient:" プロトコ
ルを付けます 。 例えば、Windows では、"esclient:C:/myfile.txt" と指定し、Unix または
Linux では、"esclient:/testfiles/myfile.txt" と指定します。
ユーザ ガイド
199
ジョブのスケジューリング
• クライアントとサーバーが同じコンピュータ上で稼働している場合は、どちらのプロトコルを使用
しても構いませんが、"file:" プロトコルを使用した方がパフォーマンスが高くなる可能性があります
。
• Management Console で定義されたファイル サーバーを使用するには、 "ftp:<ファイル サーバー
の名前>/<ファイルへのパス>" という形式を使用します。 例えば、
ftp://FS/testfiles/myfile.txt と指定します。ここで FS は、Management Console で定義
されたファイル サーバー リソースです。
ジョブ プロパティ ファイルの作成
プロパティ ファイルには、-f 引数でプロパティ ファイルへのパスを指定することによって再利用する
ことが可能な引数が含まれています。 プロパティ ファイルには、少なくともジョブ (-j) とユーザ ID
(-u) を含める必要があります。
プロセス フローのプロパティ ファイルを作成するには、テキスト エディタを開き、各行に 1 つの引
数を入力します (引数の一覧については、前出の表を参照してください)。 .properties という拡張子を
つけてこのファイルを保存します ("example.properties" など)。 例を次に示します。
D=property=true
d=%
h=g1server.mydomain.com
i=30
j=validateAddressJob1
u=user
p=password
s=8888
t=9999
w=true
X=Xmx=1024M
コマンド ライン入力とプロパティ ファイル入力を組み合わせて使用することもできます。 例を次に
示します。
java -jar jobexecutor.jar -f /dcg/job.properties -j job1
この場合、コマンドライン引数の方が、プロパティ ファイルで指定された引数よりも優先されます。
上の例では、ジョブ job1 の方が、プロパティ ファイルで指定されたジョブよりも優先されることにな
ります。
ジョブのスケジューリング
ジョブを自動的に実行するようにスケジューリングするには、Management Console のジョブ スケ
ジューラを使用します。 詳細については、ジョブとプロセス フローのスケジューリング(255ページ)
を参照してください。
200
Spectrum™ Technology Platform 8.0.0
第 10 章 : ジョブの実行
電子メール通知
実行中にある条件が発生した場合に、Spectrum™ Technology Platform からの通知を受け取ることが
できます。 以下の手順に従って、通知を設定します。
注: Enterprise Designer 内で通知を正しく使用できるようにするには、Management Console で通知
を設定する必要があります。
1. Enterprise Designer でデータフローまたはプロセス フローを開くには、 [編修] > [通知] を選択し
ます。
2. [追加] をクリックします。
3. [通知送信先] フィールドに、通知を送信する電子メール アドレスを入力します。
4. 通知するイベントを選択します。
5. [件名] フィールドに、電子メールの件名の行に表示するテキストを入力します。
6. [メッセージ] フィールドに、電子メールの本文に表示するテキストを入力します。
ジョブに関する情報を電子メールに含めたければ、[タイトルまたはメッセージ本文にフィールド
を追加する場合はここをクリック] をクリックします。 ジョブ情報の例は、 開始日時、終了日時、
失敗したレコード数などです。
7. 通知の内容を確認するには、[プレビュー] をクリックします。
8. [OK] をクリックします。 [通知] ダイアログ ボックスが再表示され、その中に新しい通知が表示さ
れます。
9. [OK] をクリックします。
実行ステータスと履歴の表示
ジョブの実行の進捗状況を確認し、実行履歴を表示するには、以下の手順に従います。
1. Enterprise Designer で [実行履歴] > [表示] を選択します。
[実行履歴] ダイアログ ボックスには、[ジョブ] と [プロセス フロー] という 2 つのタブがあります
。 [ジョブ] タブでは、ジョブ ステータスの監視、実行中のジョブの一時停止、再開、またはキャ
ンセル、完了したジョブの削除を行います。
2. [実行履歴] に表示するフィールドを選択します。
a) 最初の列のすぐ左にあるアイコンをクリックします。
b) [実行履歴] に含めるフィールドを選択または選択解除します。 フィールドは、自動的に追加ま
たは削除されます。
c) ボックスの右上隅にある "x" をクリックして、Field Chooser を閉じます。
ユーザ ガイド
201
ジョブの一時停止
3. 必要に応じてフィールドをグループ化します。 フィールドをグループ化するには、列名 (ID や
Name など) をハイライト表示して、[列ヘッダをここにドラッグすると、その列でグループ化され
ます。] と記されているエリアにドラッグします。
4. ジョブ リストをソートし、フィルタを適用します。
a) [次のジョブのみ表示] の横のドロップダウン リストをクリックして、変数 (ID など) を選択し
ます。
b) 次のドロップダウン リストから条件 ("以上" など) を 1 つ選択します。
c) 最後のボックスに、比較する値 (ゼロなど) を入力します。
d) [更新] をクリックしてデータを更新します。
5. ジョブの詳細を表示します。
[詳細] 画面では、ジョブの定義を参照できます。ジョブの定義にはデータフローが表示されます。
また、もう Enterprise Designer ではアクセスできないデータフローについて、それをどのように
して構成したかを参照することもできます。
a) [ジョブ] タブで、参照したいジョブを選択し、[詳細...] をクリックします。
b) ジョブを参照している場合は、[レポート] の下のレポート名をクリックすると、その出力が表
示されます。 右のペインの上部にある適切なアイコンをクリックすることにより、レポートを
保存または印刷できます。
ジョブの一時停止
ジョブを一時停止するには、[表示] > [実行履歴] を選択して、[一時停止] をクリックします。 一時停
止したジョブを再開するには、[再開] をクリックします。
ジョブのキャンセル
実行中のジョブをキャンセルするには、[表示] > [実行履歴] を選択して、[キャンセル] をクリックしま
す。
データフロー オプション
データフロー オプションでは、実行時に変更可能なオプションを指定できます。 例えば、大文字と小
文字を区別するかどうかと、郵便番号区切り文字の変更のみを、ユーザに許可することができます。
その後これらのオプションを、データフロー内のステージにマッピングできます。
202
Spectrum™ Technology Platform 8.0.0
第 10 章 : ジョブの実行
データフロー オプションの作成
1. 新しいジョブまたはサービスを作成するか、既存のジョブ、サービス、またはサブフローを開きま
す。
2. ツールバー上のデータフロー オプション アイコンをクリックするか、 [編集] > [データフロー オ
プション] を選択します。 [データフロー オプション] ダイアログ ボックスが表示されます。
3. [追加] をクリックします。[データフロー オプションの定義] ダイアログ ボックスが表示されます。
4. [オプション名] フィールドに名前を入力し、<Tab> を押します。 [オプション ラベル] フィールド
に同じテキストが表示されます。
5. [説明] フィールドにオプションの説明を入力します。
6. ダイアログ ボックスの最下部のテーブルには、各サービスがそのオプションの一覧とともに表示
されています。 このオプションに対して設定する項目を選択します。 最初の項目を選択すると、
[デフォルト値] フィールドと [有効値] フィールドにデータが表示されます。
注: 選択する各項目には、共通する有効値が存在する必要があります。 例えば、選択した最初の
項目の値が「Y」と「N」 ("はい" と "いいえ" に対応) である場合、その後に選択する項目は、
設定可能な値の中に「Y」または「N」を含む必要があります。また、ユーザには共通する値
の選択のみを許可する必要があります。 つまり、値が「Y」と「N」である項目を選択した場
合、値が「E」「T」「M」、および「L」 (それぞれ、"完全一致"、"厳格"、"中"、"あいまい"
に対応) である項目を選択することはできませんが、値が「P」「S」、および「N」 (それぞ
れ "PO Box 一致"、"通り一致"、"通常一致" に対応) である項目は、「N」という値が共通であ
るため、選択できます。 ただし、このオプションに対して使用可能な値は「N」のみで、「Y」
「P」、または「S」は使用できません。
7. ユーザが選択可能な値を制限するには、[有効値] フィールドのすぐ右にあるアイコンをクリックし
て、使用可能なオプションを編集します。
8. ユーザに対して表示するデフォルト値を変更するには、[デフォルト値] フィールドの横にある矢印
をクリックして、新しいデフォルト値を選択します。
9. [ターゲット] フィールドの適切なターゲットにオプションをマッピングします。
10. [OK] をクリックします。
11. 必要に応じて、オプションの追加を続けます。
12. オプションの追加を終えたら、[データフロー オプション] ダイアログ ボックスの [OK] をクリッ
クします。
データフロー オプションの変更
1. ジョブ、サービス、またはサブフローを開きます。
2. [データフロー オプション] アイコンをクリックするか、[編集] > [データフロー オプション] を選択
します。 [データフロー オプション] ダイアログ ボックスが表示されます。
3. 変更するオプションをハイライト表示し、[変更] をクリックします。 [データフロー オプションの
定義] ダイアログ ボックスが表示されます。
4. 必要な変更を加えて、[OK] をクリックします。
ユーザ ガイド
203
別のサーバーへの処理のルーティング
データフロー オプションの削除
1. ジョブ、サービス、またはサブフローを開きます。
2. [データフロー オプション] アイコンをクリックするか、[編集] > [データフロー オプション] を選択
します。 [データフロー オプション] ダイアログ ボックスが表示されます。
3. 削除するオプションをハイライト表示し、[削除] をクリックします。
別のサーバーへの処理のルーティング
[ルーティング] ボタンを使用すると、ステージまたはサービスの処理に対して使用する異なるサーバー
を指定でき、サービスをインストールして管理する時間を節約できます。 また、リモート サーバーに
インストールされているサービスおよびステージを使用するカスタム データフローを設計できます。
ステージがリモート サーバーにルーティングされる場合、ステージをデータフローにドラッグする
と、ステージの左上隅に赤い星印が表示されます。 ステージまたはサービスをリモート サーバーに
ルーティングする前に、Management Console でリモート サーバーを 1 つ以上設定する必要がありま
す。 リモート サーバーの設定の詳細については、リモート サーバー(263ページ)を参照してくださ
い。
Enterprise Designer では、特定のステージをリモート サーバーにルーティングできます。 このように
すると、そのサービスを使用するデータフローは、データフローが定義されているマシンで実行しま
す。 データフロー内のステージをルーティングできるかどうかを確認するには、データフローでその
ステージをクリックし、[オプション] ダイアログの下部に [ルーティング] ボタンが表示されるかどう
かを調べます。 このボタンは、ダイアログ ボックスの上部にある [システム デフォルト オプションを
オーバーライド] ボタンをクリックするまではグレー表示になっています。 [ルーティング] ボタンが表
示されない場合、そのステージはリモート サーバーにインストールされていないためルーティングで
きません。
注: サービスは、Management Console を使用してリモート サーバーで実行できます。 Management
Console でのリモート サーバーの使用の詳細については、リモート サーバー(263ページ)を参
照してください。
Enterprise Designer でステージをリモート サーバーにルーティングするには、次の手順に従います。
1. データフローで、リモート サーバーにルーティングするステージをダブルクリックします。
2. [ルーティング] をクリックします。 [ルーティング] ダイアログ ボックスが表示されます。
3. [リモート] をクリックし、そのステージの処理をルーティングするリモート サーバーを選択しま
す。
4. [OK] をクリックします。
次に、発生する可能性のあるエラーについて説明します。
モジュールのライセンスがない
204
Spectrum™ Technology Platform 8.0.0
第 10 章 : ジョブの実行
リモート ステージを実行するには、リモート サーバーにリアルタイム ライセンスが必要です。 ライ
センスのないステージでデータフローを実行しようとすると、次のようなエラーが発生します。
リモート サーバーは使用できません
Enterprise Designer でリモート サーバーにルーティングされるサービスを開いて、そのリモート サー
バーをシャットダウンすると、画面の下部のステータス バーに黄色のハザード アイコンが表示されま
す。
このアイコンをクリックすると、使用できないリモート サーバーについて説明するエラー メッセージ
が表示されます。 Enterprise Designer を起動しようとしたときにリモート サーバーが実行していない
場合にも、同じメッセージが表示されます。
同様に、リモート サーバーにルーティングされるサービスに含まれるステージも、ステージを使用で
きないことを示すアイコンに置き換えられます。
ユーザ ガイド
205
実行時パフォーマンス オプションの使用
実行時パフォーマンス オプションの使用
実行時パフォーマンス オプションを使用して、次の設定を実行時に使えるように設定できます。
• データフローをローカルに処理するのか、分散方式で処理するのか
• いくつの同時インスタンスをメモリにロードし、ローカル サーバー上で実行するか
• いくつの同時マイクロフローをメモリにロードし、各分散サーバー上で実行するか
• いくつのレコードを各マイクロフロー バッチに含めるか
• マイクロフロー バッチをグループ化するフィールド
• ステージまたはサービスをリモート サーバー上で処理するかどうか
実行時インスタンスの設定
[ローカル] ボタンをクリックし、ローカル サーバー上で同時に実行するインスタンスの数を入力しま
す。 複数の実行時インスタンスを指定するとパフォーマンスが向上しますが、この値を高くしすぎる
と、システムのリソースに負荷がかかり、パフォーマンスが低下する可能性があります。
分散処理の使用
注: このオプションを使用する前に、まずプロフェッショナルサービスを利用して、分散処理環境を
設定する必要があります。 サブフローを含む、正しく設計されたデータフローも必要です。 分散
処理の詳細については、『 Spectrum™ Technology Platform パフォーマンス チューニング ガイ
ド 』を参照してください。
1. [分散] ボタンをクリックします。
2. 各サーバーに送信するマイクロフローの数を入力します。
3. 各マイクロフロー バッチに含めるレコードの数を入力します。
4. (オプション) マイクロフロー バッチをグループ化するフィールドの名前を選択します。 使用可能
な値は、サブフローで使用されるフィールドによって決まります。 ステップ 3 でバッチに含める
レコード数を決定したが、グループ ID も指定する場合は、バッチ サイズは指定した数よりも大き
くなる可能性があります。グループは複数のバッチにまたがって分割されないからです。 例えば、
バッチ サイズとして 100 を指定したが、同じグループ ID を持つレコードが 108 個ある場合、バッ
チには 108 レコードが含まれます。 同様に、バッチ サイズとして 100 を指定し、同じ ID を持つ
28 レコードの新しいグループがレコード 80 から始まる場合、そのバッチには 108 レコードが含
まれます。
リモート サーバーの使用
[リモート] ボタンをクリックし、ステージまたはサービスを処理するリモート サーバーを選択します。
注: このオプションを使用する前に、まず Management Console で 1 つ以上のリモート サーバーを
設定する必要があります。 リモート サーバーの詳細については、ここ をクリックしてください。
206
Spectrum™ Technology Platform 8.0.0
サブフローの使用
このセクションの構成
• サブフロー . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .208
• データフローへのサブフローの追加 . . . . . . . . . . . . . . . . .208
• サブフローの変更 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .208
• サブフローの削除 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .209
• サブフローのアンエクスポーズ . . . . . . . . . . . . . . . . . . . . .209
• ステージからサブフローへの変換 . . . . . . . . . . . . . . . . . . .209
11
サブフロー
サブフロー
サブフローは、他のデータフローで再利用できるデータフローです。 データフロー コンポーネントの
[ユーザ定義ステージ] フォルダに表示されるサブフローは、保存してエクスポーズできます。[展開
済みステージ] フォルダに表示されるステージは、システムによって展開されるステージです。
データフローへのサブフローの追加
1. Enterprise Designer でサブフローを作成します。具体的には、 [ファイル] > [新規] > [データフロー]
> [サブフロー] を選択します。
2. 作成したサブフローを保存し、閉じます。
3. [ファイル] > [エクスポーズ/アンエクスポーズして保存] を選択するか、[エクスポーズ] ボタン (電
球) をクリックします。 そのサブフローを他のデータフローで使用できるようになります。
注: サーバーのアップグレードの間にその時点でシステムに格納されているすべてのサブフロー
はエクスポーズとマークされて、アップグレード前と同じ動作がサブフローに提供されます。
アップグレードの前にエクスポートされたサブフローには、エクスポーズ フラグは設定され
ません。 したがって、これらのサブフローをシステムにインポートして戻すときは、インポー
トされたサブフローを手動でエクスポーズする必要があります。
4. データフローを開きます。
5. [ユーザ定義ステージ] から、サブフローをキャンバスの目的のデータフローにドロップします。
6. ソースとシンクをドラッグしてサブフローに接続します。
サブフローの変更
サブフローを変更するときは、そのサブフローを使用するデータフローに対する影響を検討します。
サブフローを使用しているデータフローを確認するには、サブフローを開き、 [ツール] > [使用箇所]
を選択します。
入力または出力を削除したり、新しい入力または出力を追加したりすると、他のデータフローがサブ
フローを使用していることを伝える警告メッセージが表示され、サブフローを使用しているデータフ
ローを確認できます。 再利用可能なステージの保存を続行すると、サブフローによって使用されてい
るすべてのデータフローがアンエクスポーズされます。
ファイル名やステージ設定の変更など、それ以外の変更をサブフローに対して行うと、他のデータフ
ローがサブフローを使用していることを伝える警告メッセージが表示され、サブフローを使用してい
208
Spectrum™ Technology Platform 8.0.0
第 11 章 : サブフローの使用
るデータフローを確認できます。 この場合のデータフローはアンエクスポーズしないで続行できま
す。
注: サブフローを変更したときは、ビューを更新して、親データフローに変更を反映する必要があり
ます。
サブフローの削除
エクスポーズしたサブフローを削除しようとした場合は、削除しようとしているサブフローを他のデー
タフローが使用していることを伝える警告メッセージが表示されます。 サブフローの削除を続行する
と、接続されているすべてのデータフローがアンエクスポーズされます。
サブフローのアンエクスポーズ
サブフローをアンエクスポーズするには、 [ファイル] > [エクスポーズ/アンエクスポーズして保存] を
選択するか、[エクスポーズ] ボタン (電球) をクリックします。
サブフローをアンエクスポーズするとき、変更しようとしているサブフローを他のデータフローが使
用していることを伝える警告メッセージが表示されます。 サブフローのアンエクスポーズを続行する
と、そのサブフローを使用しているすべてのデータフローがアンエクスポーズされます。
ステージからサブフローへの変換
1. 新しいジョブ、サービス、またはサブフローを作成します。
2. ジョブ、サービス、またはサブフローに組み込むステージを追加します。
3. この時点でステージを設定する場合は、ステージを右クリックして [オプション] を選択します。
必要に応じてステージのオプションを設定した後、[OK] をクリックします。
4. 変換するステージを右クリックし、[ステージをサブフローに変換] を選択します。 [名前を付けて
保存] ダイアログ ボックスが表示されます。
5. サブフローの名前を入力して [OK] をクリックした後、サービスを保存します。 システムでユニー
クな名前を指定する必要があります。 次の 3 つのことが行われます。
• 次のものが含まれる新しいサブフローが作成されます。
• ユーザが選択したステージ
• ステージの各入力ポートに対するデータフロー入力
• ステージの各出力ポートに対するデータフロー出力
ユーザ ガイド
209
ステージからサブフローへの変換
• ステージとその入力および出力の間の接続
• ユーザが選択したステージが新しいサブフローに置き換えられます。
• 新しいサブフローがエクスポーズされます。 結果は、サーバ エクスプローラおよびツールボッ
クスの [ユーザ定義ステージ] セクションで確認できます。
サブフローを作成し、それを他のデータフローで使用した後は、サブフローを使用している他のデー
タフローを確認できます。 サブフローを開き、 [ツール] > [使用箇所] を選択します。 (または、Server
Explorer でサブフローを右クリックし、[使用箇所] を選択します。) 現在のサブフローを使用している
データフローのリストが表示され、現在のサブフローを変更した場合に影響を受けるデータフローを
確認できます。
210
Spectrum™ Technology Platform 8.0.0
第 III 部: プロセス フロー
このセクションの構成
• プロセス フローの設計 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .213
• プロセス フローの実行 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .221
プロセス フローの設計
このセクションの構成
• プロセス フローとは . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .214
• アクティビティ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .214
• プロセス フロー変数の作成 . . . . . . . . . . . . . . . . . . . . . . . .217
• 分岐オプションの使用 . . . . . . . . . . . . . . . . . . . . . . . . . . . .218
• プロセス フローの削除 . . . . . . . . . . . . . . . . . . . . . . . . . . . .218
12
プロセス フローとは
プロセス フローとは
プロセス フローでは、 Spectrum™ Technology Platformのジョブや外部アプリケーションなどの一連
のアクティビティが実行されます。 例えば、プロセス フローでは、名前を正規化し、住所を照合して
から、郵便料金の割引が受けられるようにレコードを正しい順序にソートするための外部アプリケー
ションを呼び出すような Spectrum™ Technology Platform ジョブを実行することができます。 次の図
はそのようなプロセス フローを示したものです。
この例では、ジョブ StandardizeNames と ValidateAddresses は Spectrum™ Technology Platform サー
バーでエクスポーズされたジョブです。 プログラムの実行は外部アプリケーションを起動し、成功ア
クティビティはプロセス フローの終了を示します。
アクティビティ
プロセス フローは次のアクティビティで構成されます。
• プログラムの実行(214ページ)
• ジョブ(215ページ)
• 成功(217ページ)
プログラムの実行
プログラムの実行アクティビティは、外部アプリケーションを実行します。
表 31 : プログラムの実行のオプション
214
オプション名
説明
プログラム名
実行する実行可能ファイルのパスです。
引数
[プログラム名] フィールドで指定したプログラム
に渡すコマンド ライン引数を指定します。 複数
の引数はスペースで区切ります。 [変数の挿入] を
クリックすることで、[変数] タブで定義されてい
る変数を引数として使用できます。 変数の詳細に
ついては、プロセス フロー変数の作成(217ペー
ジ)を参照してください。
Spectrum™ Technology Platform 8.0.0
第 12 章 : プロセス フローの設計
オプション名
説明
タイムアウト (秒)
[プログラム名] フィールドで指定したプログラム
が応答するのを待機する時間を指定します。 指定
した時間内にプログラムが応答しない場合、プロ
セス フローは失敗します。
環境変数
このプログラムを実行するときに使用する環境変
数の値を指定します。 この値を指定した場合、プ
ログラムはシステムに固有の値の代わりにこれら
の環境変数を使用します。 指定しないと、システ
ムで指定されている環境変数を使用します。 呼び
出すプログラムで複数の環境変数が使用されてい
る場合は、すべての環境変数の値を定義するか、
またはまったく定義しないようにする必要がある
ことに注意してください。 ここで値を指定して
も、システム上の環境変数定義は変更されませ
ん。
[追加] をクリックし、[変数名] フィールドに変数
の名前を入力します。 例えば、"JAVA_HOME" と
入力します。 変数の値を [変数値] フィールドに
入力します。 例えば、"C:\Program
Files\Java\jdk1.6.0_17" と入力します。 値を入力
する代わりに、[変数の挿入] をクリックして、[変
数] タブで定義されている変数の値に設定するこ
ともできます。 変数の定義方法については、プロ
セス フロー変数の作成(217ページ)を参照して
ください。
ジョブ
プロセス フローでは、エクスポーズされたジョブを実行できます。 エクスポーズされたジョブは、
Enterprise Designer でプロセス フローを開くと [アクティビティ] パレットに一覧表示されます。 ジョ
ブをプロセス フローに追加すると、ジョブをダブルクリックして、[オプション] タブおよび [変数] タ
ブにアクセスできます。
[オプション] タブ
[オプション] タブでは、プロセス フローに組み込んだジョブに対して設定されているデータフロー オ
プションを表示およびオーバーライドできます。 例えば、ジョブのデータフロー オプションの 1 つ
が、ある点から別の点までの距離をマイルで返すものである場合 (Get Travel Directions サービスでの
オプション)、ここでそのオプションをオーバーライドして、作成しているプロセス フローのジョブ
アクティビティの出力では代わりにキロメートルで値を返すようにすることができます。 同様に、
ユーザ ガイド
215
アクティビティ
ジョブのデータフロー オプションの 1 つが、住所を含む入力ファイルに対してカナダ向けの処理を実
行することを、"yes" を表す "Y" で示すものである場合 (Validate Address サービスでのオプション)、
ここでそのオプションをオーバーライドして、カナダ向けの処理を実行しないことを、"no" を表す "N"
で示すようにすることができます。 最後に、ジョブのデータフロー オプションの 1 つが、特定の郵便
番号に含まれる市/州/地域を検索して最大 50 件の結果を返す場合 (Get City State Province サービスの
オプション)、ここでそのオプションをオーバーライドして、代わりに最大 100 件の結果を返すように
することができます。
1. プロセス フローを開いて、ジョブ ステージをダブルクリックします。
2. オーバーライドするオプションをクリックします。
3. ドロップダウンをクリックし、必要に応じてオプションの値を変更するか、または値が指定されて
いない場合は新しい値を入力します。 前記の Get Travel Directions の例を使用すると、ドロップ
ダウンをクリックして [キロメートル] を選択します。 Validate Address の例を使用すると、ドロッ
プダウンをクリックして [U] を選択します。 Get City State Province の例を使用すると、"100" と
入力します。
[変数] タブ
[変数] タブでは、入力および出力に使用するファイルを指定できます。 これは、ジョブ データフロー
の入力および出力ステージで指定されているものとは異なる入力または出力ファイルを使用する場合
に便利です。
入力の場合は、次のいずれかを選択します。
• ジョブで指定されているファイルを使用する — ジョブの Input ステージで指定されているファイル
を使用する場合は、このオプションを選択します。
• サーバー上のファイルを参照する — 使用する入力ファイルのパスとファイル名を指定する場合は、
このオプションを選択します。
• 上流のアクティビティのファイルを参照する — 上流のアクティビティの Read from File ステージま
たは Write to File ステージ、または上流のアクティビティの変数で名前と場所が定義されているファ
イルを参照する場合に選択します。
出力の場合は、次のいずれかを選択します。
• ジョブで指定されているファイルを使用する — ジョブの出力ステージで指定されているファイルを
使用する場合は、このオプションを選択します。
• サーバー上のファイルを参照する — 出力ファイルのパスとファイル名を指定する場合は、このオプ
ションを選択します。
• サーバーでこのファイルを管理する — 必要に応じて自動的に作成および削除される一時ファイルを
参照する場合に選択します。 このオプションは、ファイルがプロセス フローの中間ステップとして
のみ使用され、プロセス フローが完了した後では必要ない場合に便利です。
216
Spectrum™ Technology Platform 8.0.0
第 12 章 : プロセス フローの設計
成功
成功アクティビティはプロセス フローの終わりを示します。 プロセス フローには少なくとも 1 つの
成功アクティビティが必要です。
プロセス フロー変数の作成
変数は、プログラムの実行アクティビティの中で、上流のアクティビティで使用されている入力ファ
イルおよび出力ファイルの参照、定義されているファイルの参照、または一時ファイルの参照のため
に使用されます。 例えば、プロセス フローで、最初のアクティビティの出力ファイルが下流のアク
ティビティに対する入力になっている場合、上流のアクティビティの Write to File ステージで定義さ
れている出力ファイルを示す変数を使用して、そのファイルを簡単に参照できます。 そのファイルを
使用するときは、変数を参照するだけで済みます。 上流のアクティビティの Write to File ステージを
別のファイルを使用するように変更した場合でも、変数は正しいファイルを示します。 変数を使用す
るもう 1 つの利点は、上流のアクティビティの入力ファイルおよび出力ファイルのファイル パスと名
前を知らなくても、変数でファイルを参照できることです。
1. プロセス フローで、[プログラムの実行] アクティビティをダブルクリックします。
2. [変数] タブをクリックします。
3. 作成する変数の種類の横にある [追加] ボタンをクリックします。 3 種類の変数があります。
•
入力 — プログラムの実行で呼び出すプログラムに対する入力として使用するデータを含むファ
イルを示します。
•
出力 — プログラムの実行で呼び出すプログラムによって書き込まれるファイルを示します。
•
コントロール ファイル — プログラムの実行で呼び出すプログラムによって使用される設定ファ
イルを示します。 例えば、VeriMove を呼び出す場合は、VeriMove コントロール ファイルを指
定します。
4. [名前] フィールドに、変数の名前を入力します。
5. 入力変数および出力変数の場合は、[場所] フィールドでオプションを選択します。 使用できるオ
プションは、入力変数と出力変数のどちらを作成するかにより異なります。
入力変数の場合は、次のいずれかを選択します。
•
サーバー上のファイルを参照する — この変数で参照するパスとファイル名を指定する場合に選
択します。
•
上流のアクティビティのファイルを参照する — 上流のアクティビティの Read from File ステー
ジまたは Write to File ステージ、または上流のアクティビティの変数で名前と場所が定義され
ているファイルを参照する場合に選択します。
出力変数の場合は、次のいずれかを選択します。
•
サーバー上のファイルを参照する — この変数で参照するパスとファイル名を指定する場合に選
択します。
ユーザ ガイド
217
分岐オプションの使用
•
サーバーでこのファイルを管理する — 必要に応じて自動的に作成および削除される一時ファイ
ルを参照する場合に選択します。 このオプションは、ファイルがプロセス フローの中間ステッ
プとしてのみ使用され、プロセス フローが完了した後では必要ない場合に便利です。
6. VeriMove などの外部プログラムで使用するコントロール ファイルを作成する場合は、[コンテン
ツ] フィールドでコントロール ファイルの内容を指定します。 コントロール ファイルでは入力お
よび出力変数を使用できます。 コントロール ファイルを使用するには、[オプション] タブで引数
としてコントロール ファイル変数を指定します。 コントロール ファイルで指定した変数は実際の
値に更新されて、コントロール ファイルがプログラムに渡されます。 コントロール ファイルの作
成と使用の詳細については、プログラムのドキュメントを参照してください。
分岐オプションの使用
分岐オプションでは、前のアクティビティからのリターン コードと、それによってトリガされる特定
の出口分岐の対応を指定します。
1. プロセス フローで、フローの 2 つのアクティビティの間の分岐をダブルクリックします。 [分岐オ
プション] ダイアログ ボックスが表示されます。
2. 追加する分岐の種類を選択します。 種類は、単純、条件、それ以外の場合です。 [条件] を選択し
た場合は、数値を含めます。 個別の整数値、開いた範囲、閉じた範囲の任意の組み合わせを指定
できます。
例えば、Run Program アクティビティの実行結果が 0、1、または -1 の場合、アクティビティの後
の分岐の [条件] フィールドに 0、1、または -1 を入力し、結果コードに基づいて動作を制御できま
す。
注: 1 つのアクティビティからの分岐に存在できる "それ以外の場合" 分岐は 1 つだけです。
3. [OK] をクリックします。
4. アクティビティを右クリックし、[入力モード] をポイントして、[すべて] または [最初] を選択しま
す。 [最初] を選択した場合、このアクティビティに入ってくる最初の分岐が使用されると、このア
クティビティが開始し、他の分岐は無視されます。 [すべて] を選択した場合は、このアクティビ
ティに対するすべての分岐が使用されるまで、このアクティビティは開始しません。
5. アクティビティを右クリックし、[出力モード] をポイントして、[すべて] または [最初] を選択しま
す。 [最初] を選択した場合は、true として評価される最初の分岐が使用されます。 [すべて] を選
択した場合は、true として評価されるすべての分岐が使用されます。
プロセス フローの削除
1. [ファイル] > [管理] を選択します。 [管理] ダイアログ ボックスが表示されます。
2. 削除するプロセス フローを右クリックし、[削除] を選択します。
218
Spectrum™ Technology Platform 8.0.0
第 12 章 : プロセス フローの設計
3. [OK] をクリックします。
ユーザ ガイド
219
プロセス フローの実行
このセクションの構成
• Enterprise Designer でのプロセス フローの実行 . . . . . .222
• コマンド ラインからのプロセス フローの実行 . . . . . . . . .222
• 実行ステータスと履歴の表示 . . . . . . . . . . . . . . . . . . . . . . .225
13
Enterprise Designer でのプロセス フローの実行
Enterprise Designer でのプロセス フローの実行
プロセス フローを実行する前に、Enterprise Designer で [実行] > [検証] を選択して、エラーを検査で
きます。
プロセス フローを実行するには、 [実行] > [現在のフローを実行] を選択します。 [実行の詳細] ダイア
ログ ボックスが表示されます。 個別のアクティビティのリターン コードを確認するには、[実行情報]
ツリーでそのアクティビティをクリックします。
コマンド ラインからのプロセス フローの実行
Spectrum™ Technology Platform Welcome ページ (例えば、http://myserver:8080 など) から Process
Flow Executer をダウンロードしてインストールします。
Process Flow Executor の使用方法は次のとおりです。
java -jar pflowexecutor.jar -r <flowname> -u <userID> -p <password>
[OptionalArguments]
次の表では、Process Flow Executor の引数を示します。
表 32 : Process Flow Executor の引数
引数
説明
-?
使用方法を出力します。
-d <区切り文字>
インスタンス/ステータスの区切り文字を設定します。 これは同期出
力でのみ使用され、デフォルトは "|" です。
-e
Spectrum™ Technology Platform サーバーとの通信にセキュアな SSL
接続を使用します。
-f <プロパティ ファイルへの プロパティ ファイルへのパスを指定します。 プロパティ ファイルの
パス>
詳細については、プロセス フローのプロパティ ファイルの使用
(225ページ) を参照してください。
-h <ホスト名>
222
Spectrum™ Technology Platform サーバーの名前または IP アドレスを
指定します。
Spectrum™ Technology Platform 8.0.0
第 13 章 : プロセス フローの実行
引数
説明
-i <ポーリング間隔>
完了したジョブを確認する間隔を秒数で指定します。 デフォルトは
"5" です。
-p <パスワード>
ユーザのパスワードです。 必須
-r <プロセス フロー 1,プロセ 実行するプロセス フローのリストをカンマで区切って指定します。
ス フロー 2...>
必須
-s <ポート>
Spectrum™ Technology Platform サーバーが実行されているソケット
(ポート)。 デフォルト値は 8080 です。
-t <タイムアウト秒数>
同期モードの場合のタイムアウト (秒単位) を設定します。 デフォル
トは 3600 です。
-u <ユーザ名>
ユーザのログイン名を指定します。 必須
-w
同期モードでプロセス フローの完了を待つことを指定します。
ステージ名=ファイル名
ジョブで指定されている入力または出力ファイルをオーバーライドし
ます。 詳細については、Read from File と Write to File の場所のオー
バーライド(224ページ)を参照してください。
例
プロセス フロー名、ユーザ ID、パスワードを指定した基本的なコマンド ライン
エントリを次に示します。
java -jar pflowexecutor.jar -r MyFlow1 -u Bob1234 -p
"mypassword1"
次の例では、前の例と同じ情報に加えて引数を指定しています。
java -jar pflowexecutor.jar -r Flow1 -u Bob1234 -p
"mypassword1" -h g1server.mydomain.com -s 8888 -w -d "%" -i
1 -t 9999
次の例では、コマンド ラインでの起動と出力を示します。
D:\g1\pflow-executor>java -jar pflowexecutor.jar -u guest -p
"mypassword1" -r
validateAddressFlow1 -h g1server.mydomain.com -s 8888 -w -d
"%" -i
1 -t 9999
validateAddressJob1%111%succeeded
ユーザ ガイド
223
コマンド ラインからのプロセス フローの実行
この例では、validateAddressFlow1 という名前のプロセス フローが実行しました
(ID は 111)。 エラーは発生していません。 その他の実行結果としては、"失敗" と
"実行中" があります。
Read from File と Write to File の場所のオーバーライド
Read from File または Write to File の場所をオーバーライドするには、Read from File ステージまたは
Write from File ステージの名前と、その入力ファイルまたは出力ファイルを最後の引数として指定し
ます。
"<jobname>|<stagename>"="<filename>"
場所:
<ジョブ名> は、プロセス フロー内で参照されるジョブの名前です。
<ステージ名> は、ジョブ内の Read from File または Write to File ステージの名前です。
<ファイル名> は、ファイルへのフル パスです。
例:
java -jar pflowexecutor.jar -r Flow1 -u Bob1234 -p "mypassword1" -h
g1server.mydomain.com -s 8888 -w -d "%" -i 1 -t 9999 "Job1|Read from
File"="file:C:/myfile_input.txt" "Job1|Write to
File"="file:C:/myfile_output.txt"
注: ファイル パスには、バックスラッシュではなくスラッシュ (/) を使用する必要があります。
コマンド ラインで指定するステージ名は、データフロー内のステージのアイコンの下に表示されるス
テージ ラベルと一致する必要があります。 例えば、入力ステージのラベルが "Read From File" である
場合は、次のように指定します。
"Job1|Read From File"="file:C:/inputfile.txt"
入力ステージのラベルが "Illinois Customers" である場合は、次のように指定します。
"Job1|Illinois Customers"="file:C:/inputfile.txt"
Read from File または Write to File の場所をオーバーライドするときは、次のようにプロトコルを指定
する必要があります。
• ファイルが Spectrum™ Technology Platform サーバーと同じコンピュータに存在する場合は、パス
の先頭に "file:" プロトコルを付けます 。 例えば、Windows では、"file:C:/myfile.txt" と指定
し、Unix または Linux では、"file:/testfiles/myfile.txt" と指定します。
• ファイルが Process Flow Executor と同じコンピュータに存在する場合は、パスの先頭に "esclient:"
プロトコルを付けます 。 例えば、Windows では、"esclient:C:/myfile.txt" と指定し、Unix
または Linux では、"esclient:/testfiles/myfile.txt" と指定します。
• クライアントとサーバーが同じコンピュータ上で稼働している場合は、どちらのプロトコルを使用
しても構いませんが、"file:" プロトコルを使用した方がパフォーマンスが高くなる可能性があります
。
224
Spectrum™ Technology Platform 8.0.0
第 13 章 : プロセス フローの実行
• Management Console で定義されたファイル サーバーを使用するには、 "ftp:<ファイル サーバー
の名前>/<ファイルへのパス>" という形式を使用します。 例えば、
ftp://FS/testfiles/myfile.txt と指定します。ここで FS は、Management Console で定義
されたファイル サーバー リソースです。
プロセス フローのプロパティ ファイルの使用
プロパティ ファイルには引数が含まれ、Process Flow Executor で -f 引数を使ってプロパティ ファ
イルのパスを指定することにより、引数を再利用できます。 プロパティ ファイルには、少なくともプ
ロセス フロー (r)、ユーザ ID (u)、およびパスワード (p) が含まれる必要があります。
1. テキスト エディタを起動します。
2. 次の例で示すように、1 行で 1 つの引数を指定します。 引数の一覧については、コマンド ライン
からのプロセス フローの実行(222ページ)を参照してください。
D=property=true
d=%
h=myserver.mydomain.com
i=30
u=user
p=password
r=MyFlow1
s=8888
t=9999
w=true
X=Xmx=1024M
3. .properties という拡張子をつけてこのファイルを保存します ("example.properties" など)。
4. Process Flow Executor を実行するときに、-f 引数を使用してプロパティ ファイルのパスを指定
します。 コマンド ライン入力とプロパティ ファイル入力を組み合わせて使用することもできま
す。 コマンド ラインでの引数の方が、プロパティ ファイルで指定されている引数より優先されま
す。
java -jar pflowexecutor.jar -f /dcg/flow.properties -r MyFlow2
この例では、プロセス フロー MyFlow2 が、プロパティ ファイルで指定されているプロセス フロー
より優先されます。
実行ステータスと履歴の表示
プロセス フロー実行の進捗を追跡し、実行履歴を表示するには、Enterprise Designer で [表示] > [実
行履歴] を選択します。[実行履歴] ダイアログ ボックスには、[ジョブ] と [プロセス フロー] の 2 つの
タブがあります。[プロセス フロー] タブには、プロセス フローとステータスについての情報が表示さ
れます。
プロセス フローのアクティビティ ステータスの情報を表示するには、プロセス フローの横のプラス
記号をクリックします。 次の情報が表示されます。
ユーザ ガイド
225
実行ステータスと履歴の表示
• アクティビティ名 — 成功アクティビティを含む、プロセス フローを構成するすべてのアクティビ
ティの名前が含まれます
• 状態 — アクティビティのステータスです (失敗、成功、実行中、キャンセル)
• リターン コード — アクティビティが実行したときに返されたコードです
• 開始 — アクティビティが開始した日時です
• 終了 — アクティビティが終了した日時です
• コメント — アクティビティに関するコメントです
実行中のプロセス フローをキャンセルするには、プロセス フローを選択してから、[キャンセル] をク
リックします。
[実行履歴] リストで表示するフィールドを選択するには、最初の列のすぐ左にあるアイコンをクリッ
クします。 [Field Chooser] ダイアログ ボックスが表示されます。
実行履歴では情報の種類をグループにまとめることができます。 列の名前 ([ID] や [名前] など) をハイ
ライト表示し、[列ヘッダをここにドラッグすると、その列でグループ化されます] という領域にドラッ
グします。 情報が種類によってグループ化されるようになります。
プロセス フロー リストをソートするには、列の名前をクリックします。 表示されるプロセス フロー
のリストを変更するには:
1. [次のプロセス フローのみ表示] の下のドロップダウン リストをクリックし、変数 (ProcessID な
ど) を選択します。
2. 次のリストでいずれかの比較を選択します。
3. 最後のボックスに、比較する値 (ゼロなど) を入力します。
4. [更新] をクリックします。
226
Spectrum™ Technology Platform 8.0.0
第 IV 部: 管理
このセクションの構成
• データベース リソースの設定 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .229
• 外部リソースの設定 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .243
• 実行の管理 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .251
• システムの監視 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .269
• セキュリティの管理 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .273
データベース リソースの設定
このセクションの構成
• データベース リソースの概要 . . . . . . . . . . . . . . . . . . . . . .230
• データベース リソースの追加 . . . . . . . . . . . . . . . . . . . . . .230
• データベース リソースの名前の変更 . . . . . . . . . . . . . . . . .241
• データベース リソースの削除 . . . . . . . . . . . . . . . . . . . . . .241
14
データベース リソースの概要
データベース リソースの概要
いくつかのモジュールは、リファレンス データに依存して処理を行っています。 例えば、Universal
Addressing モジュールは住所の妥当性を確認する際に、米国郵政公社®等の郵便当局から得た郵便デー
タを含むデータベースを使用しています。 データベース リソース ツールにより、これらのデータベー
スを管理することができます。
データベース リソースの追加
Enterprise Geocoding モジュール グローバル データベース リソースの追加
Geocode Address Global および Reverse Geocode Global の各ステージは、他のステージとは異なり、
データベース リソースを定義しなければ、Management Console、Enterprise Designer、または
Interactive Driver に表示されません。 定義したグローバル データベース リソースごとに新しいステー
ジが作成されます。 例えば、メキシコとカナダのデータベースを含む 1 つのデータベース リソース
と、オーストラリアとシンガポールのデータを含むもう 1 つのデータベース リソースを定義した場
合、2 つの Geocode Address Global ステージが表示されます。一方ではメキシコとカナダの住所のジ
オコーディングが可能で、もう一方ではオーストラリアとシンガポールの住所のジオコーディングが
可能です。 また、Reverse Geocode Global ステージも、メキシコおよびカナダ用と、オーストラリ
アおよびシンガポール用に 1 つずつ、合計 2 つ表示されます。
注: • オーストラリア、カナダ、フランス、ドイツ、および日本のジオコーディング データベース
は、サイズが大きくなっています。 これらのデータベースのうちの 2 つまたは 3 つ以上を、同
一のデータベース リソースに入れないでください。
• Spectrum™ Technology Platform サーバーを 32 ビットのマシン上で稼働している場合は、次の
制約があります。
• データベース リソースには、4 または 5 カ国を超えるデータベースを含めてはいけません。
それ以上のデータベースを含める場合は、Java メモリ設定を変更する必要があります。 詳細
については、テクニカル サポートにお問い合わせください。
• 日本のデータベースを他の国と同じデータベース リソースに入れてはいけません。 日本の
データベースには、それ専用のデータベース リソースを用意してください。
• Spectrum™ Technology Platform サーバーを 64 ビットのマシン上で稼働している場合は、デー
タベース リソースに含めるデータベースは 8 〜 10 カ国までにしてください。 それ以上のデー
タベースを含める場合は、Java メモリ設定を変更する必要があります。 詳細については、テ
クニカル サポートにお問い合わせください。
Geocode Address Global データベース リソースを作成するには
230
Spectrum™ Technology Platform 8.0.0
第 14 章 : データベース リソースの設定
1. システムにデータベース ファイルをまだインストールしていない場合は、インストールします。
データベースのインストール手順については、 Spectrum™ Technology Platform インストール ガ
イドを参照してください。.
2. Management Console を開きます。
3. Management Console で、 [モジュール] > [Enterprise Geocoding] > [ツール] を展開し、[グロー
バル データベース リソース] をクリックします。
4. [追加] をクリックして新しいデータベース リソースを作成するか、[変更] をクリックして既存の
データベース リソースを変更します。
5. [データベース] フィールドで、このリソースに付ける名前を指定します。 任意の名前を付けるこ
とができます。 通常は、新しいデータベース リソースを作成するたびに、Pitney Bowes Software
から更新済みのジオコーディング データベースを受け取るため、データベース リソース名にデー
タベース日付を使用することを検討してください。
6. [追加] をクリックします。
7. [追加] を再度クリックします。
8. [名前] フィールドで、このデータベース パスの名前を指定します。 任意の名前を付けることがで
きます。
9. [パス] フィールドで、選択した国のデータベース ファイルを含むフォルダを指定します。 データ
ベース ファイルは通常、 <インストール ディレクトリ>\IGEO-<国コード>\<バージョン>\data
に格納されています。<インストール ディレクトリ> はデータベース ファイルをインストールする
ときに指定したディレクトリ、<国コード> は 2 文字の国コード、<バージョン> はデータのバー
ジョン番号です。 一部の国については、ライセンスを取得しているものと取得していないものを
含む、複数のデータベースがデータ ディレクトリに存在する場合があります。 必ず、ライセンス
を取得しているデータのディレクトリを指定してください。
注: データベースをネットワーク ドライブに配置しないでください。 パフォーマンスの問題が生
じる恐れがあります。
10. データベースがカスタム データベースである場合は、[カスタム データベース] チェック ボックス
をオンにします。 カスタム データベースとは、ジオコーディングに使用可能な住所および緯度/経
度座標を含むユーザ定義のデータベースです。 詳細については、を参照してください。 カスタム
データベースとは(774ページ)
注: カスタム データベースのパスを指定する場合は、Pitney Bowes Software から提供されている
データベースへのパスを先に指定する必要があります。 すべてのデータベース リソースの中
で最初のパスは、Pitney Bowes Software が提供するデータベースのパスでなければなりませ
ん。
11. [OK] をクリックします。
12. その他のデータベース パスを追加する場合は、[追加] をクリックします。それ以外の場合は、[OK]
をクリックします。
13. その他の国を追加する場合は、[追加] をクリックします。それ以外の場合は、[OK] をクリックし
ます。 同一のデータベース リソースに複数の国を追加することにより、単一のステージで各国の
住所をジオコード可能な Geocode Address Global ステージが作成されます。
14. 起動中の Enterprise Designer セッションがある場合は、[更新] ボタンをクリックすると、新しい
ステージが表示されます。
ユーザ ガイド
231
データベース リソースの追加
Enterprise Geocoding モジュールの米国 データベース リソース
新しいデータベース リソースをインストール、または既存のデータベース リソースを変更するたび
に、Management Console で定義して、システム上で使用できるようにする必要があります。 この手
順では、Enterprise Geocoding モジュール用に米国データベース リソースを追加または変更する方法
について説明します。 米国以外の住所のジオコーディングを行うためのデータベース リソースについ
ては、Enterprise Geocoding モジュールの国際データベース リソースの追加(232ページ)を参照し
てください。
1. データベースをまだインストールしていない場合は、データベース ファイルをシステムにインス
トールしてください。 データベースのインストール方法については、 Spectrum™ Technology
Platform インストール ガイドを参照してください。.
2. Management Console を開きます。
3. Management Console で、[モジュール] > [Enterprise Geocoding] > [ツール] > [米国データベー
ス リソース] の順に展開します。
4. 新しいデータベースをインストールするには [追加] をクリックし、既存のデータベース リソース
を変更するには [変更] をクリックします。
5. 新しいデータベースをインストールする場合は、[名前] フィールドにデータベース リソースの名
前を入力します。 任意の名前にすることができます。 既存のデータベース リソース名を変更する
ことはできません。 既存のデータベース リソース名を変更すると、そのデータベース リソースを
参照するサービスまたはジョブが失敗します。
注: Enterprise Geocoding モジュールを Siebel モジュールとともに使用する場合は、米国ジオコー
ディング データベースの名前を KGDDatasource としてください。
6. [パス要素] フィールドにデータベース ファイルを格納するフォルダを指定します。 複数のデータ
ベース パスを含めることができます。 このため、1 つのリソースを指定して、プライマリ データ
Link
ベースと DPV、LACS 、または標高データなどオプションのデータベースの両方を含めること
ができます。
7. [OK] をクリックします。
使用可能なデータベース リソースの一覧にこのデータベース リソースが表示されるようになります。
Enterprise Geocoding モジュールの国際データベース リソースの追加
新しいデータベース リソースをインストール、または既存のデータベース リソースを変更するたび
に、Management Console で定義して、システム上で使用できるようにする必要があります。 この手
順では、Enterprise Geocoding モジュール用に米国以外のデータベース リソースを追加または変更す
る方法について説明します。 米国の住所のジオコーディングを行うためのデータベース リソースにつ
いては、Enterprise Geocoding モジュールの米国 データベース リソース(232ページ)を参照してく
ださい。
1. データベースをまだインストールしていない場合は、データベース ファイルをシステムにインス
トールしてください。 データベースのインストール方法については、 Spectrum™ Technology
Platform インストール ガイドを参照してください。.
232
Spectrum™ Technology Platform 8.0.0
第 14 章 : データベース リソースの設定
2. Management Console を開きます。
3. Management Console で、[モジュール] > [Enterprise Geocoding] > [ツール] の順に展開し、デー
タを設定する国のデータベース リソース アイコンをクリックします。
4. 新しいデータベースをインストールするには [追加] をクリックし、既存のデータベース リソース
を変更するには [変更] をクリックします。
5. [データベース] フィールドにデータベース リソース名を指定します。 任意の名前にすることがで
きます。 通常は、新しいデータベース リソースを作成するたびに、Pitney Bowes Software から更
新済みのジオコーディング データベースを受け取るため、データベース リソース名にデータベー
ス日付を使用することを検討してください。
6. [追加] をクリックします。[名前] フィールドにこのデータベース リソースの名前を指定します。
[パス] フィールドにデータベース ファイルを格納するフォルダを指定します。 通常、データベー
ス ファイルは、 <インストール ディレクトリ>\IGEO-<国コード>\<バージョン>\data に格納
されています。<インストール ディレクトリ> はデータベース ファイルをインストールするときに
指定したディレクトリ、<国コード> は 2 文字の国コード、<バージョン> はデータのバージョン番
号です。 データ ディレクトリ内に複数のデータベースを持つ国もあります。ライセンスがあるデー
タベースもあれば、ライセンスがないデータベースもあります。 ライセンスがあるデータのロケー
ションのみを指定してください。
Australia Geocoded National Address File (G-NAF) データベースの場合は、GNAF123 フォルダと
GNAF456 フォルダに別々のデータベース リソースを指定する必要があります。 住所の有無の確
認には両方のデータベースを使用し、小区画レベルのジオコーディングには GANF123 のみを使用
することを推奨します。 小区画レベルのジオコードが不要な場合は、ジオコーディングに GANF456
データベースを使用することができます。
注: ユーザ定義データベースのパスを指定する場合は、まず Pitney Bowes Software が提供する
データベースへのパスを指定する必要があります。 すべてのデータベース リソースの中で最
初のパスは、Pitney Bowes Software が提供するデータベースのパスでなければなりません。
7. [OK] をクリックします。
使用可能なデータベース リソースの一覧にこのデータベース リソースが表示されるようになります。
Enterprise Tax モジュールのデータベース リソースの追加
新しいデータベース リソースをインストール、または既存のデータベース リソースを変更するたび
に、Management Console で定義して、システム上で使用できるようにする必要があります。 この手
順では、Enterprise Tax モジュールのデータベース リソースを追加または変更する方法について説明
します。
1. データベースをまだインストールしていない場合は、データベース ファイルをシステムにインス
トールしてください。 データベースのインストール方法については、 Spectrum™ Technology
Platform インストール ガイドを参照してください。.
2. Management Console で、[モジュール] > [Enterprise Tax] > [ツール] > [データベース リソース]
の順に展開します。
3. 新しいデータベースをインストールするには [追加] をクリックし、既存のデータベース リソース
を変更するには [変更] をクリックします。
ユーザ ガイド
233
データベース リソースの追加
4. 新しいデータベースをインストールする場合は、[名前] フィールドにデータベース リソースの名
前を入力します。 任意の名前にすることができます。 既存のデータベース リソース名を変更する
ことはできません。 既存のデータベース リソース名を変更すると、そのデータベース リソースを
参照するサービスまたはジョブが失敗します。
5. このデータベース リソースに含めるデータベースのパスを指定してください。
Enterprise Tax モジュールの詳細については、Enterprise Tax データベースを参照してください。
6. [OK] をクリックします。
使用可能なデータベース リソースの一覧にこのデータベース リソースが表示されるようになります。
Enterprise Routing モジュールのデータベース リソースの追加
新しいデータベース リソースをインストール、または既存のデータベース リソースを変更するたび
に、Management Console で定義して、システム上で使用できるようにする必要があります。 この手
順では、Enterprise Routing モジュールのデータベース リソースをインストールまたは変更する方法
について説明します。 ルーティング データベース リソースは、Find Nearest、Get Travel Boundary、
Get Travel Cost Matrix、および Get Travel Directions で使用されます。
1. データベースをまだインストールしていない場合は、データベース ファイルをシステムにインス
トールしてください。 データベースのインストール方法については、 Spectrum™ Technology
Platform インストール ガイドを参照してください。.
2. Management Console を開きます。
3. Management Console で、[モジュール] > [Enterprise Routing] > [ツール] > [ルーティング データ
ベース リソース] の順に展開します。
4. 新しいデータベースをインストールするには [追加] をクリックし、既存のデータベース リソース
を変更するには [変更] をクリックします。
5. 新しいデータベースをインストールする場合は、[名前] フィールドにデータベース リソースの名
前を入力します。 任意の名前にすることができます。 既存のデータベース リソース名を変更する
ことはできません。 既存のデータベース リソース名を変更すると、そのデータベース リソースを
参照するサービスまたはジョブが失敗します。
6. [パス要素] フィールドにデータベース ファイルを格納するフォルダを指定します。 通常、データ
ベース ファイルは、 <インストール ディレクトリ>\ERM-<国コード>\<ヴィンテージ>\<タイプ
>\<国> に格納されています。<インストール ディレクトリ> はデータベース ファイルをインス
トールするときに指定したディレクトリ、<国コード> は 2 文字の国コード、<ヴィンテージ> は
データの日付 (例: 2009.1)、<タイプ> はドライブまたは歩行者、<国> は国の名前です。
7. [OK] をクリックします。
Find Nearest、Get Travel Boundary、Get Travel Cost Matrix、および Get Travel Directions で使用で
きるデータベース リソースの一覧に、このデータベース リソースが表示されるようになります。
Location Intelligence モジュール Centrus データベース リソースの追加
新しいデータベース リソースをインストール、または既存のデータベース リソースを変更するたび
に、Management Console で定義して、システム上で使用できるようにする必要があります。 この手
234
Spectrum™ Technology Platform 8.0.0
第 14 章 : データベース リソースの設定
順では、Location Intelligence モジュールの Centrus データベース リソースをインストールまたは変更
する方法について説明します。 Centrus データは、Closest Site および Point in Polygon で使用されま
す。
1. データベースをまだインストールしていない場合は、データベース ファイルをシステムにインス
トールしてください。 データベースのインストール方法については、 Spectrum™ Technology
Platform インストール ガイドを参照してください。.
2. Management Console を開きます。
3. Management Console で、[モジュール] > [Location Intelligence] > [ツール] > [Centrus データ
ベース リソース] の順に展開します。
4. 新しいデータベースをインストールするには [追加] をクリックし、既存のデータベース リソース
を変更するには [変更] をクリックします。
5. 新しいデータベースをインストールする場合は、[名前] フィールドにデータベース リソースの名
前を入力します。 任意の名前にすることができます。 既存のデータベース リソース名を変更する
ことはできません。 既存のデータベース リソース名を変更すると、そのデータベース リソースを
参照するサービスまたはジョブが失敗します。
6. [パス] フィールドにデータベース ファイルへのフル パスを入力します。 Centrus データベース
ファイルには、拡張子 .gsb が付きます。 Spectrum™ Technology Platform で使用できるようにす
るには、.gsb ファイルのファイル名を Unix および Linux システム上ですべて小文字にする必要が
あります。
7. [キャッシュ サイズ] フィールドで、データのキャッシュに使用するメモリの量を選択します。 一
般的には、キャッシュを大きくするほどパフォーマンスが向上します。 次のオプションがありま
す。
•
なし — データをキャッシュしません。
•
中 — 最大 5 MB のメモリを使用してデータをキャッシュします。 キャッシュに使用できるメ
モリの量が少ない場合は、この設定を使用してください。
•
大 — 最大 20 MB のメモリを使用してデータをキャッシュします。 多数のレコードを処理する
場合はこの設定を使用してください。
•
巨大 — 最大 100 MB のメモリを使用してデータをキャッシュします。 多数のレコードを処理
する場合はこの設定を使用してください。
8. [OK] をクリックします。データベースの一覧に次の情報が表示されます。
•
名前 — データベースに付与した名前。 このデータベースをステージまたはサービスから参照
する際に使用する名前です。
•
パス — データベース ファイルの場所。
•
キャッシュ サイズ — このデータベースのデータのキャッシュに使用するメモリの量。
•
フィーチャー タイプ — データベースに格納されている空間データのタイプを示します (ポイン
ト、ポリゴン、またはライン)。 ポイント データベースは、Closest Site ステージおよび Point
In Polygon ステージで使用できます。 ポリゴン データベースおよびライン データベースは、
Point In Polygon ステージで使用できます。
•
バッファ有効 — データベースがバッファリングをサポートしているかどうかを示します。バッ
ファリングは Point in Polygon 機能の 1 つで、ポイント、ポリゴン、またはラインに近い領域
を指定するのに使用します。
ユーザ ガイド
235
データベース リソースの追加
Closest Site および Point in Polygon で使用できるデータベース リソースの一覧にこのデータベース
リソースが表示されるようになります。
Location Intelligence モジュール データベースの名前付き接続の追加
新しいデータベース リソースをインストール、または既存のデータベース リソースを変更するたび
に、Management Console で定義して、システム上で使用できるようにする必要があります。 この手
順では、Location Intelligence モジュールの空間データベース リソースをインストールまたは変更する
方法について説明します。 これらのリソースは、データベースに名前付き接続を追加することによっ
て定義されます。 これらの名前付き接続は、Location Intelligence モジュールのリポジトリに保存さ
れ、すべての空間サービスが使用できます。 データベースに名前付き接続を追加したら、データベー
スを使用して名前付きテーブル (データベース内のテーブルへのリンク) を作成できるようになります。
空間データベース リソースは、Find Nearest、Query Spatial Data、および Read Spatial Data で使用
されます。
Spectrum™ Technology Platform でサポートされている JDBC データ型は、 BIGINT、BINARY、BIT、
BLOB、BOOLEAN、CHAR、DATE、DECIMAL、DOUBLE、FLOAT、INTEGER、LONGVARBINARY、
LONGVARCHAR、NULL、NUMERIC、REAL、SMALLINT、TIME、TIMESTAMP、TINYINT、
VARBINARY、VARCHAR です。 さらに、Spectrum™ Technology Platform では Oracle データ型
SDO_GEOMETRY と MDSYS.SDO_GEOMETRY もサポートされています。 これらのデータ型は、
次のように扱われます。
• string、INTEGER、long、FLOAT、および DOUBLE — 変更なし
• DECIMAL — DOUBLE に変換
• SDO_GEOMETRY および MDSYS.SDO_GEOMETRY — GEOMETRY に変換
• それ以外 — STRING に変換
1. データベースをまだインストールしていない場合は、データベース ファイルをシステムにインス
トールしてください。 データベースのインストール方法については、 Spectrum™ Technology
Platform インストール ガイドを参照してください。.
2. Management Console を開きます。
3. Management Console で、[モジュール] > [Location Intelligence] > [ツール] > [接続] の順に展開
します。 次のいずれかをクリックします。
•
新しいデータベース リソースを定義するには、[追加] をクリックします。
•
既存のデータベース リソースを変更するには、[変更] をクリックします。
4. 新しい名前付き接続を追加する場合は、[接続名] フィールドにリソースの名前を入力します。 任
意の名前にすることができます。 既存のデータベース リソース名を変更することはできません。
既存のデータベース リソース名を変更すると、そのデータベース リソースを参照するサービスま
たはジョブが失敗します。
5. [URL] フィールドで、データベースへの JDBC 接続 URL を指定します。 この URL は、
jdbc:[subprotocol]:[node]/[databaseName] という形式です。 例:
•
•
236
Oracle — jdbc:oracle:thin:@pbs-lim:8080:pbspatial
SQL Server — jdbc:sqlserver://PBS-LIM:8080;databaseName=pbspatial
Spectrum™ Technology Platform 8.0.0
第 14 章 : データベース リソースの設定
•
PostGres/GIS — jdbc:postgresql://111.111.11.111:8080/pbspatial
6. [ユーザ名] フィールドで、データベース リソースに接続するユーザを指定します。
7. [パスワード] フィールドで、データベース リソースに接続するユーザのパスワードを指定します。
8. [プロパティ] フィールドで、データベース固有の接続プロパティを指定します。 接続文字列に追
加できるプロパティ名と値のタイプについては、データベースのドキュメントを参照してくださ
い。 例えば、プロパティ値 networkProtocol とキー tcp を追加できます。
注: 現在、Oracle はダイアログからプロパティをサポートする唯一のデータベースです。
PostGres/GIS および SQL Server の場合は、プロパティを URL に追加します。
9. [テスト] をクリックして、接続が有効であることを確認します。
10. [OK] をクリックします。
Find Nearest、Query Spatial Data、および Read Spatial Data で使用可能なリソースの一覧にこのデー
タベース リソースへの名前付き接続が表示されるようになります。 これらの接続は、データベース
リソース内の名前付きテーブルへのアクセスにも使用できます。
Location Intelligence モジュールの名前付きテーブル リソースの追加
Location Intelligence モジュールのステージ、サービス、および操作では、さまざまなデータ タイプに
アクセスする名前付きテーブルが必要です。 名前付きテーブルはデータを指すリソースで、MapInfo
TAB、Shape、またはデータベース ファイルへのアクセスに使用できます。 この手順では、Location
Intelligence モジュールの名前付きテーブル リソースを追加または変更する方法について説明します。
これらの名前付きテーブルは、Location Intelligence モジュールのリポジトリに保存され、すべての空
間サービスが使用できます。
注: read、add、および modify 権限を持つユーザのみが、Management Console を使用して名前付
きテーブルを追加できます。 権限の割り当ての詳細については、
http://reference.mapinfo.com/software/spectrum/lim/8_0/index.html で『ユーザ管理ガイド』
を参照してください。
1. データベースをまだインストールしていない場合は、データをシステムにインストールしてくださ
い。 データベースのインストール方法については、 Spectrum™ Technology Platform インストー
ル ガイドを参照してください。. データベース リソース内の名前付きテーブルを追加するには、ま
ずデータベース リソースに名前付き接続を追加する必要があります。 名前付き接続の追加につい
ては、を参照してください。 Location Intelligence モジュール データベースの名前付き接続の追
加(236ページ).
2. Management Console を開きます。
3. Management Console で、[モジュール] > [Location Intelligence] > [ツール] > [名前付きテーブル]
の順に展開します。 次のいずれかをクリックします。
•
新しいテーブル リソースを定義するには、[追加] をクリックします。
•
既存のテーブル リソースを変更するには、[変更] をクリックします。
•
既存のテーブル リソースを削除するには、[削除] をクリックします。
ユーザ ガイド
237
データベース リソースの追加
4. 新しい名前付きテーブルを追加する場合は、その名前付きテーブル リソースのリポジトリ パスと
名前を [名前付きテーブル名] フィールドに入力します。 名前付きテーブルの名前の前に、名前付
きテーブルを作成するリポジトリ内の場所を付加する必要があります。 例えば、名前付きテーブ
ル World をリポジトリの NamedTables フォルダ内に作成する場合、[名前付きテーブル名] フィー
ルドに /NamedTables/World と入力します。 既存の名前付きテーブル リソース名を変更するこ
とはできません。 既存のリソース名を変更すると、そのリソースを参照するサービスまたはジョ
ブが失敗します。
5. [名前付きテーブル タイプ] フィールドで、次のいずれかを選択します。
•
Tab — データがファイル システム上に MapInfo TAB 形式で存在する場合はこのオプションを
選択します。
•
Shape — 空間データが ESRI シェイプ ファイル形式の場合はこのオプションを選択します。
•
データベース — データがデータベース内にあり、名前付き接続を作成済みの場合はこのオプ
ションを選択します。
6. ソース タイプとして Tab を選択した場合は、TAB ファイルへのパスを [パス] フィールドに指定し
ます。
7. ソース タイプとして Shape File を選択した場合は、シェイプ ファイルへのパスを [パス] フィール
ドに指定します。
8. ソース タイプとしてデータベースを選択した場合は、次のフィールドに入力します。
•
接続名 — データベースにアクセスするために使用する一連のパラメータを定義する、データ
ベースへの名前付き接続です。 既存の名前付き接続を指定するには、一覧から名前を選択しま
す。
•
スキーマ — オプションのデータベース スキーマ オブジェクト。 通常は、ユーザ名と同じで
す。
•
テーブル — データフローに読み込む空間データを格納しているテーブル。
9. [OK] をクリックします。
Find Nearest、Query Spatial Data、および Read Spatial Data で使用可能なリソースの一覧にこの名
前付きテーブル リソースが表示されるようになります。
Universal Addressing モジュールのデータベース リソースの追加
新しいデータベース リソースをインストール、または既存のデータベース リソースを変更するたび
に、Management Console で定義して、システム上で使用できるようにする必要があります。 この手
順では、Get Candidate Addresses、Get City State Province、Get Postal Codes、および Validate
Address で使用されるデータベース リソースを追加または変更する方法について説明します。
注: Validate Address Global 用のデータベース リソースを設定する場合は、Validate Address Global
のデータベース リソースの追加(239ページ)を参照してください。
1. データベースをまだインストールしていない場合は、データベース ファイルをシステムにインス
トールしてください。 データベースのインストール方法については、 Spectrum™ Technology
Platform インストール ガイドを参照してください。.
2. Management Console を開きます。
238
Spectrum™ Technology Platform 8.0.0
第 14 章 : データベース リソースの設定
3. Management Console で、[モジュール] > [Universal Addressing] > [ツール] の順に展開し、デー
タベース リソースを設定する国のアイコンをクリックします。
注: Validate Address Global 用のグローバル データベース リソースを定義する場合は、Validate
Address Global のデータベース リソースの追加(239ページ)を参照してください。
4. 新しいデータベースをインストールするには [追加] をクリックし、既存のデータベース リソース
を変更するには [変更] をクリックします。
5. 新しいデータベースをインストールする場合は、[名前] フィールドにデータベース リソースの名
前を入力します。 任意の名前にすることができます。 既存のデータベース リソース名を変更する
ことはできません。 既存のデータベース リソース名を変更すると、そのデータベース リソースを
参照するサービスまたはジョブが失敗します。
6. データベース ファイルへのパスを指定してください。
7. [OK] をクリックします。
使用可能なデータベース リソースの一覧にこのデータベース リソースが表示されるようになります。
Validate Address Global のデータベース リソースの追加
新しいデータベース リソースをインストール、または既存のデータベース リソースを変更するたび
に、Management Console で定義して、システム上で使用できるようにする必要があります。 この手
順では、Validate Address Global モジュールで使用されるデータベース リソースをインストールまた
は変更する方法について説明します。
1. データベースがまだインストールされていない場合は、インストール作業を行ってから、
<SpectrumLocation>\server\modules\addressglobal\conf\unlockcodes.txt に格納
されているアンロック キーを入力してください。 データベースのインストール方法については、
Spectrum™ Technology Platform インストール ガイドを参照してください。.
注: データベース リソースを作成する前に、unlockcodes.txt ファイルに格納されたアンロック
キーを指定する必要があります。
2. Management Console を開きます。
3. Management Console で、 [モジュール] > [Universal Addressing] > [ツール] > [グローバル デー
タベース リソース] 展開します。
4. 新しいデータベースをインストールするには [追加] をクリックし、既存のデータベース リソース
を変更するには [変更] をクリックします。
5. 新しいデータベースをインストールする場合は、[名前] フィールドにデータベース リソースの名
前を入力します。 任意の名前にすることができます。 既存のデータベース リソース名を変更する
ことはできません。 既存のデータベース リソース名を変更すると、そのデータベース リソースを
参照するサービスまたはジョブが失敗します。
6. [キャッシュ サイズ] フィールドで、プリロードされなかった参照データのファイル システム検索
を高速化するために使うメモリの量を選択します (プリローディングについては以降で詳しく説明
します)。 次のいずれかを選択します。
•
なし — データをキャッシュしません。
ユーザ ガイド
239
データベース リソースの追加
•
小 — Validate Address Global によるメモリ消費量を減らすには、このオプションを選択しま
す。
•
大 — この設定の使用を推奨します。 すべての参照データがプリロードされる場合 (キャッシュ
サイズを [なし] に選択できる) または Validate Address Global によるメモリ消費量を減らす必
要がある場合を除き、この設定を使用してください。
7. [パス要素] フィールドにデータベース ファイルを格納するフォルダを指定します。 パス要素を指
定するには
a) [追加] をクリックします (または既存のパスを変更する場合は [変更] をクリックします)。
b) [パス] フィールドにデータベース ファイルを格納するフォルダを指定します。
c) [追加] をクリックして国の優先設定を指定します (既存の優先設定を変更する場合は [変更] を
クリックします)。
8. データベース タイプを選択します。 次のオプションがあります。
•
バッチ インタラクティブ — (デフォルト) 高速実行以外と認定以外のすべてのデータベースに
使用します。
•
高速実行 — クイック住所エントリ アプリケーションで使用される検証モードです。複数の住
所フィールドに入力された不完全なデータから、入力住所の候補を生成できます。 高速実行を
使って、入力の途中で住所候補を作成することもできます。
注: 高速実行データベースは、拡張パーシングに対応していません。
•
認定 — オーストラリアにおける郵便のバッチ処理環境で使用される検証モードです。 Validate
Address Global はオーストラリア郵便公社の Address Matching Approval System (AMAS) で認
定されています。 これは郵便住所ファイルに照らして郵便の正規化と検証を行うことで、郵便
料金の割引と不達郵便物の最小化を実現します。
9. プリローディング タイプを選択します。
プリローディングは、データベース データをメモリにロードすることを意味し、パフォーマンス
を改善する効果があります。 プリローディング中にメモリが大量に割り当てられる可能性がある
ため、データベースがメモリに完全にロードされるまでに多少の時間がかかることがあります。
次のオプションがあります。
•
なし — データがメモリにプリロードされません。 メモリが限られたマシンでは、このオプショ
ンを使用してください (デフォルト)。
•
部分 — 部分プリローディングによって、メタデータおよびインデックス構造がメモリにロード
されます。 参照データ自体はハード ドライブに残ります。 部分プリローディングによって、
パフォーマンスがやや向上します。また、目的のデータベースをすべてロードするだけのメモ
リが使用できない場合の代替策となります。 部分プリローディングは、すべてのデータベース
に対してサポートされていないことがあります。
•
完全 — 完全プリローディングによって、参照データベース全体がメモリに移動します。 米国
や英国など、大規模なデータベースを持つ国では、大量のメモリが必要になることがあります
が、処理速度は大幅に向上します。
10. 以下のインストール方法を選択できます。
•
240
デフォルトにする — 選択したデータベース タイプとプリローディング タイプをフォルダ内の
すべての国のデフォルトにします。
Spectrum™ Technology Platform 8.0.0
第 14 章 : データベース リソースの設定
•
選択した国のみに適用 — このデータベース タイプとプリローディング タイプを選択した国の
みに適用します。
11. [OK] をクリックします。
12. 必要に応じて、異なる国に対して異なるデータベース タイプとプリローディング 設定の指定を繰
り返します。 例えば、1 つのフォルダに複数の国がある場合、デフォルトのデータベース タイプ
として FastCompletion、プリローディング タイプとして [部分] を指定し、[OK] をクリックしま
す。 次に [追加] をクリックし、頻繁に使用すると思われるいくつかの国に対するデフォルトのデー
タベース タイプとして FastCompletion、プリローディング タイプとして [完全] を指定し、[OK]
を再度クリックします。
13. データベース タイプとプリローディング オプションの定義が完了したら、[OK]をクリックしま
す。
14. 必要に応じて、追加のデータベース パスを定義します。 必要な操作が終了したら、[OK] をクリッ
クします。
Validate Address Global で使用可能なデータベース リソースの一覧にこのデータベース リソースが表
示されるようになります。
データベース リソースの名前の変更
データベースの名前を変更すると、そのデータベースを参照する既存のジョブ/サービスが機能しなく
なるおそれがあります。 そのデータベースを参照するジョブ/サービスが存在しない場合、あるいは、
別のデータベースまたは新しい名前を参照するように既存のジョブ/サービスを変更する場合は、デー
タベースの名前を問題なく変更できます。
1. データベースを定義するモジュールの [ツール] ノードの下で、[データベース リソース] アイコン
をクリックします。
2. [名前の変更] をクリックします。
3. [OK] をクリックして、データベースの名前の変更を確認します。
4. 新しい名前を入力してから、[OK] をクリックします。
データベース リソースの削除
1. データベースを削除する前に、そのデータベースを使用するジョブまたはサービスが存在しないこ
とを確認します。 ジョブ/サービスから参照されるデータベースを削除すると、それらのジョブ/
サービスは機能しなくなります。
2. データベースを定義するモジュールの [ツール] ノードの下で、[データベース リソース] アイコン
をクリックします。
3. [削除] をクリックします。
ユーザ ガイド
241
データベース リソースの削除
注: この操作によって、データベースは Spectrum™ Technology Platform ジョブから使用できな
くなりますが、データベース ファイルがシステムから削除されるわけではありません。
242
Spectrum™ Technology Platform 8.0.0
外部リソースの設定
このセクションの構成
• 外部リソースの概要 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .244
• データベースへの接続 . . . . . . . . . . . . . . . . . . . . . . . . . . . .244
• ファイル サーバーへの接続 . . . . . . . . . . . . . . . . . . . . . . . .246
• 外部 Web サービスへのアクセス . . . . . . . . . . . . . . . . . . . .247
15
外部リソースの概要
外部リソースの概要
Spectrum™ Technology Platform では、既存のデータ リポジトリをジョブの入出力として使って、デー
タベースとファイル サーバーとの読み書きを実行できます。Spectrum™ Technology Platform は、外
部 Web サービスにもアクセスできます。 ここでは、特定のソースを使う前に設定する必要がある、
接続の表示および管理の方法について説明します。
データベースへの接続
Management Console の [接続] サブノードを使って、登録済みのデータベース接続を管理できます。
データベース接続の追加または変更
1. Management Console を開きます。
2. [リソース] を展開し、[接続] をクリックします。
3. [追加] または [変更] をクリックします。 [接続 プロパティ] ダイアログ ボックスが表示されます。
4. [接続名] フィールドに接続の名前を入力します。 任意の名前にすることができます。
5. 適切なデータベース タイプを [データベース ドライバ] フィールドで選択します。
6. [接続オプション] テーブルで、必要なフィールドの設定を行います。 ここでは、ホスト、ポート、
インスタンス、ユーザ名、およびパスワードなどを指定します。
7. 必要であれば、[テスト] を押して接続をテストします。
8. [OK] をクリックします。
接続の削除
1. Management Console を開きます。
2. [リソース] を展開し、[接続] をクリックします。
3. 更新する接続をハイライト表示にして、[削除] をクリックします。 接続を削除するかどうかを尋
ねる確認メッセージが表示されます。
4. [OK] をクリックして確認します。
JDBC 接続の使用
Management Console 内の [JDBC ドライバ] サブノードにより、JDBC ドライバを管理することがで
きます。 これらのドライバを追加、変更、または削除できます。
244
Spectrum™ Technology Platform 8.0.0
第 15 章 : 外部リソースの設定
JDBC ドライバの追加または変更
注: JDBC ドライバの設定は非常に特殊であり、正しく機能させるには正確に設定する必要がありま
す。 JDBC ドライバを追加する前に、データベース/データベース ドライバのプロバイダから正
しい情報を得ていることを確認してください。
1. Management Console を開きます。
2. [リソース] を展開し、[JDBC ドライバ] をクリックします。
3. [追加] をクリックし、新しい JDBC ドライバ接続を作成します。 既存のドライバを変更する場合
は、変更するドライバを選択し、[変更] をクリックします。
注: Spectrum™ Technology Platform には、3 つの定義済み JDBC ドライバ Internal (システムが
使用)、SQL Server、および Oracle が同梱されています。 これらのドライバは変更または削
除できません。
4. [JDBC ドライバ構成名] フィールドにドライバの名前を入力します。 任意の名前にすることがで
きます。
5. [JDBC ドライバ クラス名] フィールドにドライバの Java クラス名を入力します。 通常は、JDBC
ドライバのドキュメントにクラス名が記載されています。
例えば、SQL データベースへの SSL 接続で Microsoft JDBC ドライバを使用するには、次のよう
に入力します。
com.microsoft.sqlserver.jdbc.SQLServerDriver
6. [接続文字列テンプレート] フィールドに接続文字列として使用するテンプレートを入力します。
例えば、SQL データベースへの SSL 接続を有効にするには、次のように入力します。
jdbc:sqlserver://${host}:${port};databaseName=${instance};encrypt=true;TrustServerCertificate=true
7. [ドライバ ファイル] セクションで、[追加] をクリックします。
8. 適切なドライバまで移動して選択し、[保存] をクリックします。
9. [接続プロパティ] セクションで、[追加] をクリックします。[JDBC 接続プロパティ] ダイアログ
ボックスが表示されます。
10. [ラベル] フィールドにプロパティのラベルを入力します。 ラベルには任意の名前を入力できます。
例えば、username と入力します。
11. [プロパティ トークン] フィールドに URL で使用するトークンを入力します。 例えば、user と入
力します。
注: 作成するすべての JDBC 接続に対し、プロパティ トークン user および password を入力す
る必要があります。
12. [OK] をクリックします。
JDBC ドライバの削除
1. Management Console を開きます。
ユーザ ガイド
245
ファイル サーバーへの接続
2. [リソース] を展開し、[JDBC ドライバ] をクリックします。
3. 既存の JDBC ドライバを選択して、[削除] をクリックします。 [削除の確認] ダイアログボックス
が表示されます。
注: いずれかの接続でこのドライバを使用している場合は、どの接続が使用しているかが表示さ
れ、そのドライバを削除することはできません。
ファイル サーバーへの接続
Management Console 内の [ファイル サーバー] サブノードには、ファイル サーバーを設定するための
オプションが表示されます。
ファイル サーバーの追加
1. Management Console を開きます。
2. [リソース] を展開し、[ファイル サーバー] をクリックします。
3. [追加] をクリックします。
4. [接続名] フィールドに新しい接続の名前を入力します。 任意の名前にすることができます。
5. [ホスト] フィールドにファイル サーバー情報のアドレスを入力します。
6. [ポート] フィールドにネットワーク ポート番号を入力します。
7. [ユーザ名] フィールドに名前を入力します (FTP サーバーでそれが必要な場合は必須)。
8. [パスワード] フィールドにパスワードを入力します (FTP サーバーでそれが必要な場合は必須)。
9. [OK] をクリックします。
10. サーバーをテストするには、テストする接続をハイライト表示し、[ファイル サーバー] ダイアロ
グ ボックスの [テスト] ボタンをクリックします。
注: 設定したファイル サーバーは、Enterprise Designer の Read From File ステージでデータフ
ロー入力ファイルを定義する際、[リモート マシン] をクリックしたときに選択できます。
ファイル サーバーの変更
ファイル サーバーを変更するには、次の手順に従います。
1. Management Console を開きます。
2. [リソース] を展開し、[ファイル サーバー] をクリックします。
3. 更新するサーバーをハイライト表示にして、[変更] をクリックします。
4. サーバーを適切に変更し、[OK] をクリックします。
注: 設定を変更すると、その設定を参照しているデータフローは正常に機能しなくなります。
246
Spectrum™ Technology Platform 8.0.0
第 15 章 : 外部リソースの設定
ファイル サーバーの削除
1. Management Console を開きます。
2. [リソース] を展開し、[ファイル サーバー] をクリックします。
3. 削除するファイル サーバーをハイライト表示にして、[削除] をクリックします。 サーバーを削除
するかどうかを尋ねる確認メッセージが表示されます。
4. [OK] をクリックして確認します。
注: ファイル サーバーを削除すると、そのファイル サーバーを参照しているデータフローが正し
く機能しなくなります。
外部 Web サービスへのアクセス
Management Console 内の [外部の Web サービス] サブノードには、外部 Web サービスにアクセスす
るためのオプションが表示されます。
Web サービスとは、ホストによって提供され、HTTP プロトコルを使用してインターネットを介して
リモートからアクセスするサービスのことです。 ホストによって提供されるサービスは通常、何らか
の種類のデータ処理を行います。 Web サービスを使用するには、ホストの URL に要求を送信します。
要求には、Web サービスに何らかの方法で処理してもらうデータ セットを含めることができます。
Web サービスは処理を完了すると、処理済みデータを含む応答を返信します。
現時点では、REST、SOAP 1.1、または SOAP 1.2 メッセージングのいずれかを使用する外部 Web
サービスのみが、Spectrum™ Technology Platform を使用してアクセス可能です。
外部 Web サービスの追加または変更
1. Management Console を開きます。
2. [リソース] ノードを展開し、[外部の Web サービス] をクリックします。
3. [追加] または [変更] をクリックします。
4. [名前] フィールドに、外部 Web サービスに付ける名前を入力します。 名前は一意でなければなり
ません。
5. [外部サービス タイプ] で、呼び出す Web サービスのタイプとして、 SOAP (Simple Object Access
Protocol) または REST (Representational State Transfer) を選択します。
6. [タイムアウト] フィールドに、Web サービスに送信した要求がタイムアウトするまでの経過時間
を秒数で入力します。
注: ここで指定したタイムアウト値は、Web サービスに対するすべての要求に適用されます。 こ
れには、エクスポーズされた Web サービスに対するトランザクションだけでなく、Web サー
ビスの設定の過程で送信される要求も含まれます。 このような設定タイプの要求は、[更新]
をクリックしたとき、[操作] リストで新しい項目を選択したとき、[プレビュー] を実行したと
きに送信されます。 タイムアウトは、これらのどのアクションを実行する場合にも生じる可
ユーザ ガイド
247
外部 Web サービスへのアクセス
能性があります。 タイムアウトが生じる場合、Web サービスが実際に稼働中であるならば、
[タイムアウト] の値を大きくすることによってそれを回避できる可能性があります。
7. API から Web サービスにアクセスするには、[サービスとしてエクスポーズ]Spectrum™ Technology
Platform チェック ボックスをクリックします。 このチェック ボックスが選択されている場合、[外
部の Web サービス] ビューの「エクスポーズ」列は "真" になっています。
8. Web サービスを SOAP または REST を介してエクスポーズする場合は、[エクスポーズするサー
ビス タイプ] フィールドで適切なチェック ボックスをクリックします。 これにより、http://<サー
バー名>:<ポート>/soap または http://<サーバー名>:<ポート>/rest のいずれかでそのサービスを参
照できるようになります。 例えば、http://myserver:8080/soap または http://myserver:8080/rest に
なります。
9. [オプション] タブで、アクセスする Web サービスの URL を入力します。
10. 外部 Web サービスへのアクセスに必要ならば、ユーザ名とパスワードを入力します。
注: 一部の Web サービスでは、アクセスする前にログイン認証情報 (ユーザ名とパスワード) の入
力が必要です。 その場合は、[更新] をクリックする前に必要な認証情報を入力する必要があ
ります。 そうしなければ、更新操作は失敗してしまいます。
11. [更新] をクリックして、[操作] リストに Web サービスで提供されている操作の一覧を表示します。
12. [操作] リストで、実行する Web サービスの操作を選択します。
[操作] リストで Web サービスの操作を選択すると、操作要求および応答のフィールド名の一覧が、
[要求] および [応答] タブに表示されます。
13. SOAP を選択した場合は、[WS セキュリティの使用] ボックスをオンにして、SOAP メッセージの
ヘッダを通じて認証情報を送信することにより、Web サービスにセキュリティを適用します。
14. [要求] タブで、Web サービスのタイプとして SOAP と REST のどちらを選択したかに応じて、要
求フィールドに対する設定と値を指定します。
SOAP を選択した場合
a) 必要に応じて、[Filter] リストでパスを選択します。
[Filter] リストには、外部 Web サービスで提供されているすべての XPath パスの一覧が含まれ
ます。 提供されている XPath パスの一部のみをテーブルに表示したい場合は、[Filter] リスト
でパスを選択します。 すると、選択したパスにマッチするすべての XPath パスとその子孫パス
が、テーブルに表示され、それらが要求に含まれることになります。
b) 必要に応じて、デフォルト フィールド名を変更します。
テーブル内の各 XPath パスは、外部 Web サービスが提供する初期デフォルト名が付けられた、
対応する要求フィールドに関連付けられています。 各要求フィールドに対し、デフォルト名の
ままにするか、または新しい名前を付けることができます。
c) 必要に応じて、各要求フィールドのデフォルト名を指定します。
d) 最終的な サービスで使用可能な入力フィールドとしてエクスポーズする各要求フィールドの
[エクスポーズ]Spectrum™ Technology Platform オプションを選択します。 すべての要求フィー
ルドをエクスポーズする場合は、テーブルのヘッダ行の [エクスポーズ] オプションを選択しま
す。
e) 外部 Web サービスへの要求として送信される XML のテンプレートを表示するには、[テンプ
レートの表示] をクリックします。
REST を選択した場合
248
Spectrum™ Technology Platform 8.0.0
第 15 章 : 外部リソースの設定
a) [追加] をクリックしてパラメータ名を入力することにより、外部 Web サービスにアクセスする
ために必要な各要求パラメータを追加します。 パラメータを削除するには、テーブル内でその
パラメータを選択して [削除] をクリックします。
[オプション] タブで入力した Web サービスの URL にクエリ文字列パラメータが含まれている
場合は、それらのパラメータが [要求] タブ上のパラメータ一覧に自動的に表示されます。
b) 各要求パラメータに対し、フィールド名を入力します。 フィールドがエクスポーズされる場合
は、この名前が最終的な Spectrum™ Technology Platform サービスの入力フィールドの名前に
なります。
c) 必要に応じて、各要求フィールドのデフォルト名を指定します。
d) 最終的な サービスで使用可能な入力フィールドとしてエクスポーズする各要求フィールドの
[エクスポーズ]Spectrum™ Technology Platform オプションを選択します。 すべての要求フィー
ルドをエクスポーズする場合は、テーブルのヘッダ行の [エクスポーズ] オプションを選択しま
す。
e) 外部 Web サービスに送信される要求 URL のテンプレートを表示するには、[テンプレートの表
示] をクリックします。
15. [要求] タブで、Web サービスのタイプとして SOAP と REST のどちらを選択したかに応じて、要
求フィールドに対する設定と値を指定します。
SOAP を選択した場合
a) 外部 Web サービスの応答を、応答 XML を含む SoapResponse という名前の単一のフィール
ドとして返す場合は、[応答 XML をテキストとして返す] オプションを選択します。 このオプ
ションを選択しなかった場合、Web サービスの応答は、フィールド名 から XPath パスへの指
定されたマッピングに基づく個別のフィールドとして返されます。
[応答 XML をテキストとして返す] オプションを選択した場合、Web サービスからの応答とし
て返される XML のテンプレートが表示されます。 [応答 XML をテキストとして返す] オプショ
ンを選択しなかった場合は、以下の手順を続けます。
b) 必要に応じて、[Filter] リストでパスを選択します。
[Filter] リストには、外部 Web サービスで提供されているすべての XPath パスの一覧が含まれ
ます。 提供されている XPath パスの一部のみをテーブルに表示したい場合は、[Filter] リスト
でパスを選択します。 すると、選択したパスにマッチするすべての XPath パスとその子孫パス
が、テーブルに表示され、それらが応答に含まれることになります。
c) 必要に応じて、デフォルト フィールド名を変更します。
テーブル内の各 XPath パスは、外部 Web サービスが提供する初期デフォルト名が付けられた、
対応する応答フィールドに関連付けられています。 各応答フィールドに対し、デフォルト名の
ままにするか、または新しい名前を付けることができます。
d) 最終的な サービスで使用可能な出力フィールドとしてエクスポーズする各応答フィールドの
[エクスポーズ]Spectrum™ Technology Platform オプションを選択します。 すべての応答フィー
ルドをエクスポーズする場合は、テーブルのヘッダ行の [エクスポーズ] オプションを選択しま
す。
[エクスポーズ] オプションが選択されているフィールドが、外部 Web サービスからの応答とし
て返されることになります。 各フィールドは、外部 Web サービスが提供する XPath パスに
マッピングされています。 [エクスポーズ] オプションが選択されているフィールドが、すべて
同一レベルの XPath パスにマッピングされている場合、フィールドに対して個別のレコードが
ユーザ ガイド
249
外部 Web サービスへのアクセス
返されます。 しかし、エクスポーズされたフィールドが異なるレベルの XPath パスにマッピン
グされている場合は、階層データ オブジェクトが返されます。
e) 外部 Web サービスからの応答として送信される XML のテンプレートを表示するには、[テンプ
レートの表示] をクリックします。
16. [プレビュー] タブで、外部 Web サービスに送信する任意のテスト データを入力し、[プレビュー]
をクリックします。
17. [OK] をクリックして、外部 Web サービスを保存します。
外部 Web サービスの名前の変更
外部 Web サービスの名前を変更すると、その外部 Web サービスを参照する既存のジョブ/サービスは
分断されてしまいます。 その外部 Web サービスを参照するジョブ/サービスが存在しない場合、ある
いは、別の外部 Web サービスまたは新しい名前を参照するように既存のジョブ/サービスを変更する
場合は、外部 Web サービスの名前を問題なく変更できます。
1. Management Console を開きます。
2. [リソース] ノードを展開し、[外部の Web サービス] をクリックします。
3. 名前を変更する外部 Web サービスをハイライト表示して、[名前の変更] をクリックします。
4. [OK] をクリックして、外部 Web サービスの名前の変更を確認します。
5. 外部 Web サービスの新しい名前を入力し、[OK] をクリックします。
外部 Web サービスの削除
外部 Web サービスを削除すると、その外部 Web サービスを参照する既存のジョブ/サービスは分断さ
れてしまいます。 その外部 Web サービスを参照するジョブ/サービスが存在しない場合、または、別
の外部 Web サービスを参照するように既存のジョブ/サービスを変更する場合は、外部 Web サービス
を問題なく削除できます。
1. Management Console を開きます。
2. [リソース] ノードを展開し、[外部の Web サービス] をクリックします。
3. 削除する外部 Web サービスをハイライト表示して、[削除] をクリックします。 外部 Web サービ
スを削除するかどうかを尋ねる確認メッセージが表示されます。
4. [OK] をクリックして確認します。
250
Spectrum™ Technology Platform 8.0.0
実行の管理
このセクションの構成
• サービス . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .252
• ジョブとプロセス フロー . . . . . . . . . . . . . . . . . . . . . . . . . .255
• トランザクション履歴 . . . . . . . . . . . . . . . . . . . . . . . . . . . .263
• リモート サーバー . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .263
• ソート パフォーマンス . . . . . . . . . . . . . . . . . . . . . . . . . . . .268
16
サービス
サービス
サービスは、Spectrum™ Technology Platform を使用してアクセス可能な処理機能です。 Spectrum™
Technology Platform API を使用してサービスを呼び出し、レコードを Spectrum™ Technology Platform
に引き渡すことができます。 レコードを処理する際のオプションを指定することもできます。 サービ
スはデータを処理し、API によって返されるレスポンスを通してデータを返します。
一部のサービスは、モジュールをインストールしたときに使用可能になります。 例えば、Universal
Addressing モジュールをインストールすると、お使いのシステム上で ValidateAddress サービスが使
用可能になります。 Enterprise Designer でサービスを作成し、そのサービスをシステム上でユーザ定
義サービスとしてエクスポーズしなければならない場合もあります。 例えば、Location Intelligence モ
ジュールのステージは、このモジュールのステージを使用するサービスをまず作成しなければ、サー
ビスとして使用できません。
デフォルト サービス オプションの指定
デフォルト サービス オプションは、システム上の各サービスのデフォルトの動作を制御します。 サー
ビス内の各オプションのデフォルト値を指定できます。 デフォルト オプション設定は、API 呼び出し
で、オプションの値が明示的に定義されていない場合に有効です。 また、これらの設定は、Enterprise
Designer で、このサービスを使用してデータフローを作成する際にも、デフォルトとして使用されま
す。
1. Management Console を開きます。
2. サービスを選択します。 このサービス用のオプションを含む [オプション] タブが表示されます。
以下の例では、Geocode US Address が選択されています。
3. オプションを選択します。
252
Spectrum™ Technology Platform 8.0.0
第 16 章 : 実行の管理
サービスのプレビュー
[プレビュー] タブを使用して、サービスの結果をプレビューできます。 プレビューは、どのオプショ
ンを指定するかを決める際に便利です。異なるオプションが、サービスから返されるデータに与える
影響を直ちに確認できるためです。
1. Management Console を開きます。
2. Management Console の左側で、サービスを選択します。
3. [プレビュー] タブをクリックします。
4. テスト入力データを手動で入力するか、ファイルからデータをインポートします。 すべてのフィー
ルドにデータを入力する必要はありません。 必要に応じて、フィールドを空白のままにすること
ができます。
• データを手動で入力する場合は、単に各フィールドにテストデータを入力していきます。
• データをファイルからインポートする場合は、[データのインポート] ボタンをクリックします。
インポートできるレコードの最大数は、システムで設定されている処理レコードの最大数までと
なります。 詳細については、処理レコード数の上限値の設定(254ページ)を参照してください。
5. [プレビューを実行] をクリックします。 データが、出力グリッドに表示されます。
6. 出力データをプレビューして、適切な結果が得られることを確認します。 必要に応じて、サービ
スの設定に変更を加えて、[プレビューを実行] を再度クリックすることができます (データを再度
入力する必要はありません)。
ユーザ ガイド
253
サービス
デフォルトは、垂直表示です。水平表示に変更するには、[表示] をクリックして [水平方向] を選
択します。
処理レコード数の上限値の設定
1. Management Console を開きます。
2. [ツール] > [オプション] をクリックします。
3. [サービス実行の設定] タブをクリックします。
4. [処理するレコードの最大数] フィールドに、サービスが処理可能なレコードの最大数を入力しま
す。 入力可能な数の最大値は 100 です。
フィールド区切り文字の指定
フィールド区切り文字とは、サービスへの入力としてフラット ファイルを使用する場合に、1 つの
フィールドの末尾と次のフィールドの先頭を表すために使用される文字のことです。 サービスで使用
するフィールド区切り文字を指定するには、次の手順に従います。
1. Management Console を開きます。
2. [ツール] > [オプション] をクリックします。
3. [サービス実行の設定] タブをクリックします。
4. [ファイル フィールド区切り文字] フィールドに、使用する区切り文字を指定します。 使用したい
文字が一覧にない場合は、
a) [.. . .] ボタンをクリックします。
b) [追加] をクリックします。
c) 文字を入力または選択したら、Tab を押します。 [Unicode] フィールドは自動的に入力されま
す。 また、Unicode 値を入力することもできます。この場合は、[文字] フィールドが自動的に
入力されます。
d) 必要に応じて、[説明] フィールドに、文字の説明を入力します。 例えば、文字が "&" の場合、
説明には "アンパサンド" と入力できます。 説明を入力しない場合は、その文字のみが使用可能
な文字の一覧に表示されます。
e) [OK] を 2 回クリックします。
サービス タイムアウトの設定
1. Management Console を開きます。
2. [ツール] > [オプション] をクリックします。
3. [サービス実行の設定] タブをクリックします。
4. [タイムアウト (秒)] フィールドで、サービスがタイムアウトするまでに応答を待つ秒数を指定しま
す。
254
Spectrum™ Technology Platform 8.0.0
第 16 章 : 実行の管理
ジョブとプロセス フロー
ジョブは、バッチ処理を行うデータフローです。 ジョブは、1 つ以上のファイルやデータベースから
データを読み込み、そのデータを処理し、1 つ以上のファイルやデータベースに結果を書き込みます。
プロセス フローでは、Spectrum™ Technology Platform のジョブや外部アプリケーションなどの一連
のアクティビティが実行されます。 例えば、プロセス フローでは、名前を正規化し、住所を照合して
から、郵便料金の割引が受けられるようにレコードを正しい順序にソートするための外部アプリケー
ションを呼び出すような Spectrum™ Technology Platform ジョブを実行することができます。
Management Console を使用して、ジョブおよびプロセス フローのグローバル設定や、ジョブおよび
プロセス フローの実行の管理を行います。 ジョブやプロセス フローの作成または編集には、Enterprise
Designer を使用します。
ジョブとプロセス フローのスケジューリング
ジョブまたはプロセス フローを、指定した時間に自動的に実行するには、Management Console を使
用して、ジョブおよびプロセス フローの実行スケジュールを設定します。
1. Management Console を開きます。
2. [実行] を表示し、[スケジューリング] をクリックします。
3. [追加] をクリックして新しいスケジュールを作成するか、既存のスケジュールを変更する場合は、
スケジュールを選択して [変更] をクリックします。
4. [タスクの追加] または [タスクの変更] ウィンドウで、タスクに対する設定を選択します。
•
[タスク名] — スケジューリングするこのタスクの名前を指定します。 これがタスク一覧に表示
される名前になります。
•
[フロー タイプ] — スケジューリングするプロセスの種類 (ジョブまたはプロセス フロー) を選
択します。
•
[フロー名] — スケジューリングするジョブまたはプロセス フローを選択します。 保存および
エクスポーズされたジョブとプロセス フローだけが、ここで使用可能です。 選択したいジョブ
またはプロセス フローが表示されない場合は、Enterprise Designer でジョブまたはプロセス
フローを開き、[ファイル] > [エクスポーズ/アンエクスポーズして保存] を選択します。
•
[タスクの有効化] — ジョブまたはプロセス フローを指定した時間に実行するには、このボック
スをオンにします。 スケジュールを一時的に停止するにはこのボックスをオフにします。
•
[スケジュール] — ジョブまたはプロセス フローを実行する日時を指定します。
5. データフローから参照する入力ファイルと出力ファイルは Spectrum™ Technology Platform サー
バー上に存在しなければなりません。 これはジョブと、プロセス フロー内のジョブ アクティビ
ティの両方に適用されます。 ソースまたはシンク ステージがローカル ファイルを参照している場
合は、次の手順のいずれかを実行します。
ユーザ ガイド
255
ジョブとプロセス フロー
Options
Description
オプション 1: データフ データフローそのものを変更して、ローカル ファイルを参照しないよ
ローを変更する
うにします。
1. Enterprise Designer でデータフローを開きます。
2. ソースまたはシンク ステージをダブルクリックします。
3. [ファイル名] フィールドで、参照ボタンをクリックします。
4. [リモート マシン] をクリックして、必要なファイルを選択します。
注: Spectrum™ Technology Platform サーバーと同じコンピュータ
上で Enterprise Designer を実行している場合、[リモート マシ
ン] のクリックは、[マイ コンピュータ] をクリックするのと同
じであるように見えます。 しかし、ファイルが Spectrum™
Technology Platform サーバー上に存在することをシステムに認
識させるためには、[リモート マシン] を使用してファイルを選
択する必要があります。
オプション 2: このスケ このスケジュールを実行するときに、フロー内のファイル参照をオー
ジュールの実行時にデー バーライドします。
タフローのファイルの場
1. [オプション] をクリックします。
所をオーバーライドする
2. [ステージ ファイルの場所] の下で、ローカル ファイルを参照するス
テージを選択します。
3. [変更] をクリックし、Spectrum™ Technology Platform サーバー上
のファイルを選択します。
6. ジョブまたはプロセス フローを、繰り返し実行するようにスケジュールする場合は、[タスクの繰
り返し] チェック ボックスをオンにし、[繰り返し] ボタンをクリックして、フィールドを設定しま
す。
7. データフローで電子メール通知が有効になっている場合は、データフローの実行時に通知が送信さ
れる受信者を追加的に指定できます。 データフローの通知を有効にする手順については、 電子メー
ル通知(201ページ). 電子メール通知の受信者を追加するには、以下の手順に従います。
a) [オプション] をクリックします。
b) [通知] の下の [追加] をクリックします。
c) 通知を送信する電子メール アドレスを入力します。 例えば、[email protected] と入力し
ます。
d) システムの通知設定が正しく設定されていることを確認します。 詳細については、電子メール
通知(271ページ)を参照してください。
8. [OK] をクリックします。
ファイル モニターによるジョブまたはプロセス フローのトリガ
ファイル モニターは、作成したコントロール ファイルをモニターするディレクトリ内に検出すると、
ジョブまたはプロセス フローをトリガします。 このコントロール ファイルの存在は、特定のジョブ
256
Spectrum™ Technology Platform 8.0.0
第 16 章 : 実行の管理
またはプロセス フローに必要なすべてのファイルが配置され、処理できる状態になっていることを意
味します。 コントロール ファイルが現れると、ファイル モニターは指定のジョブまたはプロセス フ
ローを実行します。 ファイル モニターは、ジョブまたはプロセス フローへの入力として使用するファ
イルを作成する他のプロセスがある場合に役立ちます。
ファイル モニターの作成
Management Console でファイル モニターを作成するには、以下の手順に従います。
1. Management Console を開きます。
2. [実行] メニューから [ファイル モニター] をクリックします。
3. [追加] をクリックします。
4. [タスク名] フィールドで、このファイル モニターに付けたい名前を指定します。 任意の名前にす
ることができます。
5. [タスクの有効化] チェック ボックスをオンにして、このファイル モニターを有効にします。 チェッ
ク ボックスをオフにして、このファイル モニターを無効にします。
6. [フロー タイプ] フィールドで、このファイル モニターで実行したいフローのタイプを選択します。
ジョブ
バッチ ジョブ データフローを実行します。
プロセス フロー
プロセス フローを実行します。
7. [フロー名] フィールドで、この File Monitor で実行したいフローを選択します。
8. ジョブ用のファイル モニターを作成する場合、[オプション] をクリックして次の内容を設定でき
ます。
a) 指定したジョブが利用するファイルの場所を変更できます。 サーバーは、データフロー内で直
接設定された場所を自動的に取得します。 これらの設定は、コントロール ファイルでもオー
バーライドできます。 コントロール ファイルの作成(258ページ) を参照してください。
b) 電子メール通知を設定できます。 [通知] リストで、ジョブまたはプロセス フローを実行するよ
うトリガされたときに通知する相手の電子メール アドレスを追加します。 データフローで電子
メール通知が有効になっている場合は、データフローの実行時に通知が送信される受信者を追
加的に指定できます。 データフローの通知を有効にする手順については、電子メール通知
(201ページ)を参照してください。 その後、システムの通知設定が正しく設定されていること
を確認します。 詳細については、電子メール通知(271ページ)を参照してください。
c) [OK] をクリックします。
9. [ファイル] フィールドで、データフローをトリガするコントロール ファイルのフル パスと名前を
指定します。 ファイル名は、そのまま指定するか、ワイルドカードとしてアスタリスク (*) を使用
できます。 たとえば、*.trg と指定すると、フォルダに拡張子 .trg の任意のファイルが現れたとき
データフローがトリガされます。
注: 複数のファイル モニターを設定する場合は、それぞれがユニークなファイル セットをモニ
ターすることが重要です。 そうしなければ、同じコントロール ファイルで複数のジョブまた
はプロセス フローがトリガされ、予期せぬ動作を引き起こす恐れがあります。
ユーザ ガイド
257
ジョブとプロセス フロー
10. [ポーリング間隔] フィールドで、コントロール ファイル用に指定された場所をモニターが確認す
る頻度を秒単位で指定します。 例えば、10 とファイル名 AddressData.trg を指定した場合、
モニターは AddressData.trg がモニター フォルダに現れるかどうかを 10 秒ごとに確認します。
デフォルトでは、60 秒に設定されています。
11. [作業フォルダ] の下の [フォルダ] フィールドで、データフローを実行する前にコントロール ファ
イルを配置するフォルダの名前を指定します。 これによって、フローが二度トリガされることが
なくなります。
12. [完了時] フィールドで、データフローの実行終了時に作業フォルダ内のファイルをどう処理するか
を指定します。
保持
ファイルを現在の場所に現在の名前で保持します。 このオプションを選択し
た場合、作業フォルダ内のファイルはファイル モニターが実行されるたびに
上書きされます。
移動
ファイルを作業フォルダから指定のフォルダに移動します。
時間スタンプを使 作業フォルダ内のファイル名に時間スタンプを付加します。 これは File
用して名前を変更 Monitor が繰り返し実行されたとき、作業フォルダ内のファイルのコピーを
保持する最も簡単な方法です。フォルダの名前を変更すれば一意の名前が与
えられるので、File Monitor がデータフローを次回実行してもファイルが上書
きされなくなるからです。
削除
データフローの実行終了時に作業フォルダ内のファイルを削除します。
13. モニターするフォルダの指定が完了したら、[OK] をクリックします。
コントロール ファイルの作成
コントロール ファイルの存在によって、実行するジョブまたはプロセス フローがトリガされます。こ
れは、特定のジョブまたはプロセス フローに必要なすべてのファイルが配置され、フローで使用する
準備ができていることを意味します。 ファイル モニターは、指定された場所を決められた間隔でス
キャンし、コントロール ファイルの存在を検出すると、ジョブまたはプロセス フローをトリガしま
す。
1. すべてのファイルを処理する準備ができたことを確認したら、テキスト エディタを開いてコント
ロール ファイルを作成します。
2. このファイルは空白のままでかまいません。このファイルが存在するだけで、ジョブまたはデータ
フローの実行がトリガされます。 ただし、ジョブの場合は、Write to File ステージまたは Read
from File ステージに対するオーバーライドを含めることができます。 オーバーライドは、Read
from File ステージ名または Write from File ステージ名とともに、最後の引数として入力ファイル
または出力ファイルを次のように指定することによって含めることができます。
stagename=filename
例:
Read\ from\ File=file:C:/myfile_input.txt
Write\ to\ File=file:C:/myfile_output.txt
258
Spectrum™ Technology Platform 8.0.0
第 16 章 : 実行の管理
コントロール ファイルで指定するステージ名は、データフロー内のステージのアイコンの下に表
示されるステージ ラベルと一致する必要があります。 例えば、入力ステージのラベルが "Read
From File" である場合は、次のように指定します。
Read\ From\ File=file:C:/inputfile.txt
入力ステージのラベルが "Illinois Customers" である場合は、次のように指定します。
Illinois\ Customers=file:C:/inputfile.txt
Read from File または Write to File の場所をオーバーライドする場合は、次のプロトコルに従って
ください。
• パスの先頭に "file:" プロトコルを付けます 。 例えば、Windows では、"file:C:/myfile.txt"
と指定し、Unix または Linux では、"file:/testfiles/myfile.txt" と指定します。
• このファイルのコンテンツは、プレーン テキストで書く必要があります。 具体的には、ASCII
ベースの ISO-8559-1 (Latin-1) 互換文字エンコーディングを使用する必要があります。
• ファイル パスには、バックスラッシュではなくスラッシュ (/) を使用する必要があります。
• ステージ名に含まれるスペースは、バックスラッシュでエスケープする必要があります。
• ステージ名は大文字と小文字を区別します。
3. ファイル モニターの作成ステップで設定したファイル モニターの場所にファイルを保存します。
次のポーリング間隔でスイープを実行すると、ファイル モニターがコントロール ファイルを検出
し、ジョブまたはプロセス フローをトリガします。 コントロール ファイルは、設定済みの作業
ディレクトリにコピーされます。 これによって、ファイル モニターの以降のスイープで同じコン
トロールを検出することがなくなります。
注: 構造上の理由から、すべての必要なファイルとコントロール ファイルを専用ディレクトリに
配置することをお勧めします。
ジョブまたはデータフローが完了すると、Management Console で指定した処理後アクションがコン
トロール ファイルに対して実行されます。
実行ステータスと履歴の表示
1. Management Console を開きます。
2. [実行] を展開し、[履歴] をクリックします。
3. ジョブの実行履歴を表示するには、[ジョブ] タブをクリックします。 プロセス フローの実行履歴
を表示するには、[プロセス フロー] タブをクリックします。
[ジョブ] タブでは、ジョブ ステータスの監視、実行中のジョブの一時停止、再開、またはキャンセ
ル、完了したジョブの削除を行います。 [ジョブ] タブには、ID 番号、レポート番号、ジョブ名、
ユーザ、日付、ジョブ ステータス、処理したレコード数、成功したレコード数、失敗したレコー
ド数、形式に誤りのあるレコード数、およびサーバーから返されたコメント (存在する場合) がグ
リッド形式で表示されます。 この情報は自動的に収集されます。
[プロセス フロー] タブでは、プロセス フロー ステータスの監視、実行中のプロセス フローのキャ
ンセル、完了したプロセス フローの削除を行います。 [プロセス フロー] タブには、ProcessID 番
ユーザ ガイド
259
ジョブとプロセス フロー
号、ProcessFlowID 名、プロセス フローを開始したユーザ名、プロセス フローの開始および終了
時間、およびサーバーから返されたコメント (存在する場合) がグリッド形式で表示されます。 こ
の情報は自動的に収集されます。 各プロセス フローの横にある [+] 記号をクリックすると、その
プロセス フローのアクティビティ ステータス情報が表示されます。 このエリアには、次の情報が
表示されます。
• アクティビティ名 — 成功アクティビティを含む、プロセス フローを構成するすべてのアクティ
ビティの名前が含まれます
• 状態 — アクティビティのステータス (完了したか否か) です
• リターン コード — アクティビティが実行したときに返されたコードです
• 開始 — アクティビティが開始した日時です
• 終了 — アクティビティが終了した日時です
• コメント — アクティビティに関するコメントです
4. [実行履歴] で表示するフィールドを選択するには、最初の列のすぐ左にあるアイコンをクリックし
ます。
これは、Field Chooser です。
5. 実行履歴では情報の種類をグループにまとめることができます。 列の名前 ([ID] や [名前] など) を
ハイライト表示し、[列ヘッダをここにドラッグすると、その列でグループ化されます] という領域
にドラッグします。 すると、その情報の種類でグループ化されて情報が表示されます。 例えば、
名前でグループ化した場合、実行履歴は次のように表示されます。
260
Spectrum™ Technology Platform 8.0.0
第 16 章 : 実行の管理
6. 列名をクリックすることにより、グリッド内のデータをソートできます。 以下の手順に従って、
データにフィルタを適用し、表示されるプロセス フローの一覧を変更します。
a) [次のプロセス フローのみ表示] の下のドロップダウン リストをクリックし、変数 (ProcessID
など) を選択します。
b) 次のドロップダウン リストから条件 ("以上" など) を 1 つ選択します。
c) 最後のボックスに、比較する値 (ゼロなど) を入力します。
d) [更新] をクリックしてデータを更新します。
7. [詳細] 画面では、データフローを表示する、ジョブ定義やプロセス フロー定義を参照できます。
また、もう Enterprise Designer ではアクセスできないデータフローについて、それをどのように
して構成したかを参照することもできます。
a) 表示するジョブまたはプロセス フローをクリックして、[詳細...] をクリックします。
左のウィンドウに、実行情報やフロー定義を表示するために選択したジョブまたはプロセス フ
ローの名前が表示されます。 [実行情報] 内では、プロセス フロー内の任意のアクティビティを
選択できます。
b) 左のウィンドウでジョブ/プロセス フロー定義をクリックすると、そのフローの処理設定が参照
できます。
ジョブの一時停止および再開
実行中のジョブを一時停止および再開するには
1. Management Console を開きます。
2. [実行] を展開し、[履歴] をクリックします。
3. [ジョブ] タブをクリックします。
4. 一時停止するジョブを選択し、[一時停止] をクリックします。
5. ジョブの実行を再開するには、[再開] をクリックします。
ジョブまたはプロセス フローのキャンセル
1. Management Console を開きます。
2. [実行] を展開し、[履歴] をクリックします。
ユーザ ガイド
261
ジョブとプロセス フロー
3. [ジョブ] タブをクリックします。
4. キャンセルするジョブを選択し、[キャンセル] をクリックします。
形式に誤りのあるレコード数の最大値の設定
形式に誤りのあるレコードをいくつ検出したら、ジョブの処理を停止するかを指定できます。 例え
ば、50 個と指定した場合、形式に誤りのあるレコードを 50 個以上含むジョブは、処理を正常に完了
することはできません。
注: ジョブ定義によって、形式に誤りのあるレコードに関するこのグローバル設定をオーバーライド
することができます。
1. Management Console を開きます。
2. [実行] を展開し、[ジョブ オプション] をクリックします。
3. 次のオプションのいずれかを選択します。
•
[形式に誤りのあるレコードでジョブを停止しない] — ジョブに含まれる形式に誤りのあるレ
コードの数に上限を設けない場合は、このオプションを選択します。
•
[形式に誤りのあるレコードを次の個数検出した時点でジョブを停止] — 形式に誤りのあるレ
コードを一定の個数検出した時点でジョブを停止するには、このオプションを選択します。
ジョブの処理を停止する前に検出してもよい形式に誤りのあるレコードの個数を入力します。
レポート オプションの設定
ジョブにレポート ステージが含まれている場合、そのジョブは、ジョブ定義で指定されたとおりにレ
ポート ファイルを生成します。 レポートには、処理の概要や、USPS CASS 3553 フォームなどの郵
便フォームを含めることができます。 使用可能なレポートの種類は、インストールしたモジュールに
よって異なります。
1. Management Console を開きます。
2. [実行] を展開し、[レポート オプション] をクリックします。
3. レポート形式として、html、pdf、または txt を選択します。
4. [レポート スナップショットの保存] ボックスをオンにすると、実際のレポート スナップショット
とともにレポートが登録されていることを示す情報が保存されます。
5. レポート スナップショットを保存する場合は、[レポートのアーカイブ] ボックスをオンにします。
[レポートのアーカイブ場所] フィールドで、アーカイブされたレポートを保存する場所を指定しま
す。
6. 新しいレポートで前のレポートを上書きする場合は、[既存のレポートを上書き] をオンにします。
7. 名前付けテンプレートを完成させて、レポートの命名方法を指定します。
262
Spectrum™ Technology Platform 8.0.0
第 16 章 : 実行の管理
トランザクション履歴
トランザクション履歴には、指定した日付範囲におけるサービスの使用状況に関するデータが表示さ
れます。 データは、サービスまたはユーザごとにまとめられ、ソートされます。
トランザクション履歴の表示
1. Management Console を開きます。
2. [トランザクション履歴] を展開し、[レポート] をクリックします。
3. レポートの日付範囲を選択します。 以下のオプションから選択できます。
•
すべての日 — すべてのトランザクションの履歴レポートが含まれます。
•
この日以前 (この日を含む) — 終了日を入力すると、その日までのトランザクションが含まれま
す。
•
この日以降 (この日を含む) — 開始日を入力すると、その日からのトランザクションが含まれま
す。
•
この日からこの日まで — 開始日と終了日の両方を入力すると、その 2 つの日付の間のトラン
ザクションが含まれます。
4. [レポートの表示] をクリックして、レポートを実行し、表示します。 指定した日付範囲のトラン
ザクション履歴レポートが表示されます。 このレポートには、サービスおよびユーザごとに、各
サービスへの呼び出しの成功数、失敗数、エラー数が示されます。
5. レポートを外部ファイルに保存する場合は、[エクスポート] ボタンをクリックします。
トランザクション履歴オプションの設定
1. Management Console を開きます。
2. [トランザクション履歴] を展開し、[オプション] をクリックします。
3. [トランザクション履歴追跡を有効にする] チェック ボックスをオンにします。 サービスおよびサー
バーに対するその後のすべてのトランザクションが記録されることになります。
4. トランザクションをログから削除するには、[これまでに発生したすべてのトランザクション ログ
エントリをクリア] の横のドロップダウン ボックスをクリックし、日付 (MM/DD/YYYY) を入力す
るか、下に表示されるカレンダーから日付を選択します。
5. [クリア] をクリックして、トランザクションを削除します。
リモート サーバー
Spectrum™ Technology Platform を複数のサーバーで実行している場合、特定のサービスに対する処
理を別のサーバーにルーティングすることで、サーバー間に処理を分散できます。 この機能を使用す
ユーザ ガイド
263
リモート サーバー
ると、ローカル以外のサーバーで使用できるサービスにアクセスできるので、サービスをインストー
ルして管理する時間を節約できます。 また、リモート サーバーにインストールされているサービスを
使用するカスタム データフローを設計できます。 別のサーバーにサービスがルーティングされると、
サービスがデータフロー内にある場合、Interactive Driver から実行された場合、または Spectrum™
Technology Platform API を使用して呼び出された場合のいずれであっても、サービスはリモート サー
バーで実行されます。
サービスをルーティングできるかどうかを確認するには、Management Console を開き、そのサービ
スをクリックして、[オプション] タブの下部にある [ルーティング] ボタンが有効になるかどうかを調
べます。
注: リモート サーバーのモジュールでバッチ データフローを実行するには、リアルタイム ライセン
スがリモート マシンに必要です。
特定の製品で展開されるツールは、製品が物理的にインストールされているマシンでのみ使用できま
す。 例えば、Enterprise Geocoding モジュールがローカル サーバーとリモート サーバーの両方にイ
ンストールされている場合、そのモジュールのツールはローカル サーバー バージョンに対してのみ表
示されます。 Enterprise Geocoding モジュールをリモート サーバーでのみ実行している場合、ツール
はまったく表示されません。
その他の情報については、以下を参照してください。
• リモート サーバーの追加(264ページ)
• リモート サーバーへのサービスのルーティング(265ページ)
• リモート サーバーの変更(266ページ)
• リモート サーバーの削除(266ページ)
• リモート サーバーのエラーのトラブルシューティング(267ページ)
リモート サーバーの追加
リモート サーバーを追加するには、次の手順に従います。
1. Management Console を開きます。
2. [システム] の下の [リモート サーバー] を選択します。
3. [追加] をクリックします。
4. [名前] フィールドにリモート サーバーの名前を入力します (必須)。
5. [ホスト] フィールドにリモート サーバーのホスト名または IP アドレスを入力します (必須)。
6. [ポート] フィールドにポート番号を入力します (必須)。
7. [ユーザ名] フィールドにリモート サーバーの有効なユーザ名を入力します (必須)。
8. [パスワード] フィールドに入力したユーザ名の有効なパスワードを入力します (サーバーで必要な
場合は必須)。
9. [マイクロバッチ サイズ] フィールドに、一度に渡されるレコードの数 (1 〜 99) を入力します (必
須)。 デフォルトは 50 です。 このフィールドに大きい値を入力すると、入力と出力は速くなりま
すが、データ転送は遅くなります。
10. [タイムアウト] フィールドに、接続がタイムアウトする秒数 (1 〜 99) を入力します (必須)。 デフォ
ルトは 2 です。
264
Spectrum™ Technology Platform 8.0.0
第 16 章 : 実行の管理
11. 接続しようとしているリモート サーバーが HTTPS アクセスだけを許可するファイアウォールの内
側にある場合は、[Secure Sockets Layer を使用] ボックスをオンにします。
12. 接続をテストする場合は、[テスト] ボタンをクリックします。 リモート サーバーが正常に追加さ
れた場合は、"リモート サーバー接続テストに成功しました" というメッセージが表示されます。
リモート サーバーのテストが失敗した場合は、"リモート サーバー構成テストに失敗しました" と
いうメッセージと失敗の理由が表示されます。
リモート サーバーのテストにかかる時間が予想より長い場合は (テストが失敗することを意味しま
す)、[停止] ボタンをクリックできます。
13. [OK] をクリックします。
14. リモート サーバーでサービスを追加または削除した後、[更新] をクリックして Management Console
を更新します (リモート サーバーを追加、変更、または削除したときは、Management Console は
自動的に更新されます)。
リモート サーバーへのサービスのルーティング
[ルーティング] ボタンを使用すると、ステージまたはサービスの処理に対して使用する異なるサーバー
を指定でき、サービスをインストールして管理する時間を節約できます。 また、リモート サーバーに
インストールされているサービスおよびステージを使用するカスタム データフローを設計できます。
注: Enterprise Designer または Spectrum™ Technology Platform API で、サービスのリモート サー
バー設定をオーバーライドできます。 Enterprise Designer でリモート サーバーを使用する方法
の詳細については、リモート サーバー(263ページ)を参照してください。 Interactive Driver で
はリモート サーバー ルーティングをオーバーライドできません。Interactive Driver は、
Management Console で指定されているリモート サーバー ルーティングを使用します。
サービスまたはステージをリモート サーバーにルーティングするには、次の手順に従います。
1. Management Console を開きます。
2. ルーティング先のサーバーが定義されていることを確認します。 方法については、リモート サー
バーの追加(264ページ)を参照してください。
3. リモート サーバーにルーティングするサービスを選択します。
4. [オプション] タブで [ルーティング] をクリックします。 [ルーティング] ボタンがグレー表示され
ている場合は、そのモジュールにはルーティングを使用できません。 [ルーティング] ダイアログ
ボックスが表示されます。
5. [リモート] をクリックし、そのステージの処理をルーティングするリモート サーバーを選択しま
す。
6. [OK] をクリックします。
ローカル サーバーでは使用できないサービスまたはステージを含むリモート サーバーを追加すると、
そのリモート サーバーのデフォルト オプションが使用されます。
リモートの Management Console でサービスまたはステージを変更しても、ローカル サーバーに変更
は反映されません。 ローカルの Management Console では、ローカルのデフォルト オプションが使
用されます。
ユーザ ガイド
265
リモート サーバー
リモート サーバーの変更
リモート サーバーを変更するには、次の手順に従います。
1. [システム] の [リモート サーバー] サブノードを選択します。 [リモート サーバー] ダイアログ ボッ
クスが表示されます。
2. 更新するサーバーをハイライト表示にして、[変更] をクリックします。 [リモート サーバーの変更]
ダイアログ ボックスが表示されます。
3. サーバーを適切に変更し、[OK] をクリックします。
4. リモート サーバーでモジュールを追加または削除した後、[更新] をクリックして Management
Console を更新します (リモート サーバーを追加、変更、または削除したときは、Management
Console は自動的に更新されます)。
リモート サーバーの削除
接続を削除するには、次の手順に従います。
注: 依存するデータフローを使用しているユーザがいる場合は、リモート サーバーを削除できませ
ん。
1. [システム] の [リモート サーバー] サブノードを選択します。 [リモート サーバー] ダイアログ ボッ
クスが表示されます。
2. 更新するサーバーをハイライト表示にして、[削除] をクリックします。
3. サーバーを削除するかどうかを尋ねる確認メッセージが表示されます。 [OK] をクリックして確認
します。
4. リモート サーバーでモジュールを追加または削除した後、[更新] をクリックして Management
Console を更新します (リモート サーバーを追加、変更、または削除したときは、Management
Console は自動的に更新されます)。
5. リモート サーバーを削除すると、そのリモート サーバーを参照しているデータフローが正しく機
能しなくなります。 ルーティングされるサービスまたはステージを含むリモート サーバーを削除
した場合は、そのサービスまたはステージのルーティングの変更を求められます。
266
•
影響を受けるサービス、ステージ、データフローが使用できなくなるのを防ぐには、削除され
るサーバーを置き換えるサーバーを望ましい順序に再設定した後、[次へ] をクリックします。
•
削除したリモート サーバーを使用するデータフローがある場合は、[データフロー参照の確認]
ダイアログ ボックスが表示されます。
•
削除したリモート サーバーを使用するサービスまたはステージがある場合は、[サービス参照
の確認] ダイアログ ボックスが表示されます。
•
これらのダイアログ ボックスの情報を確認し、データフローまたはサービスが使用していた
サーバーを変更します。 [終了] をクリックします。
Spectrum™ Technology Platform 8.0.0
第 16 章 : 実行の管理
リモート サーバーのエラーのトラブルシューティング
ここでは、リモート サーバーを使用すると発生する可能性のあるエラー状態について説明します。
モジュールのライセンスがない
リモート サーバーのモジュールを実行するには、リアルタイム ライセンスが必要です。 ライセンス
のないモジュールでジョブを実行しようとすると、次のようなエラーが発生します。
リモート サーバーは使用できません
Management Console で (ローカルではなく) リモート サーバーだけにインストールされているサービ
スを開き、そのリモート サーバーをシャットダウンすると、リモート サービスは左側のウィンドウに
表示されなくなり、画面の下部のステータス バーに黄色のハザード アイコンが表示されます。
ユーザ ガイド
267
ソート パフォーマンス
このアイコンをクリックすると、使用できないリモート サーバーについて説明するエラー メッセージ
が表示されます。 Management Console を起動しようとしたときにリモート サーバーが実行していな
い場合にも、同じメッセージが表示されます。
ルーティングが変化した
ローカルとリモートの両方にインストールされていて、リモート サーバーにルーティングされるサー
ビスを、削除または展開解除した後、Management Console でそのサービスをクリックすると、その
サービスの [オプション] タブのルーティング ボタンの横に、ルーティング変更インジケータ (点滅す
る感嘆符) が表示されます。 このインジケータは、そのサービスのルーティングが変化したことを意
味します。
ソート パフォーマンス
ソート パフォーマンス オプションにより、大きなデータ セットに対するソート操作のパフォーマン
スを最適化することができます。 Management Console で指定したソート パフォーマンス値は、デー
タに対してソート操作を実行する個々のステージでオーバーライドできます。
ソート パフォーマンス設定を指定するには
1. Management Console を開きます。
2. [実行] を展開して、[ソート パフォーマンス] をクリックします。
3. 以下の設定によって、ソート パフォーマンスを制御します。
•
メモリ内レコードの上限値 — ソートでメモリ内に保持できるデータ行の最大数を指定します。
この上限を越えると、ディスクにページングします。 複数のジョブを同時並行で実行する環境
では、[メモリ内レコードの上限値] の設定を増やすと、メモリ不足になる可能性が高くなりま
す。
•
使用する一時ファイルの最大数 — ソート プロセスで使用できる一時ファイルの最大数を指定
します。
•
圧縮を有効にする — 一時ファイルをディスクに書き込むときに圧縮します。
注: 最適なソート パフォーマンスの設定は、サーバーのハードウェア構成によって異なります。
それでも一般には、次の式で妥当なソート パフォーマンスが得られます。
(InMemoryRecordLimit × MaxNumberOfTempFiles ÷ 2) >= TotalNumberOfRecords
268
Spectrum™ Technology Platform 8.0.0
システムの監視
このセクションの構成
• イベント ログ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .270
• 電子メール通知 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .271
• ライセンス有効期限通知の設定 . . . . . . . . . . . . . . . . . . . . .271
• バージョン情報の表示 . . . . . . . . . . . . . . . . . . . . . . . . . . . .272
• ライセンス情報の表示とエクスポート . . . . . . . . . . . . . . . .272
17
イベント ログ
イベント ログ
イベント ログの表示
1. Management Console を開きます。
2. [イベント ログ] を展開し、[イベント] をクリックします。 ウィンドウに現在のログの情報が表示
されます。 これらのログ エントリには、システム ログとサービス ログの両方が含まれます。
3. 最新のエントリを表示するには、[更新] をクリックします。
4. イベント ログを起動するには、[オープン時にイベントを表示] をクリックします (オンになってい
る状態でクリックすると、イベント ログを停止します)。
テキスト エディタを使用してファイル <サーバー ディレクトリ
>\server\app\repository\logs\wrapper.log を開くことによっても、イベント ログを表示で
きます。
イベント ログ オプションの設定
デフォルトのログ レベルや、システム上の各サービスのログ レベルを指定することができます。 ロ
グ レベルを変更しても、変更前に作成されたログ エントリにはその変更は反映されません。
1. Management Console を開きます。
2. [イベント ログ] を展開し、[オプション] をクリックします。
3. [システム デフォルト ログ レベル] ドロップダウン リストをクリックして、イベント ログ レベル
を選択します。 イベント ログ レベルには、次の種類があります。
• 無効 — すべてのイベント ログを無効にします。
• 致命的 — 最小限のログです。致命的なエラーのみを記録します。 致命的なエラーとは、システ
ムを使用不可能にするエラーのことです。
• エラー — エラーと致命的なエラーのみを記録します。 エラーが生じると、単一の呼び出し、あ
るいは単一のサービスが使用不可能になりますが、システム全体が使用不可能になることはあり
ません。 特定のサービスがロードできないという現象は、エラーである可能性があります。他
のサービスは使用できる場合があるからです。
• 警告 — イベント警告とエラーを記録します。 警告とは、システムの動作を停止することのない
問題を指します (例えば、サービスのロード時にパラメータに無効な値が設定されている場合に
は、警告が発行され、デフォルトのパラメータが使用されます)。 サービスの使用時に、結果は
返ってきたが問題が存在するという場合に、警告がログに記録されます。 例えば、大文字と小
文字の区別で小文字が指定されているが、カナダでは大文字と小文字の区別がサポートされてい
ない、といった場合が挙げられます。 この場合、結果とともに、大文字と小文字の区別のオプ
ションが無視されたという警告が返されます。
• 情報 — 高いレベルのシステム情報を記録します。 これは、実稼働に適した最も詳細なログ レベ
ルです。 情報ログ レベルは通常、起動時および初期化時に使用され、製品およびバージョン情
報や、どのサービスがロードされたかなどの情報を提供します。
270
Spectrum™ Technology Platform 8.0.0
第 17 章 : システムの監視
• デバッグ — システムの問題のデバッグ時に適した、非常に詳細なログ レベルです。
• トレース — プログラムの実行 (メソッドの開始と終了) をトレースする、最も詳細なログ レベル
です。 デバッグのための詳細なプログラム フロー情報を提供します。
各ログ レベルは、1 つ上のログ レベルの内容を含みます。 つまり、警告ログ レベルが選択されて
いる場合、エラーと致命的なエラーも記録されます。 情報ログ レベルが選択されている場合は、
情報メッセージ、警告、エラー、および致命的なエラーが記録されます。
注: 最も詳細なログ レベルを選択すると、システムのパフォーマンスに影響が生じる恐れがあり
ます。 したがって、必要なログ要件を満たす最小レベルの設定を選択する必要があります。
4. サービスごとに異なるログ レベルを指定することもできます。
電子メール通知
Spectrum™ Technology Platform では、重要なビジネス プロセスが中断されることがないように、潜
在する問題について警告を通知することができます。 データフローおよびプロセス フロー内の各種条
件の結果として、通知を送信します。 発生したイベントに関するコンテキスト依存の情報を含むよう
に、メッセージをフォーマットすることが可能です。
1. Management Console を開きます。
2. [システム] を展開し、[通知] をクリックします。
3. [SMTP 設定] タブで、[ホスト] フィールドに有効なホスト名または IP アドレスを入力します。
4. [ポート] フィールドに有効なポート番号または範囲を入力します。 デフォルト値は 25 です。
5. [ユーザ名] フィールドに SMTP サーバーにログインするためのユーザ名を入力します。
6. [パスワード] フィールドに SMTP サーバーにログインするためのパスワードを入力します。
7. [パスワード] フィールドにパスワードを入力したら、[パスワードの確認] フィールドに SMTP サー
バーにログインするためのパスワードを再入力します。
8. [From アドレス] フィールドに、通知メールを送信する有効な電子メール アドレスを入力します。
9. [テスト アドレス] フィールドに、通知メールを送信する有効な電子メール アドレスを入力します。
これによって、通知プロセスが正しく動作することを確認します。
10. [テスト] をクリックして、テスト メッセージを送信します。
[有効期限設定] タブの詳細については、ライセンス有効期限通知の設定(271ページ) を参照してくだ
さい。
ライセンス有効期限通知の設定
ライセンスの有効期限が切れる前に、Spectrum™ Technology Platform からの電子メールによる通知
を受け取ることができます。
ユーザ ガイド
271
バージョン情報の表示
1. Management Console を開きます。
2. [システム] を展開し、[通知] をクリックします。
3. [SMTP 設定] タブをクリックします。 このタブ上のフィールドの設定については、電子メール通
知(271ページ) を参照してください。
4. [有効期限設定] タブをクリックします。
5. [通知送信日 (有効期限までの日数で指定)] フィールドに、ライセンスまたはデータの有効期限をそ
の何日前に通知するかを、有効期限までの日数で指定します。 例えば、ライセンスの有効期限が
切れる 30 日前の通知を希望する場合は、30 と指定します。
6. [有効期限通知を送信] チェック ボックスをオンにします。
7. [追加] をクリックし、通知を受信する電子メール アドレスを指定します。
8. [ファイル] > [保存] を選択します。
バージョン情報の表示
1. Management Console を開きます。
2. [システム] を展開して、[バージョン情報] をクリックします。
3. [バージョン情報] ウィンドウに、設定されたサービスの情報が表示されます。 [サーバー情報]、[シ
ステム情報]、[サービス情報]、[コンポーネント情報] の各フォルダを展開すると、それぞれ対応す
る詳細情報が表示されます。 表示される情報には、サーバーのバージョン番号、オペレーティン
グ システム、サービス ソフトウェア、およびコンポーネント バージョンなどがあります。
注: この情報は読み取り専用です。
ライセンス情報の表示とエクスポート
1. Management Console を開きます。
2. [システム] を展開し、[ライセンス] をクリックします。
3. [有効期限情報] タブをクリックして、有効期限が近づいているライセンスの一覧を表示します。
[有効期限設定] タブの [通知] ノードに指定された期間内のライセンスのみが表示されます。
4. システム上にインストールされているすべてのライセンスの一覧を表示するには、[ライセンス情
報] タブをクリックします。 ライセンス情報を .lic ファイルにエクスポートするには、[エクスポー
ト] をクリックします。 この機能は、テクニカル サポートとともにライセンスの問題を解決する際
に便利です。
272
Spectrum™ Technology Platform 8.0.0
セキュリティの管理
このセクションの構成
• ユーザ アカウント . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .274
18
ユーザ アカウント
ユーザ アカウント
ユーザ権限の付与
Spectrum™ Technology Platform Spectrum™ Technology Platform では、ユーザ アカウントに権限を
付与し、ユーザが実行できるアクションをさらに詳細に制御することができます。
1. Management Console を開きます。
2. [セキュリティ] を展開し、[オプション] をクリックします。
3. [ユーザの権限に応じてアクセスを制限する] チェック ボックスをオンにして、個々のユーザに対
して設定された権限のアクセスを制限します。
このボックスをオンにすると、ユーザがどのサービスにアクセスできるかなど、各ユーザに固有の
権限が適用されます。 このボックスをオンにしない場合、すべてのユーザがすべてのサービスお
よび権限にアクセスできます。
注: [ユーザの権限に応じてアクセスを制限する] オプションを有効にしない場合でも、サービスに
アクセスするには常に有効なユーザ アカウントが必要です。
各ユーザの権限を定義する手順については、新しいユーザの追加(274ページ)とユーザの変更
(275ページ)を参照してください。
新しいユーザの追加
1. Management Console を開きます。
2. [セキュリティ] を展開し、[ユーザ] をクリックします。
3. [追加] をクリックします。[新しいユーザ] ウィンドウが表示されます。
4. [ユーザ名] フィールドにユーザの名前を入力します。
5. [パスワード] フィールドにユーザのパスワードを入力します。
6. [パスワードの確認] フィールドにユーザのパスワードを再入力します。
7. [説明] フィールドにユーザの説明を入力します。
8. このユーザにどのサービスへの権限を与えるかを指定するためにサービスのチェック ボックスを
オンにします。
注: 管理者権限を付与されると、ユーザは Management Console、Enterprise Designer、および
Interactive Driver を使えるようになります。
9. [OK] をクリックします。
274
Spectrum™ Technology Platform 8.0.0
第 18 章 : セキュリティの管理
ユーザの変更
1. Management Console を開きます。
2. [セキュリティ] を展開し、[ユーザ] をクリックします。
3. 権限を変更したいユーザを選択し、[変更] をクリックします。
[ユーザ プロパティ] ウィンドウが表示され、その中でユーザ名、パスワード、説明、およびユー
ザ権限を変更できます。 なお、パスワードは、その長さの分だけアスタリスクを表示してマスク
されます。
注: 管理者権限を付与されると、ユーザ は Management Console、Enterprise Designer、および
Interactive Driver を使えるようになります。
4. [OK] をクリックして、変更を保存します。
ユーザの削除
1. Management Console を開きます。
2. [セキュリティ] を展開し、[ユーザ] をクリックします。
3. [ユーザ管理] 画面で、削除するユーザを選択して、[削除] をクリックします。
4. 削除するには [はい] を、キャンセルするには [いいえ] をクリックします。
注: 管理者およびゲストのアカウントを削除することはできません。
ユーザ ガイド
275
第 V 部: モジュール
このセクションの構成
• Address Now モジュール . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .279
• Advanced Matching モジュール . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .323
• Business Steward モジュール . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .415
• Data Hub モジュール . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .467
• Data Normalization モジュール . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .533
• Enterprise Geocoding モジュール . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .625
• Enterprise Routing モジュール . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .783
• GeoConfidence モジュール . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .815
• Global Sentry モジュール . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .821
• Location Intelligence モジュール . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .833
• Universal Addressing モジュール . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .925
• Universal Name モジュール . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .1053
Address Now モジュール
このセクションの構成
• Address Now モジュールとは . . . . . . . . . . . . . . . . . . . . . .280
• Build Global Address . . . . . . . . . . . . . . . . . . . . . . . . . . . .281
• Get Global Candidate Addresses . . . . . . . . . . . . . . . . . .294
• Validate Global Address . . . . . . . . . . . . . . . . . . . . . . . . . .302
• ACR コード . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .318
19
Address Now モジュールとは
Address Now モジュールとは
Address Now モジュールは、住所の正規化およびバリデーション ツールで、米国とカナダ以外の住所
を広範囲にカバーします。 Spectrum™ Technology Platform では、住所の正規化と検証 (バリデーショ
ン) を行う 2 つのモジュールを使用でき、Address Now はその 1 つです。 もう 1 つは Universal
Addressing モジュールです。 Address Now モジュールは、米国とカナダ以外の住所について、Universal
Addressing モジュールよりも次の点で優れています。
• データの品質が高い — Address Now モジュールで使用するデータベースは、Universal Addressing
モジュールで使用するデータベースよりも、多くの国について、より新しく、より詳細な情報を提
供します。 なぜこのような違いがあるかと言うと、Universal Addressing モジュールは、国際デー
タについては、万国郵便連合 (UPU) が提供するデータを利用し、そのデータの対象には多数の国が
含まれていますが、UPU は、住所情報の更新と住所情報の詳細度を積極的に管理していません。 一
方、Address Now モジュールは、(ほとんどの国の) 郵便当局と他のサード パーティのデータ プロバ
イダが提供するデータを直接利用しています。 つまり、最新情報が反映された、より詳細なデータ
を利用しているということです。
• ドリル ダウン機能 — Address Now モジュールは、国の住所データに対するドリル ダウン機能も備
えています。この機能を使用すると、住所情報をすばやく入力できます。構造に注意する必要はな
く、データの入力ミスもありません。
• 2 バイトのサポート — Address Now モジュールは Unicode 対応で、漢字等の 2 バイト文字を認識
します。
Address Now コンポーネント
Address Now は、以下のコンポーネントで構成されます。 これらのコンポーネントは、米国、カナ
ダ、および国際住所に対して使用できます。
• BuildGlobalAddresses — 個々の住所要素を検索することにより、対話的に住所を作成することが
できます。 詳細については、Build Global Address(281ページ)を参照してください。
• GetGlobalCandidateAddresses — 与えられた住所にマッチすると思われる住所のリストを返しま
す。 詳細については、Get Global Candidate Addresses(294ページ)を参照してください。
• ValidateGlobalAddress — 国際郵便データを使用して住所を正規化します。 ValidateGlobalAddress
は、米国およびカナダの住所の妥当性も確認できますが、その他の国の住所の妥当性を確認する能
力に優れています。 米国およびカナダ以外の住所データが大量に存在する場合は、
ValidateGlobalAddress の使用を検討してください。 詳細については、Validate Global Address
(302ページ)を参照してください。
与えられた入力住所に対し、ValidateGlobalAddress が複数の一致住所を返す場合は、
GetGlobalCandidateAddresses を使用して、住所スタックを返すことができます。
GetGlobalCandidateAddresses は、返された住所のうち、どれが最良のマッチ結果であるかを判断す
るための、郵便データベースからの追加情報を返します。
280
Spectrum™ Technology Platform 8.0.0
第 19 章 : Address Now モジュール
Address Now データベース
Address Now データベースには、サポートされるすべての国の郵便データが含まれています。 データ
ベース全体、または特定の国のデータのみをインストールできます。 データベースは、サーバーにイ
ンストールされます。 このデータベースは、Pitney Bowes Software からのサブスクリプションによっ
て提供され、毎月更新されます。
Build Global Address
Build Global Address では、単一または数個の住所要素のみから有効な住所を作成することができま
す。
Build Global Address は、Address Now モジュールに含まれています。 Address Now モジュールの詳
細 (これに含まれるその他のコンポーネントなど) については、Address Now モジュールとは(280ペー
ジ)を参照してください。
Build Global Address の使用
Build Global Address は、Spectrum™ Technology Platform の他のコンポーネントとは動作が異なりま
す。 住所の作成は対話的なプロセスであり、住所作成プロセスの各ステップで住所要素を選択するこ
とが必要になります。 つまり、住所を作成するために、Build Global Address を 1 度ではなく複数回
呼び出す必要があります。 まず最初に、Build Global Address に対する初期化呼び出しを実行します。
この呼び出しにより、セッション ID が返されます。 以降の呼び出しでは、このセッション ID を使用
します。 各呼び出しにおいて、Build Global Address は、住所要素に対する選択肢となる値のリスト
を提示します。 値を選択して、次の住所要素へと処理を進めます。この処理を住所全体が作成される
まで続けます。 一部の例外を除き、各住所要素に対して個別に呼び出しを行う必要があります。
全体的なプロセスは、次のようになります。
• まず、初期化呼び出しによって、セッションを開始し、システムによって割り当てられたセッショ
ン ID を取得します。
• 与えられた住所要素に対する、候補となる値を見つけるための検索呼び出しを行います。
• 必要な値を選択したら、与えられた住所要素に対して確定した値を通知するための確定呼び出しを
行います。
• すべての住所要素が確定するまで、検索/確定呼び出しを続行します。
• 最後に、セッションを終了するための終了呼び出しを行います。
プロセスの動作方法を理解するには、Management Console の [プレビュー] タブを使用して、以下の
処理を順に実行します。
1. Management Console を開きます。
2. [サービス] ノードの下で、[Build Global Address] を選択します。
ユーザ ガイド
281
Build Global Address
3. [オプション] タブで、必要なオプションを指定します。 オプションの詳細については、オプショ
ン(287ページ) を参照してください。
4. [プレビュー] タブをクリックします。
5. [Action] フィールドに、"init" と入力します。
6. [Country] フィールドに、作成する住所の国を入力します。
7. [プレビューを実行] をクリックします。
8. [プレビュー出力] の下で [SessionId] フィールドを探し、値を右クリックして、ポップアップ メ
ニューから [コピー] を選択します。
9. [プレビュー入力] の下で [SessionId] フィールドを右クリックして、[貼り付け] を選択します。
282
Spectrum™ Technology Platform 8.0.0
第 19 章 : Address Now モジュール
10. 入力フィールドに以下の値を入力します。
• Action — "search" と入力します。
• Country — このフィールドはそのままにします。
• FieldIndex — 検索する最初のフィールドのインデックス値を入力します。 例えば、シカゴの住
所を検索する場合は "1" と入力します。米国住所では、フィールド インデックス 1 が、都市
フィールドに対応するためです。
• SearchValue — 検索する値を入力します。 例えば、シカゴの住所を作成する場合は、"chicago"
と入力します。
• SessionId — 同じ値のままとします。
注: 他の入力フィールドの値は無視されます。
11. [プレビューを実行] を再度クリックします。
12. 検索結果は、 [Alternatives.InContext] と [AlternativesOutContext] という最大 2 つの出力フィー
ルドに表示されます。 インコンテキスト結果とアウトオブコンテキスト結果の違いについては、
コンテキストとは(294ページ)を参照してください。
13. 必要な値が見つかった場合は、以下の値を入力フィールドに入力します。
•
Action — "commit" と入力します。
•
AlternativeIndex — 選択する選択肢のインデックス番号を入力します。 インデックス値の最
小値は 1 ではなく、0 です。 例えば、シカゴを検索する場合、Build Global Address によって
返される選択肢には、以下のようにインデックスが付与されます。 "CHICAGO" という値を確
定する場合は、[AlternativeIndex] フィールドに "0" と入力します。
• 0—CHICAGO
ユーザ ガイド
283
Build Global Address
•
•
•
•
•
•
1—CHICAGO HTS
2—CHICAGO PARK
3—CHICAGO RIDGE
4—EAST CHICAGO
5—NORTH CHICAGO
6—WEST CHICAGO
•
AlternativeContext — "in" または "out" と入力し、[AlternativeIndex] で指定したインデッ
クス値が [Alternatives.InContext] フィールドと [Alternatives.OutContext] フィールドのどち
らの選択肢リストのものであるかを示します。
•
SessionId — この値は同じままにします。
注: 他の入力フィールドの値は無視されます。
14. [プレビューを実行] を再度クリックします。 指定した値が、適切な住所要素の [Field.n.Value]
フィールドに表示されます。
15. 住所が作成されるまで、検索と確定のステップを必要なだけ繰り返します。
16. 入力フィールドに以下の値を入力することにより、セッションを終了します。
• Action — "close" と入力します。
• SessionId — この値は同じままにします。
注: 他の入力フィールドの値は無視されます。
入力
注: API を使用してこのコンポーネントを利用する場合は、DataTable クラスを使用して入力を指定
してください。 以下で説明するフィールドは、DataTable クラスにおける有効な列名です。
DataTable クラスの詳細については、 API ユーザ ガイドの「API の基礎」のセクションを参照し
てください。.
表 33 : Build Global Address の入力
フィールド名
書式
説明/有効値
Action
String
実行するアクションを指定します。 次のいずれかを指定し
ます。
init
284
初期化。 このアクションは、セッションを開始
し、他のすべてのアクションで必要となるセッショ
ン ID を返します。 init アクションでは、[Country]
入力フィールドが必須です。
Spectrum™ Technology Platform 8.0.0
第 19 章 : Address Now モジュール
フィールド名
書式
説明/有効値
search 特定の住所要素に対する値を検索し、選択肢とな
る値のリストを返します。 search アクションで
は、次の入力フィールドが必須です。
• FieldIndex
• SearchValue
• SessionId
commit search アクションで返された値のうちの 1 つを
フィールドに代入します。 commit アクションで
は、次の入力フィールドが必須です。
• AlternativeIndex
• AlternativeContext
• SessionId
clear
[FieldIndex] フィールドに指定されたフィールドの
確定を取り消します。 clear アクションでは、次の
入力フィールドが必須です。
• FieldIndex
• SessionID
close セッションを終了します。 close アクションでは、
[SessionId] 入力フィールドが必須です。
AlternativeContext
String
commit アクションにおいて、[Alternatives.InContext]
フィールドと [Alternatives.OutContext] フィールドのどち
らからの値を選択したかを表します。 このフィールドは、
他のアクションでは無視されます。 次のいずれかを選択し
ます。
in
[Alternatives.InContext] フィールドからの値を確定
しています。 つまり、[AlternativeIndex] 入力フィー
ルドで指定した値は、[Alternatives.InContext] 出力
フィールドの値に対応します。
out [Alternatives.OutContext] フィールドからの値を確
定しています。 つまり、[AlternativeIndex] 入力
フィールドで指定した値は、
[Alternatives.OutContext] 出力フィールドの値に対
応します。
ユーザ ガイド
285
Build Global Address
フィールド名
書式
説明/有効値
AlternativeIndex
String
[79]
commit アクションにおいて、作成中の住所で使用する値を
指定します。 例えば、都市を検索し、Build Global Address
が 3 つの都市を返した場合に、インデックス値を指定する
ことによって、どの都市を選択したかを表します。 Build
Global Address が提示する選択肢のインデックス値は 0 か
ら開始します。つまり、最初の選択肢のインデックス値は
0、2 つめの選択肢のインデックス値は 1 で、以後同様に続
きます。
この入力フィールドは、commit 以外のアクションでは無視
されます。
Country
String
[79]
init アクションにおいて、作成する住所が所在する国を指定
します。 入力した国フォーマット (英語名、2 文字の ISO
3116-1 Alpha-2 コード、または 3 文字の ISO 3116-1 Alpha-3
コード) を使用して、国を指定します。 ISO コードの一覧に
ついては、各国のISOコードとモジュールサポート(1086ペー
ジ)を参照してください。
この入力フィールドは、init 以外のアクションでは無視され
ます。
FieldIndex
String
[79]
search アクションに対しては、検索する住所要素を指定し
ます。 clear アクションに対しては、確定を取り消す住所要
素を指定します。 次のいずれかを選択します。
all
すべての住所要素に対して、"clear" アクション
を実行します。 このオプションは、"clear" アク
ションのみに適用されます。
<イン
特定の住所要素に対して、アクションを実行しま
デック す。 住所要素のインデックスを調べるには、
ス番号> [Field.n.Name] フィールドを参照して、必要な
フィールドを探します。 値 n は、フィールドの
インデックスを表します。 例えば、米国住所の
ZIP Code のインデックスを調べる場合を考えま
す。 init 呼び出しの後、[Field.0.Name] が "Zip"
となるため、ZIP Code のフィールド インデック
スが "0" であることがわかります。
この入力フィールドは、search と clear 以外のアクション
では無視されます。
286
Spectrum™ Technology Platform 8.0.0
第 19 章 : Address Now モジュール
フィールド名
書式
説明/有効値
SearchValue
String
[79]
search アクションにおいて、検索する値を指定します。 こ
の値は、[FieldIndex] で指定したフィールドに対して適切な
値である必要があります。 例えば、[FieldIndex] で ZIP Code
フィールドを指定した場合は、このフィールドに ZIP Code
または ZIP Code の一部を入力します。 同様に、FieldIndex
で都市フィールドを選択した場合は、このフィールドに都
市名または都市名の一部を指定します。このフィールドを
空白のままにすると、search はインコンテキストのすべて
の値を返します。 インコンテキストおよびアウトオブコン
テキストの値については、コンテキストとは(294ページ)
を参照してください。
この入力フィールドは、search 以外のアクションでは無視
されます。
SessionId
String
[79]
この呼び出しで使用するセッション ID を指定します。 セッ
ション ID を取得するには、init アクションを使用します。
動作のない状態が 5 分間続くと、セッションの有効期限が
切れ、新しい init 呼び出しを実行して、新しいセッションを
開始する必要が生じます。
このフィールドは、init 以外のすべてのアクションで必須で
す。
オプション
表 34 : Build Global Address のオプション
オプション
説明
自国
デフォルト国を指定します。 データ内の住所の多くが所在する国を指
定する必要があります。 例えば、住所の多くがカナダに所在する場合
は、カナダを指定します。 Build Global Address は、州/省、郵便番
号、国の各住所フィールドから国を特定できなかった場合、指定され
た国を使用して、住所の検証を試みます。
国フォーマット
出力の国名に使用するフォーマットを指定します。 次のいずれかを選
択します。
英語名
ユーザ ガイド
国を英語で出力します (デフォルト)。
287
Build Global Address
オプション
説明
ISO コード
国を 2 文字の ISO コードで出力します。
UPU コード
国を 3 文字の UPU コードで出力します。
郵便番号区切り文字を挿入す ZIP Code またはカナダの郵便番号において、区切り文字 (空白または
る
ハイフン) を使用するかどうかを指定します。
例えば、ZIP + 4® Code は、区切り文字付きでは 20706-1844、区切り
文字なしでは 207061844 となります。 カナダの郵便番号は、区切り
文字付きでは P5E"1S7、区切り文字なしでは P5E1S7 となります。
注: カナダの郵便コードには空白を使用し、米国の ZIP + 4® Code に
はハイフンを使用します。
その他の住所行を表示
住所行の出力フィールドの 1 つに、都市、州/省、および郵便番号を含
めるかどうかを指定します。 このオプションを指定したかどうかにか
かわらず、[City]、[State/Province]、および [PostalCode] の各出力
フィールドには必ず、都市、州/省、および郵便番号が含まれます。
返されるレコードの最大数
このオプションのデフォルト値として、1 〜 10000 の間の任意の値が
設定できます。デフォルト値は、50 レコードです。 Enterprise Designer
で設定された値が、Management Console における設定値よりも優先
されることに注意してください。
出力
Build Global Address は、各入力住所の住所データとリターン コードを返します。
注: API を介してこのコンポーネントを利用する場合は、出力は DataTable クラスを使用して返され
ます。 以下に、DataTable クラスの有効な列名であるフィールドについて説明します。 DataTable
クラスの詳細については、API ユーザ ガイドの「API の基礎」のセクションを 参照してくださ
い。.
住所データ
表 35 : Build Global Address の出力
288
フィールド名
書式
説明/有効値
Action
文字列 [79]
この呼び出しで Action 入力フィールドに指定され
た値を表示します。 この入力フィールドの詳細に
Spectrum™ Technology Platform 8.0.0
第 19 章 : Address Now モジュール
フィールド名
書式
説明/有効値
ついては、入力(284ページ)を参照してくださ
い。
AddressLine1
文字列 [79]
フォーマット済みの最初の住所行。
AddressLine2
文字列 [79]
フォーマット済みの 2 行目の住所行。
AddressLine3
文字列 [79]
フォーマット済みの 3 行目の住所行。
AddressLine4
文字列 [79]
フォーマット済みの 4 行目の住所行。
AddressLine5
文字列 [79]
フォーマット済みの 5 行目の住所行。
AddressLine6
文字列 [79]
フォーマット済みの 6 行目の住所行。
AddressLine7
文字列 [79]
フォーマット済みの 7 行目の住所行。
AddressLine8
文字列 [79]
フォーマット済みの 8 行目の住所行。
AlternativeContext
文字列 [79]
この呼び出しで AlternativeContext 入力フィール
ドに指定された値を表示します。 詳細について
は、入力(284ページ)を参照してください。
AlternativeIndex
文字列 [79]
この呼び出しで AlternativeIndex 入力フィールド
に指定された値を表示します。 この入力フィール
ドの詳細については、入力(284ページ)を参照し
てください。
Alternatives.InContext
String [79]
検索したフィールドの候補値のうち、確定済みの
フィールドのコンテキストに合致するものが、カ
ンマで区切られたリスト。 コンテキストの詳細に
ついては、コンテキストとは(294ページ)を参照
してください。
Alternatives.InContext.Count
String [79]
検索によって返された「インコンテキスト」結果
の数。 コンテキストの詳細については、コンテキ
ストとは(294ページ)を参照してください。
Alternatives.OutContext
String [79]
検索したフィールドの候補値のうち、確定済みの
フィールドのコンテキストに合致しないものが、
カンマで区切られたリスト。 コンテキストの詳細
ユーザ ガイド
289
Build Global Address
フィールド名
書式
説明/有効値
については、コンテキストとは(294ページ)を参
照してください。
Alternatives.OutContext.Count
String [79]
検索によって返された「アウトオブコンテキス
ト」結果の数。 コンテキストの詳細については、
コンテキストとは(294ページ)を参照してくださ
い。
ApartmentLabel
String [79]
アパートの指定子 (STE や APT など). 例えば、
123 E Main St. APT 3
ApartmentNumber
String [79]
アパート番号。 例えば、
123 E Main St. APT 3
Building
String [79]
建物名。
City
String [79]
都市名。
Country
String [79]
この呼び出しの、[Country] 入力フィールドで指定
された値。 この入力フィールドの詳細について
は、入力(284ページ)を参照してください。
Country
String [79]
2 文字または 3 文字の ISO コード、または、国の
英語名。 ISO コードの一覧については、各国の
ISO コードとモジュール サポート(1086ページ)
を参照してください。
Department
String [79]
複数の部門に整理された任意のものの個々の部分
の名前。 例えば、企業の中の財務部門など。
Field.n.CommitFlag
String [79]
フィールド n の値を選択済みかどうか (つまり、
値を "確定" したかどうか) を表します。 次のいず
れかの値をとります。
Field.n.Index
290
String [79]
Y
このフィールドの値は確定済みです。
N
このフィールドの値は確定していません。
フィールド n (n は 0 〜 10) を指すために使用する
インデックス値。 例えば、米国住所における ZIP
フィールドのインデックス値は "0" です。
Spectrum™ Technology Platform 8.0.0
第 19 章 : Address Now モジュール
フィールド名
書式
説明/有効値
Field.n.Name
String [79]
フィールド n (n は 0 〜 10) に含まれる住所要素の
名前。 例えば、米国住所では、Field.0.Name は
ZIP です。
Field.n.Value
String [79]
フィールド n (n は 0 〜 10) に対して確定済みの
値。
init 呼び出しでは、このフィールドは空白です。
FieldIndex
String [79]
この呼び出しの、[FieldIndex] 入力フィールドで指
定された値。 この入力フィールドの詳細について
は、入力(284ページ)を参照してください。
FirmName
String [79]
企業名。 例えば、
Pitney Bowes Software
4200 PARLIAMENT PL STE 600
LANHAM MD 20706-1844
USA
HouseNumber
String [79]
家番号。 例えば、
123 E Main St. Apt 3
POBox
String [79]
私書箱番号。 住所が地方配送路住所である場合
は、地方配送路の私書箱番号がここに表示されま
す。
PostalCode
文字列 [79]
郵便番号。 米国では、ZIP Code™ と呼びます。
PostalCode.AddOn
文字列 [79]
ZIP + 4® コードの 4 桁アドオン部分。 例えば、
ZIP Code™ 60655-1844 の場合は 1844 が 4 桁の
アドオン部分です。 (米国の住所のみ)
PostalCode.Base
文字列 [79]
5 桁の ZIP Code™。 例えば、20706 (米国の住所
のみ)。
Principality
文字列 [79]
国内の地域。 例えば、イングランド、スコットラ
ンド、ウェールズは公国です。 このフィールド
は、通常は空白です。
SearchFieldIndex
文字列 [79]
前回の検索操作で検索されたフィールドのイン
デックス値。
ユーザ ガイド
291
Build Global Address
フィールド名
書式
説明/有効値
SearchValue
文字列 [79]
この呼び出しで SearchValue 入力フィールドに指
定された値を表示します。 この入力フィールドの
詳細については、入力(284ページ)を参照してく
ださい。
SessionId
文字列 [79]
この呼び出しで SessionId 入力フィールドに指定
された値を表示します。 この入力フィールドの詳
細については、入力(284ページ)を参照してくだ
さい。
StateProvince
文字列 [79]
州または省の省略形。
StreetName
文字列 [79]
通り名。 例えば、
123 E Main St. Apt 3
StreetSuffix
文字列 [79]
通り接尾語。 例えば、
123 E Main St. Apt 3
SubCity
文字列 [79]
地区または郊外。 地区または郊外を住所に含める
のが一般的な国で使用します。 例えば、
27 Crystal Way
Bradley Stoke
Bristol BS32 8GA
この住所では "Bradley Stoke" が該当します。
SubStreet
文字列 [79]
住所の識別に使われる 2 番目の通り名。 2 つの通
り名を住所に含めるのが一般的な国で使用しま
す。 例えば、
12 The Mews
High Street
この例では、"High Street" が 2 番目の通り名で
す。 この通り名は、配達先を正確に特定するため
に使用できます。 前の例の "The Mews" は短い通
りなので、住所を正確に示すために別の通り名が
必要とされることから、"High Street" が追記され
ています。 このような場合、"High Street" がメイ
ンまたは既知の通り名です。
USCountyName
292
文字列 [79]
米国式の住所の場合に、住所がある国の名前で
す。
Spectrum™ Technology Platform 8.0.0
第 19 章 : Address Now モジュール
リターン コード
表 36 : Build Global Address のリターン コード
フィールド名
書式
説明/有効値
Status
文字列 [79]
マッチの成功または失敗を報告します。
Status.Code
文字列 [79]
null
成功
F
失敗
失敗の原因 (ある場合)。
• SessionError
• SeverError
• CountryNotFound
Status.Description
文字列 [79]
問題の説明 (ある場合)。
Please
initialize new
session
Status.Code=SessionError の場
合にこの値が表示されます。
Null or empty
action
Status.Code=SessionError の場
合にこの値が表示されます。
Unknown
action
Status.Code=SessionError の場
合にこの値が表示されます。
Invalid
session
Status.Code=SessionError の場
合にこの値が表示されます。
Invalid value
for
Status.Code=SessionError の場
合にこの値が表示されます。
Cannot Search Status.Code=SessionError の場
Committed
合にこの値が表示されます。
Field
ユーザ ガイド
Module not
licensed
Status.Code=ServerError の場
合にこの値が表示されます。
Could Not
Identify
Country
Status.Code=CountryNotFound
の場合にこの値が表示されま
す。
293
Get Global Candidate Addresses
コンテキストとは
住所要素の検索を実行する際、Build Global Address は、確定済みの住所要素を参照し、返す値を、確
定済みの住所要素のコンテキスト内にあるかどうかによって分割します。 例えば、米国には次の都市
が存在します。
イリノイ州の都市
• CHICAGO
• CHICAGO HTS
• CHICAGO RIDGE
• NORTH CHICAGO
• WEST CHICAGO
インディアナ州の都市
• EAST CHICAGO
ネバダ州の都市
• CHICAGO PARK
州として "IN" (インディアナ州) の値が確定済みの状態で、都市 "chicago" を検索した場合、Build Global
Address は「インコンテキスト」結果として EAST CHICAGO を返します。それがインディアナ州に
存在するためです。"chicago" に対するその他のマッチ結果はすべて、アウトオブコンテキスト結果と
して返されます。 同様に、州として "IL" (イリノイ州) の値が確定済みである場合は、Build Global
Address は、アウトオブコンテキスト結果として EAST CHICAGO と CHICAGO PARK を返し、「イ
ンコンテキスト」結果として CHICAGO、CHICAGO HTS、CHICAGO RIDGE、NORTH CHICAGO、
および WEST CHICAGO を返します。
Get Global Candidate Addresses
Get Global Candidate Addresses は、与えられた入力住所にマッチすると思われる住所のリストを返
します。 入力住所が、Address Now データベースの複数の住所にマッチする場合は、可能性のある複
数のマッチ結果が返されます。 入力住所が、Address Now データベースの 1 つの住所のみにマッチす
る場合は、住所データは返されません。
Get Global Candidate Addresses は、Address Now モジュールに含まれています。 Address Now モ
ジュールの詳細 (これに含まれるその他のコンポーネントなど) については、Address Now モジュー
ルとは(280ページ)を参照してください。
入力
Get Global Candidate Addresses は正規化済み住所を受け取ります。 どの国の住所であるかにかかわ
らず、すべての住所がこのフォーマットを使用します。 [AddressLine1] および [Country] は、必須の
入力フィールドです。 他のフィールドはすべてオプションです。
294
Spectrum™ Technology Platform 8.0.0
第 19 章 : Address Now モジュール
注: API でこのコンポーネントを操作する場合は、DataTable クラスを使用して入力を指定します。
以下で説明するフィールドは、DataTable クラスにおける有効な列名です。DataTable クラスの
詳細については、API ユーザ ガイドの「API の基礎」のセクションを 参照してください。.
表 37 : Get Global Candidate Addresses 入力
フィールド名
書式
説明/有効値
AddressLine1
文字列
[79]
最初の住所行。 これは必須のフィールドです。
AddressLine2
文字列
[79]
2 行目の住所行。
AddressLine3
文字列
[79]
3 行目の住所行。
AddressLine4
文字列
[79]
4 行目の住所行。
AddressLine5
文字列
[79]
5 行目の住所行。
AddressLine6
文字列
[79]
6 行目の住所行。
AddressLine7
文字列
[79]
7 行目の住所行。
AddressLine8
文字列
[79]
8 行目の住所行。
City
文字列
[79]
都市名
StateProvince
文字列
[79]
州または省。
PostalCode
文字列
[10]
住所の郵便番号は、次のフォーマットのいずれかで表されます。
99999
99999-9999
A9A9A9
ユーザ ガイド
295
Get Global Candidate Addresses
フィールド名
書式
説明/有効値
A9A 9A9
9999 999
Country
文字列
国。 入力の国フォーマットとして選択したフォーマット (英語名また
は ISO コード) を使って国を指定します。 ISO コードの一覧は、各国
の ISO コードとモジュール サポート(1086ページ)を参照してくださ
い。
FirmName
文字列
[79]
会社名または企業名
オプション
表 38 : Get Global Candidate Addresses オプション
オプション
説明
自国
デフォルト国を指定します。 ほとんどの郵送物の宛先となる国を指定
します。 例えば、ほとんどの郵送先がカナダであれば、カナダを指定
します。 Get Global Candidate Addresses では、住所の
[StateProvince]、[PostalCode]、または [Country] フィールドから国を
確認できない場合に、デフォルトの国を使って検証を行おうとしま
す。
国フォーマット
出力で国の名前として使うフォーマットを指定します。 次のいずれか
を選択します。
大文字と小文字の区別
英語名
出力の国名には英語表記を使います (デフォル
ト)。
ISO コード
出力の国名には 2 文字の ISO コードを使います。
UPU コード
出力の国名には 2 文字の UPU コードを使いま
す。
出力データの大文字と小文字の区別を指定します。 次のいずれかを選
択します。
混在
296
出力には、大文字と小文字が混在します (デフォルト)。
例えば、 123 Main St Mytown FL 12345
Spectrum™ Technology Platform 8.0.0
第 19 章 : Address Now モジュール
オプション
説明
大文字
出力に大文字を使用します。 例えば、 123 MAIN ST
MYTOWN FL 12345
郵便番号区切り文字を挿入す ZIP™ Code またはカナダ郵便番号で区切り文字 (スペースまたはハイ
る
フン) を使うかどうかを指定します。
例えば、空切り文字ありの ZIP + 4® Code は 20706-1844 、区切り文
字なしは 207061844 になります。 区切り文字ありのカナダの郵便番
号は P5E"1S7、区切り文字なしは P5E1S7 になります。
注: カナダの郵便番号ではスペースが、米国の ZIP + 4® コードではハ
イフンが使用されます。
その他の住所行を表示
都市、州/省、および郵便番号を [AddressLine] 出力フィールドのいず
れかに格納するかどうかを指定します。 このオプションの設定とは関
係なく、出力フィールド [都市]、[州/省]、および [郵便番号] には常に
都市、州/省、および郵便番号が格納されます。
返されるレコードの最大数
出力する候補住所の最大数。 デフォルトは 50 です。 最大値は 100 で
す。
妥当性が確認されなかった入 妥当性を確認できなかった入力住所を出力データに含めるかどうかを
力データを返す
指定します。
出力
Get Global Candidate Addresses は、各住所の住所データとリターン コードを返します。
注: API を介してこのコンポーネントを利用する場合は、出力は DataTable クラスを使用して返され
ます。 以下で説明するフィールドは、DataTable クラスにおける有効な列名です。DataTable ク
ラスの詳細については、API ユーザ ガイドの「API の基礎」のセクションを 参照してください。.
住所データ
表 39 : Get Global Candidate Addresses の住所データ出力
フィールド名
書式
説明/有効値
AddressLine1
文字列
[79]
フォーマット済みの最初の住所行。
ユーザ ガイド
297
Get Global Candidate Addresses
298
フィールド名
書式
説明/有効値
AddressLine2
文字列
[79]
フォーマット済みの 2 行目の住所行。
AddressLine3
文字列
[79]
フォーマット済みの 3 行目の住所行。
AddressLine4
文字列
[79]
フォーマット済みの 4 行目の住所行。
AddressLine5
文字列
[79]
フォーマット済みの 5 行目の住所行。
AddressLine6
文字列
[79]
フォーマット済みの 6 行目の住所行。
AddressLine7
文字列
[79]
フォーマット済みの 7 行目の住所行。
AddressLine8
文字列
[79]
フォーマット済みの 8 行目の住所行。
ApartmentLabel
文字列
[79]
アパート指定子 (STE や APT など)。 例えば、
123 E Main St. APT 3
ApartmentNumber 文字列
[79]
アパート番号。 例えば、
Building
文字列
[79]
建物の名前。
City
文字列
[79]
都市名。
Country
文字列
[79]
国の ISO コードまたは英語名。 ISO コードの一覧は、各国の ISO コー
ドとモジュール サポート(1086ページ)を参照してください。
Department
文字列
[79]
複数の部門に整理された任意のものの個々の部分の名前。 例えば、企
業の中の財務部門など。
FirmName
文字列
[79]
会社名。 例えば、
123 E Main St. APT 3
Pitney Bowes Software
4200 PARLIAMENT PL
Spectrum™ Technology Platform 8.0.0
第 19 章 : Address Now モジュール
フィールド名
書式
説明/有効値
STE 600
LANHAM MD 20706-1844
USA
HouseNumber
文字列
[79]
家番号。 例えば、
POBox
文字列
[79]
私書箱番号。 住所が地方配送路住所である場合は、地方配送路の私書
箱番号がここに表示されます。
PostalCode
文字列
[79]
現地の郵便当局が記入を必須とする郵便番号。 例えば、米国の郵便番
号は ZIP Code です。
PostalCode.AddOn 文字列
[79]
米国の住所では、ZIP + 4® Code の最後の 4 文字がこれに該当します。
PostalCode.Base
文字列
[79]
米国の住所では、5 桁の ZIP Code がこれに該当します。
Principality
文字列
[79]
国内の地域。 例えば、イングランド、スコットランド、ウェールズは
公国です。 このフィールドは、通常は空白です。
StateProvince
文字列
[79]
州または省の省略形。
StreetName
文字列
[79]
通り名。 例えば、
文字列
[79]
通り接尾語。 例えば、
文字列
[79]
地区または郊外。 地区または郊外を住所に含めるのが一般的な国で使
用します。 例えば、
StreetSuffix
SubCity
123 E Main St. Apt 3
123 E Main St. Apt 3
123 E Main St. Apt 3
27 Crystal Way
Bradley Stoke
Bristol BS32 8GA
この住所では "Bradley Stoke" が該当します。
SubStreet
ユーザ ガイド
文字列
[79]
住所の識別に使われる 2 番目の通り名。 2 つの通り名を住所に含める
のが一般的な国で使用します。 例えば、
299
Get Global Candidate Addresses
フィールド名
書式
説明/有効値
12 The Mews
High Street
この例では、"High Street" が 2 番目の通り名です。 この通り名は、配
達先を正確に特定するために使用できます。 前の例の "The Mews" は
短い通りなので、住所を正確に示すために別の通り名が必要とされる
ことから、"High Street" が追記されています。 このような場合、"High
Street" がメインまたは既知の通り名です。
USCountyName
文字列
[79]
米国式の住所の場合に、住所がある郡の名前です。
リターン コード
表 40 : Get Global Candidate Addresses リターン コード
フィールド名
書式
説明/有効値
ACRCode
文字列 [79]
ACR (住所訂正結果) コードは、各レコードでどのデータが
変更されたかを示します。 このコードの意味については、
ACR コード(318ページ)を参照してください。
Confidence
文字列 [79]
返された住所に割り当てられた確信レベル。 範囲は 0 〜
100 です。0 は失敗を表し、100 はマッチ結果が正しいこと
に対する確信レベルが非常に高いことを表します。
Status
文字列 [79]
マッチの成功または失敗を報告します。
Status.Code
文字列 [79]
Null
成功
F
失敗
失敗の原因 (ある場合)。
• RequestFailed
• ServerError
• CountryNotFound
Status.Description 文字列 [79]
問題の説明 (ある場合)。
Maximum records
cannot be set to 0.
Minimum value
should be 1
300
Status.Code=RequestFailed の場合
にこの値が表示されます。
Spectrum™ Technology Platform 8.0.0
第 19 章 : Address Now モジュール
フィールド名
書式
説明/有効値
Address Not Found Status.Code=RequestFailed の場合
にこの値が表示されます。
Module not licensed Status.Code=ServerError の場合に
この値が表示されます。
Could Not Identify
Country
Status.Code=CountryNotFound の
場合にこの値が表示されます。
レポート
Get Global Candidate Addresses で使用可能な唯一のレポートは、 Get Global Candidate Addresses
Report です。 このレポートを作成するには、Enterprise Designer で [Get Global Candidate Addresses
Report] アイコンをキャンバスにドラッグします。 レポートにコネクタを設定する必要はありません。
Get Global Candidate Addresses Report
Get Global Candidate Addresses Report は、ジョブで処理されたレコードの設定と数に関する情報を
示します。
General Information
レポートの最初の部分には、レポートの日付と、以下の設定情報が配置されます。
• Output Country Format — ジョブに適用される [国フォーマット] 設定。 この設定の詳細について
は、オプション(296ページ)を参照してください。
• Output Text Casing — ジョブに適用される [大文字と小文字の区別] 設定。 この設定の詳細につい
ては、オプション(296ページ)を参照してください。
• Maximum Results — ジョブに適用される [返されるレコードの最大数] 設定。 この設定の詳細につ
いては、オプション(296ページ)を参照してください。
Input Address
このセクションには、ジョブで使われた入力の統計情報が配置されます。
• Input Record Count — ジョブの入力住所の総数。
• Address Records Processed — Global Address によって検証が試みられた住所の数。
• Total Records For Which Address Search Attempted — 検索が試みられた入力住所の総数。
• Total Records Successfully Searched — 候補が返された入力住所の数。 これは結果ステータスが
"F" にならなかった入力住所の数です。
• Total Unsearched Records — 候補が返されなかった入力住所の数。 これは結果ステータスが "F"
だった入力住所の数に等しくなります。
ユーザ ガイド
301
Validate Global Address
Output Address
このセクションには、ジョブからの出力に関する統計情報が配置されます。
• Search Results Count — ジョブから返された住所 (候補を含む) の総数です。
Validate Global Address
Validate Global Address は、米国およびカナダ以外の住所に対する高度な住所の正規化および検証機
能を提供します。 Validate Global Address は、米国およびカナダの住所の妥当性も確認できますが、
その他の国の住所の妥当性を確認する能力にも優れています。 米国およびカナダ以外の住所宛てに大
量の郵便物を送付する場合は、Validate Global Address の使用を検討してください。
Validate Global Address は、Address Now モジュールに含まれています。 Address Now モジュールの
詳細 (これに含まれるその他のコンポーネントなど) については、Address Now モジュールとは(280ペー
ジ)を参照してください。
入力
Validate Global Address は、正規化済みの住所を入力として受け取ります。 どの国の住所であるかに
かかわらず、すべての住所がこのフォーマットを使用します。
注: API でこのコンポーネントを操作する場合は、DataTable クラスを使用して入力を指定します。
以下で説明するフィールドは、DataTable クラスにおける有効な列名です。DataTable クラスの
詳細については、API ユーザ ガイドの「API の基礎」のセクションを 参照してください。.
表 41 : Validate Global Address 入力
302
フィールド名
書式
説明/有効値
AddressLine1
文字列
[79]
最初の住所行。
AddressLine2
文字列
[79]
2 行目の住所行。
AddressLine3
文字列
[79]
3 行目の住所行。
AddressLine4
文字列
[79]
4 行目の住所行。
Spectrum™ Technology Platform 8.0.0
第 19 章 : Address Now モジュール
フィールド名
書式
説明/有効値
AddressLine5
文字列
[79]
5 行目の住所行。
AddressLine6
文字列
[79]
6 行目の住所行。
AddressLine7
文字列
[79]
7 行目の住所行。
AddressLine8
文字列
[79]
8 行目の住所行。
City
文字列
[79]
都市名
StateProvince
文字列
[79]
州または省。
PostalCode
文字列
[79]
住所の郵便番号。 米国では、ZIP Code と呼びます。
™
99999
999999999
A9A9A9
A9A 9A9
9999
999
Country
文字列
[79]
入力の国フォーマットとして選択したフォーマット (英語名
または ISO コード) を使って国を指定します。 ISO コード
の一覧は、各国のISOコードとモジュールサポート(1086ペー
ジ)を参照してください。
FirmName
文字列
[79]
会社名または企業名
ユーザ ガイド
303
Validate Global Address
オプション
入力データ オプション
表 42 : Validate Global Address 出力フォーマット オプション
オプション
説明
自国
デフォルト国を指定します。 住所の大半がある国を指定してくださ
い。 例えば、処理する住所の大部分がカナダにある場合は、カナダを
指定します。 Validate Global Address では、[StateProvince]、
[PostalCode]、または [Country] 住所フィールドで国を特定できない場
合に自国を使って住所を確認しようとします。 有効な値の一覧は、各
国の ISO コードとモジュール サポート(1086ページ)を参照してくだ
さい。
出力データ オプション
表 43 : Validate Global Address 出力データ オプション
オプション
説明
国フォーマット
出力で国の名前として使うフォーマットを指定します。 次のいずれか
を選択します。
大文字と小文字の区別
英語名
出力の国名には英語表記を使います (デフォル
ト)。
ISO コード
出力の国名には 2 文字の ISO コードを使います。
UPU コード
出力の国名には 2 文字の UPU コードを使いま
す。
出力データの大文字と小文字の区別を指定します。 次のいずれかを選
択します。
混在
出力には、大文字と小文字が混在します (デフォルト)。
例えば、 123 Main St Mytown FL 12345
大文字
出力に大文字を使用します。 例えば、 123 MAIN ST
MYTOWN FL 12345
郵便番号区切り文字を挿入す ZIP™ Code またはカナダ郵便番号で区切り文字 (スペースまたはハイ
る
フン) を使うかどうかを指定します。
304
Spectrum™ Technology Platform 8.0.0
第 19 章 : Address Now モジュール
オプション
説明
例えば、空切り文字ありの ZIP + 4® Code は 20706-1844 、区切り文
字なしは 207061844 になります。 区切り文字ありのカナダの郵便番
号は P5E"1S7、区切り文字なしは P5E1S7 になります。
注: カナダの郵便番号ではスペースが、米国の ZIP + 4® コードではハ
イフンが使用されます。
その他の住所行を表示
都市、州/省、および郵便番号を [AddressLine] 出力フィールドのいず
れかに格納するかどうかを指定します。 このオプションの設定とは関
係なく、出力フィールド [都市]、[州/省]、および [郵便番号] には常に
都市、州/省、および郵便番号が格納されます。
マッチしなかった場合に正規 住所を検証できない場合に正規化された住所を返すかどうかを指定し
化データを返す
ます。 住所には、その国の標準住所書式が設定されます。 このオプ
ションを選択しない場合、住所のに失敗すると出力住所コンポーネン
ト フィールド ([StreetName]、[HouseNumber] など) は空白になりま
す。
マッチしなかった場合に書式 住所を検証できない場合に書式設定された住所を返すかどうかを指定
を整えたデータを返す
します。 住所には、その国の標準住所書式が設定されます。
住所検証を有効にする
住所検証を有効にします。 住所検証は以下の手順で進められます。
• 各コンポーネントを当該国の参照データと照合します。
• スペルの誤りを訂正します。
• 欠落しているコンポーネントを補います。
• 郵便番号を訂正するか補います。
住所の書式設定を有効にする 住所のコンポーネントを法律で定められたフォーマットまたはカスタ
ム フォーマットに書式設定します。
正規化オプション
表 44 : Validate Global Address 正規化オプション
説明
住所行から作成
ユーザ ガイド
これらのオプションは、住所の正規化に使用する住所要素を指定しま
す。 Validate Global Address は、入力住所行を、これらのオプション
で指定されたコンポーネントにパースします。
305
Validate Global Address
説明
不適切な語を報告
不適切な語を検出するかどうかを指定します。 このオプションを有効
にすると、Validate Global Address は、結果を示す値を [WCRCode]
出力フィールドに返します。
不適切な語をマーク
">VulgarWord<" 形式を使って、不適切な語を出力中にマークするかど
うかを指定します。
デバッグ出力
このオプションは、トラブルシューティング用の情報を出力フィール
ド [Email1]、[Email2]、[URL1]、および [URL2] に設定するかどうかを
指定します。
検証オプション
表 45 : Validate Global Address 検証オプション
306
オプション
説明
可能ならば設定
これらのオプションは、住所を検証するときに住所のどの部分を使う
かを指定します。 Validate Global Address は、入力住所行をパースし
て、これらのオプションで指定されたコンポーネントに変換します。
強制的に更新
これらのオプションは、検証中にどのフィールドを訂正するかを指定
します。
エイリアスを置換
これらのオプションは、入力データが Address Now データベースに
エイリアスとして見つかった場合にどの住所コンポーネントを上書き
するかを指定します。 エイリアスは、郵便コードが変更されたり、都
市に別名がある場合に使用されます。 このオプションを有効にする
と、エイリアスは Address Now データベースに指定されたマスタ バー
ジョンで上書きされます。
慎重に更新
このオプションは、[強制的に更新] オプションと併用することで、処
理中にデータが大きく変更されないようにすることができます。
クロス コンポーネント マッ
チ
住所正規化と検証の一般的なエラーを訂正するためにクロス コンポー
ネント マッチを実行するかどうかを指定します。 クロス コンポーネ
ント マッチを実行すると、入力データのフィールドにあるデータと
Address Now データベースの別のフィールドにあるデータがマッチす
るかどうかがチェックされます。
Spectrum™ Technology Platform 8.0.0
第 19 章 : Address Now モジュール
オプション
説明
付加記号の参照を使用
住所の違いが付加記号 (アクセント記号、ウムラウト記号など) のみの
場合に Validate Global Address が住所を変更して郵便データベース内
の住所の付加記号に一致させるかどうかを指定します。
例えば、[付加記号の参照を使用] を有効にすると、データは以下のよ
うに処理されます。
入力される都市名: Chalon-Sur-Saone
郵便データベース内の都市名: CHALON SUR SAONE
出力される都市名: CHALON SUR SAONE
入力される都市名: ARTEMIVS'K
郵便データベース内の都市名: ARTEMIVSK
出力される都市名: ARTEMIVSK
一方、[付加記号の参照を使用] を有効にしない場合は、データは以下
のように処理されます。
入力される都市名: Chalon-Sur-Saone
参照される都市名: CHALON SUR SAONE
出力される都市名: Chalon-Sur-Saone
入力される都市名: ARTEMIVS'K
参照される都市名: ARTEMIVSK
出力される都市名: ARTEMIVS'K
このオプションの設定は、[書き直し方法] オプションに影響しないこ
とに注意してください。
正規化形の変更を ACR コー 正規化による変更 ("ROAD" を "RD" に変更するなど) を ACR コードと
ドに記録
して報告するかどうかを指定します。
許容レベル
[許容レベル] 設定は、住所全体を検証されたと見なすために検証しな
ければならない住所コンポーネントの最小限の数を指定します。 [許
容レベル] に指定された値は、ACR コードの 2 番目の文字に対応しま
す。 詳細については、ACR コード(318ページ)を参照してください。
許容レベルは [バリデーションの最小確信レベル] オプションとは異な
ります。許容レベルは、Validate Global Address が検証するコンポー
ネントの数を指定するオプションであり、検証対象のコンポーネント
が郵便データベースの住所コンポーネントにどの程度マッチするかは
問いません。一方、[バリデーションの最小確信レベル] は、出力住所
が検証済みの正しいバージョンの入力住所である可能性を示します。
ユーザ ガイド
307
Validate Global Address
オプション
説明
次のいずれかを選択します。
• 国固有 — 許容レベルは、住所の国に基づいて適切なレベルに自動
的に設定されます。 例えば、米国の住所は許容レベル 4 で処理され
ます。
• レベル 0 — コンポーネントを一つも検証しません (既定)
• レベル 1 — 国名のみを検証します
• レベル 2 — 都市名および国名を検証します
• レベル 3 — 都市名、郵便コード、および国名を検証します
• レベル 4 — 通り名、都市名、郵便コード、および国名を検証します
• レベル 5 — 敷地番号、建物名、従属する建物名、私書箱、企業名、
通り名、都市名、郵便番号、および国名を検証します
バリデーションの最小確信レ 住所検証の最小確信レベルを指定します。 [Confidence] 出力フィール
ベル
ドの値がこのレベル値と同じかそれを超える住所が検証の対象となり
ます。値がレベル値よりも小さい住所は検証されません (出力フィー
ルド [Status] に "F" が設定されます)。
0 〜 100 の範囲の値を指定できます。 値が大きいほど、住所検証の実
行に必要な確信レベルが高くなります。 デフォルト値は 60 です。
マッチ スコア重み付け
この値は、指定したフィールドに関する、入力データと Address Now
データベースとの類似または相違の相対的な重要性を指定します。 こ
のオプションは、確信値に影響するので、正しい更新と正しくない更
新を区別するために確信の度合いを調節する目的に使えます。 詳細に
ついては、ACR コード(318ページ)を参照してください。
フィールドごとに 0 〜 10 の範囲で整数を指定します。この数値が、
フィールド間の相対的な重要性の違いを表します。 デフォルト値は次
のとおり。
• 企業名 — 1
• 通り名 — 10
• 都市名 — 8
• 郵便コード — 8
外部マッチ スコア行
308
外部マッチ スコアを計算するときに使う住所の行数を示す 0 〜 8 の
範囲の値。 デフォルト値は 8 です。 外部マッチ スコア行の詳細につ
いては、外部マッチ スコア(315ページ)を参照してください。
Spectrum™ Technology Platform 8.0.0
第 19 章 : Address Now モジュール
出力フォーマット オプション
表 46 : Validate Global Address 出力フォーマット オプション
オプション
説明
書式を整えた住所出力に含め 住所のどの部分を該当国の標準住所書式に従ってフォーマットするか
る要素
を指定します。 Validate Global Address は、入力住所行をパースし
て、このオプションで参照されるコンポーネントに設定します。
Transliteration
出力住所の付加記号をフォーマットする方法を指定します。 次のいず
れかを選択します。
付加記号を保持 書き直しを実行しません。 付加記号は、入力また
は郵便データベースで提供されたままで残されま
す。 こちらがデフォルトです。
付加記号を除去 付加記号を除去し、それに相当する非装飾文字で置
き換えます。
書き直す
言語固有の書き直しルールに従って、付加記号をそ
れに相当する非装飾文字または文字シーケンスに書
き直します。
例えば、スウェーデンの住所に 3 つの書き直しオプションを適用した
場合のそれぞれの結果を以下に示します。 "Vastra Frolunda" の違いに
注目してください。
付加記号を保持
Gustaf Wernersgata 12 S-42132 Vastra Frolunda
付加記号を除去
Gustaf Wernersgata 12 S-42132 Vastra Frolunda
書き直す
Gustaf Wernersgata 12 S-42132 Vaestra Froelunda
ユーザ ガイド
309
Validate Global Address
出力
住所データ出力
表 47 : Validate Global Address 住所データ出力
フィールド名
書式
説明/有効値
AddressLine1
文字列
[79]
フォーマット済みの最初の住所行。
AddressLine2
文字列
[79]
フォーマット済みの 2 行目の住所行。
AddressLine3
文字列
[79]
フォーマット済みの 3 行目の住所行。
AddressLine4
文字列
[79]
フォーマット済みの 4 行目の住所行。
AddressLine5
文字列
[79]
フォーマット済みの 5 行目の住所行。
AddressLine6
文字列
[79]
フォーマット済みの 6 行目の住所行。
AddressLine7
文字列
[79]
フォーマット済みの 7 行目の住所行。
AddressLine8
文字列
[79]
フォーマット済みの 8 行目の住所行。
ApartmentLabel
文字列
[79]
アパート指定子 (STE や APT など)。 例えば、
文字列
[79]
アパート番号。 例えば、
Building
文字列
[79]
建物の名前。
City
文字列
[79]
都市名。
ApartmentNumber
310
123 E Main St. APT 3
123 E Main St. APT 3
Spectrum™ Technology Platform 8.0.0
第 19 章 : Address Now モジュール
フィールド名
書式
説明/有効値
Country
文字列
[79]
国の ISO コードまたは英語名。 ISO コードの一覧は、各国
の ISO コードとモジュール サポート(1086ページ)を参照し
てください。
Department
文字列
[79]
フランス語圏やスペイン語圏で使われる国内の従属する地
区。 たとえば、フランスは 100 の department (県) に分割
されます。
FirmName
文字列
[79]
会社名。 例えば、
文字列
[79]
家番号。 例えば、
Latitude
文字列
[79]
住所から確認できる最も精度の高い緯度。 ポイント レベル
の場所またはセントロイドである場合があります。 精度レ
ベルは、[ECRCode] 出力フィールドをチェックすると確認
できます。 詳細については、ECR コード(314ページ)を参
照してください。
Longitude
文字列
[79]
住所から確認できる最も精度の高い経度。 ポイント レベル
の場所またはセントロイドである場合があります。 精度レ
ベルは、[ECRCode] 出力フィールドをチェックすると確認
できます。 詳細については、ECR コード(314ページ)を参
照してください。
POBox
文字列
[79]
郵便局の私書箱番号。 住所が地方配送路住所である場合は、
地方配送路の私書箱番号がここに表示されます。
PostalCode
文字列
[79]
郵便番号。 米国では、ZIP Code™ と呼びます。
PostalCode.AddOn
文字列
[79]
ZIP + 4® コードの 4 桁アドオン部分。 例えば、60655-1844
という ZIP Code™ において、4 桁のアドオン部分は 1844
になります (米国住所のみ)。
PostalCode.Base
文字列
[79]
5 桁の ZIP Code™。 例えば、20706 (米国の住所のみ)。
HouseNumber
ユーザ ガイド
Pitney Bowes Software
4200 PARLIAMENT PL
STE 600
LANHAM MD 20706-1844
USA
123 E Main St. Apt 3
311
Validate Global Address
フィールド名
書式
説明/有効値
Principality
文字列
[79]
国内の地域。 例えば、イングランド、スコットランド、
ウェールズは公国です。 このフィールドは、通常は空白で
す。
StateProvince
文字列
[79]
州または省の省略形。
StreetName
文字列
[79]
通り名。 例えば、
文字列
[79]
通り接尾語。 例えば、
文字列
[79]
地区または郊外。 地区または郊外を住所に含めるのが一般
的な国で使用します。 例えば、
StreetSuffix
SubCity
123 E Main St. Apt 3
123 E Main St. Apt 3
27 Crystal Way
Bradley Stoke
Bristol BS32 8GA
この住所では "Bradley Stoke" が該当します。
SubStreet
文字列
[79]
住所の識別に使われる 2 番目の通り名。 2 つの通り名を住
所に含めるのが一般的な国で使用します。 例えば、
12 The Mews
High Street
この例では、"High Street" が 2 番目の通り名です。 この通
り名は、配達先を正確に特定するために使用できます。 前
の例の "The Mews" は短い通りなので、住所を正確に示すた
めに別の通り名が必要とされることから、"High Street" が
追記されています。 このような場合、"High Street" がメイ
ンまたは既知の通り名です。
USCountyName
312
文字列
[79]
米国式の住所の場合に、住所がある郡の名前です。
Spectrum™ Technology Platform 8.0.0
第 19 章 : Address Now モジュール
リターン コード
表 48 : Validate Global Address のリターン コード
フィールド名
書式
説明/有効値
ACRCode
文字列
[79]
ACR (住所訂正結果) コードは、各レコードでどのデータが
変更されたかを示します。 このコードの意味については、
ACR コード(318ページ)を参照してください。
Confidence
文字列
[79]
返された住所に割り当てられた確信レベル。 範囲は 0 〜
100 です。0 は失敗を表し、100 はマッチ結果が正しいこと
に対する確信レベルが非常に高いことを表します。 この値
は、ACR コードの最後の 3 文字と同じであり、検証マッチ
スコアと呼ばれます。 詳細については、ACR コード
(318ページ)を参照してください。
ECRCode
文字列
[79]
住所訂正結果 (ECR) コードは、住所に対して返される緯度/
経度の精度レベルを表します。 詳細については、ECR コー
ド(314ページ)を参照してください。
Email1
文字列
[79]
追加の正規化情報。
Email2
文字列
[79]
追加の正規化情報。
OuterMatchScore
文字列
[79]
各住所行への変更を測るスコア。 詳細については、外部マッ
チ スコア(315ページ)を参照してください。
Status
文字列
[79]
マッチの成功または失敗を報告します。
• NULL — 成功
• F — 失敗
Status.Code
Status.Description
ユーザ ガイド
文字列
[79]
失敗の原因 (ある場合)。
文字列
[79]
問題の説明 (ある場合)。
• UnableToValidate
• ServerError
• CountryNotFound
• 住所が見つかりません — Status.Code=UnableToValidate
の場合にこの値が表示されます。
313
Validate Global Address
フィールド名
書式
説明/有効値
• モジュールのライセンスがない —
Status.Code=ServerError の場合にこの値が表示されま
す。
• 国を特定できませんでした —
Status.Code=CountryNotFound の場合にこの値が表示さ
れます。
URL1
文字列
[79]
追加の正規化情報。
URL2
文字列
[79]
追加の正規化情報。
WCRCode
文字列
[79]
語訂正結果 (WCR) コードは、入力住所に不適切な語が見つ
かったことを示します。 コードは、2 つの要素に分かれて
います。
• ロケーション コード — 次のいずれかの値です。
• AB — 不適切な語が住所に見つかったことを示します。
• NB — 不適切な語が名前に見つかったことを示します。
• 個数 — ロケーション コードが示す場所に見つかった不適
切な語の数。
例えば、"AB2" は 2 つの不適切な語が入力住所に見つかっ
たことを意味します。
ECR コード
住所訂正結果 (ECR) コードは、住所に対して返される緯度/経度の精度レベルを表します。 コードは、
接頭文字とコード本体がダッシュで区切られるフォーマットで構成されます。
接頭文字は常に "EL" で始まり、これに全体の精度レベルを示す 1 〜 5 の番号が続きます。
• 5 — ポイント ジオコード
• 4 — 通りセントロイド
• 3 — 郵便番号セントロイド
• 2 — 都市セントロイド
• 1 — 地域セントロイド
コードの本体は、住所とジオコードのマッチングに使われたコンポーネントを示します。 本体が英数
字で構成されることに注意してください。 コード本体の意味は次のとおりです。
• P — 敷地/家番号 (私書箱番号を含む)
• S — 通り
314
Spectrum™ Technology Platform 8.0.0
第 19 章 : Address Now モジュール
• T — 都市
• R — 地域/州
• Z — 郵便番号
• C—国
コードの本体で使用できる数字オプションは、 4 または 0 の 2 つのみです。
• 4 — コンポーネント データが、ジオコードと住所のマッチング検出に使用できました。
• 0 — コンポーネント データは使用できませんでした。
例えば、 EL4-P0S4T4R4Z4C4
この例では、P の次にある 0 は、この住所マッチング検出に敷地/家番号を使用できなかったものの、
それを除く、通り名から国名までのコンポーネントは使用できたことを意味します。
外部マッチ スコア
外部マッチ スコアは、住所を検証するために Validate Global Address が各住所行をどの程度変更した
かを示します。 このスコアは、正規化前の住所行を検証/フォーマット後の住所と比較して決定されま
す。 [外部マッチ スコア行] オプションを 0 より大きな値に設定した場合に、このスコアが生成され
ます。
外部マッチ スコアは、検証マッチ スコアと似ています。後者は ACR コードの一部です (ACR コード
(318ページ)を参照)。 両者の違いは、外部マッチ スコアが住所行への変更 (フォーマットなど) を数
値化するのに対し、検証マッチ スコアはデータを検証できたかどうかのみを数値化することです。
例えば、次のような入力住所行を処理前に受け取ったとします。
住所行 1: 5 camden cres 住所行 2: bath 住所行 3: uk
この住所行は、処理後に以下のようになります。
住所行 1: 5 Camden Crescent 住所行 2: Bath 住所行 3: BA1 5HY 住所行 4: United Kingdom
このデータの検証マッチ スコアは 84% であり、外部マッチ スコアは 23% です。
検証マッチ スコアの値が高いのは、住所コンポーネントが検証前でもかなり正確だったからです。 通
り名は、大文字と小文字の違いと省略形が使われていたことを除き、実在の名称でした。 都市と国の
名前はどちらも有効でした。 唯一正しくなかったのが郵便番号です (元の住所には欠落していました)。
結果として、84% という比較的高い検証マッチ スコアが得られました。
外部マッチ スコアが低いのは、フォーマット後の住所行が入力住所とかなり異なるからです。 前の例
では、入力住所行 3 は "uk" でしたが、出力では "BA1 5HY" となっています。 住所行 4 は入力では空
でしたが、出力では値が設定されました。 住所行 1 も変更されました。 よって、外部スコアはかなり
低い数値になります。
レポート
Validate Global Address は、以下のバッチ処理用レポートを生成できます。 レポートを作成するに
は、Enterprise Designer で目的のレポートのアイコンをキャンバスにドラッグします。 レポートにコ
ネクタを引く必要はありません。
ユーザ ガイド
315
Validate Global Address
Address Now Summary Report
Input Name/Address
このセクションには、ジョブの高レベルの個数が配置されます。
• Input Record Count — ジョブの入力住所の総数。
• Address Records Processed — ジョブの入力住所の総数。
• Total Records For Which Address Validation Attempted — 検証が試みられた入力レコードの数。
• Total Records Successfully Matched — 検証または訂正された入力住所の数。 結果がステータス
"F" にならなかった入力住所の数です。
• Total Unmatched Records — 検証または訂正できなかった入力住所の数。 結果がステータス "F"
になった入力住所の数と等しくなります。
• Standard Address Returned Successfully — Validate Global Address が正規化したマッチしない
(失敗した) 住所の数。 正規化は、オプション [マッチしなかった場合に正規化データを返す] が有効
になっている場合にのみ実行されます。 このオプションの詳細については、出力データ オプション
(304ページ)を参照。
Address Standardization Results Component Population Counts
このセクションには、このジョブで Validate Global Address が正規化した住所要素の数が配置されま
す。 正規化された各要素の合計値と全体に占める割合が表示されます。 例えば、[通り名] がカウント
6、パーセント 11、およびパーセント 92% を示す場合、ジョブで正規化された通り名が 11 あり、ジョ
ブ全体の通り名の 92% に相当することを意味します。
Address Validation Results
このセクションには、ジョブのバリデーション レベルが配置されます。 バリデーション レベルの詳
細については、ACR コード(318ページ) を参照してください。
Address Correction Results
このセクションは、このジョブの ACR (住所訂正結果) コードのコンポーネント ステータス部を一覧
表示します。 テーブルの先頭の行には、コンポーネント ステータス コードが格納されます。 テーブ
ルの本体には、各住所要素の数が格納されます。 例えば、コンポーネント ステータス コードが 0 で
ある通り名の数が表示され、次にコードが 1 の通り名の数が表示され、以降もこれと同様です。 ACR
コードのコンポーネント ステータス部の詳細については、ACR コード(318ページ)を参照してくだ
さい。
Validation/Correction Records
このセクションには、郵便番号の検証と訂正に関する情報が表示されます。
• Original Postal Code Confirmed Via Address Match — 郵便番号の ACR コンポーネント ステー
タスが 2 である住所の数。
316
Spectrum™ Technology Platform 8.0.0
第 19 章 : Address Now モジュール
• Postal Code Corrected Via Address Match — Validate Global Address によって誤りが訂正された
入力郵便番号の数。
• Original Postal Code Retained — 郵便番号の ACR コンポーネント ステータスが 1 である住所の
数。
• No Postal Code Available — 住所に対応する郵便番号が郵便データに含まれていません。
Matched Records
このセクションには、Address Now モジュール データベース内の既知の住所にマッチした入力住所に
関する情報が配置されます。
• Total Records Valid On Input — 正しいことが確認された住所の数。
• Total Corrected — Validate Global Address が訂正した住所の数。
• Total Records Successfully Matched — 検証または訂正に成功した住所の総数。
Unmatched Records
このセクションには、Validate Global Address が確認または訂正できなかった入力住所に関する情報
が配置されます。
• Street Mismatch — 通り名を検証または訂正できなかった住所の数。
• House Mismatch — 家番号を検証または訂正できなかった住所の数。
• Total Unmatched Records — 検証または訂正できなかった住所の総数。
Records Processed
このセクションには、処理されたレコードの数が地域別に一覧表示されます。
• Records Processed By US — 米国のマッチング ロジックで処理された住所の数。
• Records Processed By Canada — カナダのマッチング ロジックで処理された住所の数。
• Records Processed By International — 国際的な (米国/カナダ以外の) マッチング ロジックで処理
された住所の数。
• Total Records Processed — ジョブで処理したレコードの総数。
Address Now Summary Report By Country
このレポートには、処理された住所の数、検証のレベルなどの要約情報が国別に一覧表示されます。
Address Now Detailed Report By Country
このレポートには、各住所要素の検証結果が国別に一覧表示されます。
ユーザ ガイド
317
ACR コード
ACR コード
ACR (住所訂正結果) コードは、各レコードでどのデータが変更されたかを示します。 ACR は、以下
のような形式です。
L5-P0S0A5T1R0Z0C4-098
ACR コードは、以下の 3 つの部分で構成されています。
• バリデーション レベル
• コンポーネント ステータス
• 検証マッチ スコア
バリデーション レベル
住所訂正結果の最初の 2 文字は、バリデーションのタイプとレベルを表します。
最初の文字 (常に英字) はバリデーションのタイプを示します。
• U — 住所の正規化ができません。
• C — 住所はコンポーネント形式です。
• L — 住所は書式が設定され、住所行に変換されました。
• R — 住所は元に戻されました。許容レベルに達していません。
2 番目の文字 (常に数字) はバリデーションのレベルを示します。 数字が大きいほど、バリデーション
のレベルが高くなります。 到達できるレベルは以下のとおりです。
• 0 — コンポーネントはいずれも検証されませんでした。
• 1 — 国名のみが検証されました。
• 2 — 都市名と国名が検証されました。
• 3 — 都市名、郵便コード、および国名が検証されました。
• 4 — 通り名、都市名、郵便コード、および国名が検証されました。
• 5 — 敷地番号、建物名、従属する建物名、私書箱、企業名、通り名、都市名、郵便コード、および
国名が検証されました。
コンポーネント ステータス
ACR コードの 2 番目の部分は、住所の主要コンポーネントのステータスを表します。 住所のコンポー
ネントは、以下のように識別されます。
• 3、4 文字目: P — 敷地/家番号
• 5、6 文字目: S — 通り
• 7、8 文字目: A — 従属する都市 (都市エリア)
• 9、10 文字目: T — 都市
318
Spectrum™ Technology Platform 8.0.0
第 19 章 : Address Now モジュール
• 11、12 文字目: R — 地域/州
®
• 13、14 文字目: Z — 郵便番号/ZIP Code
• 15、16 文字目: C — 国
コンポーネントの直後には数字が 1 文字配置され、以下のいずれかの値を示します。
• 0 — 見つかりません/空。
• 1 — 入力データ内での位置に基づいて推測しました。
• 2 — Address Now モジュール データベースに基づいて認識されました。
• 3 — Address Now モジュール データベースに基づいて認識され、正規の形式に変換されました。
• 4 — Address Now モジュール データベースを使って検証されました。
• 5 — Address Now モジュール データベースを使って更新/訂正されました。
• 4 — Address Now モジュール データベースを使って追加されました。
• 7 — 正常な空。
• 8 — Address Now モジュール データベースを使って部分的に認識されました。
• 9 — 訂正して Address Now モジュール データベースに一致させる必要があります。
検証マッチ スコア
検証マッチ スコアは、ACR コードの最後の 3 文字 (17 〜 19 文字目) に設定されます。 これは、正規
化データ (コンポーネント形式のデータ) を、Address Now モジュール データベースから返されたマッ
チ候補と比較した結果です。
このスコアを計算するために、Address Now モジュール データベースから返されたすべてのフィール
ドが確認され、それらが個別に既存のコンポーネント データと比較されます。 その後、全体のマッチ
スコアを計算するために、これらの個別の値から平均スコアが求められます。この計算には、住所バ
リデーションのオプションを設定するダイアログ ボックスで指定できるマッチ スコア重み付けが加味
されます。 次に例を示します。
入力データ:
住所行 1: 11 High Street
都市名: Anytown
国名: UK
正規化データ:
敷地番号: 11
通り名: High Street
都市名: Anytown
このレコードを検証すると、Address Now モジュール データベースからは以下のデータが返されま
す。
敷地番号: 11
通り名: High Street
ユーザ ガイド
319
ACR コード
都市名: Anytown
郵便番号: ZZ9 9ZZ
Address Now モジュール データベースを正規化データと比較すると、以下の結果が得られます。
• 敷地番号: 100% マッチ
• 通り名: 100% マッチ
• 都市名: 100% マッチ
• 郵便番号: 入力では空のため、未使用
これらの割合を結合すると、マッチ スコアは 100% となります。
別の例を以下に示します。
入力データ:
住所行 1: bergerstrasse 12
住所行 2: munich
住所行 3: 80124
国名: Germany
正規化データ:
敷地番号: 12
通り名: Bergerstr.
都市名: Munchen
郵便番号: 80124
Address Now モジュール データベースからの出力:
敷地番号: 12
通り名: Burgerstr.
都市名: Munchen
郵便番号: 80142
Address Now モジュール データベースの出力を正規化データと比較すると、以下の結果が得られま
す。
• 敷地番号:100% マッチ
• 通り名: 90% マッチ (実際の数値は、2 つの値をテキストとして照合して決定されます)
• 都市名: 100% マッチ
• 郵便番号: 80% マッチ (番号の位置が入れ替わっているため)
マッチ スコアの重み付けをすべて 1 に設定した場合、全体のマッチ スコアは 92% になります。 郵便
コードのマッチ スコア重み付けを増やすと、全体のマッチ スコアは減ります。これは、郵便番号コン
ポーネントのスコア (80%) が計算の際に重視されるからです。 都市名のマッチ スコア重み付けを増
やすと、全体のマッチ スコアは増えます。これは、都市名コンポーネントのスコア (100%) がより重
視されるからです。
320
Spectrum™ Technology Platform 8.0.0
第 19 章 : Address Now モジュール
次に例を示します。
L5-P4S4A5T5R4Z4C4-098
• L は、住所行を作成するために書式が設定されたことを意味します。
• バリデーション レベルは 5 です。Address Now モジュール データベースとのマッチングが最高レ
ベルで実行されたことを意味します。
• 従属する都市 (A) と都市 (T) を除き、すべてのコンポーネントが 4 に設定されています。これは、
Address Now モジュール データベースを使って検証されたことを意味します。
• 従属する都市と都市のコードはどちらも 5 に設定されています。これらのコンポーネントが Address
Now モジュール データベースに従って訂正されたことを意味します。
住所全体の Address Now モジュール データベースに対するマッチングは 98% です。
注: また、検証マッチ スコアの代わりに "SDS" という値が返される場合があります。 SDS が返され
るのは住所が正規化されなかったことを意味し、その場合、住所が元に戻された可能性がありま
す。
ユーザ ガイド
321
Advanced Matching モジュー
ル
このセクションの構成
• Advanced Matching モジュールとは . . . . . . . . . . . . . . . .324
• Best of Breed . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .324
• Candidate Finder . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .334
• Duplicate Synchronization . . . . . . . . . . . . . . . . . . . . . . . .337
• Filter . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .341
• Interflow Match . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .345
• Intraflow Match . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .359
• マッチ分析 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .374
• Match Key Generator . . . . . . . . . . . . . . . . . . . . . . . . . . . .398
• Transactional Match . . . . . . . . . . . . . . . . . . . . . . . . . . . . .400
20
Advanced Matching モジュールとは
Advanced Matching モジュールとは
Advanced Matching モジュールは、複数の入力ファイル間や、複数の入力ファイル内でレコードを照
合します。 また、Advanced Matching モジュールでは、名前、住所、名前と住所、名前/住所以外の
フィールド (社会保障番号、生年月日等) 等、さまざまなフィールドの照合も可能です。
Advanced Matching モジュールは、次のコンポーネントで構成されます。
• Best-of-Breed — このコンポーネントは、プライマリ/テンプレート レコードを選択して、そのレ
コードから複合的な最良のレコードを作成することで、重複クラスタから最良の組み合わせレコー
ドを選択します。 このレコードは、サバイバ レコードとして返されます。 詳細については、Best
of Breed(324ページ)を参照してください。
• Candidate Finder — このコンポーネントは、候補レコードを取得します。これらの候補レコード
は、一連の潜在的なマッチとして、Transactional Match コンポーネントで評価されます。 Candidate
Finder は Transactional Match と併用します。 詳細については、Candidate Finder(334ページ)を
参照してください。
• Duplicate Synchronization — このコンポーネントでは、レコードのコレクションからフィールド
を指定して、そのフィールドをコレクション内のすべてのレコードの対応するフィールドにコピー
(配置) できます。 詳細については、Duplicate Synchronization(337ページ)を参照してください。
• Filter — このコンポーネントでは、重複レコードのコレクションから削除するレコードと、そのコ
レクションに残すレコードを選別する条件を指定できます。この条件によって絞り込まれたレコー
ドは、下流でさらに処理されるか、出力ファイルに書き込まれます。詳細については、Filter(341ペー
ジ)を参照してください。
• Interflow Match — このコンポーネントは、複数の入力ストリーム内の類似するデータ レコード間
でマッチを識別します。 詳細については、Interflow Match(345ページ)を参照してください。
• Intraflow Match — このコンポーネントは、単一の入力ストリーム内の類似するデータ レコード間
でマッチを識別します。 詳細については、Intraflow Match(359ページ)を参照してください。
• Match Key Generator — このコンポーネントは、すべての類似レコードで共有する非ユニーク キー
を作成します。 同じキーを共有するレコードは、グループ化して比較できます。 詳細については、
Match Key Generator(398ページ)を参照してください。
• Transactional Match — このコンポーネントは、Candidate Finder ステージでクエリを実行してサ
スペクト トランザクションをデータベースと照合し、可能性がある候補レコードを返します。 詳細
については、Transactional Match(400ページ)を参照してください。
• マッチ分析 — マッチ分析では、マッチング コンポーネントからの結果を分析および比較して、マッ
チング処理の結果を詳細に把握できます。また、マッチ分析は、マッチング結果の向上に役立てる
こともできます。 詳細については、マッチ分析(374ページ)を参照してください。
Best of Breed
Best of Breed は、重複レコードのコレクションから選択する最良のデータを使用して新しい統合レ
コードを作成することで、重複レコードを統合します。 この "スーパー" レコードは、最良の組み合わ
324
Spectrum™ Technology Platform 8.0.0
第 20 章 : Advanced Matching モジュール
せレコードと呼ばれます。 処理対象レコードの選択で使用するルールを定義します。 処理が完了する
と、最良の組み合わせレコードがシステムに保持されます。
オプション
グループ化
[グループ化方法] オプションは、レコードをグループ化するのに使うフィールドを指定します。 [グ
ループ化方法] リストでフィールドを選択すると、[ソート] オプションと [詳細設定] ボタンが使用可
能になります。デフォルトで、[ソート] オプションはオンになっています。
追加のソート パフォーマンス オプションを指定するには、[詳細設定] をクリックして、[詳細オプショ
ン] ダイアログ ボックスを開きます。 [詳細オプション] ダイアログ ボックスには、次のソート パフォー
マンス オプションがあります。
• ソート パフォーマンス オプションをオーバーライド — これらのオプションをデフォルトのソート
パフォーマンス オプションよりも優先します。
• メモリ内レコードの上限値 — ソートでメモリ内に保持できるデータ行の最大数を指定します。この
上限を越えると、ディスクにページングします。
• 使用する一時ファイルの最大数 — ソート プロセスで使用できる一時ファイルの最大数を指定しま
す。
• 圧縮を有効にする — 一時ファイルをディスクに書き込むときに圧縮します。
注: ソートを最も効率的に実行できるソート パフォーマンス オプション設定の組み合わせは、サー
バーのハードウェア構成によって異なります。 ただし、次の一般的なガイドラインに従うと、良
好なパフォーマンスでソートを実行できることが確認されています。
(メモリ内レコードの上限値 × 使用する一時ファイルの最大数 ÷ 2) >= ソートする行数の合計。
複数のジョブを同時並行で実行する環境では、[メモリ内レコードの上限値] の設定を増やすと、
メモリ不足になる可能性が高くなります。
追加のソート パフォーマンス オプションを指定したら、[OK] をクリックして、[詳細オプション] ダ
イアログ ボックスを閉じて、[Best of Breed オプション] ダイアログ ボックスに戻ります。
元のレコードを保持
Best of Breed レコードと共にコレクション内のすべてのレコードを保持するには、[元のレコードを保
持] オプションを選択します。 Best of Breed レコードのみが必要な場合は、このオプションをオフに
します。
テンプレート レコード設定
テンプレート レコードは、Best of Breed レコードを作成するレコードです。 テンプレート レコード
は必要に応じて自動的に選択されます。また、テンプレート レコードを選択するルールを独自に指定
することもできます。 テンプレート ルールを作成するには、フィールド名、演算子、値タイプ、およ
び値を指定します。 テンプレート レコード オプションの例を以下に示します。
ユーザ ガイド
325
Best of Breed
フィールド名: MatchScore
フィールド タイプ: 数値
演算子: 等しい
値タイプ: 文字列
値: 100
このテンプレート ルールを適用すると、マッチ スコアが値 100 に等しいレコードが選択されます。
以下のオプションを使って、テンプレート レコード設定を制御できます。
表 49 : テンプレート レコード設定
オプション
説明
最初のレコードを使用
コレクションの最初のレコードをテンプレート レコードとして自動的に使
用するには、このオプションを選択します。
テンプレート レコード
を定義
テンプレート レコードを選択するルールを定義する場合は、このオプショ
ンを選択します。
テンプレート レコード ルールを追加するには、階層内で [ルール] ノードを選択します。 [テンプレー
ト レコード設定] フレームで [ルールの追加] ボタンをクリックします。 [テンプレート レコード ルー
ルのオプション] ダイアログ ボックスが表示されます。
テンプレート レコード ルールをさらに追加するには、[ルール] ノードを選択して [ルールの追加] をク
リックするか、[ルール] ノードの下にある定義済みのルールを選択して [ルールの挿入] をクリックし
ます。 [テンプレート レコード ルールのオプション] ダイアログ ボックスが表示されます。 このダイ
アログ ボックスには、[論理演算子] オプションが追加で表示されます。
テンプレート ルールを変更するには、[変更] をクリックします。 ルールを変更する場合、論理演算子
は変更できません。
以下のテーブルで、テンプレート レコード ルールのオプションについて説明します。
注: テンプレート レコード、Best of Breed レコード、およびフィルタリングのルールは同じ方法で
定義します。
表 50 : テンプレート レコード ルールのオプション
オプション
論理演算子
説明
ルールを追加するための適切なロジックを指定します。 次のいずれかを選
択します。
• And
• Or
ルールを既存の [ルール] ノードに追加する場合にのみ使用できます。
326
Spectrum™ Technology Platform 8.0.0
第 20 章 : Advanced Matching モジュール
オプション
説明
フィールド名
テストする入力レコードのフィールド。
フィールド タイプ
フィールドの値が数値なのか数値以外なのかを指定します。
演算子
フィールドに実行する比較方法を指定します。 有効な演算子は、以下のと
おりです。
含む
フィールドが指定された値を含むかどうかを確認します。 例
えば、"sailboat" には値 "boat" が含まれます。
等しい
フィールドが指定された値に正確に一致するかどうかを確認
します。
次の値より フィールド値が指定された値よりも大きいかどうかを確認し
大きい
ます。 この演算子は、数値のフィールドにのみ有効です。
次の値以上 フィールド値が指定された値に一致するか、またはそれより
も大きいかどうかを確認します。 この演算子は、数値の
フィールドにのみ有効です。
最高
フィールドの値をグループ内のすべてのレコードについて
チェックし、最も大きな値が格納されているレコードを特定
します。 例えば、グループ内でフィールドに値 10、20、30、
および 100 が格納されている場合、フィールド値が 100 の
レコードが選択されます。 この演算子は、数値のフィールド
にのみ有効です。 最高値が複数のレコードにある場合は、一
つのレコードが選択されます。
空
フィールドに値がないことを確認します。
空でない
フィールドに値が含まれているかどうかを確認します。
次の値より フィールド値が指定された値よりも小さいかどうかを確認し
小さい
ます。 この演算子は、数値のフィールドにのみ有効です。
次の値以下 フィールド値が指定された値以下であるかどうかを確認しま
す。 この演算子は、数値のフィールドにのみ有効です。
ユーザ ガイド
最長
グループ内のすべてのレコードのフィールドの値を比較し、
フィールドに (バイト数が) 最長の値が格納されているレコー
ドを特定します。 例えば、グループ内に、"Mike" という値と
"Michael" という値が含まれる場合、"Michael" という値が格
納されているレコードが選択されます。 最長値が複数のレ
コードにある場合は、一つのレコードが選択されます。
最低
グループ内のすべてのレコードのフィールドの値を比較し、
フィールドに最も小さい値が格納されているレコードを特定
します。 例えば、グループ内に、値 10、20、30、および
327
Best of Breed
オプション
説明
100 が格納されているフィールドがある場合、フィールド値
が 10 のレコードが選択されます。 この演算子は、数値の
フィールドにのみ有効です。 最低値が複数のレコードにある
場合は、一つのレコードが選択されます。
最多
フィールド値が、グループ内のレコードのこのフィールドに
おいて最も多く出現する値であるかどうかを確認します。 最
多の値が複数存在する場合、アクションは実行されません。
等しくない フィールド値が指定された値に一致しないことを確認しま
す。
値タイプ
このオプションは、最高、最低、または最長以外の演算子が選択されてい
る場合のみ有効です。 有効な値タイプは次のとおりです。
• フィールド
• 文字列
値
このオプションは、最高または最低以外の演算子が選択されている場合の
み有効です。 このフィールドの値は、選択されている演算子に応じて、
[フィールド名] の値と比較されます。
[値タイプ] が「フィールド」の場合、フィールドの一覧が [値] オプション
ドロップ ダウン リストに表示されます。 [値タイプ] が「文字列」の場合
は、[値] テキスト ボックスに定数値を入力します。
ルール
Best of Breed ルール (最善の組み合わせルール) は、コレクション内のどのフィールドを Best of Breed
レコードにコピーするかを決定します。 Best of Breed ルールを追加するには、階層内で [ルール] ノー
ドを選択します。 [Best of Breed 設定] フレームで、[ルールの追加] をクリックします。 [ルール オプ
ション] ダイアログ ボックスが表示されます。
Best of Breed ルールをさらに追加するには、[ルール] ノードを選択して [ルールの追加] をクリックす
るか、[ルール] ノードの下にある定義済みのルールを選択して [ルールの挿入] をクリックします。
[ルール オプション] ダイアログ ボックスが表示されます。 このダイアログ ボックスには、[論理演算
子] オプションが追加で表示されます。
328
Spectrum™ Technology Platform 8.0.0
第 20 章 : Advanced Matching モジュール
注: テンプレート レコード、Best of Breed レコード、および Filter ルールは同じ方法で定義します。
表 51 : Best of Breed ルール オプション
オプション
論理演算子
説明
ルールを追加するための適切なロジックを指定します。 次のいずれかを選
択します。
• And
• Or
ルールを既存の [ルール] ノードに追加する場合にのみ使用できます。
フィールド名
入力レコード内のテストするフィールド。
フィールド タイプ
フィールドの値が数値なのか数値以外なのかを指定します。
演算子
フィールドに実行する比較方法を指定します。 有効な演算子は、以下のと
おりです。
含む
フィールドが指定された値を含むかどうかを確認します。 例
えば、"sailboat" には値 "boat" が含まれます。
等しい
フィールドが指定された値に正確に一致するかどうかを確認
します。
次の値より フィールド値が指定された値よりも大きいかどうかを確認し
大きい
ます。 この演算子は、数値のフィールドにのみ有効です。
次の値以上 フィールド値が指定された値に一致するか、またはそれより
も大きいかどうかを確認します。 この演算子は、数値の
フィールドにのみ有効です。
最高
ユーザ ガイド
フィールドの値をグループ内のすべてのレコードについて
チェックし、最も大きな値が格納されているレコードを特定
329
Best of Breed
オプション
説明
します。 例えば、グループ内でフィールドに値 10、20、30、
および 100 が格納されている場合、フィールド値が 100 の
レコードが選択されます。 この演算子は、数値のフィールド
にのみ有効です。 最高値が複数のレコードにある場合は、一
つのレコードが選択されます。
空
フィールドに値がないことを確認します。
空でない
フィールドに値が含まれているかどうかを確認します。
次の値より フィールド値が指定された値よりも小さいかどうかを確認し
小さい
ます。 この演算子は、数値のフィールドにのみ有効です。
次の値以下 フィールド値が指定された値以下であるかどうかを確認しま
す。 この演算子は、数値のフィールドにのみ有効です。
最長
グループ内のすべてのレコードのフィールドの値を比較し、
フィールドに (バイト数が) 最長の値が格納されているレコー
ドを特定します。 例えば、グループ内に、"Mike" という値と
"Michael" という値が含まれる場合、"Michael" という値が格
納されているレコードが選択されます。 最長値が複数のレ
コードにある場合は、一つのレコードが選択されます。
最低
グループ内のすべてのレコードのフィールドの値を比較し、
フィールドに最も小さい値が格納されているレコードを特定
します。 例えば、グループ内に、値 10、20、30、および
100 が格納されているフィールドがある場合、フィールド値
が 10 のレコードが選択されます。 この演算子は、数値の
フィールドにのみ有効です。 最低値が複数のレコードにある
場合は、一つのレコードが選択されます。
最多
フィールド値が、グループ内のレコードのこのフィールドに
おいて最も多く出現する値であるかどうかを確認します。 最
多の値が複数存在する場合、アクションは実行されません。
等しくない フィールド値が指定された値に一致しないことを確認しま
す。
値タイプ
このオプションは、最高、最低、または最長以外の演算子が選択されてい
る場合のみ有効です。 有効な値タイプは次のとおりです。
• フィールド
• 文字列
330
Spectrum™ Technology Platform 8.0.0
第 20 章 : Advanced Matching モジュール
オプション
値
説明
このオプションは、最高または最低以外の演算子が選択されている場合の
み有効です。 このフィールドの値は、選択されている演算子に応じて、
[フィールド名] の値と比較されます。
[値タイプ] がフィールドの場合、フィールドの一覧が [値] オプション ドロッ
プ ダウン リストに表示されます。 [値タイプ] が文字列の場合は、[値] テキ
スト ボックスに定数値を入力します。
アクション
Best of Breed アクション ルールは、デスティネーション フィールドにコピーするソース データのタ
イプを指定します。 接続にアクションを追加するには、追加する Best of Breed 条件の中のアクショ
ンを選択し、[アクションの追加] ボタンをクリックします。 [アクションのオプション] ダイアログ
ボックスが表示されます。 アクションのオプションの各フィールドを以下に示します。
表 52 : Best of Breed アクションのオプション
オプション
ソース タイプ
説明
有効な値タイプは次のとおりです。
• フィールド
• 文字列
ソース データ
[ソース タイプ] がフィールドの場合、[ソース データ] の値が [デスティネー
ション] フィールドにコピーされます。 [ソース タイプ] が文字列の場合、
[ソース データ] に定義した定数値がデスティネーション フィールドにコ
ピーされます。
出力先
ソース データをコピーするコピー先のフィールド。
ソース データを蓄積
アクション条件を満たすフィールド値を蓄積するかどうかを指定します。
Best of Breed ルールの例
この Best of Breed ルールを適用すると、マッチ スコアが値 100 に等しいレコードが選択されます。
続いて、選択されたフィールドに対応する顧客番号データが、Best of Breed レコード上の
AccountNumber フィールドにコピーされます。
ルール
フィールド名: MatchScore
フィールド タイプ: 数値
演算子: 等しい
値タイプ: 文字列
ユーザ ガイド
331
Best of Breed
値: 100
アクション
ソース タイプ: フィールド
ソース データ: AccountNumber
デスティネーション: AccountNumber
SQL クエリの定義
有効な SQL SELECT 文を [Candidate Finder オプション] ダイアログ ボックスのテキスト ボックス
に入力できます。
注: Select * は無効です。
例えば、Customer_Table というテーブルがデータベース内にあり、以下の列が含まれると仮定しま
す。
•
•
•
•
•
•
Customer_Table
Cust_Name
Cust_Address
Cust_City
Cust_State
Cust_Zip
データベースからこれらの行をすべて取得するには、次のようなクエリを作成します。
select Cust_Name, Cust_Address, Cust_City, Cust_State, Cust_Zip from
Customer_Table;
データベース内のすべての行にマッチするようなトランザクションを実行することは、実際にはほと
んどないでしょう。 必要な候補レコードのみを返すには、置換変数を使って WHERE 節を追加しま
す。 置換変数は、変数をサスペクト レコードの実データで置換するように Candidate Selection エン
ジンに指示するために使用できる特殊な表記です。
置換変数を使うには、${FieldName} のようにフィールド名をカッコで囲み、その直前にドル記号を付
けます。 例えば、SQL 2005 の使用時は、次のクエリを実行すると、サスペクト レコード内の
PostalCode の値に Cust_Zip の値が一致するレコードのみが返されます。
select Cust_Name, Cust_Address, Cust_City, Cust_State,Cust_Zip
from Customer_Table
where Cust_Zip = ${PostalCode};
SQL 2000 では、データ タイプは Candidate Finder で使われるタイプと同一である必要があります。
JDBC ドライバによって Candidate Finder 入力変数 (例えば ${MatchKey}) が設定され、これが "WHERE"
節で nVarChar(4000) データ タイプに使用されます。 データベース内でデータが VarChar データ タ
イプに設定されている場合、SQL Server はデータベースのインデックスを無視します。 インデック
332
Spectrum™ Technology Platform 8.0.0
第 20 章 : Advanced Matching モジュール
スが無視されると、パフォーマンスが著しく低下します。 したがって、SQL 2000 では以下のクエリ
を使ってください。
select Cust_Name, Cust_Address, Cust_City, Cust_State,Cust_Zip
from Customer_Table
where Cust_Zip = CAST(${PostalCode} AS VARCHAR(255));
データベース列をステージ フィールドにマッピングする
データベース内の列名が [Component Field] 名に完全に一致する場合、列名は対応するステージ フィー
ルドに自動的にマッピングされます。 名前が正確に一致しない場合は、選択フィールド (データベー
スの列) を使ってステージ フィールド (データフローで定義されたフィールド名) にマッピングする必
要があります。
例えば、Customer_Table という名前のテーブルに次の列があるとします。
•
•
•
•
•
Cust_Name
Cust_Address
Cust_City
Cust_State
Cust_Zip
これらのレコードをデータベースから取得するには、列名を、Transactional Match およびデータフ
ロー内の他のコンポーネントで使われるフィールド名にマッピングする必要があります。 例えば、
Cust_Address は AddressLine1 にマッピングし、Cust_Zip は PostalCode にマッピングします。
1. [Candidate Finder オプション] ダイアログの [選択フィールド] の下でドロップダウン リストを選
択します。 次に、データベース列 Cust_Zip を選択します。
2. [ステージ フィールド] の下でドロップダウン リストを選択します。 次に、マッピングするフィー
ルドを選択します。
例えば、Cust_Zip を Postal Code にマッピングするには、最初に選択フィールドで Cust_Zip を選択
してから、対応するステージ フィールドの行で PostalCode を選択します。
別のフィールド マッピング方法
SQL クエリで特殊な表記を使ってマッピングを実行できます。 列名の後に、マッピング先のフィール
ド名をカッコで囲んで記述します。 このように表記すると、選択フィールドは対応するステージ フィー
ルドに自動的にマッピングされます。
例を次に示します。
select Cust_Name {Name}, Cust_Address {AddressLine1},
Cust_City {City}, Cust_State {StateProvince},
Cust_Zip {PostalCode}
from Customer
where Cust_Zip = ${PostalCode};
ユーザ ガイド
333
Candidate Finder
出力
表 53 : Best of Breed 出力
フィールド名
書式
CollectionRecordType 文字列
説明/有効値
重複するレコードのコレクションからテンプレートと Best of Breed
レコードを識別します。 有効な値を次に示します。
Primary
レコードは、コレクションの選択されたテンプレー
ト レコードです。
Secondary
レコードは、コレクションの選択されたテンプレー
ト レコードではありません。
BestOfBreed
レコードは、コレクションの新規作成 Best of Breed
レコードです。
Candidate Finder
Candidate Finder は、候補レコードを取得します。これらの候補レコードは、一連の潜在的なマッチ
として、Transactional Match で評価されます。 Candidate Finder は Transactional Match と組み合わ
せて使用します。 また、Candidate Finder では、データの書式によっては、サスペクト レコード、候
補レコード、またはその両方のレコードの名前や住所のパーシングが必要となる場合もあります。
オプション
[Candidate Finder] ダイアログを使って、潜在的なマッチ候補をデータベースから取得する SQL 文を
定義したり、データベースから選択した列をデータフローで定義したフィールド名にマッピングする
ことができます。
Candidate Finder オプションを定義するには
1. キャンバスで、Candidate Finder のインスタンスをダブルクリックします。
[Candidate Finder オプション] ダイアログ ボックスが表示されます。
2. [Connection] フィールドで、候補レコードが含まれるデータベースを選択します。 Management
Console で設定されたいずれかの接続を選択できます。 リストにないデータベースに接続するに
は、Management Console でそのデータベースへの接続を設定してから CandidateFinder をいった
ん閉じ、再び開いて接続リストの内容を更新します。 データベース接続の作成の詳細については、
Management Console のドキュメントを参照してください。
3. SQL クエリの定義(335ページ)の説明に従って、SQL 文をテキスト ボックスに入力します。
334
Spectrum™ Technology Platform 8.0.0
第 20 章 : Advanced Matching モジュール
4. [設定] をクリックします。
5. データベース列をステージ フィールドにマッピングする(336ページ)の説明に従って、フィール
ド マッピング設定を選択します。
6. 必要であれば、サスペクト データを入力してから [プレビュー] タブをクリックしてクエリをテス
トします。
プレビュー機能によって SQL SELECT 文が実行され、クエリ結果が表示されます。 SELECT 文
に定義したデータベース列ごとに 1 つの列が返されます。
7. [OK] をクリックして、設定を保存します。
SQL クエリの定義
有効な SQL SELECT 文を [Candidate Finder オプション] ダイアログ ボックスのテキスト ボックス
に入力できます。
注: Select * は無効です。
例えば、Customer_Table というテーブルがデータベース内にあり、以下の列が含まれると仮定しま
す。
•
•
•
•
•
•
Customer_Table
Cust_Name
Cust_Address
Cust_City
Cust_State
Cust_Zip
データベースからこれらの行をすべて取得するには、次のようなクエリを作成します。
select Cust_Name, Cust_Address, Cust_City, Cust_State, Cust_Zip from
Customer_Table;
データベース内のすべての行にマッチするようなトランザクションを実行することは、実際にはほと
んどないでしょう。 必要な候補レコードのみを返すには、置換変数を使って WHERE 節を追加しま
す。 置換変数は、変数をサスペクト レコードの実データで置換するように Candidate Selection エン
ジンに指示するために使用できる特殊な表記です。
置換変数を使うには、${FieldName} のようにフィールド名をカッコで囲み、その直前にドル記号を付
けます。 例えば、SQL 2005 の使用時は、次のクエリを実行すると、サスペクト レコード内の
PostalCode の値に Cust_Zip の値が一致するレコードのみが返されます。
select Cust_Name, Cust_Address, Cust_City, Cust_State,Cust_Zip
from Customer_Table
where Cust_Zip = ${PostalCode};
SQL 2000 では、データ タイプは Candidate Finder で使われるタイプと同一である必要があります。
JDBC ドライバによって Candidate Finder 入力変数 (例えば ${MatchKey}) が設定され、これが "WHERE"
節で nVarChar(4000) データ タイプに使用されます。 データベース内でデータが VarChar データ タ
イプに設定されている場合、SQL Server はデータベースのインデックスを無視します。 インデック
ユーザ ガイド
335
Candidate Finder
スが無視されると、パフォーマンスが著しく低下します。 したがって、SQL 2000 では以下のクエリ
を使ってください。
select Cust_Name, Cust_Address, Cust_City, Cust_State,Cust_Zip
from Customer_Table
where Cust_Zip = CAST(${PostalCode} AS VARCHAR(255));
データベース列をステージ フィールドにマッピングする
データベース内の列名が [Component Field] 名に完全に一致する場合、列名は対応するステージ フィー
ルドに自動的にマッピングされます。 名前が正確に一致しない場合は、選択フィールド (データベー
スの列) を使ってステージ フィールド (データフローで定義されたフィールド名) にマッピングする必
要があります。
例えば、Customer_Table という名前のテーブルに次の列があるとします。
•
•
•
•
•
Cust_Name
Cust_Address
Cust_City
Cust_State
Cust_Zip
これらのレコードをデータベースから取得するには、列名を、Transactional Match およびデータフ
ロー内の他のコンポーネントで使われるフィールド名にマッピングする必要があります。 例えば、
Cust_Address は AddressLine1 にマッピングし、Cust_Zip は PostalCode にマッピングします。
1. [Candidate Finder オプション] ダイアログの [選択フィールド] の下でドロップダウン リストを選
択します。 次に、データベース列 Cust_Zip を選択します。
2. [ステージ フィールド] の下でドロップダウン リストを選択します。 次に、マッピングするフィー
ルドを選択します。
例えば、Cust_Zip を Postal Code にマッピングするには、最初に選択フィールドで Cust_Zip を選択
してから、対応するステージ フィールドの行で PostalCode を選択します。
別のフィールド マッピング方法
SQL クエリで特殊な表記を使ってマッピングを実行できます。 列名の後に、マッピング先のフィール
ド名をカッコで囲んで記述します。 このように表記すると、選択フィールドは対応するステージ フィー
ルドに自動的にマッピングされます。
例を次に示します。
select Cust_Name {Name}, Cust_Address {AddressLine1},
Cust_City {City}, Cust_State {StateProvince},
Cust_Zip {PostalCode}
from Customer
where Cust_Zip = ${PostalCode};
336
Spectrum™ Technology Platform 8.0.0
第 20 章 : Advanced Matching モジュール
出力
表 54 : Candidate Finder 出力
フィールド名
書式
説明/有効値
CandidateGroup
文字列
このフィールドは、サスペクト レコードとその候補のグルー
プを表します。 各サスペクト レコードには、
CandidateGroup 番号が与えられます。. サスペクトの候補
には、同じ CandidateGroup 番号が与えられます。 例え
ば、"John Smith" がサスペクト レコードであり、候補レコー
ドが "John Smith" と "Mike Ryan" である場合、これらの 3
つのレコードはどれも同じ CandidateGroup 値を持ちます。
TransactionalRecordType
文字列
値は次のいずれかです。
Suspect
サスペクト レコードは、クエリへの入力と
して使われます。
Candidate
候補レコードは、クエリから結果として返さ
れます。
Duplicate Synchronization
Duplicate Synchronization は、レコードのコレクションから、そのコレクション内のすべてのレコー
ドの対応するフィールドにコピーするフィールドを指定します。 フィールド データをコレクション内
の別のレコードにコピーするときに従う必要があるルールを指定できます。 処理が完了すると、コレ
クション内のレコードがすべて保持されます。
オプション
グループ化
[グループ化] ドロップダウン ボックスは、レコードのグループ化を指定するために使用できます。
[グループ化] リストでフィールドを選択すると、[ソート] オプションと [詳細設定] ボタンが有効にな
ります ([ソート] オプションはデフォルトでオンです)。
追加のソート パフォーマンス オプションを指定するには、[詳細設定] をクリックして、[詳細オプショ
ン] ダイアログ ボックスを開きます。
[詳細オプション] ダイアログ ボックスには、次のソート パフォーマンス オプションがあります。
ユーザ ガイド
337
Duplicate Synchronization
• ソート パフォーマンス オプションをオーバーライド — これらのオプションをデフォルトのソート
パフォーマンス オプションよりも優先します。
• メモリ内レコードの上限値 — ソートでメモリ内に保持できるデータ行の最大数を指定します。この
上限を越えると、ディスクにページングします。
• 使用する一時ファイルの最大数 — ソート プロセスで使用できる一時ファイルの最大数を指定しま
す。
• 圧縮を有効にする — 一時ファイルをディスクに書き込むときに圧縮します。
注: ソートを最も効率的に実行できるソート パフォーマンス オプション設定の組み合わせは、サー
バーのハードウェア構成によって異なります。 ただし、次の一般的なガイドラインに従うと、良
好なパフォーマンスでソートを実行できることが確認されています。 (メモリ内レコードの上限
値 × 使用する一時ファイルの最大数 ÷ 2) >= ソートする行数の合計。複数のジョブを同時並行で
実行する環境では、[メモリ内レコードの上限値] の設定を増やすと、メモリ不足になる可能性が
高くなります。
追加のソート パフォーマンス オプションを指定したら、[OK] をクリックして、[詳細オプション] ダイ
アログ ボックスを閉じて、[Duplicate Synchronization オプション] ダイアログ ボックスに戻ります。
ルールの追加については、ここをクリックして説明を参照してください。
アクションの追加については、ここをクリックして説明を参照してください。
ルール オプション
ルールは、レコードから、同じコレクション内の他のすべてのレコードの対応するフィールドにコピー
するフィールドを指定します。
ルールを条件に追加するには、対応する条件の [ルール] ノードを選択し、[ルールの追加] ボタンをク
リックします。 [Duplicate Synchronization ルール オプション] ダイアログが表示されます。 これらの
フィールドの値を以下に示します。
表 55 : ルール オプション
オプション
説明
フィールド名
入力レコード内のテストするフィールド。
フィールド タイプ
フィールドの値が数値なのか数値以外なのかを指定します。
演算子
フィールドに実行する比較方法を指定します。 有効な演算子は、以下
のとおりです。
含む
338
フィールドが指定された値を含むかどうかを確認します。
例えば、"sailboat" には値 "boat" が含まれます。
Spectrum™ Technology Platform 8.0.0
第 20 章 : Advanced Matching モジュール
オプション
ユーザ ガイド
説明
等しい
フィールドが指定された値に正確に一致するかどうかを
確認します。
次の値よ
り大きい
フィールド値が指定された値よりも大きいかどうかを確
認します。 この演算子は、数値のフィールドにのみ有効
です。
次の値以
上
フィールド値が指定された値に一致するか、またはそれ
よりも大きいかどうかを確認します。 この演算子は、数
値のフィールドにのみ有効です。
最高
フィールドの値をグループ内のすべてのレコードについ
てチェックし、最も大きな値が格納されているレコード
を特定します。 例えば、グループ内でフィールドに値
10、20、30、および 100 が格納されている場合、フィー
ルド値が 100 のレコードが選択されます。 この演算子
は、数値のフィールドにのみ有効です。 最高値が複数の
レコードにある場合は、一つのレコードが選択されます。
空
フィールドに値がないことを確認します。
空でない
フィールドに値が含まれているかどうかを確認します。
次の値よ
り小さい
フィールド値が指定された値よりも小さいかどうかを確
認します。 この演算子は、数値のフィールドにのみ有効
です。
次の値以
下
フィールド値が指定された値以下であるかどうかを確認
します。 この演算子は、数値のフィールドにのみ有効で
す。
最長
グループ内のすべてのレコードのフィールドの値を比較
し、フィールドに (バイト数が) 最長の値が格納されてい
るレコードを特定します。 例えば、グループ内に、"Mike"
という値と "Michael" という値が含まれる場合、"Michael"
という値が格納されているレコードが選択されます。 最
長値が複数のレコードにある場合は、一つのレコードが
選択されます。
最低
グループ内のすべてのレコードのフィールドの値を比較
し、フィールドに最も小さい値が格納されているレコー
ドを特定します。 例えば、グループ内に、値 10、20、
30、および 100 が格納されているフィールドがある場
合、フィールド値が 10 のレコードが選択されます。 こ
の演算子は、数値のフィールドにのみ有効です。 最低値
339
Duplicate Synchronization
オプション
説明
が複数のレコードにある場合は、一つのレコードが選択
されます。
値タイプ
最多
フィールド値が、グループ内のレコードのこのフィール
ドにおいて最も多く出現する値であるかどうかを確認し
ます。 最多の値が複数存在する場合、アクションは実行
されません。
等しくな
い
フィールド値が指定された値に一致しないことを確認し
ます。
このオプションは、最高、最低、または最長以外の演算子が選択され
ている場合のみ有効です。 有効な値タイプは次のとおりです。
• フィールド
• 文字列
値
このオプションは、最高または最低以外の演算子が選択されている場
合のみ有効です。 このフィールドの値は、選択されている演算子に応
じて、[フィールド名] フィールドの値と比較されます。
[値タイプ] フィールドを「フィールド」に設定した場合、フィールド
の一覧が [値] オプション ドロップ ダウン リストに表示されます。 [値
タイプ] が「文字列」の場合は、[値] テキスト ボックスに定数値を入
力します。
ルールをさらに追加するには、[ルール] ノードを選択して [ルールの追加] をクリックするか、定義済
みのルールを選択して [ルールの挿入] をクリックします。 ルールを追加する場合は、ルールを接続す
るための論理演算子 (And/Or) を選択する必要があります。
アクションのオプション
アクションによって、選択されたフィールドにどのフィールドをコピーするかが決まります。 条件に
アクションを追加するには、追加する Duplicate Synchronization 条件の中のアクションを選択し、[ア
クションの追加] ボタンをクリックします。 [Duplicate Synchronization アクションのオプション] ダイ
アログが表示されます。 これらのフィールドの値を以下に示します。
340
Spectrum™ Technology Platform 8.0.0
第 20 章 : Advanced Matching モジュール
表 56 : アクションのオプション
オプション
説明
ソース タイプ
有効な値タイプは次のとおりです。
ソース データ
フィールド
コピーするソース データはフィールドです。
文字列
コピーするソース データは文字列です。
[ソース タイプ] が「フィールド」の場合、[ソース データ] の値が [デ
スティネーション] フィールドにコピーされます。
[ソース タイプ] が「文字列」の場合、[ソース データ] フィールドで指
定した定数値が [デスティネーション] フィールドにコピーされます。
デスティネーション
ソース データをコピーするコピー先のフィールド。
アクションをさらに追加するには、[アクション] ノードを選択して [アクションの追加] をクリックす
るか、定義済みのアクションを選択して [アクションの挿入] をクリックします。
Duplicate Synchronization ルールの例
この Duplicate Synchronization ルールを適用すると、マッチ スコアが値 100 に等しいレコードが選択
されます。 続いて、選択されたフィールドに対応する顧客番号データが、Best-of-Breed レコード上の
NewAccountNumber フィールドにコピーされます。
ルール フィールド名: MatchScore
フィールド タイプ: 数値
演算子: 等しい
値タイプ: 文字列
値: 100
アクション ソース タイプ: フィールド
ソース データ: AccountNumber
デスティネーション: NewAccountNumber
Filter
Filter コンポーネントは、指定したルールに基づいて、重複レコードのコレクションからレコードを削
除するか、レコードをコレクションに残します。
ユーザ ガイド
341
Filter
オプション
これらのオプションにより、フィルタ適用後に残るレコードが決まります。
• グループ化方法(342ページ)
• 返すレコードの数(342ページ)
• 重複の削減(343ページ)
• フィルタリングのルール(343ページ)
グループ化方法
[グループ化方法] オプションは、レコードをグループ化するのに使うフィールドを指定します。
[グループ化方法] リストでフィールドを選択すると、[ソート] オプションと [詳細設定] ボタンが使用
可能になります。デフォルトで、[ソート] オプションはオンになっています。
追加のソート パフォーマンス オプションを指定するには、[詳細設定] をクリックして、[詳細オプショ
ン] ダイアログ ボックスを開きます。
[詳細オプション] ダイアログ ボックスには、次のソート パフォーマンス オプションがあります。
• ソート パフォーマンス オプションをオーバーライド — これらのオプションをデフォルトのソート
パフォーマンス オプションよりも優先します。
• メモリ内レコードの上限値 — ソートでメモリ内に保持できるデータ行の最大数を指定します。この
上限を越えると、ディスクにページングします。
• 使用する一時ファイルの最大数 — ソート プロセスで使用できる一時ファイルの最大数を指定しま
す。
• 圧縮を有効にする — 一時ファイルをディスクに書き込むときに圧縮します。
注: ソートを最も効率的に実行できるソート パフォーマンス オプション設定の組み合わせは、サー
バーのハードウェア構成によって異なります。 ただし、次の一般的なガイドラインに従うと、良
好なパフォーマンスでソートを実行できることが確認されています。 (メモリ内レコードの上限
値 × 使用する一時ファイルの最大数 ÷ 2) >= ソートする行数の合計。複数のジョブを同時並行で
実行する環境では、[メモリ内レコードの上限値] の設定を増やすと、メモリ不足になる可能性が
高くなります。
追加のソート パフォーマンス オプションを指定したら、[OK] をクリックして、[詳細オプション] ダイ
アログ ボックスを閉じて、[Filter オプション] ダイアログ ボックスに戻ります。
返すレコードの数
[返される重複レコード数の上限値] オプションは、各コレクションから返されるレコードの最大数を
指定します。 例えば、コレクション内でマッチ スコアが最も高いレコードを保持するルールが定義さ
れているときにこのオプションを 1 に設定すると、そのレコードのみが返されます。
注: このオプションを 1 に設定した場合、[Filter] ルールを定義しないという選択肢もあります。 ルー
ルを定義しないと、各コレクションの先頭のレコードが出力に返されます。
342
Spectrum™ Technology Platform 8.0.0
第 20 章 : Advanced Matching モジュール
注: 定義したルールの条件を満たすレコードがコレクションになければ、レコードは 1 つも出力に返
されません。
重複の削減
[コレクションから重複を削除] オプションは、Filter ルールの条件が満たされる場合にどのレコードを
コレクションから削除するかを指定します。 コレクション内の他のレコードは保持されます。
注: このオプションを選択するときは、ルールを定義する必要があります。
フィルタリングのルール
Filter ルールでは、いくつかのオプションを使ってどのレコードを削除または保持するかを指定しま
す。 ルールの作成には、フィールド名、フィールド タイプ、演算子、値タイプ、および値を指定しま
す。
注: 各 Filter には一つのフィルタ条件のみを設定できます。 フィルタ階層で [Filter 条件] を選択する
と、ボタンが灰色の表示に変わります。
Filter ルールを追加するには
1. キャンバスで、Filter のインスタンスをダブルクリックします。
[Filter オプション] ダイアログが表示されます。
2. [ルール] ノードを選択してから [ルールの追加] をクリックします。 [Filter Rule オプション] ダイア
ログが表示されます。
次の表にフィールドを示します。
表 57 : Filter オプション
オプション
説明
フィールド名
入力レコード内のテストするフィールド。
フィールド タイプ
フィールドの値が数値かそれ以外かを指定します。
演算子
[フィールド名] フィールドに対して実行する比較演算を指定します。
有効な演算子を以下に示します。
• 最高
• 最低
• 最長 (バイト単位) 最長の文字列が複数ある場合、1 つのレコードが
選択されます。
ユーザ ガイド
343
Filter
オプション
説明
• 最多 (コレクションで最も数が多い語) 最多の文字列が複数ある場
合、アクションは実行されません。
• より大きい
• 以上
• より小さい
• 以下
• 等しい
• 等しくない
• が次の文字を含む
値タイプ
このオプションは、最高、最低、または最長以外の演算子が選択され
ている場合のみ有効です。 有効な値タイプは次のとおりです。
• フィールド
• 文字列
値
このオプションは、最高または最低以外の演算子が選択されている場
合のみ有効です。 このフィールドの値は、選択されている演算子に応
じて、[フィールド名] の値と比較されます。
[値タイプ] がフィールドの場合、フィールドの一覧が [値] オプション
ドロップ ダウン リストに表示されます。 [値タイプ] が文字列の場合
は、[値] テキスト ボックスに定数値を入力します。
ルールをさらに追加するには、[ルール] ノードを選択して [ルールの追加] をクリックするか、定義済
みのルールを選択して [ルールの挿入] をクリックします。 ルールを追加する場合は、ルールを接続す
るための論理演算子 (And/Or) を選択する必要があります。
Filter ルールの例
フィールド名 = MatchScore フィールド タイプ = Numeric 演算子 = Highest
この Filter ルールは、マッチスコア の値が最も高いレコードをコレクションに保持します。 演算子が
最高または最低の場合、値と値タイプは適用されないことに注意してください。
フィールド名 = AccountNumber フィールド タイプ = Numeric 演算子 = Equals 値タイプ = String 値 =
12345
このルールは、AccountNumber が "12345" に等しいレコードを保持します。
344
Spectrum™ Technology Platform 8.0.0
第 20 章 : Advanced Matching モジュール
Interflow Match
Interflow Match は、2 つの入力レコード ストリーム内の類似するデータ レコード間でマッチを検出し
ます。 最初のレコード ストリームは、サスペクト レコードのソースで、2 番目のストリームは、候補
レコードのソースです。
Interflow Match では、マッチ グループ条件 (マッチ キー等) を使用して、特定のサスペクト レコード
と重複する可能性があるレコードのグループを識別します。
各候補はサスペクトと個々に照合され、マッチ ルールに基づいてスコアが付けられます。 候補が重複
の場合は、コレクション番号が割り当てられ、そのマッチ レコード タイプに重複が設定され、その候
補が書き出されます。マッチしないユニークな候補を書き出すかどうかは、ユーザの選択に基づきま
す。 Interflow Match によって、現在のマッチ グループ内の候補レコードがすべて使用されると、マッ
チするサスペクト レコードには、重複レコードに対応するコレクション番号が割り当てられます。 ま
た、マッチが見つからない場合は、サスペクトにコレクション番号 0 が割り当てられ、そのラベルに
ユニーク レコードが設定されます。
重複の数を制限している場合に、現在のサスペクトでその制限を越えると、特定のサスペクトのマッ
チング処理が終了することがあります。
Express キーのマッチ結果を候補マッチ スコアに変換する方法は、マッチングのタイプ (Intraflow ま
たは Interflow) によって異なります。 Interflow マッチングの場合、正常な Express キー マッチは常に
100 マッチスコアを候補に与えます。 一方、Intraflow マッチングの場合、Express キー マッチの結果
として候補に与えられるスコアは、その候補がマッチするレコードが他のサスペクトのマッチである
かどうかによって異なります。つまり、Express キーがサスペクトの重複であれば、マッチスコアは
常に 100 になり、Express キーが他の候補の重複であれば、その候補のマッチスコア (必ずしも 100
ではない) が継承されます。
Interflow Match オプションの定義
1. 定義済みのマッチング ルールを選択するか、新しいマッチング ルールを作成します。
• 一般的なルールをサポートする定義済みのオプション セットを使用するには、[ロードするマッ
チ ルール] ドロップダウン メニューから 1 つを選択します。
• 独自のカスタム マッチング ルールを指定するには、[ロードするマッチ ルール] ドロップダウン
メニューの右にある [新規] ボタンをクリックします。 既存のマッチ タイプを変更して、名前を
変更することもできます。 作成できるカスタム マッチング ルールは、1 セッションあたり 1 つ
だけです。
注: 定義済みのルールを変更してカスタム マッチング ルールを作成することもできます。
ジョブまたはサービス 1 つあたり 1 つのカスタム ルールのみを保存できます。
2. マッチ キュー内のレコードをグループ化するのに使うフィールドを選択するには、[グループ化方
法] をクリックします。
ユーザ ガイド
345
Interflow Match
Interflow Match は、同じマッチ キューにある他のレコードに対してのみレコードのマッチングを
試みます。 [グループ化方法] ドロップダウンで選択したフィールドに基づいて、マッチング前に
入力をソートするには、[ソート] ボックスを選択します。
追加のソート パフォーマンス オプションを指定するには、[詳細設定] をクリックして、[詳細オプ
ション] ダイアログ ボックスを開きます。
[詳細オプション] ダイアログ ボックスには、次のソート パフォーマンス オプションがあります。
• ソート パフォーマンス オプションをオーバーライド — これらのオプションをデフォルトのソー
ト パフォーマンス オプションよりも優先します。
• メモリ内レコードの上限値 — ソートでメモリ内に保持できるデータ行の最大数を指定します。
この上限を越えると、ディスクにページングします。
• 使用する一時ファイルの最大数 — ソート プロセスで使用できる一時ファイルの最大数を指定し
ます。
• 圧縮を有効にする — 一時ファイルをディスクに書き込むときに圧縮します。
注: ソートを最も効率的に実行できるソート パフォーマンス オプション設定の組み合わせは、
サーバーのハードウェア構成によって異なります。 ただし、次の一般的なガイドラインに従
うと、良好なパフォーマンスでソートを実行できることが確認されています。 (メモリ内レ
コードの上限値 × 使用する一時ファイルの最大数 ÷ 2) >= ソートする行数の合計。複数のジョ
ブを同時並行で実行する環境では、[メモリ内レコードの上限値] の設定を増やすと、メモリ不
足になる可能性が高くなります。
追加のソート パフォーマンス オプションを指定したら、[OK] をクリックして、[詳細オプション]
ダイアログ ボックスを閉じて、[Interflow Match オプション] ダイアログ ボックスに戻ります。
3. [Express マッチ有効] をクリックして Express キー値の初期比較を実行して 2 つのレコードがマッ
チすると判断できるかどうかを確認します。
Express キー マッチは、実行する比較の回数を減らし、実行速度を改善するには便利なツールで
す。 あいまいな Express キーを使うと、誤検出のマッチが多数返されます。 Express キーは、
MatchKeyGenerator で生成されるマッチ キーの一部として生成できます。 詳細については、Match
Key Generator(398ページ)を参照してください。
2 つのレコードが Express キーに正確にマッチする場合、候補は 100% の重複と見なされます。
2 つのレコードが Express キー値にマッチしない場合は、ルール ベースの方法で比較されます。
Express キーを使った比較で候補がマッチしたかどうかを確認するには、[ExpressKeyIdentified]
フィールドの値をチェックします。"Y" はマッチしたことを示し、"N" はマッチしなかったことを
示します。 サスペクト レコードは [ExpressKeyIdentified] 値が常に "N" であることに注意してく
ださい。
4. [最初のコレクション番号] テキスト ボックスに、重複レコードのコレクション番号フィールドに
割り当てる最初の番号を入力します。
コレクション番号は、マッチ キュー内の各重複レコードを一意に識別するための値です。 ユニー
ク レコードには、コレクション番号 0 が割り当てられます。 各重複レコードには、[最初のコレク
ション番号] テキスト ボックスに指定した値で始まるコレクション番号が割り当てられます。
5. 次のオプションのいずれかを選択します。
346
Spectrum™ Technology Platform 8.0.0
第 20 章 : Advanced Matching モジュール
•
[サスペクトをすべての候補と比較] を選択すると、マッチ グループに既に重複が見つかってい
る場合でも、サスペクトは同じマッチ グループ (グループ化オプション) のすべての候補にマッ
チします。 例 : サスペクトが "John Smith" で、候補が "Bill Jones"、"John Smith"、"John Smith"
の場合、サスペクトの "John Smith" は候補の両方の "John Smith" と比較されます。 [ユニーク
な候補を返す] ボックスをオンにすると、ユニーク レコードとして識別されたマッチ グループ
内のレコードが候補ポートから返されます。
•
[比較を停止] を選択すると、サスペクトはマッチ グループ (グループ化オプション) 内のすべて
の候補と比較されますが、ユーザーが指定した重複数が検出された時点で比較が停止されます。
例 : 1 個の重複を検出した後にサスペクトと候補の比較を停止します。 サスペクトが "John
Smith" で、候補が "Bill Jones"、"John Smith"、"John Smith" の場合、最初の "John Smith" 候補
が重複として検出された時点で、マッチ グループ内でのサスペクト レコード "John Smith" と
の比較が停止されます。
6. [分析用データを生成する] をクリックしてマッチ結果を生成します。 詳細については、マッチ分
析(374ページ)を参照してください。
7. カスタム マッチング ルールを作成するには、マッチング ルールの作成(361ページ)を参照してく
ださい。
8. [評価] をクリックして、サスペクト レコードと候補レコードとの比較によるスコアを生成します。
マッチング ルールの作成
マッチング ルールは、階層構造に整理された親タイプと子タイプで構成されます。 親タイプは、マッ
チする要素のグループを表します。 子タイプは、親タイプがマッチするかどうかを確認する入力ソー
ス フィールド名です。 例えば、
• 世帯 - 親タイプ - これは階層のルート タイプでもあります。
• 名前 - 親タイプ - 世帯の子。
• 姓 - 子タイプ - 名前の子であるフィールド。
• 住所 - 親タイプ - 世帯の子。
• 通り - 親タイプ - 住所の子。
• 家番号 - 子タイプ - 通りの子であるフィールド。
• 通り名 - 子タイプ - 通りの子であるフィールド。
• 通り接尾語 - 子タイプ - 通りの子であるフィールド。
1. 親タイプと子タイプを作成します。
a) [新規] をクリックします。 空のマッチ ルールが作成されます。
b) [親の追加] をクリックします。
c) 親ノードの名前を入力します。 名前は一意であり、フィールドであってはなりません。 マッチ
タイプ名として使う階層の最初のノードを [ロードするマッチ タイプ] フィールドに入力しま
す。 作成したすべてのカスタム マッチ ルールと変更した定義済みルールは、名前の前に
"Custom" という語が付加されて保存されます。
ユーザ ガイド
347
Interflow Match
d) [子の追加] をクリックしてフィールドを親ノードに関連付けます。 子フィールドは、Spectrum™
Technology Platform のデータ タイプ フィールドである必要があります。つまり、1 つ以上の
コンポーネントを通じて使用できるフィールドでなければなりません。
e) 子ノードを追加すると、ドロップダウン矢印が子ノード プレースホルダーの横に表示されま
す。 矢印をクリックして、表示されるリストからフィールドを選択します。
f) この操作を繰り返してマッチング階層を完成させます。
2. 親タイプ オプションを定義します。 親オプションは、親ノードを選択するとマッチング階層の右
側に表示されます。
マッチング 親タイプがマッチするかどうかを判定する方法を指定します。 次のいずれかです。
方法
すべて真
親タイプの下にあるすべての子タイプがマッチすると確認された場
合にマッチすると見なします。 この方法を選択すると、タイプ間に
"AND" コネクタが作成されます。
いずれかが真 親タイプの下にある少なくとも 1 つの子タイプがマッチすると確認
された場合にマッチすると見なします。 この方法を選択すると、タ
イプ間に "OR" コネクタが作成されます。
しきい値で判 親タイプのスコアがそのしきい値に等しいか、それよりも大きい場
断
合にマッチすると見なします。 このオプションを選択すると、[し
きい値] スライダーが表示されます。 このスライダーを使ってしき
い値を指定します。 スコアリング方法によって、使用する論理コネ
クタが決定されます。
注: ここで設定したしきい値は、実行時に [データフロー オプション] ダイアログ
ボックスを使って変更できます。 [編集] > [データフロー オプション] の順にク
リックし、[追加] をクリックします。ステージを展開し、[トップ レベルのしき
い値] をクリックしてから [デフォルト値] フィールドにしきい値を入力します。
欠落データ フィールド内の空白データのスコアの計算方法を決定します。 次のいずれかです。
しきい値
空白を無視
フィールドに空白データが入っている場合、そのフィール
ドを無視します。
0 としてカウント
フィールドに空白データが入っている場合、そのフィール
ドのスコアを 0 とします。
100 としてカウント
フィールドに空白データが入っている場合、そのフィール
ドのスコアを 100 とします。
[マッチング方法] で [しきい値で判断] を指定すると、しきい値スライダーが表示さ
れます。 マッチ スコアがしきい値より高くなければ、親はマッチと判断されませ
ん。 親ノードのしきい値を子のしきい値より高くすることはできません。
スコアリン マッチング スコアの決定に使用する方法を選択できます。 次のいずれかです。
グ方法
加重平均
親の下の各子ノードの重みを使用して、平均マッチ スコアを決
定します。
348
Spectrum™ Technology Platform 8.0.0
第 20 章 : Advanced Matching モジュール
平均
親の下の各子ノードの平均スコアを使用して、親のスコアを決定
します。
最大値
親の下の子の最も高いスコアを使用して、親のスコアを決定しま
す。
最小値
親の下の子の最も低いスコアを使用して、親のスコアを決定しま
す。
次の表に、マッチング方法とスコアリング方法の論理的な関係、およびそれぞれの組み合わせに
よってマッチング処理時に使用されるロジックがどのように変わるかを示します。
表 58 : マッチング方法とスコアリング方法の表
マッチング方法
いずれかが すべて真
真
コメント
しきい値で
判断
スコアリング方法
加重平均
不可
AND
AND
平均
不可
AND
AND
最大値
OR
不可
OR
最小値
OR
不可
OR
マッチング方法として [すべて真] ま
たは [しきい値で判断] が選択されて
いる場合にのみ使用可能です。
マッチング方法として [いずれかが
真] または [しきい値で判断] が選択
されている場合にのみ使用可能で
す。
3. 子タイプ オプションを定義します。 子ノードを選択すると、マッチング階層の右側に子オプショ
ンが表示されます。
注: 親の下のすべての子は、同じ論理演算子を使用する必要があります。 コネクタを結合するに
は、まず中間の親ノードを作成する必要があります。
クロス 2 つのレコード間で異なるフィールドを相互にマッチングするのに使用します。
マッチ
対象
欠落
フィールド内の空白データのスコアの計算方法を決定します。 次のいずれかです。
データ
空白を無視
フィールドに空白データが入っている場合、そのフィールド
を無視します。
0 としてカウント
ユーザ ガイド
フィールドに空白データが入っている場合、そのフィールド
のスコアを 0 とします。
349
Interflow Match
100 としてカウント
フィールドに空白データが入っている場合、そのフィールド
のスコアを 100 とします。
しきい フィールドがマッチと判断されるために個々のフィールド レベルで満たす必要があるし
値
きい値。
スコア マッチング スコアの決定に使用する方法を選択できます。 次のいずれかです。
リング
加重平均
各アルゴリズムの重みを使用して、平均マッチ スコアを決定しま
方法
す。
平均
各アルゴリズムの平均スコアを使用して、マッチ スコアを決定しま
す。
最大値
最も高いアルゴリズムのスコアを使用して、マッチ スコアを決定し
ます。
最小値
最も低いアルゴリズムのスコアを使用して、マッチ スコアを決定し
ます。
アルゴ 2 つの文字列データのスコアを決定するために使用します。 次のものから複数指定でき
リズム ます。
Acronym (頭 企業名がその頭字語にマッチするかどうかを判定します。 例: Internal
字語)
Revenue Service とその頭字語 IRS はマッチすると判断され、マッチ
スコア 100 が返されます。
Character
Frequency
(文字出現回
数)
文字列に含まれるすべての文字の出現回数を個別に確認し、2 つの文字
列における全体的な出現回数を比較します。
Date (日付)
日付のフォーマットにかかわらず、入力レコードに含まれる日付を比較
します。 [オプション] 列の [編集] をクリックして、次のオプションを
指定します。
• 月を必須とする: 年のみで構成される日付のマッチングを防ぎます。
• 日を必須とする: 月と年のみで構成される日付のマッチングを防ぎま
す。
• MM/DD という転置形式もマッチとみなす: 月と日が数値形式で指定
されている場合に、サスペクトの月と候補の月、サスペクトの日と候
補の日という標準的な比較に加えて、サスペクトの月と候補の日、サ
スペクトの日と候補の月の比較を行います。
• MM/DD/YYYY ではなく DD/MM/YYYY 形式を優先する: 月と日がとも
に数値形式で指定されており、両者が文脈からは識別できない場合の
日付のパーシングに使用します。 例えば、数字が 5 と 13 の場合、
パーサーは自動的に 5 を月に、13 を日に割り当てます。1 年に 12 カ
月しかないためです。 しかし、数字が 5 と 12 (または、ともに 12 以
下の任意の 2 つの数字) の場合、パーサーは最初の数字が月であると
350
Spectrum™ Technology Platform 8.0.0
第 20 章 : Advanced Matching モジュール
みなします。 このオプションを選択することにより、パーサーが最
初の数字を月ではなく日として読むように指定することができます。
• 範囲オプション — 全体: マッチング日付間の最大日数を設定できま
す。 例えば、全体範囲として 35 日と入力し、候補日付が 2000/12/31
の場合、サスペクト日付 2001/02/05 はマッチですが、サスペクト日
付 2001/02/06 はマッチではありません。 全体範囲として 1 日と入力
し、候補日付が 2000/01 の場合、サスペクト日付 1999 はマッチです
が (1999/12/31 と比較します)、サスペクト日付 2001/01 はマッチで
はありません。
• 範囲オプション — 年: 月、日とは別に、マッチング日付間の年数を設
定できます。 例えば、年の範囲として 3 年と入力し、候補日付が
2000/01/31 の場合、サスペクト日付 2003/01/31 はマッチですが、サ
スペクト日付 2003/02 はマッチではありません。 同様に、候補日付
が 2000 の場合、サスペクト日付 2003/03 は月の不整合がなく、3 年
の範囲内にあるので、マッチとなります。
• 範囲オプション — 月: 年、日とは別に、マッチング日付間の月数を設
定できます。 例えば、月の範囲として 4 と入力し、候補日付が
2000/01/01 の場合、サスペクト日付 2000/05 は日の不整合がなく、
4 カ月の範囲内にあるのでマッチですが、サスペクト日付 2000/05/02
は日の不整合があるためマッチではありません。
• 範囲オプション — 日: 年、月とは別に、マッチング日付間の日数を設
定できます。 例えば、日の範囲として 5 と入力し、候補日付が
2000/01/01 の場合、サスペクト日付 2000/01 は日の不整合がないの
でマッチですが、サスペクト日付 1999/12/27 は月の不整合があるた
めマッチではありません。
Double
Metaphone
文字の発音表記に基づいて、2 つの文字列間の類似性を判断します。
Double Metaphone は Metaphone アルゴリズムの改良版で、さまざま
な言語に多数存在する不規則性を考慮しています。
Edit Distance 1 つの文字列をもう 1 つの文字列に変換するために必要な削除、挿入、
(編集距離)
または置換の数に基づいて、2 つの文字列間の類似性を判断します。
Exact Match
(完全一致)
2 つの文字列が同じであるかどうかを判断します。
Initials (頭文
字)
パースした個人名の頭文字のマッチングに使用します。
Jaro-Winkler 1 つの文字列をもう 1 つの文字列に変換するために要する文字の置換の
Distance
数に基づいて、2 つの文字列間の類似性を判断します。 このオプション
(Jaro-Winker は、個人名などの短い文字列用に開発されました。
距離)
Keyboard
Distance
(キーボード距
離)
ユーザ ガイド
キーボード上のキーの位置によって重みを付け、1 つの文字列をもう一
方の文字列に変換するために必要な削除、挿入、または置換の数に基づ
いて、2 つの文字列間の類似性を判断します。 [オプション] 列の [編集]
をクリックして、使用しているキーボードのタイプを QWERTY (米国)、
351
Interflow Match
QWERTZ (オーストリアおよびドイツ)、または AZERTY (フランス) か
ら指定します。
Metaphone
文字の発音表記に基づいて、2 つの文字列間の類似性を判断します。 こ
のオプションは、Soundex の制限に対応するために作成されました。
Metaphone
(スペイン語)
文字の発音表記に基づいて、2 つの文字列間の類似性を判断します。 こ
のオプションは、Soundex の制限に対応するために作成されました。
Name Variant 2 つの名前が互いの派生形であるかどうかを判断します。 このアルゴリ
(名前の派生
ズムは、2 つの名前が互いの派生形である場合はマッチ スコア 100 を
形)
返し、互いの派生形でない場合はマッチ スコア 0 を返します。 例え
ば、JOHN は JAKE の派生形なので、マッチ スコア 100 が返されます。
JOHN は HENRY の派生形ではないので、マッチ スコア 0 が返されま
す。 [オプション] 列の [編集] をクリックして、[Name Variant (名前の
派生形)] オプションを選択します。 詳細については、Name Variant
Finder(1073ページ)を参照してください。
Numeric
住所行の数値属性を文字から分離して、住所行を比較します。 例えば、
String (数値文 住所文字列 1234 Main Street Apt 567 では、文字列の数値属性 (1234567)
字列)
がパースされ、残りの文字列値 (Main Street Apt) とは異なる処理が行わ
れます。 このアルゴリズムでは、まず数値アルゴリズムを使用して、
文字列の中の数値データが照合されます。 数値データのマッチが 100
の場合、Edit Distance と Character Frequency を使用して、英字データ
が照合されます。 最終的なマッチ スコアは次のように計算されます。
(numericScore + (EditDistanceScore +
CharacterFrequencyScore) / 2) / 2
例えば、以下の 2 つの住所は次のように計算され、マッチ スコアは 95.5
になります。
123 Main St Apt 567
123 Maon St Apt 567
Numeric Score = 100
Edit Distance = 91
Character Frequency = 91
91 + 91 = 182
182/2 = 91
100 + 91 = 191
191/2 = 95.5
Soundex
文字の発音表記に基づいて、2 つの文字列間の類似性を判断します。
SubString (部 1 つの文字列が別の文字列内に出現するかどうかを判断します。
分文字列)
次の表に、選択した親タイプのスコアリング方法と、使用できるアルゴリズム数との論理的関係を
示します。
352
Spectrum™ Technology Platform 8.0.0
第 20 章 : Advanced Matching モジュール
表 59 : マッチング アルゴリズムとスコアリング方法の表
アルゴリズム
単一
複数
加重平均
不可
はい
平均
不可
はい
最大値
はい
はい
最小値
不可
はい
スコアリング方法
マッチング ルールの例
次の例では、名前データと住所データを照合するマッチ ルールの作成方法を示し
ます。 名前マッチは、First Name フィールドと Last Name フィールドで構成さ
れます。 名前がマッチと判断されるには、どちらのフィールドも一致しなければ
なりません。 住所マッチは、House Number フィールドと Street Name フィール
ドで構成されます。 マッチと判断されるには、どちらのフィールドも一致しなけ
ればなりません。
カスタム マッチ ルールの作成は、次の 3 つのステップで行われます。
1. 1(353ページ)
2. 2(354ページ)
3. 3(356ページ)
1. マッチング階層を作成します。
a. [新規] をクリックして、新しいマッチ ルールを作成します。
b. [親の追加] をクリックして、階層にルート マッチ ノードを作成します。
これにより、[ロードするマッチ タイプ:] ドロップダウン ボックスに設定
されるルール セット名も決定されます。
c. 親ノードの一意な名前を入力します。 親ノード名は一意な名前でなければ
なりません。フィールドにすることはできません。 この例では、マッチ
ルールに "Name and Address Match" と命名します。
d. 階層で "Name and Address" 親ノードを選択します。
e. [親の追加] をクリックして、"Name and Address" 親ノードの下に子ノー
ドを作成します。
ユーザ ガイド
353
Interflow Match
f. 親/子ノードの一意な名前を入力します。 この例では、一意な名前は "Name"
です。
g. 階層で "Name" 親/子ノードを選択します。
h. [子の追加] をクリックして、"Name" 親/子ノードの下に子/フィールド ノー
ドを作成します。
i.
リストで FirstName を選択します。
j.
階層で "Name" 親/子ノードを選択します。
k. [子の追加] をクリックして、"Name" 親/子ノードの下に別の子/フィールド
ノードを作成します。
l.
リストで LastName を選択します。
m. 階層で "Name and Address" 親ノードを選択します。
n. [親の追加] をクリックして、"Name and Address" 親ノードの下に子ノー
ドを作成します。
o. 親/子ノードの一意な名前を入力します。 この例では、一意な名前は
"Address" です。
p. 階層で "Address " 親/子ノードを選択します。
q. [子の追加] をクリックして、"Address" 親/子ノードの下に子/フィールド
ノードを作成します。
r. リストで HouseNumber を選択します。
s. 階層で "Address " 親/子ノードを選択します。
t. [子の追加] をクリックして、"Address" 親/子ノードの下に別の子/フィール
ド ノードを作成します。
u. リストで StreetName を選択します。
2. 親タイプ マッチング オプションを選択します。
a. 階層で "Name and Address" 親ノードを選択し、次の操作を行います。
• [マッチング方法] で [すべて真] を選択します。 [すべて真] を選択する
と、"Name and Address" 親ノードの下の各子ノードが "and" コネクタ
で結合されます。 マッチと判断されるには、"Name" 子ノード と
"Address" 子ノードがどちらも真である必要があります。 親の [すべて
真] は、フィールド レベルで判断されます。
• [スコアリング方法] リストで [平均] を選択します。 [平均] を選択する
と、"Name and Address" 親ノードの下の各子ノードのスコアの平均ス
コアが採用されます。 Name ノードのスコアが 80 で、Address ノード
のスコアが 100 の場合、"Name and Address" 親ノードにロールアップ
されるスコアは 90 になります。
• [欠落データ] で [空白を無視] を選択します。 この例ではデータに空白
が含まれていないため、このルールは "Name and Address" 親ノード レ
ベルでは使用されません。 ただし、フィールド レベルのすべての子ノー
354
Spectrum™ Technology Platform 8.0.0
第 20 章 : Advanced Matching モジュール
ドが空白データを含む場合、これらのフィールドの親ノードも空白デー
タを含むものとしてマークされます。 この例では、First Name フィー
ルドと Last Name フィールドがどちらも空白データを含む場合、"Name"
親ノードも空白データを含むことになります。 最終的なマッチ スコア
を計算する際、"Name" 親ノードは無視されます。 例: フィールド レベ
ルの子ノード (House Number および Street Name) にはデータが入って
いて、平均スコア 100 が計算されるため、Address 親ノードのスコアは
100 になります。 フィールド レベルの子ノード (First Name および Last
Name) にはデータが入っていないため、Name 親ノードは空白データを
含むことになり、無視されます。 Address 親ノードのスコアのみがマッ
チングにカウントされ、そのスコアが Name and Address Match 親ノー
ドにロールアップされます。 全体のマッチ スコアは 100 と計算されま
す。
b. 階層で "Name" 親ノードを選択し、次の操作を行います。
• [マッチング方法] で [すべて真] を選択します。 [すべて真] を選択する
と、"Name" 親ノードの下の各子ノードが "and" コネクタで結合されま
す。 マッチと判断されるには、First Name 子ノードと Last Name 子ノー
ドがどちらも真でなければなりません。
• [スコアリング方法] リストで [平均] を選択します。 [平均] を選択する
と、"Name " 親ノードの下の各子ノードのスコアの平均スコアが採用さ
れます。 First Name フィールドのスコアが 70 で、Last Name フィール
ドのスコアが 90 の場合、Name 親ノードにロールアップされるスコア
は 80 になります。
• [欠落データ] で [空白を無視] を選択します。 この例ではデータに空白
が含まれていないため、このルールは "Name" 親ノード レベルでは使用
されません。 ただし、First Name フィールドと Last Name フィールド
がどちらも空白データを含む場合、これらのフィールドの "Name" 親
ノードも空白データを含むものとしてマークされます。 この場
合、"Name" 親ノードはマッチングで無視されます。
c. 階層で "Address" 親ノードを選択し、次の操作を行います。
• [マッチング方法] で [すべて真] を選択します。 [すべて真] を選択する
と、"Address" 親ノードの下の各子ノードが "and" コネクタで結合され
ます。 マッチと判断されるには、House Number 子ノードと Street Name
子ノードがどちらも真でなければなりません。
• [スコアリング方法] リストで [平均] を選択します。 [平均] を選択する
と、"Address" 親ノードの下の各子ノードのスコアの平均スコアが採用
されます。 House Number フィールドのスコアが 100 で、Street Name
フィールドのスコアが 100 の場合、"Address" 親ノードのスコアは 100
になります。
ユーザ ガイド
355
Interflow Match
• [欠落データ] で [空白を無視] を選択します。 この例ではデータに空白
が含まれていないため、このルールは "Address" 親ノード レベルでは使
用されません。 ただし、House Number フィールドと Street Name
フィールドがどちらも空白データを含む場合、これらのフィールドの
"Address" 親ノードも空白データを含むものとしてマークされます。 こ
の場合、"Address" 親ノードはマッチングで無視されます。
3. 子タイプ マッチング オプションを選択します。
a. "Name" 親ノードの下の FirstName を選択し、次の操作を行います。
• [アルゴリズム] の下の [Exact Match (完全一致)] チェック ボックスをク
リアし、[Edit Distance (編集距離)] チェック ボックスと [Character
Frequency (文字出現回数)] チェック ボックスを選択します。
• [スコアリング方法] ボックスで [平均] を選択します。 [平均] を選択す
ると、2 つのアルゴリズムのスコアの平均を採用して、[FirstName] フィー
ルドのスコアが計算されます。 Edit Distance アルゴリズムのスコアが
80 で、Character Frequency アルゴリズムのスコアが 60 の場合、
FirstName フィールドのスコアは 70 になります。
• [欠落データ] で [空白を無視] を選択します。 この例ではデータに空白
が含まれていないため、このルールはフィールド レベルでは使用されま
せん。 ただし、FirstName フィールドが空白を含み、LastName フィー
ルドにはデータが入っている場合、FirstName フィールドはマッチング
で無視され、LastName のスコアのみがカウントされて、親ノードにロー
ルアップされます。
• [しきい値] の下のスライダーを 70 に設定します。 フィールドのスコア
がしきい値以上の場合にのみ、First Name フィールドはマッチと見なさ
れます。
b. "Name" 親ノードの下の LastName を選択し、次の操作を行います。
• [アルゴリズム] の下の [Exact Match (完全一致)] チェック ボックスをク
リアし、[Edit Distance (編集距離)] チェック ボックスと [Character
Frequency (文字出現回数)] チェック ボックスを選択します。
• [スコアリング方法] ボックスで、[最大値] を選択します。 [最大値] を
選択すると、2 つのアルゴリズムのスコアの最大スコアが採用され、
LastName フィールドのスコアとして使用されます。 Edit Distance アル
ゴリズムのスコアが 90 で、Character Frequency アルゴリズムのスコア
が 80 の場合、LastName フィールドのスコアは 90 になります。
• [欠落データ] で [空白を無視] を選択します。 この例ではデータに空白
が含まれていないため、このルールはフィールド レベルでは使用されま
せん。 ただし、Last Name フィールドが空白を含み、First Name フィー
ルドにはデータが入っている場合、Last Name フィールドはマッチング
356
Spectrum™ Technology Platform 8.0.0
第 20 章 : Advanced Matching モジュール
で無視され、First Name のスコアのみがカウントされて、親ノードに
ロールアップされます。
• [しきい値] の下のスライダーを 80 に設定します。 フィールドのスコア
がしきい値以上の場合にのみ、[LastName] フィールドはマッチと見なさ
れます。
c. "Address" 親ノードの下の HouseNumber を選択し、次の操作を行いま
す。
• [アルゴリズム] の下の [Exact Match (完全一致)] チェック ボックスをク
リアします。
• [欠落データ] で [空白を無視] を選択します。 この例ではデータに空白
が含まれていないため、このルールはフィールド レベルでは使用されま
せん。 ただし、[HouseNumber] フィールドが空白を含み、[StreetName]
フィールドにはデータが入っている場合、[HouseNumber] フィールドは
マッチングで無視され、[StreetName] のスコアのみがカウントされて、
親ノードにロールアップされます。
• [しきい値] の下のスライダーを 100 に設定します。 フィールドのスコ
アがしきい値以上の場合にのみ、[HouseNumber] フィールドはマッチと
見なされます。
d. "Address" 親ノードの下の StreetName を選択し、次の操作を行います。
• [アルゴリズム] の下の [Exact Match (完全一致)] チェック ボックスをク
リアし、[Edit Distance (編集距離)] チェック ボックスと [Character
Frequency (文字出現回数)] チェック ボックスを選択します。
• [スコアリング方法] ボックスで [平均] を選択します。 [平均] を選択す
ると、2 つのアルゴリズムのスコアの平均を採用して、[FirstName] フィー
ルドのスコアが計算されます。 Edit Distance アルゴリズムのスコアが
100 で、Character Frequency アルゴリズムのスコアが 100 の場合、
[StreetName] フィールドのスコアは 100 になります。
• [欠落データ] で [空白を無視] を選択します。 この例ではデータに空白
が含まれていないため、このルールはフィールド レベルでは使用されま
せん。 ただし、[StreetName] フィールドが空白を含み、[HouseNumber]
フィールドにはデータが入っている場合、[StreetName] フィールドは
マッチングで無視され、[HouseNumber] のスコアのみがカウントされ
て、親ノードにロールアップされます。
• [しきい値] の下のスライダーを 100 に設定します。 フィールドのスコ
アがしきい値以上の場合にのみ、[StreetName] フィールドはマッチと見
なされます。
ユーザ ガイド
357
Interflow Match
出力
表 60 : Interflow Match 出力フィールド
フィールド名
説明/有効値
CollectionNumber
重複レコードのコレクションを識別します。 有効な値は 1 以上です。
ExpressMatchIdentified
マッチの取得に Express マッチ キーが使われたかどうかを示します。
有効な値は Yes または No です。
InterflowSourceType
有効な値は input_port_0 または input_port_1 です。
MatchRecordType
コレクションに含まれるマッチ レコードのタイプを識別します。 有
効な値を次に示します。
MatchScore
suspect
他のレコードと重複する可能性があるとフラグが立
てられた元の入力レコード。
duplicate
入力レコードと重複するレコード。
unique
重複がないレコード。
2 つのレコードの全体的なスコアを識別します。 有効な値は 0 〜 100
です。0 は精度の低いマッチを意味し、100 は完全一致を意味します。
注: Validate Address および Advanced Matching モジュールのコンポーネントは、どちらも MatchScore
フィールドを使用します。 データフローの出力の MatchScore フィールドの値は、出力ステージ
に送られる前に最後に値を変更したステージによって決まります。 データフローに Validate
Address および Advanced Matching モジュールのコンポーネントが含まれ、各ステージの
MatchScore 出力フィールドを確認したい場合は、Transformer ステージを使用して、MatchScore
値を他のフィールドにコピーしてください。 例えば、Validate Address によって MatchScore と
いう出力フィールドが作成され、Transformer ステージによって Validate Address の MatchScore
フィールドが AddressMatchScore というフィールドにコピーされます。 マッチャー ステージを
実行すると、マッチャーから得た値が MatchScore フィールドに設定され、Validate Address か
ら得た AddressMatchScore の値が 引き渡されます。
358
Spectrum™ Technology Platform 8.0.0
第 20 章 : Advanced Matching モジュール
Intraflow Match
Intraflow Match は、単一の入力ストリーム内の類似するデータ レコード間でマッチを検出します。
マッチしたレコードは、名前/住所以外の情報で修飾できます。 データフローの別のコンポーネントで
定義または作成したフィールドに基づいて、階層的なルールを作成できます。
デフォルトのマッチング方法
マッチャーは、ユーザが設定したグループ化方法 (マッチ グループ) を使用して、重複している可能性
のあるレコードのグループを識別します。 次に、マッチャーはグループ内の各レコードを調べます。
レコードが既存のサスペクトにマッチする場合、そのレコードはサスペクトの重複と見なされ、スコ
ア、コレクション番号、および マッチ レコード タイプ (重複) が割り当てられ、マッチから除外され
ます。 一方、レコードがマッチ グループ内の既存のサスペクトにマッチしなかった場合は、そのレ
コードが新しいサスペクトとなります。つまり、現在のマッチ グループに追加され、後続のレコード
とマッチングできるようになります。 現在のマッチ グループ内のすべてのレコードを調べ終わると、
マッチャーはすべてのサスペクトをマッチから除外し、マッチ レコード タイプにユニークというラベ
ルを付け、コレクション番号 0 を割り当てます。 少なくとも 1 つの重複があるサスペクトのマッチ
レコード タイプはサスペクトのままで、マッチした重複レコードと同じコレクション番号が割り当て
られます。 最後に、マッチ グループ内のすべてのレコードが出力に書き出されます。 新しいマッチ
グループが比較されます。
注: デフォルトのマッチング方法では、同じマッチ グループ内のレコードのみが比較されます。
Express キーのマッチ結果を候補マッチ スコアに変換する方法は、マッチングのタイプ (Intraflow ま
たは Interflow) によって異なります。 Interflow マッチングの場合、正常な Express キー マッチは常に
100 マッチスコアを候補に与えます。 一方、Intraflow マッチングの場合、Express キー マッチの結果
として候補に与えられるスコアは、その候補がマッチするレコードが他のサスペクトのマッチである
かどうかによって異なります。つまり、Express キーがサスペクトの重複であれば、マッチスコアは
常に 100 になり、Express キーが他の候補の重複であれば、その候補のマッチスコア (必ずしも 100
ではない) が継承されます。
スライディング ウィンドウ マッチング方法
スライディング ウィンドウ アルゴリズムは、ウィンドウというあらかじめ定められたバッファ サイ
ズを対応するデータ行で連続して埋めていくアルゴリズムです。 各行はウィンドウに追加され、既に
ウィンドウ内にある各項目と比較されます。 ある項目とのマッチと判断された場合、ドライバ レコー
ド (ウィンドウに追加する新規項目) と候補 (既にウィンドウ内にある項目) の両方に同じグループ ID
が付与されます。 ドライバ レコードがウィンドウ内に含まれるすべての項目と比較されるまで、この
比較が続行されます。
新しいドライバをウィンドウに追加していくと、最終的にはあらかじめ定められた容量に達します。
その時点でウィンドウがスライドするため、スライディング ウィンドウという用語が使用されます。
スライディングとは、最新のドライバ レコードがウィンドウに追加されると、ウィンドウ バッファが
削除され、ウィンドウ内の最古の項目が書き出されるということを意味しています。
ユーザ ガイド
359
Intraflow Match
Intraflow マッチング オプションの定義
1. 定義済みのマッチング ルールを選択するか、新しいマッチング ルールを作成します。
•
一般的なルールをサポートする定義済みのオプション セットを使用するには、[ロードするマッ
チ ルール] ドロップダウン メニューから 1 つを選択します。
•
独自のカスタム マッチング ルールを指定するには、[ロードするマッチ ルール] ドロップダウ
ン メニューの右にある [新規] ボタンをクリックします。 既存のマッチ タイプを変更して、名
前を変更することもできます。 作成できるカスタム マッチング ルールは、1 セッションあた
り 1 つだけです。
注: 定義済みのルールを変更してカスタム マッチング ルールを作成することもできます。
ジョブまたはサービス 1 つあたり 1 つのカスタム ルールのみを保存できます。
2. マッチ キュー内のレコードをグループ化するのに使うフィールドを選択するには、[グループ化方
法] をクリックします。
Intraflow Match は、同じマッチ キューにある他のレコードに対してのみレコードのマッチングを
試みます。 [グループ化方法] ドロップダウンで選択したフィールドに基づいて、マッチング前に
入力をソートするには、[ソート] ボックスを選択します。
追加のソート パフォーマンス オプションを指定するには、[詳細設定] をクリックして、[詳細オプ
ション] ダイアログ ボックスを開きます。
[詳細オプション] ダイアログ ボックスには、次のソート パフォーマンス オプションがあります。
• ソート パフォーマンス オプションをオーバーライド — これらのオプションをデフォルトのソー
ト パフォーマンス オプションに優先して適用することを指定します。
• メモリ内レコードの上限値 — ソートでメモリ内に保持できるデータ行の最大数を指定します。
この上限を越えると、ディスクにページングします。
• 使用する一時ファイルの最大数 — ソート プロセスで使用できる一時ファイルの最大数を指定し
ます。
• 圧縮を有効にする — 一時ファイルをディスクに書き込むときに圧縮します。
注: ソートを最も効率的に実行できるソート パフォーマンス オプション設定の組み合わせは、
サーバーのハードウェア構成によって異なります。 ただし、次の一般的なガイドラインに従
うと、良好なパフォーマンスでソートを実行できることが確認されています。 (メモリ内レ
コードの上限値 × 使用する一時ファイルの最大数 ÷ 2) >= ソートする行数の合計。複数のジョ
ブを同時並行で実行する環境では、[メモリ内レコードの上限値] の設定を増やすと、メモリ不
足になる可能性が高くなります。
追加のソート パフォーマンス オプションを指定したら、[OK] をクリックして、[詳細オプション]
ダイアログ ボックスを閉じて、[Intraflow Match オプション] ダイアログ ボックスに戻ります。
3. [Express マッチ有効] をクリックして Express キー値の初期比較を実行して 2 つのレコードがマッ
チすると判断できるかどうかを確認します。
Express キー マッチは、実行する比較の回数を減らし、実行速度を改善するには便利なツールで
す。 あいまいな Express キーを使うと、誤検出のマッチが多数返されます。 Express キーは、
360
Spectrum™ Technology Platform 8.0.0
第 20 章 : Advanced Matching モジュール
MatchKeyGenerator で生成されるマッチ キーの一部として生成できます。 詳細については、Match
Key Generator(398ページ)を参照してください。
2 つのレコードが Express キーに正確にマッチする場合、候補は 100% の重複と見なされます。
2 つのレコードが Express キー値にマッチしない場合は、ルール ベースの方法で比較されます。
Express キーを使った比較で候補がマッチしたかどうかを確認するには、[ExpressKeyIdentified]
フィールドの値をチェックします。"Y" はマッチしたことを示し、"N" はマッチしなかったことを
示します。 サスペクト レコードは [ExpressKeyIdentified] 値が常に "N" であることに注意してく
ださい。
4. [最初のコレクション番号] テキスト ボックスに、重複レコードのコレクション番号フィールドに
割り当てる最初の番号を入力します。
コレクション番号は、マッチ キュー内の各重複レコードを一意に識別するための値です。 ユニー
ク レコードには、コレクション番号 0 が割り当てられます。 各重複レコードには、[最初のコレク
ション番号] テキスト ボックスに指定した値で始まるコレクション番号が割り当てられます。
5. [スライディング ウィンドウ] をクリックして、このマッチング方法を有効にします。 スライディ
ング ウィンドウの詳細については、を参照してください。 スライディング ウィンドウ マッチング
方法(359ページ)
6. [分析用データを生成する] をクリックしてマッチ結果を生成します。 詳細については、マッチ分
析(374ページ)を参照してください。
7. カスタム マッチング ルールを作成するには、マッチング ルールの作成(361ページ)を参照してく
ださい。
8. [評価] をクリックして、サスペクト レコードと候補レコードとの比較によるスコアを生成します。
詳細については、Interflow Match(345ページ)を参照してください。
マッチング ルールの作成
マッチング ルールは、階層構造に整理された親タイプと子タイプで構成されます。 親タイプは、マッ
チする要素のグループを表します。 子タイプは、親タイプがマッチするかどうかを確認する入力ソー
ス フィールド名です。 例えば、
• 世帯 - 親タイプ - これは階層のルート タイプでもあります。
• 名前 - 親タイプ - 世帯の子。
• 姓 - 子タイプ - 名前の子であるフィールド。
• 住所 - 親タイプ - 世帯の子。
• 通り - 親タイプ - 住所の子。
• 家番号 - 子タイプ - 通りの子であるフィールド。
• 通り名 - 子タイプ - 通りの子であるフィールド。
• 通り接尾語 - 子タイプ - 通りの子であるフィールド。
1. 親タイプと子タイプを作成します。
a) [新規] をクリックします。 空のマッチ ルールが作成されます。
ユーザ ガイド
361
Intraflow Match
b) [親の追加] をクリックします。
c) 親ノードの名前を入力します。 名前は一意であり、フィールドであってはなりません。 マッチ
タイプ名として使う階層の最初のノードを [ロードするマッチ タイプ] フィールドに入力しま
す。 作成したすべてのカスタム マッチ ルールと変更した定義済みルールは、名前の前に
"Custom" という語が付加されて保存されます。
d) [子の追加] をクリックしてフィールドを親ノードに関連付けます。 子フィールドは、Spectrum™
Technology Platform のデータ タイプ フィールドである必要があります。つまり、1 つ以上の
コンポーネントを通じて使用できるフィールドでなければなりません。
e) 子ノードを追加すると、ドロップダウン矢印が子ノード プレースホルダーの横に表示されま
す。 矢印をクリックして、表示されるリストからフィールドを選択します。
f) この操作を繰り返してマッチング階層を完成させます。
2. 親タイプ オプションを定義します。 親オプションは、親ノードを選択するとマッチング階層の右
側に表示されます。
マッチング 親タイプがマッチするかどうかを判定する方法を指定します。 次のいずれかです。
方法
すべて真
親タイプの下にあるすべての子タイプがマッチすると確認された場
合にマッチすると見なします。 この方法を選択すると、タイプ間に
"AND" コネクタが作成されます。
いずれかが真 親タイプの下にある少なくとも 1 つの子タイプがマッチすると確認
された場合にマッチすると見なします。 この方法を選択すると、タ
イプ間に "OR" コネクタが作成されます。
しきい値で判 親タイプのスコアがそのしきい値に等しいか、それよりも大きい場
断
合にマッチすると見なします。 このオプションを選択すると、[し
きい値] スライダーが表示されます。 このスライダーを使ってしき
い値を指定します。 スコアリング方法によって、使用する論理コネ
クタが決定されます。
注: ここで設定したしきい値は、実行時に [データフロー オプション] ダイアログ
ボックスを使って変更できます。 [編集] > [データフロー オプション] の順にク
リックし、[追加] をクリックします。ステージを展開し、[トップ レベルのしき
い値] をクリックしてから [デフォルト値] フィールドにしきい値を入力します。
欠落データ フィールド内の空白データのスコアの計算方法を決定します。 次のいずれかです。
しきい値
362
空白を無視
フィールドに空白データが入っている場合、そのフィール
ドを無視します。
0 としてカウント
フィールドに空白データが入っている場合、そのフィール
ドのスコアを 0 とします。
100 としてカウント
フィールドに空白データが入っている場合、そのフィール
ドのスコアを 100 とします。
[マッチング方法] で [しきい値で判断] を指定すると、しきい値スライダーが表示さ
れます。 マッチ スコアがしきい値より高くなければ、親はマッチと判断されませ
ん。 親ノードのしきい値を子のしきい値より高くすることはできません。
Spectrum™ Technology Platform 8.0.0
第 20 章 : Advanced Matching モジュール
スコアリン マッチング スコアの決定に使用する方法を選択できます。 次のいずれかです。
グ方法
加重平均
親の下の各子ノードの重みを使用して、平均マッチ スコアを決
定します。
平均
親の下の各子ノードの平均スコアを使用して、親のスコアを決定
します。
最大値
親の下の子の最も高いスコアを使用して、親のスコアを決定しま
す。
最小値
親の下の子の最も低いスコアを使用して、親のスコアを決定しま
す。
次の表に、マッチング方法とスコアリング方法の論理的な関係、およびそれぞれの組み合わせに
よってマッチング処理時に使用されるロジックがどのように変わるかを示します。
表 61 : マッチング方法とスコアリング方法の表
マッチング方法
いずれかが すべて真
真
コメント
しきい値で
判断
スコアリング方法
加重平均
不可
AND
AND
平均
不可
AND
AND
最大値
OR
不可
OR
最小値
OR
不可
OR
マッチング方法として [すべて真] ま
たは [しきい値で判断] が選択されて
いる場合にのみ使用可能です。
マッチング方法として [いずれかが
真] または [しきい値で判断] が選択
されている場合にのみ使用可能で
す。
3. 子タイプ オプションを定義します。 子ノードを選択すると、マッチング階層の右側に子オプショ
ンが表示されます。
注: 親の下のすべての子は、同じ論理演算子を使用する必要があります。 コネクタを結合するに
は、まず中間の親ノードを作成する必要があります。
クロス 2 つのレコード間で異なるフィールドを相互にマッチングするのに使用します。
マッチ
対象
ユーザ ガイド
363
Intraflow Match
欠落
フィールド内の空白データのスコアの計算方法を決定します。 次のいずれかです。
データ
空白を無視
フィールドに空白データが入っている場合、そのフィールド
を無視します。
0 としてカウント
フィールドに空白データが入っている場合、そのフィールド
のスコアを 0 とします。
100 としてカウント
フィールドに空白データが入っている場合、そのフィールド
のスコアを 100 とします。
しきい フィールドがマッチと判断されるために個々のフィールド レベルで満たす必要があるし
値
きい値。
スコア マッチング スコアの決定に使用する方法を選択できます。 次のいずれかです。
リング
加重平均
各アルゴリズムの重みを使用して、平均マッチ スコアを決定しま
方法
す。
平均
各アルゴリズムの平均スコアを使用して、マッチ スコアを決定しま
す。
最大値
最も高いアルゴリズムのスコアを使用して、マッチ スコアを決定し
ます。
最小値
最も低いアルゴリズムのスコアを使用して、マッチ スコアを決定し
ます。
アルゴ 2 つの文字列データのスコアを決定するために使用します。 次のものから複数指定でき
リズム ます。
Acronym (頭 企業名がその頭字語にマッチするかどうかを判定します。 例: Internal
字語)
Revenue Service とその頭字語 IRS はマッチすると判断され、マッチ
スコア 100 が返されます。
Character
Frequency
(文字出現回
数)
文字列に含まれるすべての文字の出現回数を個別に確認し、2 つの文字
列における全体的な出現回数を比較します。
Date (日付)
日付のフォーマットにかかわらず、入力レコードに含まれる日付を比較
します。 [オプション] 列の [編集] をクリックして、次のオプションを
指定します。
• 月を必須とする: 年のみで構成される日付のマッチングを防ぎます。
• 日を必須とする: 月と年のみで構成される日付のマッチングを防ぎま
す。
• MM/DD という転置形式もマッチとみなす: 月と日が数値形式で指定
されている場合に、サスペクトの月と候補の月、サスペクトの日と候
補の日という標準的な比較に加えて、サスペクトの月と候補の日、サ
スペクトの日と候補の月の比較を行います。
364
Spectrum™ Technology Platform 8.0.0
第 20 章 : Advanced Matching モジュール
• MM/DD/YYYY ではなく DD/MM/YYYY 形式を優先する: 月と日がとも
に数値形式で指定されており、両者が文脈からは識別できない場合の
日付のパーシングに使用します。 例えば、数字が 5 と 13 の場合、
パーサーは自動的に 5 を月に、13 を日に割り当てます。1 年に 12 カ
月しかないためです。 しかし、数字が 5 と 12 (または、ともに 12 以
下の任意の 2 つの数字) の場合、パーサーは最初の数字が月であると
みなします。 このオプションを選択することにより、パーサーが最
初の数字を月ではなく日として読むように指定することができます。
• 範囲オプション — 全体: マッチング日付間の最大日数を設定できま
す。 例えば、全体範囲として 35 日と入力し、候補日付が 2000/12/31
の場合、サスペクト日付 2001/02/05 はマッチですが、サスペクト日
付 2001/02/06 はマッチではありません。 全体範囲として 1 日と入力
し、候補日付が 2000/01 の場合、サスペクト日付 1999 はマッチです
が (1999/12/31 と比較します)、サスペクト日付 2001/01 はマッチで
はありません。
• 範囲オプション — 年: 月、日とは別に、マッチング日付間の年数を設
定できます。 例えば、年の範囲として 3 年と入力し、候補日付が
2000/01/31 の場合、サスペクト日付 2003/01/31 はマッチですが、サ
スペクト日付 2003/02 はマッチではありません。 同様に、候補日付
が 2000 の場合、サスペクト日付 2003/03 は月の不整合がなく、3 年
の範囲内にあるので、マッチとなります。
• 範囲オプション — 月: 年、日とは別に、マッチング日付間の月数を設
定できます。 例えば、月の範囲として 4 と入力し、候補日付が
2000/01/01 の場合、サスペクト日付 2000/05 は日の不整合がなく、
4 カ月の範囲内にあるのでマッチですが、サスペクト日付 2000/05/02
は日の不整合があるためマッチではありません。
• 範囲オプション — 日: 年、月とは別に、マッチング日付間の日数を設
定できます。 例えば、日の範囲として 5 と入力し、候補日付が
2000/01/01 の場合、サスペクト日付 2000/01 は日の不整合がないの
でマッチですが、サスペクト日付 1999/12/27 は月の不整合があるた
めマッチではありません。
Double
Metaphone
文字の発音表記に基づいて、2 つの文字列間の類似性を判断します。
Double Metaphone は Metaphone アルゴリズムの改良版で、さまざま
な言語に多数存在する不規則性を考慮しています。
Edit Distance 1 つの文字列をもう 1 つの文字列に変換するために必要な削除、挿入、
(編集距離)
または置換の数に基づいて、2 つの文字列間の類似性を判断します。
Exact Match
(完全一致)
2 つの文字列が同じであるかどうかを判断します。
Initials (頭文
字)
パースした個人名の頭文字のマッチングに使用します。
Jaro-Winkler 1 つの文字列をもう 1 つの文字列に変換するために要する文字の置換の
Distance
数に基づいて、2 つの文字列間の類似性を判断します。 このオプション
は、個人名などの短い文字列用に開発されました。
ユーザ ガイド
365
Intraflow Match
(Jaro-Winker
距離)
Keyboard
Distance
(キーボード距
離)
キーボード上のキーの位置によって重みを付け、1 つの文字列をもう一
方の文字列に変換するために必要な削除、挿入、または置換の数に基づ
いて、2 つの文字列間の類似性を判断します。 [オプション] 列の [編集]
をクリックして、使用しているキーボードのタイプを QWERTY (米国)、
QWERTZ (オーストリアおよびドイツ)、または AZERTY (フランス) か
ら指定します。
Metaphone
文字の発音表記に基づいて、2 つの文字列間の類似性を判断します。 こ
のオプションは、Soundex の制限に対応するために作成されました。
Metaphone
(スペイン語)
文字の発音表記に基づいて、2 つの文字列間の類似性を判断します。 こ
のオプションは、Soundex の制限に対応するために作成されました。
Name Variant 2 つの名前が互いの派生形であるかどうかを判断します。 このアルゴリ
(名前の派生
ズムは、2 つの名前が互いの派生形である場合はマッチ スコア 100 を
形)
返し、互いの派生形でない場合はマッチ スコア 0 を返します。 例え
ば、JOHN は JAKE の派生形なので、マッチ スコア 100 が返されます。
JOHN は HENRY の派生形ではないので、マッチ スコア 0 が返されま
す。 [オプション] 列の [編集] をクリックして、[Name Variant (名前の
派生形)] オプションを選択します。 詳細については、Name Variant
Finder(1073ページ)を参照してください。
Numeric
住所行の数値属性を文字から分離して、住所行を比較します。 例えば、
String (数値文 住所文字列 1234 Main Street Apt 567 では、文字列の数値属性 (1234567)
字列)
がパースされ、残りの文字列値 (Main Street Apt) とは異なる処理が行わ
れます。 このアルゴリズムでは、まず数値アルゴリズムを使用して、
文字列の中の数値データが照合されます。 数値データのマッチが 100
の場合、Edit Distance と Character Frequency を使用して、英字データ
が照合されます。 最終的なマッチ スコアは次のように計算されます。
(numericScore + (EditDistanceScore +
CharacterFrequencyScore) / 2) / 2
例えば、以下の 2 つの住所は次のように計算され、マッチ スコアは 95.5
になります。
123 Main St Apt 567
123 Maon St Apt 567
Numeric Score = 100
Edit Distance = 91
Character Frequency = 91
91 + 91 = 182
182/2 = 91
100 + 91 = 191
191/2 = 95.5
Soundex
366
文字の発音表記に基づいて、2 つの文字列間の類似性を判断します。
Spectrum™ Technology Platform 8.0.0
第 20 章 : Advanced Matching モジュール
SubString (部 1 つの文字列が別の文字列内に出現するかどうかを判断します。
分文字列)
次の表に、選択した親タイプのスコアリング方法と、使用できるアルゴリズム数との論理的関係を
示します。
表 62 : マッチング アルゴリズムとスコアリング方法の表
アルゴリズム
単一
複数
加重平均
不可
はい
平均
不可
はい
最大値
はい
はい
最小値
不可
はい
スコアリング方法
マッチング ルールの例
次の例では、名前データと住所データを照合するマッチ ルールの作成方法を示し
ます。 名前マッチは、First Name フィールドと Last Name フィールドで構成さ
れます。 名前がマッチと判断されるには、どちらのフィールドも一致しなければ
なりません。 住所マッチは、House Number フィールドと Street Name フィール
ドで構成されます。 マッチと判断されるには、どちらのフィールドも一致しなけ
ればなりません。
カスタム マッチ ルールの作成は、次の 3 つのステップで行われます。
1. 1(367ページ)
2. 2(368ページ)
3. 3(370ページ)
1. マッチング階層を作成します。
a. [新規] をクリックして、新しいマッチ ルールを作成します。
b. [親の追加] をクリックして、階層にルート マッチ ノードを作成します。
これにより、[ロードするマッチ タイプ:] ドロップダウン ボックスに設定
されるルール セット名も決定されます。
ユーザ ガイド
367
Intraflow Match
c. 親ノードの一意な名前を入力します。 親ノード名は一意な名前でなければ
なりません。フィールドにすることはできません。 この例では、マッチ
ルールに "Name and Address Match" と命名します。
d. 階層で "Name and Address" 親ノードを選択します。
e. [親の追加] をクリックして、"Name and Address" 親ノードの下に子ノー
ドを作成します。
f. 親/子ノードの一意な名前を入力します。 この例では、一意な名前は "Name"
です。
g. 階層で "Name" 親/子ノードを選択します。
h. [子の追加] をクリックして、"Name" 親/子ノードの下に子/フィールド ノー
ドを作成します。
i.
リストで FirstName を選択します。
j.
階層で "Name" 親/子ノードを選択します。
k. [子の追加] をクリックして、"Name" 親/子ノードの下に別の子/フィールド
ノードを作成します。
l.
リストで LastName を選択します。
m. 階層で "Name and Address" 親ノードを選択します。
n. [親の追加] をクリックして、"Name and Address" 親ノードの下に子ノー
ドを作成します。
o. 親/子ノードの一意な名前を入力します。 この例では、一意な名前は
"Address" です。
p. 階層で "Address " 親/子ノードを選択します。
q. [子の追加] をクリックして、"Address" 親/子ノードの下に子/フィールド
ノードを作成します。
r. リストで HouseNumber を選択します。
s. 階層で "Address " 親/子ノードを選択します。
t. [子の追加] をクリックして、"Address" 親/子ノードの下に別の子/フィール
ド ノードを作成します。
u. リストで StreetName を選択します。
2. 親タイプ マッチング オプションを選択します。
a. 階層で "Name and Address" 親ノードを選択し、次の操作を行います。
• [マッチング方法] で [すべて真] を選択します。 [すべて真] を選択する
と、"Name and Address" 親ノードの下の各子ノードが "and" コネクタ
で結合されます。 マッチと判断されるには、"Name" 子ノード と
"Address" 子ノードがどちらも真である必要があります。 親の [すべて
真] は、フィールド レベルで判断されます。
• [スコアリング方法] リストで [平均] を選択します。 [平均] を選択する
と、"Name and Address" 親ノードの下の各子ノードのスコアの平均ス
368
Spectrum™ Technology Platform 8.0.0
第 20 章 : Advanced Matching モジュール
コアが採用されます。 Name ノードのスコアが 80 で、Address ノード
のスコアが 100 の場合、"Name and Address" 親ノードにロールアップ
されるスコアは 90 になります。
• [欠落データ] で [空白を無視] を選択します。 この例ではデータに空白
が含まれていないため、このルールは "Name and Address" 親ノード レ
ベルでは使用されません。 ただし、フィールド レベルのすべての子ノー
ドが空白データを含む場合、これらのフィールドの親ノードも空白デー
タを含むものとしてマークされます。 この例では、First Name フィー
ルドと Last Name フィールドがどちらも空白データを含む場合、"Name"
親ノードも空白データを含むことになります。 最終的なマッチ スコア
を計算する際、"Name" 親ノードは無視されます。 例: フィールド レベ
ルの子ノード (House Number および Street Name) にはデータが入って
いて、平均スコア 100 が計算されるため、Address 親ノードのスコアは
100 になります。 フィールド レベルの子ノード (First Name および Last
Name) にはデータが入っていないため、Name 親ノードは空白データを
含むことになり、無視されます。 Address 親ノードのスコアのみがマッ
チングにカウントされ、そのスコアが Name and Address Match 親ノー
ドにロールアップされます。 全体のマッチ スコアは 100 と計算されま
す。
b. 階層で "Name" 親ノードを選択し、次の操作を行います。
• [マッチング方法] で [すべて真] を選択します。 [すべて真] を選択する
と、"Name" 親ノードの下の各子ノードが "and" コネクタで結合されま
す。 マッチと判断されるには、First Name 子ノードと Last Name 子ノー
ドがどちらも真でなければなりません。
• [スコアリング方法] リストで [平均] を選択します。 [平均] を選択する
と、"Name " 親ノードの下の各子ノードのスコアの平均スコアが採用さ
れます。 First Name フィールドのスコアが 70 で、Last Name フィール
ドのスコアが 90 の場合、Name 親ノードにロールアップされるスコア
は 80 になります。
• [欠落データ] で [空白を無視] を選択します。 この例ではデータに空白
が含まれていないため、このルールは "Name" 親ノード レベルでは使用
されません。 ただし、First Name フィールドと Last Name フィールド
がどちらも空白データを含む場合、これらのフィールドの "Name" 親
ノードも空白データを含むものとしてマークされます。 この場
合、"Name" 親ノードはマッチングで無視されます。
c. 階層で "Address" 親ノードを選択し、次の操作を行います。
• [マッチング方法] で [すべて真] を選択します。 [すべて真] を選択する
と、"Address" 親ノードの下の各子ノードが "and" コネクタで結合され
ユーザ ガイド
369
Intraflow Match
ます。 マッチと判断されるには、House Number 子ノードと Street Name
子ノードがどちらも真でなければなりません。
• [スコアリング方法] リストで [平均] を選択します。 [平均] を選択する
と、"Address" 親ノードの下の各子ノードのスコアの平均スコアが採用
されます。 House Number フィールドのスコアが 100 で、Street Name
フィールドのスコアが 100 の場合、"Address" 親ノードのスコアは 100
になります。
• [欠落データ] で [空白を無視] を選択します。 この例ではデータに空白
が含まれていないため、このルールは "Address" 親ノード レベルでは使
用されません。 ただし、House Number フィールドと Street Name
フィールドがどちらも空白データを含む場合、これらのフィールドの
"Address" 親ノードも空白データを含むものとしてマークされます。 こ
の場合、"Address" 親ノードはマッチングで無視されます。
3. 子タイプ マッチング オプションを選択します。
a. "Name" 親ノードの下の FirstName を選択し、次の操作を行います。
• [アルゴリズム] の下の [Exact Match (完全一致)] チェック ボックスをク
リアし、[Edit Distance (編集距離)] チェック ボックスと [Character
Frequency (文字出現回数)] チェック ボックスを選択します。
• [スコアリング方法] ボックスで [平均] を選択します。 [平均] を選択す
ると、2 つのアルゴリズムのスコアの平均を採用して、[FirstName] フィー
ルドのスコアが計算されます。 Edit Distance アルゴリズムのスコアが
80 で、Character Frequency アルゴリズムのスコアが 60 の場合、
FirstName フィールドのスコアは 70 になります。
• [欠落データ] で [空白を無視] を選択します。 この例ではデータに空白
が含まれていないため、このルールはフィールド レベルでは使用されま
せん。 ただし、FirstName フィールドが空白を含み、LastName フィー
ルドにはデータが入っている場合、FirstName フィールドはマッチング
で無視され、LastName のスコアのみがカウントされて、親ノードにロー
ルアップされます。
• [しきい値] の下のスライダーを 70 に設定します。 フィールドのスコア
がしきい値以上の場合にのみ、First Name フィールドはマッチと見なさ
れます。
b. "Name" 親ノードの下の LastName を選択し、次の操作を行います。
• [アルゴリズム] の下の [Exact Match (完全一致)] チェック ボックスをク
リアし、[Edit Distance (編集距離)] チェック ボックスと [Character
Frequency (文字出現回数)] チェック ボックスを選択します。
• [スコアリング方法] ボックスで、[最大値] を選択します。 [最大値] を
選択すると、2 つのアルゴリズムのスコアの最大スコアが採用され、
370
Spectrum™ Technology Platform 8.0.0
第 20 章 : Advanced Matching モジュール
LastName フィールドのスコアとして使用されます。 Edit Distance アル
ゴリズムのスコアが 90 で、Character Frequency アルゴリズムのスコア
が 80 の場合、LastName フィールドのスコアは 90 になります。
• [欠落データ] で [空白を無視] を選択します。 この例ではデータに空白
が含まれていないため、このルールはフィールド レベルでは使用されま
せん。 ただし、Last Name フィールドが空白を含み、First Name フィー
ルドにはデータが入っている場合、Last Name フィールドはマッチング
で無視され、First Name のスコアのみがカウントされて、親ノードに
ロールアップされます。
• [しきい値] の下のスライダーを 80 に設定します。 フィールドのスコア
がしきい値以上の場合にのみ、[LastName] フィールドはマッチと見なさ
れます。
c. "Address" 親ノードの下の HouseNumber を選択し、次の操作を行いま
す。
• [アルゴリズム] の下の [Exact Match (完全一致)] チェック ボックスをク
リアします。
• [欠落データ] で [空白を無視] を選択します。 この例ではデータに空白
が含まれていないため、このルールはフィールド レベルでは使用されま
せん。 ただし、[HouseNumber] フィールドが空白を含み、[StreetName]
フィールドにはデータが入っている場合、[HouseNumber] フィールドは
マッチングで無視され、[StreetName] のスコアのみがカウントされて、
親ノードにロールアップされます。
• [しきい値] の下のスライダーを 100 に設定します。 フィールドのスコ
アがしきい値以上の場合にのみ、[HouseNumber] フィールドはマッチと
見なされます。
d. "Address" 親ノードの下の StreetName を選択し、次の操作を行います。
• [アルゴリズム] の下の [Exact Match (完全一致)] チェック ボックスをク
リアし、[Edit Distance (編集距離)] チェック ボックスと [Character
Frequency (文字出現回数)] チェック ボックスを選択します。
• [スコアリング方法] ボックスで [平均] を選択します。 [平均] を選択す
ると、2 つのアルゴリズムのスコアの平均を採用して、[FirstName] フィー
ルドのスコアが計算されます。 Edit Distance アルゴリズムのスコアが
100 で、Character Frequency アルゴリズムのスコアが 100 の場合、
[StreetName] フィールドのスコアは 100 になります。
• [欠落データ] で [空白を無視] を選択します。 この例ではデータに空白
が含まれていないため、このルールはフィールド レベルでは使用されま
せん。 ただし、[StreetName] フィールドが空白を含み、[HouseNumber]
フィールドにはデータが入っている場合、[StreetName] フィールドは
ユーザ ガイド
371
Intraflow Match
マッチングで無視され、[HouseNumber] のスコアのみがカウントされ
て、親ノードにロールアップされます。
• [しきい値] の下のスライダーを 100 に設定します。 フィールドのスコ
アがしきい値以上の場合にのみ、[StreetName] フィールドはマッチと見
なされます。
マッチ ルール評価の使用
マッチ ルール評価を使用して、1 個のサスペクトと最大 10 個の候補で構成される、サンプル データ
の小さな集合に対するマッチ ルールの効果を調べます。 マッチ ルール評価を使用するには、マッチ
ルール階層内のノードを選択し、[評価] をクリックします。
Match Rule Evaluator は、次のコンポーネントで使用可能です。
• Interflow Match(345ページ)
• Intraflow Match(359ページ)
• Transactional Match(400ページ)
評価用の入力レコードを指定するには、次の 2 つの方法があります。
• 手動で入力 — [入力] タブで、[サスペクト] の下にサスペクト レコードを入力し、[候補] の下に最大
10 個の候補を入力します。 レコードを入力したら、[エクスポート] をクリックしてレコードをファ
イルに保存できます。それ以降は、データを手動で再入力する代わりに、このファイルをインポー
トすることができます。
• ファイルからインポート — [入力] タブで、[インポート...] をクリックして、サンプル レコードを含
むファイルを選択します。 区切り記号付きファイルは、区切り文字としてカンマ、パイプ、または
タブを使用し、[候補] の下に表示されたフィールド名と一致するヘッダ フィールドを持つヘッダ レ
コードを含む必要があります。 Household 入力のヘッダ レコードのサンプルを以下に示します。
LastName,HouseNumber,LeadingDirectional,StreetName,StreetSuffix,TrailingDirectional,ApartmentNumber,
POBox,RRHC,PrivateMailbox
評価結果を表示するには、次の 2 つの方法があります。
• 現在のルールを評価 — [現在のルール] をクリックします。 これにより、[マッチ ルール] タブで定
義されたルールが実行されます。 結果は、一度に 1 つのサスペクトと候補のペアに対して表示され
ます。 結果を循環して表示するには、矢印ボタンをクリックします。 フィールドのスコアとアルゴ
リズムが、マッチ ルール制御と同様のツリー形式で表示されます。 結果は、xml フォーマットでエ
クスポートすることもできます。
• すべてのアルゴリズムの評価 — [すべてのアルゴリズム] をクリックします。 この設定を使うと、
マッチ ルールが無視され、すべてのアルゴリズムが各フィールドに実行されてサスペクトと候補の
ペアが評価されます。 結果は、一度に 1 つのサスペクトまたは候補のペアについて表示され、矢印
ボタンを使って循環して表示できます。
[スコア] の下に表示される結果は、次のように色分けされます。
372
Spectrum™ Technology Platform 8.0.0
第 20 章 : Advanced Matching モジュール
• 緑 — 実行結果がマッチだったルール。
• 赤 — 実行結果がマッチでなかったルール。
• 灰色 — 無視されたルール。
• 青 — ルールに含まれる個別のアルゴリズムの結果。
マッチ ルールまたは入力を変更したときに結果が自動的に更新されるようにするには、[自動更新]
チェック ボックスを選択します。 この機能を [すべてのアルゴリズム] オプションを選択して使うと、
入力を変更したときにのみ、結果が更新されます。
評価結果を XML フォーマットでエクスポートするには、[エクスポート] をクリックします。
[マッチ ルール] タブを使って、さまざまなマッチ ルール設定を試すことができます。 このタブで行っ
た変更をステージのマッチ ルールに適用するには、[保存] をクリックします。
出力
表 63 : Intraflow Match 出力
フィールド名
説明/有効値
CollectionNumber
重複レコードのコレクションを識別します。 有効な値は 1 以上です。
ExpressMatchIdentified
マッチの取得に Express マッチ キーが使われたかどうかを示します。
有効な値は Yes または No です。
MatchRecordType
コレクションに含まれるマッチ レコードのタイプを識別します。 有
効な値を次に示します。
MatchScore
suspect
互いに重複する関係にあるかどうかを確認するため
に、他のレコードと比較するレコード。 1 コレクショ
ンにサスペクト レコードは 1 つのみ含まれます。
duplicate
サスペクト レコードと重複するレコード。
unique
重複がないレコード。
2 つのレコードの全体的なスコアを識別します。 有効な値は 0 〜 100
です。0 は精度の低いマッチを意味し、100 は完全一致を意味します。
注: Validate Address および Advanced Matching モジュールのコンポーネントは、どちらも MatchScore
フィールドを使用します。 データフローの出力の MatchScore フィールドの値は、出力ステージ
に送られる前に最後に値を変更したステージによって決まります。 データフローに Validate
Address および Advanced Matching モジュールのコンポーネントが含まれ、各ステージの
MatchScore 出力フィールドを確認したい場合は、Transformer ステージを使用して、MatchScore
ユーザ ガイド
373
マッチ分析
値を他のフィールドにコピーしてください。 例えば、Validate Address によって MatchScore と
いう出力フィールドが作成され、Transformer ステージによって Validate Address の MatchScore
フィールドが AddressMatchScore というフィールドにコピーされます。 マッチャー ステージを
実行すると、マッチャーから得た値が MatchScore フィールドに設定され、Validate Address か
ら得た AddressMatchScore の値が 引き渡されます。
マッチ分析
マッチ分析を使用して、同じタイプの 1 つ以上のマッチング タイプのジョブ結果を分析および比較し
ます。 このツールを使用すると、マッチング処理の結果を詳細に把握できるほか、マッチング結果の
向上に役立てることもできます。
マッチ分析は、次の機能を備えています。
• マッチ サマリ結果: 単一のマッチ結果の (または 2 つのマッチ結果の比較による) サマリ レコード数
を表示します。 詳細については、単一マッチ ステージのマッチ結果の表示(380ページ)および2 つ
のマッチ ステージのマッチ結果の比較(389ページ)を参照してください。
• ドロップ グラフ: マッチしたデータの増減を棒グラフで表示します。 詳細については、リフト/ド
ロップ グラフの表示(382ページ)またはリフト/ドロップ グラフの比較(390ページ)を参照してく
ださい。
• マッチ ルール: 単一のマッチ結果に使用するマッチ ルール、または 2 つのマッチ結果を比較すると
きマッチ ルールに加えられる変更を表示します。 詳細については、マッチ ルールの表示(382ペー
ジ)またはマッチ ルールの比較(391ページ)を参照してください。
• マッチ詳細情報結果: 単一のマッチ結果の (または 2 つのマッチ結果の比較による) レコード処理の
詳細情報を表示します。 詳細については、単一マッチ ステージのマッチ結果の表示(380ページ)お
よび2 つのマッチ ステージのマッチ結果の比較(389ページ)を参照してください。
マッチ分析の用語
次の表に、マッチ結果の理解に役立つ用語を示します。
表 64 : マッチ分析の用語
374
用語
説明
平均スコア
すべての重複の平均スコア。
ベースライン
マッチした他の結果と比較するために選択したマッチ結果。
Spectrum™ Technology Platform 8.0.0
第 20 章 : Advanced Matching モジュール
用語
説明
候補グループ
Candidate Finder が割り当てた ID でグループ化されたサスペクトま
たは候補のレコード。 サスペクト (そのグループの最初のレコード)
は入力ソースから読み込まれたレコードですが、候補は通常、SQL ク
エリを使用してデータベースから取り出されたレコードです。
候補レコード
マッチ グループまたは候補グループ内にあるサスペクト以外のすべて
のレコード。
ドロップ
重複の減少。
詳細マッチ レコード
マッチ ステージによって処理されたレコードに合致した 1 つのレコー
ドのこと。 各レコードは、そのマッチ グループまたは候補グループ
と出力コレクションの情報と共に、そのレコードがサスペクト、ユ
ニーク、または重複のいずれであったかという情報を提供します。 候
補レコードは、なぜその入力レコードがサスペクトにマッチしたか、
またはマッチしなかったかという情報を提供します。
重複コレクション
サスペクトとその重複レコードがコレクション番号によってグループ
化されたもの。 ユニーク レコードは常にコレクション番号 0 とされ
ます。
重複レコード
マッチ グループ内で他のレコードとマッチしたレコード。 サスペク
トまたは候補となります。
Express マッチ
サスペクトと候補が指定されたフィールド内の内容に正確にマッチし
た場合に作成されるもののこと。通常は ExpressMatchKey が Match
Key Generator によって提供されます。 式マッチがそれ以上の処理が
されず終了した場合、サスペクトと候補は重複していると判断できま
す。
入力レコード
マッチング ソート実行前のマッチング ステージにおけるレコードの
順序。
Interflow Match
2 つの入力レコード ストリーム間で類似データ レコードのマッチを検
出するマッチング コンポーネント。 最初のレコード ストリームはサ
スペクト レコードのソースで、2 番目のストリームは候補レコードの
ソースです。
ユーザ ガイド
375
マッチ分析
376
用語
説明
Intraflow Match
1 つの入力ストリーム内の類似データ レコードのマッチを検出する
マッチング コンポーネント。
リフト
重複の増加。
マッチ グループ
(グループ化方法) マッチ キーまたはスライディング ウィンドウでグ
ループ化されたレコード。
マッチ結果
(またはリソース バンドル) ステージで生成されたファイルの論理的グ
ループ。 このデータはステージの実行毎に保持され、ディスクに保存
されます。 次の実行では、前回の結果の上書きまたは変更はしませ
ん。 MAT では、設定情報と同様にサマリと詳細結果に関する情報を
提供するために使用されます。
マッチ結果リスト
MAT が現在の分析セッションで分析できる、1 種類のマッチ結果のリ
スト。
マッチ結果タイプ
マッチ結果の中身を示します。 MAT はマッチ結果タイプを使用して、
データの使用方法を決定します。
マッチャー ステージ
マッチング ルーチンを実行するキャンバス上のステージ。 マッチャー
ステージは Interflow Match、Intraflow Match、および Transactional
Match です。
マッチでなくなったもの
以前は重複またはサスペクトとされていたが、現在はユニークとなっ
ているレコード。
新しいマッチ
以前はユニークだったが、現在は重複またはサスペクトとされている
レコード。
スライディング ウィンドウ
スライディング ウィンドウ マッチング方法は、ウィンドウというあ
らかじめ定められたバッファ サイズを、対応するデータ行で連続して
埋めていきます。 各行はウィンドウに追加され、既にウィンドウ内に
あるアイテムと比較されます。
サスペクト レコード
マッチ グループまたは候補グループ内の候補と照合されるドライバ
レコード。
Spectrum™ Technology Platform 8.0.0
第 20 章 : Advanced Matching モジュール
用語
説明
Transactional Match
Candidate Finder または外部アプリケーションが返す候補レコードと
サスペクト レコードを照合するマッチング コンポーネント。
ユニーク レコード
マッチ グループで他のレコードにマッチしないサスペクトまたは候補
レコード。 マッチ グループ内に 1 つしか存在していないレコードで
あれば、サスペクトは自動的にユニーク レコードとなります。
分析用マッチ結果を有効/無効にする
分析用マッチ結果を有効/無効にするには、[分析用データを生成する] オプションを使用します。
マッチ結果の有効化
1. キャンバス上のマッチャー ステージを右クリックして、[オプション] を選択します。 [マッチャー
オプション] ダイアログ ボックスが表示されます。
2. [分析用データを生成する] チェック ボックスを選択します。
3. [OK] をクリックします。
このジョブを実行すると、マッチ結果が生成されるようになります。
マッチ結果の無効化
1. キャンバス上のマッチャー ステージを右クリックして、[オプション] を選択します。
2. [分析用データを生成する] チェック ボックスをクリアします。
ユーザ ガイド
377
マッチ分析
3. [OK] をクリックします。
このジョブを実行すると、マッチ結果が生成されなくなります。
マッチ結果の参照
分析可能なジョブが [マッチ結果を表示] ダイアログ ボックスに表示されます。 キャンバスが空の場
合、保存していないジョブがある場合、またはジョブ以外のタスクが表示されている場合、[次のジョ
ブのみ表示] の値は [開始]、[次の値以上]、およびデフォルトで表示される日時です。 保存済みのジョ
ブが開かれていて、キャンバス上でアクティブな場合、[次のジョブのみ表示] の値は [名前は <ジョブ
名>] に設定されて表示されます。
ジョブは、正常終了、処理済み、終了、ステータス、および他のフィルタでフィルタリングできます。
すべてのフィルタ属性のリストが [次のジョブのみ表示] リストに表示されます。
単一マッチ ステージのサマリ結果を表示するには、次の手順に従います。
1. [ツール] メニューで [マッチ分析] を選択します。
[マッチ結果を表示] ダイアログ ボックスが表示されます。 [マッチ結果を表示] ダイアログ ボック
スに、マッチ分析ツールで処理できるマッチ結果を持つジョブの一覧が表示されます。
2. 表示されるマッチ結果を変更するには、次の手順に従います。
a) [次のジョブのみ表示] ドロップダウン リストで Filter オプションを選択します。 次の中から選
択します。 ID、名前、ユーザ、開始、終了、ステータス、処理済み、正常終了、失敗、形式誤
り。
b) 論理演算子を選択します。 次の中から選択します。 が次の値である、が次の値ではない、以
上、未満、以下。
3. ジョブ インスタンスの左側のプラス アイコンをクリックして展開し、ジョブ マッチ結果までドリ
ルダウンします。 各マッチ結果にはステージ名が関連付けられます。
4. 1 つまたは複数の結果を選択し、[追加] をクリックします。複数の結果を選択するには、Ctrl キー
を押しながら、追加する結果をクリックします。
選択したマッチ結果マッチ結果リストに表示され、ベースラインとして設定されます。 マッチ結
果リストの使用方法の詳細については、マッチ結果リストの使用(378ページ)を参照してくださ
い。
マッチ結果リストの使用
ここでは次の内容について説明します。
• ベースライン結果と比較結果の設定(379ページ)
• マッチ結果リストへのマッチ結果の追加 (379ページ)
• マッチ結果リストからのマッチ結果の削除(380ページ)
• マッチ詳細情報の表示(380ページ)
マッチ結果リストには、選択したマッチ結果群が表示されます。 列ヘッダをクリックして、リストを
ソートすることができます。
378
Spectrum™ Technology Platform 8.0.0
第 20 章 : Advanced Matching モジュール
マッチ分析タイトル バーを選択し、いずれかの位置にドラッグすることにより、Enterprise Designer
ウィンドウ内でマッチ結果リストの配置を変更することができます。 次の位置を選択できます。
• フローティング ウィンドウ
• Enterprise Designer ウィンドウの左、上、右、または下。 デフォルト設定は下です。
• キャンバスの左、上、右、または下。
• 元の位置に戻すには、タイトル バーをダブル クリックします。
ベースライン結果と比較結果の設定
ベースライン結果を設定するには、マッチ結果リストから結果を選択し、[ベースライン] をクリック
します。
比較結果を設定するには、マッチ結果リストから結果を選択し、[比較] をクリックします。
マッチ結果リストへのマッチ結果の追加
マッチ分析ツールのオープン中にジョブを実行し、マッチ結果リストが空の場合、マッチ結果はリス
トに自動的に追加されます。 マッチ結果の追加後、MAT は同じタイプのマッチ結果のみを追加しま
す。
同じマッチ タイプのマッチ結果の自動追加
同じマッチ タイプのマッチ結果を自動的に追加するには、ジョブを実行します。
ジョブの実行が完了したら、最後のジョブ インスタンスのマッチ結果がマッチ結果リストに追加され
ます。
異なるマッチ タイプのマッチ結果の自動追加
異なるマッチ タイプのマッチ結果を自動的に追加するには、次の手順に従います。
1. マッチ結果リストのすべてのマッチ結果を選択し、[削除] をクリックします。
2. 異なるマッチング ステージを使用するジョブを Server Explorer から開くか、ジョブが既に開かれ
ている場合は、キャンバスの上のタブをクリックします。
3. ジョブを実行します。
ユーザ ガイド
379
マッチ分析
ジョブの実行が完了したら、最後のジョブ インスタンスのマッチ結果がマッチ結果リストに追加され
ます。
マッチ結果リストからのマッチ結果の追加
1. [追加] をクリックします。
2. マッチ結果を選択します。
マッチ結果の選択の詳細については、マッチ結果の参照(378ページ)を参照してください。
注: マッチ結果は、同じマッチ タイプである場合にのみ追加されます。
マッチ結果リストからのマッチ結果の削除
マッチ結果リストからマッチ結果を削除するには、マッチ結果リストでマッチ結果を選択し、[削除]
をクリックします。
マッチ結果リストと [サマリ] タブは、次のように更新されます。
• 削除するマッチ結果がベースラインまたは比較マッチ結果のどちらでもない場合、マッチ結果が削
除されます。[サマリ] タブに変更はありません。
• 削除するマッチ結果がベースラインとして設定されていた場合、次に古いマッチ結果が新しいベー
スラインとして設定され、[サマリ] タブが更新されて、新しいベースライン データのみが表示され
ます。
• 削除するマッチ結果が比較マッチ結果として設定されていた場合、[サマリ] タブが更新されて、既
存のベースライン データのみが表示されます。
• 削除するマッチ結果がマッチ結果リストに表示されている 2 つのマッチ結果のどちらかの場合、残っ
たマッチ結果が新しいベースラインとして設定され、[サマリ] タブが更新されて、新しいベースラ
イン データのみが表示されます。
マッチ詳細情報の表示
選択したマッチ結果のマッチ詳細情報を表示するには、[詳細] をクリックします。 詳細については、
ベースライン マッチ結果の詳細情報の表示(383ページ)および比較結果の詳細情報の表示(392ペー
ジ)を参照してください。
単一マッチ ステージのマッチ結果の表示
ここでは、次の内容について説明します。
• サマリ結果の表示(381ページ)
• リフト/ドロップ グラフの表示(382ページ)
• マッチ ルールの表示(382ページ)
• ベースライン マッチ結果の詳細情報の表示(383ページ)
• ベースライン候補レコード詳細情報の表示(386ページ)
380
Spectrum™ Technology Platform 8.0.0
第 20 章 : Advanced Matching モジュール
• マッチ率グラフ(386ページ)
• Field Chooser の使用(387ページ)
• レコードのフィルタリング(388ページ)
注: マッチ結果を表示するには、[分析用データを生成する] オプションを有効にしたジョブを事前に
実行している必要があります。
サマリ結果の表示
サマリ結果には、マッチ結果のマッチ レコードに関するサマリ情報が表示されます。表 65 : 表示され
るサマリ結果データ(381ページ)に、表示される結果データをマッチ ステージ タイプ別に示します。
表 65 : 表示されるサマリ結果データ
サマリ関連の結果
Intraflow
Interflow
Transactional
入力レコード
X
重複レコード
X
ユニーク レコード
X
マッチ グループ
X
重複コレクション
X
X
Express マッチ
X
X
平均スコア
X
X
X
入力サスペクト
X
X
サスペクトと重複
X
X
ユニーク サスペクト
X
X
サスペクトと候補
X
X
候補がないサスペクト
X
X
別のマッチ ステージのサマリ結果をマッチ結果リストに表示するには、マッチ結果リストからマッチ
結果を選択し、[ベースライン] をクリックします。
ユーザ ガイド
381
マッチ分析
選択したベースラインのサマリ マッチ結果が [サマリ] タブに表示されます。表 65 : 表示されるサマ
リ結果データ(381ページ)に、表示される結果データをマッチ ステージ タイプ別に示します。
リフト/ドロップ グラフの表示
単一のマッチ結果のリフト/ドロップ グラフには、マッチと非マッチが棒グラフで表示されます。 リ
フトは、重複レコード数の増加として定義されます。 ドロップは、重複レコード数の減少として定義
されます。 ユニーク レコードは黄色で、重複レコードは緑で示されます。
リフト/ドロップ グラフを表示するには、[リフト/ドロップ] タブをクリックします。
マッチ ルールの表示
マッチ ルールは、階層構造で表示されます。これはマッチ ルールを作成したステージ ダイアログで
の表示方法と同じです。 [マッチ ルール] タブには、 [オプション] と [ルール] の2 つのノードが表示さ
れます。
マッチ ルールを表示するには
1. [マッチ ルール] タブをクリックします。
• [オプション] ノードには、選択したマッチ結果のステージ設定が表示されます。
• [ルール] ノードには、選択したマッチ結果のマッチ ルールが表示されます。
382
Spectrum™ Technology Platform 8.0.0
第 20 章 : Advanced Matching モジュール
2. ルール詳細情報を表示するには、階層内のノードを選択します。
ルール詳細情報がベースライン ウィンドウの下半分に表示されます。
ベースライン マッチ結果の詳細情報の表示
詳細結果には、マッチ結果セットのマッチ レコードに関する詳細情報が表示されます。表 66 : 表示さ
れる詳細結果データ(383ページ)に、表示される結果データをマッチ ステージ タイプ別に示します。
表 66 : 表示される詳細結果データ
詳細関連の結果
Intraflow
Interflow
Transactional
入力レコード番号
X
X
X
マッチ グループ
X
X
Express キー
X
X
ユーザ ガイド
383
マッチ分析
詳細関連の結果
Intraflow
Interflow
Transactional
Express キー ドライバ レコード
X
X
コレクション番号
X
X
X
マッチ レコード タイプ
X
X
X
ルールで使用するフィールド
X
X
X
全体 (トップレベル) ルール スコア
X
候補グループ
X
X
マッチ スコア
X
X
ベースライン結果セットの詳細結果を表示するには
1. マッチ結果リストから、マッチ結果を選択し、[ベースライン] をクリックします。
2. [詳細] をクリックします。
注: 最適な結果を得るには、マッチ分析で使用するマッチ結果のレコード数が 100,000 件未満に
なるようにしてください。 マッチ結果の数がそれ以上になると、データ ビューを切り替える
ときに、データのロードと返却にかかる時間が長くなります。
進捗バーが表示されます。 進捗が 100% に達すると、[表示] ドロップダウン リストで選択した
ビューに基づいて、ベースライン マッチ結果が表示されます。表 66 : 表示される詳細結果データ
(383ページ)に、表示される列をマッチ ステージ タイプ別に示します。
384
Spectrum™ Technology Platform 8.0.0
第 20 章 : Advanced Matching モジュール
マッチ率グラフについては、マッチ率グラフ(386ページ)を参照してください。
[サスペクトと候補] ビューは、デフォルトで表示されます。 レコードは、サスペクト別にグループ
化されます。 各サスペクトを展開して、その候補を表示できます。
3. サスペクト レコードを展開して、その候補を表示します。
4. [詳細] をクリックして表示します。候補レコード詳細情報については、ベースライン候補レコード
詳細情報の表示(386ページ)を参照してください。
5. ビュー オプションを変更するには、[表示] リストから次のいずれかの値を選択して、[更新] をク
リックします。
•
[サスペクトと候補]: (すべてのマッチャー) サスペクト レコードと、各サスペクトとの照合を試
みる候補レコードをすべて表示します。
•
[サスペクトと重複]: (すべてのマッチャー) すべてのサスペクト レコードと、各サスペクトと照
合された候補レコードを表示します。
•
[サスペクトと Express マッチ]: (Express マッチ キーが有効時の Interflow Match と Intraflow
Match) Express マッチ キーに基づいて照合されるサスペクト レコードと候補レコードを表示
します。
•
[重複コレクション]: (Intraflow と Interflow) すべての候補コレクションをコレクション番号別に
表示します。
•
[マッチ グループ]: (Intraflow と Interflow) レコードをマッチ グループ別に表示します。
•
[候補グループ]: (Transactional Match) レコードを候補グループ別に表示します。
•
[ユニーク サスペクト]: (Interflow および Transactional Match) どの候補レコードともマッチし
ないサスペクト レコードをすべて表示します。
•
[ユニーク レコード]: (Intraflow) マッチしないレコードをすべて表示します。
•
[候補がないサスペクト]: (Interflow および Transactional Match) 照合する候補がないサスペクト
をすべて表示します。
ユーザ ガイド
385
マッチ分析
•
[すべてのレコード]: 処理されたレコードをマッチング ステージ別にすべて表示します。
ベースライン候補レコード詳細情報の表示
候補のベースライン レコード詳細情報を表示するには
1. [マッチ分析結果] ビューから、サスペクト ビューを選択し、[更新] をクリックします。
2. サスペクトを展開し、候補または重複レコードのいずれかを選択します。
3. [詳細] をクリックします。
[レコード詳細情報] ダイアログが表示されます。 データは 2 つのセクションに表示されます。
• [ベースライン入力] — マッチで使用するフィールド レベルのデータがサスペクトと候補の両方
について表示されます。
• [ベースライン マッチ詳細情報] — マッチ ルールの各ノードのスコアリング情報が表示されます。
注: このオプションは、Intraflow Match ステージでスライディング ウィンドウが有効になってい
る場合は使用できません。
マッチ率グラフ
マッチ率グラフは、詳細ビューにマッチ情報をグラフィカルに表示します。
386
Spectrum™ Technology Platform 8.0.0
第 20 章 : Advanced Matching モジュール
Intraflow Match の場合、1 つのグラフにマッチ全体が表示されます。
• [ベースライン マッチ]: ベースライン結果の総マッチ数。
• [比較マッチ]: 比較結果の総マッチ数。
• [新しいマッチ]: ベースライン結果ではユニークであったが、比較結果ではサスペクトまたは重複に
なるレコードの総数。
• [マッチでなくなったもの]: ベースライン結果ではサスペクトまたは重複であったが、比較結果では
ユニークになるレコードの総数。
Interflow および Transactional Match の場合、2 つのグラフが表示されます。
• [全体マッチ率]
• [ベースライン マッチ]: ベースライン結果の総マッチ数。
• [比較マッチ]: 比較結果の総マッチ数。
• [新しいマッチ]: ベースライン結果ではユニークであったが、比較結果ではサスペクトまたは重複に
なるレコードの総数。
• [マッチでなくなったもの]: ベースライン結果ではサスペクトまたは重複であったが、比較結果では
ユニークになるレコードの総数。
• [サスペクト マッチ率]
• [ベースライン マッチ]: ベースラインでユニークでなかったサスペクトの総数。
• [比較マッチ]: 比較でユニークでなかったサスペクトの総数。
• [新しいマッチ]: ベースラインではユニークであったが、比較結果ではマッチになるサスペクトの総
数。
• [マッチでなくなったもの]: ベースラインではマッチであったが、比較結果ではユニークになるサス
ペクトの総数。
Field Chooser の使用
Field Chooser アイコン
をクリックして、選択した列をマッチ分析結果に表示します。 Field
Chooser は、親レベルと子レベルに表示されます。 表示する列は、親と子で別々に選択できます。
ユーザ ガイド
387
マッチ分析
レコードのフィルタリング
[条件を満たすレコードを表示] チェック ボックスを使用して、表示する詳細マッチ レコードをフィル
タリングします。 いくつかの演算子に基づいてレコードをフィルタリングして、ユーザが提供する値
を、各詳細マッチ レコードの特定のフィールド内のデータと比較できます。
次の演算子を選択できます。
• 文字列タイプ フィールド (マッチグループ、マッチレコードタイプ、任意のマッチング データ)
• が次の文字を含む
• が次の値の間
• が次の値と同じ
• が次の値と異なる
• が次の文字から始まる
• 数値タイプ フィールド (コレクション番号、入力レコード番号、マッチスコア)
• が次の値の間
• が次の値と同じ
• が次の値と異なる
• が次の値より大きい
• が次の値以上
• が次の値より小さい
• が次の値以下
レコードをフィルタリングするには
388
Spectrum™ Technology Platform 8.0.0
第 20 章 : Advanced Matching モジュール
1. [マッチ分析結果] ビューから、ベースラインまたは比較マッチ結果を選択し、[更新] をクリックし
ます。
2. [条件を満たすレコードを表示] チェック ボックスを選択します。
3. [フィールド] リスト ボックスから、フィールドを選択します。
4. 演算子を選択します。
5. 選択した演算子タイプの値を入力します。 [が次の値の間] を選択する場合は、値の範囲を入力し
ます。
6. サスペクト ビューでフィルタリングする場合は、次のフィルタリングを実行できます。
• [親] — 親 (サスペクト) のみでフィルタリングします。すべての子が返されます。
• [子] — フィルタリング範囲に含まれない子をすべて除外します。 親 (サスペクト) ノードが返さ
れます。
• [親と子] — 親 (サスペクト) でフィルタリングします。このとき、親が返される場合は、その子
でフィルタリングします。
7. [更新] をクリックします。 オプションと値の範囲に含まれるレコードが表示されます。 選択した
オプションと値の範囲内にレコードが含まれない場合は、該当するレコードがないことを示すメッ
セージが表示されます。
2 つのマッチ ステージのマッチ結果の比較
ここでは、次の内容について説明します。
• 比較に関する検討事項(390ページ)
• 比較結果の詳細情報の表示(392ページ)
ユーザ ガイド
389
マッチ分析
• リフト/ドロップ グラフの比較(390ページ)
• マッチ ルールの比較(391ページ)
• 比較結果の詳細情報の表示(392ページ)
• 比較候補レコード詳細情報(394ページ)
• マッチ率グラフ(386ページ)
• Field Chooser の使用(387ページ)
• レコードのフィルタリング(388ページ)
注: マッチ結果を表示するには、[分析用データを生成する] オプションを有効にしたジョブを事前に
実行している必要があります。
比較に関する検討事項
• ベースライン マッチ結果と比較マッチ結果とを比較する場合、マッチ分析では、入力データが同じ
で、順序も同じであることを想定します。 入力データが異なると、本来の結果が得られない可能性
があります。 例えば、次のような場合がこれに該当します。
• 異なる入力ファイルまたはテーブルを使用する。
• マッチング ステージの前にデータを別の方法でソートする。
• Transactional Match を使用するときに、Candidate Finder のクエリに変更を加える。
• 最適な結果を得るには、マッチ分析で使用するマッチ結果のレコード数が 100,000 件未満になるよ
うにしてください。 マッチ結果の数がそれ以上になると、データ ビューを切り替えるときに、デー
タのロードと返却にかかる時間が長くなります。
リフト/ドロップ グラフの比較
リフト/ドロップ グラフには、選択したベースライン結果と比較結果について、重複レコードとユニー
ク レコードの数が棒グラフで表示されます。 リフトは、重複レコード数の増加として、ドロップは、
重複レコード数の減少として定義されます。 ユニーク レコードは黄色で、重複レコードは緑で示され
ます。
リフト/ドロップ グラフを比較するには、[リフト/ドロップ] タブをクリックします。
390
Spectrum™ Technology Platform 8.0.0
第 20 章 : Advanced Matching モジュール
マッチ ルールの比較
マッチ ルールは、階層ツリー構造で表示されます。これはマッチ ルールを作成したステージ ダイア
ログでの表示方法と同じです。 [マッチ ルール] タブには、 [オプション] と [ルール] の2 つのノードが
表示されます。
• [オプション] ノードには、選択したマッチ結果のステージ設定が表示されます。
• [ルール] ノードには、選択したマッチ結果のマッチ ルールが表示されます。
ベースライン マッチ結果と比較マッチ結果との相違点は色分けして表示されます。
• 青 — 比較マッチ結果のマッチ ルールが変更されたことを示します。
• 緑 — 比較マッチ結果のマッチ ルールが追加されたことを示します。
• 赤 — 比較マッチ結果のマッチ ルールが省略されたことを示します。
マッチ ルールを比較するには
1. [マッチ ルール] タブをクリックします。
2. ルール詳細情報を表示するには、階層内のノードを選択します。
ユーザ ガイド
391
マッチ分析
ルール詳細情報がベースライン ウィンドウの下半分に表示されます。
比較結果の詳細情報の表示
1. マッチ結果リストから、マッチ結果を選択し、[ベースライン] をクリックします。
2. 比較結果を選択し、[比較] をクリックします。
3. [詳細] をクリックします。
進捗バーが表示されます。 進捗が 100% に達すると、ベースライン マッチ結果が表示されます。
注: 最適な結果を得るには、マッチ分析で使用するマッチ結果のレコード数が 100,000 件未満に
なるようにしてください。 マッチ結果の数がそれ以上になると、データ ビューを切り替える
ときに、データのロードと返却にかかる時間が長くなります。
4. [マッチ分析結果] ビューから、[分析] ドロップダウン リストの [比較] を選択し、[更新] をクリッ
クします。
表 66 : 表示される詳細結果データ(383ページ) に、表示される列をマッチ ステージ タイプ別に
示します。
392
Spectrum™ Technology Platform 8.0.0
第 20 章 : Advanced Matching モジュール
マッチ率グラフについては、マッチ率グラフ(386ページ)を参照してください。
5. サスペクト レコードを展開して、その候補を表示します。 候補レコード詳細情報については、ベー
スライン候補レコード詳細情報の表示(386ページ)を参照してください。
6. ビュー オプションを変更するには、[表示] リストから次のいずれかの値を選択して、[更新] をク
リックします。
•
[新しいマッチ]: (Intraflow) 新しいマッチと、それに関連するサスペクトをすべて表示します。
このビューでは、新しい重複のあるサスペクトと、新しいサスペクトが 1 つのビューに表示さ
れます。
•
[新しくマッチしたサスペクト]: (Interflow および Transactional Match) ベースラインには重複を
持たないが、比較には少なくとも 1 つの重複を持つサスペクトを表示します。
•
[新しいユニーク サスペクト]: (Interflow および Transactional Match) ベースラインには重複を
持つが、比較には重複を持たないサスペクトを表示します。
•
[マッチでなくなったもの]: (Intraflow) マッチでなくなったものをすべて表示します。 このビュー
では、重複がなくなったサスペクトと、サスペクトでなくなったものが 1 つのビューに表示さ
れます。
•
[新しい重複のあるサスペクト]: (すべてのマッチャー) ベースラインでサスペクトで、比較でも
サスペクトのままのレコードに対して新しい重複となるレコードを表示します。
•
[重複がなくなったサスペクト]: (すべてのマッチャー) ベースラインでサスペクトで、比較でも
サスペクトのままのレコードに対して重複でなくなったレコードを表示します。
•
[新しいサスペクト]: (Intraflow) 比較マッチ結果ではサスペクトであるが、ベースラインではサ
スペクトでなかったレコードを表示します。
•
[サスペクトでなくなったもの] (Intraflow) 比較結果ではサスペクトでないが、ベースラインでは
サスペクトであったレコードを表示します。
他のビューの詳細については、ベースライン マッチ結果の詳細情報の表示(383ページ)を参照し
てください。
ユーザ ガイド
393
マッチ分析
注: 新しいサスペクトや、サスペクトでなくなったものとみなされるレコードがない場合は、警
告が表示されるだけで、データの表示に変化はありません。 結果の差が大きすぎて有意な比
較が得られない場合は、警告が表示され、詳細アクションがキャンセルされます。
比較候補レコード詳細情報
候補の比較レコード詳細情報を表示するには
1. [マッチ分析結果] ビューから、サスペクト ビューを選択し、[更新] をクリックします。
2. サスペクトを展開し、候補または重複レコードのいずれかを選択します。
3. [詳細] をクリックします。
[レコード詳細情報] ダイアログが表示され、[候補詳細情報] タブが選択されます。 データは 4 つのセ
クションに表示されます。
• [ベースライン入力] — マッチで使用するフィールド レベルのデータがサスペクトと候補の両方につ
いて表示されます。
• [比較入力] — マッチで使用するフィールド レベルのデータがサスペクトと候補の両方について表示
されます。
• [ベースライン マッチ詳細情報] — マッチ ルールの各ノードのスコアリング情報が表示されます。
• [比較マッチ詳細情報] — マッチ ルールの各ノードのスコアリング情報が表示されます。 緑のテキス
トは、ルール内でマッチするノードを表します。 赤のテキストは、ルール内でマッチしないノード
を表します。
394
Spectrum™ Technology Platform 8.0.0
第 20 章 : Advanced Matching モジュール
注: このオプションは、Intraflow Match ステージでスライディング ウィンドウが有効になっている場
合は使用できません。
マッチ率グラフ
マッチ率グラフは、詳細ビューにマッチ情報をグラフィカルに表示します。
Intraflow Match の場合、1 つのグラフにマッチ全体が表示されます。
• [ベースライン マッチ]: ベースライン結果の総マッチ数。
• [比較マッチ]: 比較結果の総マッチ数。
• [新しいマッチ]: ベースライン結果ではユニークであったが、比較結果ではサスペクトまたは重複に
なるレコードの総数。
• [マッチでなくなったもの]: ベースライン結果ではサスペクトまたは重複であったが、比較結果では
ユニークになるレコードの総数。
Interflow および Transactional Match の場合、2 つのグラフが表示されます。
• [全体マッチ率]
• [ベースライン マッチ]: ベースライン結果の総マッチ数。
• [比較マッチ]: 比較結果の総マッチ数。
• [新しいマッチ]: ベースライン結果ではユニークであったが、比較結果ではサスペクトまたは重複に
なるレコードの総数。
• [マッチでなくなったもの]: ベースライン結果ではサスペクトまたは重複であったが、比較結果では
ユニークになるレコードの総数。
• [サスペクト マッチ率]
• [ベースライン マッチ]: ベースラインでユニークでなかったサスペクトの総数。
• [比較マッチ]: 比較でユニークでなかったサスペクトの総数。
• [新しいマッチ]: ベースラインではユニークであったが、比較結果ではマッチになるサスペクトの総
数。
• [マッチでなくなったもの]: ベースラインではマッチであったが、比較結果ではユニークになるサス
ペクトの総数。
ユーザ ガイド
395
マッチ分析
Field Chooser の使用
Field Chooser アイコン
をクリックして、選択した列をマッチ分析結果に表示します。 Field
Chooser は、親レベルと子レベルに表示されます。 表示する列は、親と子で別々に選択できます。
レコードのフィルタリング
[条件を満たすレコードを表示] チェック ボックスを使用して、表示する詳細マッチ レコードをフィル
タリングします。 いくつかの演算子に基づいてレコードをフィルタリングして、ユーザが提供する値
を、各詳細マッチ レコードの特定のフィールド内のデータと比較できます。
次の演算子を選択できます。
• 文字列タイプ フィールド (マッチグループ、マッチレコードタイプ、任意のマッチング データ)
• が次の文字を含む
• が次の値の間
• が次の値と同じ
• が次の値と異なる
• が次の文字から始まる
• 数値タイプ フィールド (コレクション番号、入力レコード番号、マッチスコア)
• が次の値の間
• が次の値と同じ
• が次の値と異なる
• が次の値より大きい
396
Spectrum™ Technology Platform 8.0.0
第 20 章 : Advanced Matching モジュール
• が次の値以上
• が次の値より小さい
• が次の値以下
レコードをフィルタリングするには
1. [マッチ分析結果] ビューから、ベースラインまたは比較マッチ結果を選択し、[更新] をクリックし
ます。
2. [条件を満たすレコードを表示] チェック ボックスを選択します。
3. [フィールド] リスト ボックスから、フィールドを選択します。
4. 演算子を選択します。
5. 選択した演算子タイプの値を入力します。 [が次の値の間] を選択する場合は、値の範囲を入力し
ます。
6. サスペクト ビューでフィルタリングする場合は、次のフィルタリングを実行できます。
• [親] — 親 (サスペクト) のみでフィルタリングします。すべての子が返されます。
• [子] — フィルタリング範囲に含まれない子をすべて除外します。 親 (サスペクト) ノードが返さ
れます。
• [親と子] — 親 (サスペクト) でフィルタリングします。このとき、親が返される場合は、その子
でフィルタリングします。
7. [更新] をクリックします。 オプションと値の範囲に含まれるレコードが表示されます。 選択した
オプションと値の範囲内にレコードが含まれない場合は、該当するレコードがないことを示すメッ
セージが表示されます。
ユーザ ガイド
397
Match Key Generator
Match Key Generator
Match Key Generator は、非ユニーク キーを作成して、重複の可能性があるレコードを識別します。
マッチ キーは、同じマッチ キーを含むレコードのみを比較するため、簡易的なマッチング処理です。
マッチ キーは、定義したルールを使用して作成されます。 マッチ キーは、入力フィールドで構成さ
れます。 指定する入力フィールドごとに、そのフィールドで実行されるアルゴリズムが選択されま
す。 その後、各フィールドの結果を連結して、単一のマッチ キー フィールドが作成されます。
例えば、次のような入力住所があり、
名- Fred
姓 - Mertz
郵便番号 - 21114-1687
性別コード - M
次のルールが指定されている場合、
入力フィールド
開始位置
長さ
郵便番号
1
5
郵便番号
7
4
姓
1
5
名
1
5
性別コード
1
1
次のようなキーになります。
211141687MertzFredM
入力
入力はソース データの任意のフィールドです。
オプション
Match Key Generator のオプションを定義するには、[追加] ボタンをクリックします。 [マッチ キー
フィールド] ダイアログが表示されます。
398
Spectrum™ Technology Platform 8.0.0
第 20 章 : Advanced Matching モジュール
注: 複数のマッチ キー生成アルゴリズムを追加する場合は、[上へ移動] ボタンと [下へ移動] ボタンを
使用して、アルゴリズムの適用順序を変更することができます。
表 67 : Match Key Generator のオプション
オプション名
説明/有効値
アルゴリズム
マッチ キーの生成に使用するアルゴリズムを指定します。 次のいず
れかを選択します。
Consonant (子 指定したフィールドから子音を削除して返します。
音)
Double
Metaphone
文字の発音表記に基づくコードを返します。 Double
Metaphone は Metaphone アルゴリズムの改良版
で、さまざまな言語に多数存在する不規則性を考慮
しています。
Metaphone
選択したフィールドを Metaphone コード化したキー
を返します。 Metaphone は、英語の発音を使用し
て単語をコード化するアルゴリズムです。
Metaphone (ス 選択したフィールドをスペイン語用に Metaphone
ペイン語)
コード化したキーを返します。 この Metaphone ア
ルゴリズムは、スペイン語の発音を使用して単語を
コード化します。
Soundex
選択したフィールドの Soundex コードを返します。
Soundex は、単語の英語の発音に基づいて、固定長
のコードを生成します。
Substring (部
分文字列)
選択したフィールドの指定した部分を返します。
フィールド名
マッチ キーの生成に使用するフィールドを指定します。
開始位置
指定したフィールド内での開始位置を指定します。 すべてのアルゴリ
ズムで開始位置を指定できるとは限りません。
長さ
開始位置から含める文字の数を指定します。 すべてのアルゴリズムで
長さを指定できるとは限りません。
ノイズ文字の削除
ハイフン、空白、その他の特殊文字等、英数字以外の文字を入力フィー
ルドからすべて削除します。
ユーザ ガイド
399
Transactional Match
オプション名
説明/有効値
ソート入力
入力フィールド内の文字または語をすべてアルファベット順にソート
します。
文字
ユニーク ID を作成する前に、入力フィールドの文字値を
ソートします。
語
ユニーク ID を作成する前に、入力フィールドの各語値を
ソートします。
[Express マッチ キーを生成] オプションが有効で、Interflow Matcher または Intraflow Matcher で選択
されている場合、ここで作成される Express マッチ キーを使用してマッチが判断され、その他のマッ
チ ルールの設定はすべて無視されます。
出力
表 68 : Match Key Generator 出力
フィールド名
説明/有効値
ExpressMatchKey
マッチ レベルを表す値。 Express マッチ キーが一致する場合、スコ
アは 100 です。 Express マッチ キーが一致しない場合、スコア 0 が
返されます。
MatchKey
レコードを識別するために生成されるキー。
Transactional Match
Transactional Match では、サスペクト レコードを、Candidate Finder ステージから返される潜在的な
候補レコードと照合できます。 Transactional Match は Candidate Finder と組み合わせて使用します。
Candidate Finder の詳細については、Candidate Finder(334ページ)を参照してください。
Transactional Match では、マッチング ルールを使用して、サスペクト レコードを、同じ候補グルー
プ番号 (Canadidate Finder で割り当てられる番号) を持つすべての候補レコードと比較して、重複を識
別します。 候補レコードが重複の場合は、コレクション番号が割り当てられ、そのマッチ レコード
タイプに重複が設定され、その候補レコードが書き出されます。 グループ内のマッチしない候補には
コレクション番号 0 が割り当てられ、そのラベルにユニークが設定され、その候補が書き出されます。
400
Spectrum™ Technology Platform 8.0.0
第 20 章 : Advanced Matching モジュール
オプション
ここでは次の内容について説明します。
• マッチング ルールの作成(402ページ)
• マッチ ルール評価の使用
一般的なルールをサポートする定義済みのオプション集合を使用するには、[ロードするマッチ ルー
ル] ドロップダウン メニューから 1 つ選択します。
独自のカスタム マッチング ルールを指定するには、[ロードするマッチ ルール] ドロップダウン メ
ニューの右にある [新規] ボタンをクリックします。 既存のマッチ ルールを変更して、名前を変更す
ることもできます。 作成できるカスタム マッチング ルールは、1 セッションあたり 1 つだけです。
ユニークな候補レコードを出力するように指定するには、[ユニークな候補を返す] オプションを選択
します。
マッチ結果を生成するには、[分析用データを生成する] を選択します。 詳細については、マッチ分析
(374ページ)を参照してください。
マッチ ルール評価の使用
マッチ ルール評価を使用して、1 個のサスペクトと最大 10 個の候補で構成される、サンプル データ
の小さな集合に対するマッチ ルールの効果を調べます。 マッチ ルール評価を使用するには、マッチ
ルール階層内のノードを選択し、[評価] をクリックします。
Match Rule Evaluator は、次のコンポーネントで使用可能です。
• Interflow Match(345ページ)
• Intraflow Match(359ページ)
• Transactional Match(400ページ)
評価用の入力レコードを指定するには、次の 2 つの方法があります。
• 手動で入力 — [入力] タブで、[サスペクト] の下にサスペクト レコードを入力し、[候補] の下に最大
10 個の候補を入力します。 レコードを入力したら、[エクスポート] をクリックしてレコードをファ
イルに保存できます。それ以降は、データを手動で再入力する代わりに、このファイルをインポー
トすることができます。
• ファイルからインポート — [入力] タブで、[インポート...] をクリックして、サンプル レコードを含
むファイルを選択します。 区切り記号付きファイルは、区切り文字としてカンマ、パイプ、または
タブを使用し、[候補] の下に表示されたフィールド名と一致するヘッダ フィールドを持つヘッダ レ
コードを含む必要があります。 Household 入力のヘッダ レコードのサンプルを以下に示します。
LastName,HouseNumber,LeadingDirectional,StreetName,StreetSuffix,TrailingDirectional,ApartmentNumber,
POBox,RRHC,PrivateMailbox
評価結果を表示するには、次の 2 つの方法があります。
ユーザ ガイド
401
Transactional Match
• 現在のルールを評価 — [現在のルール] をクリックします。 これにより、[マッチ ルール] タブで定
義されたルールが実行されます。 結果は、一度に 1 つのサスペクトと候補のペアに対して表示され
ます。 結果を循環して表示するには、矢印ボタンをクリックします。 フィールドのスコアとアルゴ
リズムが、マッチ ルール制御と同様のツリー形式で表示されます。 結果は、xml フォーマットでエ
クスポートすることもできます。
• すべてのアルゴリズムの評価 — [すべてのアルゴリズム] をクリックします。 この設定を使うと、
マッチ ルールが無視され、すべてのアルゴリズムが各フィールドに実行されてサスペクトと候補の
ペアが評価されます。 結果は、一度に 1 つのサスペクトまたは候補のペアについて表示され、矢印
ボタンを使って循環して表示できます。
[スコア] の下に表示される結果は、次のように色分けされます。
• 緑 — 実行結果がマッチだったルール。
• 赤 — 実行結果がマッチでなかったルール。
• 灰色 — 無視されたルール。
• 青 — ルールに含まれる個別のアルゴリズムの結果。
マッチ ルールまたは入力を変更したときに結果が自動的に更新されるようにするには、[自動更新]
チェック ボックスを選択します。 この機能を [すべてのアルゴリズム] オプションを選択して使うと、
入力を変更したときにのみ、結果が更新されます。
評価結果を XML フォーマットでエクスポートするには、[エクスポート] をクリックします。
[マッチ ルール] タブを使って、さまざまなマッチ ルール設定を試すことができます。 このタブで行っ
た変更をステージのマッチ ルールに適用するには、[保存] をクリックします。
マッチング ルールの作成
マッチング ルールは、階層構造に整理された親タイプと子タイプで構成されます。 親タイプは、マッ
チする要素のグループを表します。 子タイプは、親タイプがマッチするかどうかを確認する入力ソー
ス フィールド名です。 例えば、
• 世帯 - 親タイプ - これは階層のルート タイプでもあります。
• 名前 - 親タイプ - 世帯の子。
• 姓 - 子タイプ - 名前の子であるフィールド。
• 住所 - 親タイプ - 世帯の子。
• 通り - 親タイプ - 住所の子。
• 家番号 - 子タイプ - 通りの子であるフィールド。
• 通り名 - 子タイプ - 通りの子であるフィールド。
• 通り接尾語 - 子タイプ - 通りの子であるフィールド。
1. 親タイプと子タイプを作成します。
a) [新規] をクリックします。 空のマッチ ルールが作成されます。
b) [親の追加] をクリックします。
402
Spectrum™ Technology Platform 8.0.0
第 20 章 : Advanced Matching モジュール
c) 親ノードの名前を入力します。 名前は一意であり、フィールドであってはなりません。 マッチ
タイプ名として使う階層の最初のノードを [ロードするマッチ タイプ] フィールドに入力しま
す。 作成したすべてのカスタム マッチ ルールと変更した定義済みルールは、名前の前に
"Custom" という語が付加されて保存されます。
d) [子の追加] をクリックしてフィールドを親ノードに関連付けます。 子フィールドは、Spectrum™
Technology Platform のデータ タイプ フィールドである必要があります。つまり、1 つ以上の
コンポーネントを通じて使用できるフィールドでなければなりません。
e) 子ノードを追加すると、ドロップダウン矢印が子ノード プレースホルダーの横に表示されま
す。 矢印をクリックして、表示されるリストからフィールドを選択します。
f) この操作を繰り返してマッチング階層を完成させます。
2. 親タイプ オプションを定義します。 親オプションは、親ノードを選択するとマッチング階層の右
側に表示されます。
マッチング 親タイプがマッチするかどうかを判定する方法を指定します。 次のいずれかです。
方法
すべて真
親タイプの下にあるすべての子タイプがマッチすると確認された場
合にマッチすると見なします。 この方法を選択すると、タイプ間に
"AND" コネクタが作成されます。
いずれかが真 親タイプの下にある少なくとも 1 つの子タイプがマッチすると確認
された場合にマッチすると見なします。 この方法を選択すると、タ
イプ間に "OR" コネクタが作成されます。
しきい値で判 親タイプのスコアがそのしきい値に等しいか、それよりも大きい場
断
合にマッチすると見なします。 このオプションを選択すると、[し
きい値] スライダーが表示されます。 このスライダーを使ってしき
い値を指定します。 スコアリング方法によって、使用する論理コネ
クタが決定されます。
注: ここで設定したしきい値は、実行時に [データフロー オプション] ダイアログ
ボックスを使って変更できます。 [編集] > [データフロー オプション] の順にク
リックし、[追加] をクリックします。ステージを展開し、[トップ レベルのしき
い値] をクリックしてから [デフォルト値] フィールドにしきい値を入力します。
欠落データ フィールド内の空白データのスコアの計算方法を決定します。 次のいずれかです。
しきい値
ユーザ ガイド
空白を無視
フィールドに空白データが入っている場合、そのフィール
ドを無視します。
0 としてカウント
フィールドに空白データが入っている場合、そのフィール
ドのスコアを 0 とします。
100 としてカウント
フィールドに空白データが入っている場合、そのフィール
ドのスコアを 100 とします。
[マッチング方法] で [しきい値で判断] を指定すると、しきい値スライダーが表示さ
れます。 マッチ スコアがしきい値より高くなければ、親はマッチと判断されませ
ん。 親ノードのしきい値を子のしきい値より高くすることはできません。
403
Transactional Match
スコアリン マッチング スコアの決定に使用する方法を選択できます。 次のいずれかです。
グ方法
加重平均
親の下の各子ノードの重みを使用して、平均マッチ スコアを決
定します。
平均
親の下の各子ノードの平均スコアを使用して、親のスコアを決定
します。
最大値
親の下の子の最も高いスコアを使用して、親のスコアを決定しま
す。
最小値
親の下の子の最も低いスコアを使用して、親のスコアを決定しま
す。
次の表に、マッチング方法とスコアリング方法の論理的な関係、およびそれぞれの組み合わせに
よってマッチング処理時に使用されるロジックがどのように変わるかを示します。
表 69 : マッチング方法とスコアリング方法の表
マッチング方法
いずれかが すべて真
真
コメント
しきい値で
判断
スコアリング方法
加重平均
不可
AND
AND
平均
不可
AND
AND
最大値
OR
不可
OR
最小値
OR
不可
OR
マッチング方法として [すべて真] ま
たは [しきい値で判断] が選択されて
いる場合にのみ使用可能です。
マッチング方法として [いずれかが
真] または [しきい値で判断] が選択
されている場合にのみ使用可能で
す。
3. 子タイプ オプションを定義します。 子ノードを選択すると、マッチング階層の右側に子オプショ
ンが表示されます。
注: 親の下のすべての子は、同じ論理演算子を使用する必要があります。 コネクタを結合するに
は、まず中間の親ノードを作成する必要があります。
クロス 2 つのレコード間で異なるフィールドを相互にマッチングするのに使用します。
マッチ
対象
404
Spectrum™ Technology Platform 8.0.0
第 20 章 : Advanced Matching モジュール
欠落
フィールド内の空白データのスコアの計算方法を決定します。 次のいずれかです。
データ
空白を無視
フィールドに空白データが入っている場合、そのフィールド
を無視します。
0 としてカウント
フィールドに空白データが入っている場合、そのフィールド
のスコアを 0 とします。
100 としてカウント
フィールドに空白データが入っている場合、そのフィールド
のスコアを 100 とします。
しきい フィールドがマッチと判断されるために個々のフィールド レベルで満たす必要があるし
値
きい値。
スコア マッチング スコアの決定に使用する方法を選択できます。 次のいずれかです。
リング
加重平均
各アルゴリズムの重みを使用して、平均マッチ スコアを決定しま
方法
す。
平均
各アルゴリズムの平均スコアを使用して、マッチ スコアを決定しま
す。
最大値
最も高いアルゴリズムのスコアを使用して、マッチ スコアを決定し
ます。
最小値
最も低いアルゴリズムのスコアを使用して、マッチ スコアを決定し
ます。
アルゴ 2 つの文字列データのスコアを決定するために使用します。 次のものから複数指定でき
リズム ます。
Acronym (頭 企業名がその頭字語にマッチするかどうかを判定します。 例: Internal
字語)
Revenue Service とその頭字語 IRS はマッチすると判断され、マッチ
スコア 100 が返されます。
Character
Frequency
(文字出現回
数)
文字列に含まれるすべての文字の出現回数を個別に確認し、2 つの文字
列における全体的な出現回数を比較します。
Date (日付)
日付のフォーマットにかかわらず、入力レコードに含まれる日付を比較
します。 [オプション] 列の [編集] をクリックして、次のオプションを
指定します。
• 月を必須とする: 年のみで構成される日付のマッチングを防ぎます。
• 日を必須とする: 月と年のみで構成される日付のマッチングを防ぎま
す。
• MM/DD という転置形式もマッチとみなす: 月と日が数値形式で指定
されている場合に、サスペクトの月と候補の月、サスペクトの日と候
補の日という標準的な比較に加えて、サスペクトの月と候補の日、サ
スペクトの日と候補の月の比較を行います。
ユーザ ガイド
405
Transactional Match
• MM/DD/YYYY ではなく DD/MM/YYYY 形式を優先する: 月と日がとも
に数値形式で指定されており、両者が文脈からは識別できない場合の
日付のパーシングに使用します。 例えば、数字が 5 と 13 の場合、
パーサーは自動的に 5 を月に、13 を日に割り当てます。1 年に 12 カ
月しかないためです。 しかし、数字が 5 と 12 (または、ともに 12 以
下の任意の 2 つの数字) の場合、パーサーは最初の数字が月であると
みなします。 このオプションを選択することにより、パーサーが最
初の数字を月ではなく日として読むように指定することができます。
• 範囲オプション — 全体: マッチング日付間の最大日数を設定できま
す。 例えば、全体範囲として 35 日と入力し、候補日付が 2000/12/31
の場合、サスペクト日付 2001/02/05 はマッチですが、サスペクト日
付 2001/02/06 はマッチではありません。 全体範囲として 1 日と入力
し、候補日付が 2000/01 の場合、サスペクト日付 1999 はマッチです
が (1999/12/31 と比較します)、サスペクト日付 2001/01 はマッチで
はありません。
• 範囲オプション — 年: 月、日とは別に、マッチング日付間の年数を設
定できます。 例えば、年の範囲として 3 年と入力し、候補日付が
2000/01/31 の場合、サスペクト日付 2003/01/31 はマッチですが、サ
スペクト日付 2003/02 はマッチではありません。 同様に、候補日付
が 2000 の場合、サスペクト日付 2003/03 は月の不整合がなく、3 年
の範囲内にあるので、マッチとなります。
• 範囲オプション — 月: 年、日とは別に、マッチング日付間の月数を設
定できます。 例えば、月の範囲として 4 と入力し、候補日付が
2000/01/01 の場合、サスペクト日付 2000/05 は日の不整合がなく、
4 カ月の範囲内にあるのでマッチですが、サスペクト日付 2000/05/02
は日の不整合があるためマッチではありません。
• 範囲オプション — 日: 年、月とは別に、マッチング日付間の日数を設
定できます。 例えば、日の範囲として 5 と入力し、候補日付が
2000/01/01 の場合、サスペクト日付 2000/01 は日の不整合がないの
でマッチですが、サスペクト日付 1999/12/27 は月の不整合があるた
めマッチではありません。
Double
Metaphone
文字の発音表記に基づいて、2 つの文字列間の類似性を判断します。
Double Metaphone は Metaphone アルゴリズムの改良版で、さまざま
な言語に多数存在する不規則性を考慮しています。
Edit Distance 1 つの文字列をもう 1 つの文字列に変換するために必要な削除、挿入、
(編集距離)
または置換の数に基づいて、2 つの文字列間の類似性を判断します。
Exact Match
(完全一致)
2 つの文字列が同じであるかどうかを判断します。
Initials (頭文
字)
パースした個人名の頭文字のマッチングに使用します。
Jaro-Winkler 1 つの文字列をもう 1 つの文字列に変換するために要する文字の置換の
Distance
数に基づいて、2 つの文字列間の類似性を判断します。 このオプション
は、個人名などの短い文字列用に開発されました。
406
Spectrum™ Technology Platform 8.0.0
第 20 章 : Advanced Matching モジュール
(Jaro-Winker
距離)
Keyboard
Distance
(キーボード距
離)
キーボード上のキーの位置によって重みを付け、1 つの文字列をもう一
方の文字列に変換するために必要な削除、挿入、または置換の数に基づ
いて、2 つの文字列間の類似性を判断します。 [オプション] 列の [編集]
をクリックして、使用しているキーボードのタイプを QWERTY (米国)、
QWERTZ (オーストリアおよびドイツ)、または AZERTY (フランス) か
ら指定します。
Metaphone
文字の発音表記に基づいて、2 つの文字列間の類似性を判断します。 こ
のオプションは、Soundex の制限に対応するために作成されました。
Metaphone
(スペイン語)
文字の発音表記に基づいて、2 つの文字列間の類似性を判断します。 こ
のオプションは、Soundex の制限に対応するために作成されました。
Name Variant 2 つの名前が互いの派生形であるかどうかを判断します。 このアルゴリ
(名前の派生
ズムは、2 つの名前が互いの派生形である場合はマッチ スコア 100 を
形)
返し、互いの派生形でない場合はマッチ スコア 0 を返します。 例え
ば、JOHN は JAKE の派生形なので、マッチ スコア 100 が返されます。
JOHN は HENRY の派生形ではないので、マッチ スコア 0 が返されま
す。 [オプション] 列の [編集] をクリックして、[Name Variant (名前の
派生形)] オプションを選択します。 詳細については、Name Variant
Finder(1073ページ)を参照してください。
Numeric
住所行の数値属性を文字から分離して、住所行を比較します。 例えば、
String (数値文 住所文字列 1234 Main Street Apt 567 では、文字列の数値属性 (1234567)
字列)
がパースされ、残りの文字列値 (Main Street Apt) とは異なる処理が行わ
れます。 このアルゴリズムでは、まず数値アルゴリズムを使用して、
文字列の中の数値データが照合されます。 数値データのマッチが 100
の場合、Edit Distance と Character Frequency を使用して、英字データ
が照合されます。 最終的なマッチ スコアは次のように計算されます。
(numericScore + (EditDistanceScore +
CharacterFrequencyScore) / 2) / 2
例えば、以下の 2 つの住所は次のように計算され、マッチ スコアは 95.5
になります。
123 Main St Apt 567
123 Maon St Apt 567
Numeric Score = 100
Edit Distance = 91
Character Frequency = 91
91 + 91 = 182
182/2 = 91
100 + 91 = 191
191/2 = 95.5
Soundex
ユーザ ガイド
文字の発音表記に基づいて、2 つの文字列間の類似性を判断します。
407
Transactional Match
SubString (部 1 つの文字列が別の文字列内に出現するかどうかを判断します。
分文字列)
次の表に、選択した親タイプのスコアリング方法と、使用できるアルゴリズム数との論理的関係を
示します。
表 70 : マッチング アルゴリズムとスコアリング方法の表
アルゴリズム
単一
複数
加重平均
不可
はい
平均
不可
はい
最大値
はい
はい
最小値
不可
はい
スコアリング方法
マッチング ルールの例
次の例では、名前データと住所データを照合するマッチ ルールの作成方法を示し
ます。 名前マッチは、First Name フィールドと Last Name フィールドで構成さ
れます。 名前がマッチと判断されるには、どちらのフィールドも一致しなければ
なりません。 住所マッチは、House Number フィールドと Street Name フィール
ドで構成されます。 マッチと判断されるには、どちらのフィールドも一致しなけ
ればなりません。
カスタム マッチ ルールの作成は、次の 3 つのステップで行われます。
1. 1(408ページ)
2. 2(409ページ)
3. 3(411ページ)
1. マッチング階層を作成します。
a. [新規] をクリックして、新しいマッチ ルールを作成します。
b. [親の追加] をクリックして、階層にルート マッチ ノードを作成します。
これにより、[ロードするマッチ タイプ:] ドロップダウン ボックスに設定
されるルール セット名も決定されます。
408
Spectrum™ Technology Platform 8.0.0
第 20 章 : Advanced Matching モジュール
c. 親ノードの一意な名前を入力します。 親ノード名は一意な名前でなければ
なりません。フィールドにすることはできません。 この例では、マッチ
ルールに "Name and Address Match" と命名します。
d. 階層で "Name and Address" 親ノードを選択します。
e. [親の追加] をクリックして、"Name and Address" 親ノードの下に子ノー
ドを作成します。
f. 親/子ノードの一意な名前を入力します。 この例では、一意な名前は "Name"
です。
g. 階層で "Name" 親/子ノードを選択します。
h. [子の追加] をクリックして、"Name" 親/子ノードの下に子/フィールド ノー
ドを作成します。
i.
リストで FirstName を選択します。
j.
階層で "Name" 親/子ノードを選択します。
k. [子の追加] をクリックして、"Name" 親/子ノードの下に別の子/フィールド
ノードを作成します。
l.
リストで LastName を選択します。
m. 階層で "Name and Address" 親ノードを選択します。
n. [親の追加] をクリックして、"Name and Address" 親ノードの下に子ノー
ドを作成します。
o. 親/子ノードの一意な名前を入力します。 この例では、一意な名前は
"Address" です。
p. 階層で "Address " 親/子ノードを選択します。
q. [子の追加] をクリックして、"Address" 親/子ノードの下に子/フィールド
ノードを作成します。
r. リストで HouseNumber を選択します。
s. 階層で "Address " 親/子ノードを選択します。
t. [子の追加] をクリックして、"Address" 親/子ノードの下に別の子/フィール
ド ノードを作成します。
u. リストで StreetName を選択します。
2. 親タイプ マッチング オプションを選択します。
a. 階層で "Name and Address" 親ノードを選択し、次の操作を行います。
• [マッチング方法] で [すべて真] を選択します。 [すべて真] を選択する
と、"Name and Address" 親ノードの下の各子ノードが "and" コネクタ
で結合されます。 マッチと判断されるには、"Name" 子ノード と
"Address" 子ノードがどちらも真である必要があります。 親の [すべて
真] は、フィールド レベルで判断されます。
• [スコアリング方法] リストで [平均] を選択します。 [平均] を選択する
と、"Name and Address" 親ノードの下の各子ノードのスコアの平均ス
ユーザ ガイド
409
Transactional Match
コアが採用されます。 Name ノードのスコアが 80 で、Address ノード
のスコアが 100 の場合、"Name and Address" 親ノードにロールアップ
されるスコアは 90 になります。
• [欠落データ] で [空白を無視] を選択します。 この例ではデータに空白
が含まれていないため、このルールは "Name and Address" 親ノード レ
ベルでは使用されません。 ただし、フィールド レベルのすべての子ノー
ドが空白データを含む場合、これらのフィールドの親ノードも空白デー
タを含むものとしてマークされます。 この例では、First Name フィー
ルドと Last Name フィールドがどちらも空白データを含む場合、"Name"
親ノードも空白データを含むことになります。 最終的なマッチ スコア
を計算する際、"Name" 親ノードは無視されます。 例: フィールド レベ
ルの子ノード (House Number および Street Name) にはデータが入って
いて、平均スコア 100 が計算されるため、Address 親ノードのスコアは
100 になります。 フィールド レベルの子ノード (First Name および Last
Name) にはデータが入っていないため、Name 親ノードは空白データを
含むことになり、無視されます。 Address 親ノードのスコアのみがマッ
チングにカウントされ、そのスコアが Name and Address Match 親ノー
ドにロールアップされます。 全体のマッチ スコアは 100 と計算されま
す。
b. 階層で "Name" 親ノードを選択し、次の操作を行います。
• [マッチング方法] で [すべて真] を選択します。 [すべて真] を選択する
と、"Name" 親ノードの下の各子ノードが "and" コネクタで結合されま
す。 マッチと判断されるには、First Name 子ノードと Last Name 子ノー
ドがどちらも真でなければなりません。
• [スコアリング方法] リストで [平均] を選択します。 [平均] を選択する
と、"Name " 親ノードの下の各子ノードのスコアの平均スコアが採用さ
れます。 First Name フィールドのスコアが 70 で、Last Name フィール
ドのスコアが 90 の場合、Name 親ノードにロールアップされるスコア
は 80 になります。
• [欠落データ] で [空白を無視] を選択します。 この例ではデータに空白
が含まれていないため、このルールは "Name" 親ノード レベルでは使用
されません。 ただし、First Name フィールドと Last Name フィールド
がどちらも空白データを含む場合、これらのフィールドの "Name" 親
ノードも空白データを含むものとしてマークされます。 この場
合、"Name" 親ノードはマッチングで無視されます。
c. 階層で "Address" 親ノードを選択し、次の操作を行います。
• [マッチング方法] で [すべて真] を選択します。 [すべて真] を選択する
と、"Address" 親ノードの下の各子ノードが "and" コネクタで結合され
410
Spectrum™ Technology Platform 8.0.0
第 20 章 : Advanced Matching モジュール
ます。 マッチと判断されるには、House Number 子ノードと Street Name
子ノードがどちらも真でなければなりません。
• [スコアリング方法] リストで [平均] を選択します。 [平均] を選択する
と、"Address" 親ノードの下の各子ノードのスコアの平均スコアが採用
されます。 House Number フィールドのスコアが 100 で、Street Name
フィールドのスコアが 100 の場合、"Address" 親ノードのスコアは 100
になります。
• [欠落データ] で [空白を無視] を選択します。 この例ではデータに空白
が含まれていないため、このルールは "Address" 親ノード レベルでは使
用されません。 ただし、House Number フィールドと Street Name
フィールドがどちらも空白データを含む場合、これらのフィールドの
"Address" 親ノードも空白データを含むものとしてマークされます。 こ
の場合、"Address" 親ノードはマッチングで無視されます。
3. 子タイプ マッチング オプションを選択します。
a. "Name" 親ノードの下の FirstName を選択し、次の操作を行います。
• [アルゴリズム] の下の [Exact Match (完全一致)] チェック ボックスをク
リアし、[Edit Distance (編集距離)] チェック ボックスと [Character
Frequency (文字出現回数)] チェック ボックスを選択します。
• [スコアリング方法] ボックスで [平均] を選択します。 [平均] を選択す
ると、2 つのアルゴリズムのスコアの平均を採用して、[FirstName] フィー
ルドのスコアが計算されます。 Edit Distance アルゴリズムのスコアが
80 で、Character Frequency アルゴリズムのスコアが 60 の場合、
FirstName フィールドのスコアは 70 になります。
• [欠落データ] で [空白を無視] を選択します。 この例ではデータに空白
が含まれていないため、このルールはフィールド レベルでは使用されま
せん。 ただし、FirstName フィールドが空白を含み、LastName フィー
ルドにはデータが入っている場合、FirstName フィールドはマッチング
で無視され、LastName のスコアのみがカウントされて、親ノードにロー
ルアップされます。
• [しきい値] の下のスライダーを 70 に設定します。 フィールドのスコア
がしきい値以上の場合にのみ、First Name フィールドはマッチと見なさ
れます。
b. "Name" 親ノードの下の LastName を選択し、次の操作を行います。
• [アルゴリズム] の下の [Exact Match (完全一致)] チェック ボックスをク
リアし、[Edit Distance (編集距離)] チェック ボックスと [Character
Frequency (文字出現回数)] チェック ボックスを選択します。
• [スコアリング方法] ボックスで、[最大値] を選択します。 [最大値] を
選択すると、2 つのアルゴリズムのスコアの最大スコアが採用され、
ユーザ ガイド
411
Transactional Match
LastName フィールドのスコアとして使用されます。 Edit Distance アル
ゴリズムのスコアが 90 で、Character Frequency アルゴリズムのスコア
が 80 の場合、LastName フィールドのスコアは 90 になります。
• [欠落データ] で [空白を無視] を選択します。 この例ではデータに空白
が含まれていないため、このルールはフィールド レベルでは使用されま
せん。 ただし、Last Name フィールドが空白を含み、First Name フィー
ルドにはデータが入っている場合、Last Name フィールドはマッチング
で無視され、First Name のスコアのみがカウントされて、親ノードに
ロールアップされます。
• [しきい値] の下のスライダーを 80 に設定します。 フィールドのスコア
がしきい値以上の場合にのみ、[LastName] フィールドはマッチと見なさ
れます。
c. "Address" 親ノードの下の HouseNumber を選択し、次の操作を行いま
す。
• [アルゴリズム] の下の [Exact Match (完全一致)] チェック ボックスをク
リアします。
• [欠落データ] で [空白を無視] を選択します。 この例ではデータに空白
が含まれていないため、このルールはフィールド レベルでは使用されま
せん。 ただし、[HouseNumber] フィールドが空白を含み、[StreetName]
フィールドにはデータが入っている場合、[HouseNumber] フィールドは
マッチングで無視され、[StreetName] のスコアのみがカウントされて、
親ノードにロールアップされます。
• [しきい値] の下のスライダーを 100 に設定します。 フィールドのスコ
アがしきい値以上の場合にのみ、[HouseNumber] フィールドはマッチと
見なされます。
d. "Address" 親ノードの下の StreetName を選択し、次の操作を行います。
• [アルゴリズム] の下の [Exact Match (完全一致)] チェック ボックスをク
リアし、[Edit Distance (編集距離)] チェック ボックスと [Character
Frequency (文字出現回数)] チェック ボックスを選択します。
• [スコアリング方法] ボックスで [平均] を選択します。 [平均] を選択す
ると、2 つのアルゴリズムのスコアの平均を採用して、[FirstName] フィー
ルドのスコアが計算されます。 Edit Distance アルゴリズムのスコアが
100 で、Character Frequency アルゴリズムのスコアが 100 の場合、
[StreetName] フィールドのスコアは 100 になります。
• [欠落データ] で [空白を無視] を選択します。 この例ではデータに空白
が含まれていないため、このルールはフィールド レベルでは使用されま
せん。 ただし、[StreetName] フィールドが空白を含み、[HouseNumber]
フィールドにはデータが入っている場合、[StreetName] フィールドは
412
Spectrum™ Technology Platform 8.0.0
第 20 章 : Advanced Matching モジュール
マッチングで無視され、[HouseNumber] のスコアのみがカウントされ
て、親ノードにロールアップされます。
• [しきい値] の下のスライダーを 100 に設定します。 フィールドのスコ
アがしきい値以上の場合にのみ、[StreetName] フィールドはマッチと見
なされます。
出力
表 71 : Transactional Match 出力
フィールド名
説明/有効値
HasDuplicates
レコードが別のレコードと重複するかどうかを示しま
す。 次のいずれかの値です。
MatchRecordType
MatchScore
ユーザ ガイド
Y
レコードはサスペクト レコードであり、重複す
るレコードがあります。
N
レコードはサスペクト レコードであり、重複す
るレコードはありません。
D
レコードは候補レコードであり、サスペクト レ
コードと重複します。
U
レコードは候補レコードですが、サスペクト レ
コードと重複しません。
コレクションに含まれるマッチ レコードのタイプを示
します。 有効な値を次に示します。
Suspect
他のレコードと重複する可能性があると
フラグが立てられた元の入力レコード。
Duplicate
入力レコードと重複するレコード。
Unique
重複がないレコード。
2 つのレコードの全体的なスコアを示します。 有効な
値は 0 〜 100 です。0 は精度の低いマッチを意味し、
100 は完全一致を意味します。
413
Transactional Match
フィールド名
説明/有効値
MatchInfo.MatchRuleNodeName.IsMatch
このフィールドは、ルール階層に含まれる各ノードの
マッチ状態を示します。 MatchRuleNodeName はフィー
ルド名に含まれる変数であり、実際のマッチ ルールに
含まれる階層ノード名で置き換えられます。ルール階
層内の各ノードはこのフィールドを生成します。
有効な値は、True (1 つ以上のマッチがある) または
False (マッチがない) です。
MatchInfo.MatchRuleNodeName.Score
このフィールドは、ルール階層に含まれる各ノードの
マッチ スコアを示します。 MatchRuleNodeName は
フィールド名に含まれる変数であり、実際のマッチ
ルールに含まれる階層ノード名で置き換えられます。
ルール階層内の各ノードはこのフィールドを生成しま
す。
有効な値は 0 〜 100 です。0 は精度の低いマッチを意
味し、100 は完全一致を意味します。
注: Validate Address および Advanced Matching モジュールのコンポーネントは、どちらも MatchScore
フィールドを使用します。 データフローの出力の MatchScore フィールドの値は、出力ステージ
に送られる前に最後に値を変更したステージによって決まります。 データフローに Validate
Address および Advanced Matching モジュールのコンポーネントが含まれ、各ステージの
MatchScore 出力フィールドを確認したい場合は、Transformer ステージを使用して、MatchScore
値を他のフィールドにコピーしてください。 例えば、Validate Address によって MatchScore と
いう出力フィールドが作成され、Transformer ステージによって Validate Address の MatchScore
フィールドが AddressMatchScore というフィールドにコピーされます。 マッチャー ステージを
実行すると、マッチャーから得た値が MatchScore フィールドに設定され、Validate Address か
ら得た AddressMatchScore の値が 引き渡されます。
414
Spectrum™ Technology Platform 8.0.0
Business Steward モジュー
ル
このセクションの構成
• Business Steward モジュールとは . . . . . . . . . . . . . . . . . .416
• 例外を処理するデータフローの設計 . . . . . . . . . . . . . . . . .416
• Business Steward Portal . . . . . . . . . . . . . . . . . . . . . . . . .427
21
Business Steward モジュールとは
Business Steward モジュールとは
Business Steward モジュールは、例外レコードを特定および解決することのできる機能の集合です。
例外レコードとは、Spectrum™ Technology Platform で適切に処理できなかったレコードです。例外
レコードは、データ スチュワード (data steward) が手動で確認する必要があります。 例外の例として
は、次のものがあります。
• 住所検証エラー
• ジオコーディング エラー
• 確信レベルの低いマッチング
• 結合/統合の判断
Business Steward モジュールでは、ブラウザベースのツールを使用して例外レコードを確認できま
す。 手動で修正され、承認された例外レコードは、Spectrum™ Technology Platform データ品質処理
に再度投入することができます。
Business Steward モジュールは、次の部分で構成されます。
• Exception Monitor — レコードを一連の条件と照合して、データ スチュワードによる手動での確認
が必要なレコードかどうかを判断するステージです。 詳細については、を参照してください。
Exception Monitor(418ページ)
• Write Exceptions — 例外レコードを例外リポジトリに書き出すステージです。 例外リポジトリに
書き出された例外レコードは、データ スチャワードが確認できる状態になります。 詳細について
は、を参照してください。 例外の書き出し(426ページ)
• 例外ダッシュボードと Exception Editor — このブラウザベースのツールには統計の要約とグラフが
ダッシュボード形式で表示され、データに発生した例外の種類を確認するためにこの情報を利用で
きます。 また、例外レコードを変更し、その再処理を承認できるエディターも用意されています。
詳細については、を参照してください。 Business Steward Portal とは(427ページ)
• Read Exceptions — 例外リポジトリから例外レコードをデータフローに読む込むステージです。
このステージでは、データ スチュワードが修正した例外レコードの再処理を行えます。 詳細につい
ては、を参照してください。 例外の読み込み(423ページ)
例外を処理するデータフローの設計
例外管理処理の基本的な構成要素には次のものがあります。
• レコードの重複除外、住所検証、ジオコーディングなど、データ品質処理を実行する初期データフ
ロー。 Exception Monitor ステージは、高い信頼性で処理できなかった住所を特定します。
• 例外の書き出しステージは、Exception Monitor ステージで特定された例外レコードを取得して、手
動による確認のために例外リポジトリに書き出します。
416
Spectrum™ Technology Platform 8.0.0
第 21 章 : Business Steward モジュール
• ブラウザベースのツールである Business Steward Portal を使用して、例外レコードを確認および編
集することができます。 編集したレコードは承認済みとしてマークされ、再処理できるようになり
ます。
• 例外再処理データフローは、例外の読み込みステージを使用して、承認済みのレコードを例外リポ
ジトリからデータフローに読み込みます。このデータフローは、通常は元のデータフローと同じロ
ジックを使用して、訂正されたレコードの再処理を試みます。
• 例外再処理データフローでは、Exception Monitor ステージによって、信頼性の低い検証やエラーな
どの例外が再度チェックされます。 例外の書き出しステージにより、例外は例外リポジトリに送り
返され、追加の確認が行われます。
基本的な例外管理の実装を説明するシナリオ例を示します。
この例では、2 つのデータフローがあります。 レコードの重複除外を実行する初期データフローと、
編集された例外を取得して、そのレコードが重複除外ロジックで正しく処理できるようになったかど
うかを検証する例外再処理データフローです。 重複除外ロジックはサブフローに含まれているため、
このロジックを 2 つのデータフローで再利用することができます。
どちらのデータフローにも Exception Monitor ステージがあります。このステージには、手動による確
認のためにレコードをルーティングすべきかどうかの判断に使用する条件が含まれます。 この条件
は、Confidence < 80 など、1 つ以上の式で構成されます。この式は、Confidence フィールドの値
が 80 未満のレコードを例外と見なし、例外の書き出しステージにルーティングするということを意味
します。 詳細については、Exception Monitor(418ページ)を参照してください。
Exception Monitor が例外として特定したレコードは、例外の書き出しステージを使用して、例外リポ
ジトリにルーティングされます。 データ スチュワードが、例外レコードの確認および変更用のブラウ
ザベースのツールである Business Steward Portal を使用して、リポジトリ内の例外を確認します。
Business Steward Portal で "承認済み" とマークされたレコードは、Spectrum™ Technology Platform
データフローに再度読み込むことができます。 この処理は、例外の読み込みステージによって行われ
ユーザ ガイド
417
例外を処理するデータフローの設計
ます。 まだ例外となるレコードがある場合は、データ スチュワードによる確認のため、再度例外リポ
ジトリに書き出されます。
ユーザの状況に最適なアプローチを判断するには、次の点を考慮してください。
• 例外レコードをどのように特定するか。 Exception Monitor ステージでは、任意のフィールドの値、
またはフィールドの組み合わせを評価して、レコードが例外かどうかを判断することができます。
現在データフローから得ている結果を分析して、例外をどのように特定するかを決定する必要があ
ります。 明確に検証済みまたはエラーになったレコードではなく、中程度のデータ品質のレコード
を特定したい場合があります。 例えば、住所を検証する場合、極めて信頼性が低いと見なされるレ
コードは不正レコードとなり、データ スチュワードがクリーンアップすることができません。
• 元のデータフローで使用したものと同じロジックを使用して、編集済みおよび承認済みのレコード
を再処理するか。 その場合は、サブフローを使用して、再利用可能なビジネス ロジックを作成する
ことができます。 例えば、住所検証を実行する初期データフローと、訂正済みのレコードを再処理
して訂正を検証する例外再処理データフローで、サブフローを使用することができます。 すると、
2 つのデータフロー間で異なるソース ステージとシンク ステージを使用することができます。 初期
データフローには、処理するデータを顧客データベースから取得する Read from DB ステージが含
まれることがあります。 例外再処理データフローには、例外リポジトリから編集済みおよび承認済
みの例外レコードを取得する、例外の読み込みステージステージが含まれます。
• 訂正済みおよび承認済みの例外をあらかじめ定められたスケジュールで再処理するか。 その場合は、
Management Console の実行スケジューラを使用して、再処理ジョブをスケジュールすることがで
きます。
Exception Monitor
Exception Monitor は、レコードを一連の条件と照合して、データ スチュワードによる手動での確認が
必要なレコードかどうかを判断するステージです。 Exception Monitor を使って、Spectrum™ Technology
Platform が正しく処理できなかったレコードを手動による確認ツール (Business Steward Portal) に渡
すことができます。
例外の例としては、次のものがあります。
• 住所検証エラー
• ジオコーディング エラー
• 信頼性の低いマッチング
• マージ/統合の結果
例外処理の詳細については、を参照してください。 Business Steward モジュールとは(416ページ).
入力
Exception Monitor は、任意のレコードを入力とします。
注: Exception Monitor は、リストやジオメトリ オブジェクトなどの複合データを含むフィールドをモ
ニタリングできません。
418
Spectrum™ Technology Platform 8.0.0
第 21 章 : Business Steward モジュール
オプション
表 72 : Exception Monitor のオプション
オプション名
説明
Exception Monitor を無
効にする
Exception Monitor をオンまたはオフにします。 Exception Monitor を無効
にした場合、レコードはステージを通過するだけで、アクションは発生し
ません。 これは、実際にはデータフローから Exception Monitor を削除す
ることと似ています。
例外上限に達したらジョ 指定した数のレコードが例外条件を満たした場合にジョブの実行を停止す
ブを停止する
るかどうかを指定します。
例外レコードの最大数
[例外上限に達したらジョブを停止する] が選択されている場合、このフィー
ルドを使用して、ジョブの実行を停止するまでに許可する例外レコードの
最大数を指定します。 例えば、100 を指定した場合、101 番目の例外レコー
ドが発生するとジョブは停止します。
条件が満たされた時点で
1 つの条件が満たされた場合に、残りの条件に対してレコードの評価を続
評価を停止する
行するかどうかを指定します。 このオプションを有効にすると、実行すべ
き評価の数が減少する可能性があるため、パフォーマンスが向上すること
があります。 ただし、必ずしもすべての条件を評価しない場合、Business
Steward Portal に表示される例外レポートの完全性はある程度損なわれま
す。 例えば、3 つの条件 (Address Completeness、Name Confidence、
Geocode Confidence) を定義し、レコードが Address Completeness で定
義された条件を満たしていて、このオプションが有効な場合、レコードは
Name Confidence および Geocode Confidence に対して評価されません。
Name Confidence 条件にマッチするためにこのレコードが例外と判定され
る場合でも、この情報は記録されません。 レコードは、Address
Completeness と Name Confidence 両方の問題があるとレポートされる代
わりに、Address Completeness の問題のみがあるとレポートされます。
例外グループのすべての
例外レコードだけでなく、例外レコードのグループに属するすべてのレコー
レコードを返す
ドを返すかどうかを指定します。 例えば、あるマッチ グループ (MatchKey
に基づく) に 4 つのレコードがあるとします。 1 つはサスペクト レコード、
1 つはスコア 90 の重複レコード、残り 2 つはスコア 80 と 83 のユニーク
レコードです。 MatchScore が 80 〜 89 のレコードを例外とする条件があ
る場合、デフォルトでは、マッチ スコア 80 と 83 のレコードだけが例外
ポートに送信されます。 しかし、このオプションが有効な場合は、4 つの
レコードすべてが例外ポートに送信されます。
データ スチュワードが例外レコードをグループ内の他のレコードと比較で
きるようにする場合は、このオプションを有効にしてください。 グループ
ユーザ ガイド
419
例外を処理するデータフローの設計
オプション名
説明
内のすべてのレコードを比較することにより、データ スチュワードは、例
外レコードの処理方法に関して、より詳細な情報に基づく決定を行うこと
ができます。 たとえば、マッチングを行う際に、データ スチュワードはす
べての候補を確認して、例外レコードが他の重複レコードかどうかを判断
することができます。
グループ化方法
[例外グループのすべてのレコードを返す] を選択した場合は、レコードを
グループ化するフィールドを選択します。
条件の追加または変更
条件は、レコードが "例外" で手動による確認のためにルーティングする必要があるかどうかを判断す
るための基準を定義します。 通常は、データフローの初期に自動処理がエラーになったり、信頼性が
低いために、手動で確認する必要があるレコードを一貫して特定できる条件を定義するということで
す。
1. [Exception Monitor のオプション] ウィンドウで、[追加] をクリックして新しい条件を作成する
か、[変更] をクリックして既存の条件を編集します。 次のフィールドに必要な値を指定します。
• 名前 — 条件の名前。 任意の名前にすることができます。 条件名は Business Steward Portal に
表示されるので、わかりやすい名前を使用してください。 例えば、"MatchScore<80" や
"FailedDPV" などです。
• データ ドメイン — (オプション) この条件によって評価するデータの種類を指定します。 Business
Steward Portal で、データに発生した例外の種類を表示するレポート目的でのみ使用されます。
例えば、条件によって住所検証の成功/失敗を評価する場合、データ ドメインは "住所" です。条
件によってジオコーディング操作の成功/失敗を評価する場合、データ ドメインは "空間" になり
ます。 独自のデータ ドメインを指定するか、定義済みの以下のドメインのいずれかを選択する
ことができます。
• 未分類 — この条件を分類しない場合は、このオプションを選択します。
• 名前 — 名や姓などの個人名データをチェックします。
• 住所 — 完全な郵送先住所や郵便番号などの住所データをチェックします。
• 電話 — 電話番号データをチェックします。
• 日付 — 日付データをチェックします。
• 電子メール — 電子メール データをチェックします。
• SSN — 米国 社会保障番号データをチェックします。
• アカウント — セールス アカウントに関連付けられた企業または組織の名前をチェックしま
す。
• 製品 — 材料、部品、商品などに関するデータをチェックします。
• アセット — 物理的資産、不動産、人材、その他のアセットなど、企業の資産に関するデータ
をチェックします。
• ファイナンシャル — 通貨、証券などに関連するデータをチェックします。
420
Spectrum™ Technology Platform 8.0.0
第 21 章 : Business Steward モジュール
• 空間 — 洪水発生地帯、海岸線、家屋、販売区域など定義済みの地勢を表す点、ポリゴン、ま
たは線データをチェックします。
• データ品質指標 — (オプション) この条件が評価する指標を指定します。 Business Steward Portal
で、データに発生した例外の種類を表示するレポート目的でのみ使用されます。 例えば、レコー
ドの完全性 (すべての住所に郵便番号が含まれているかなど) を評価するための条件を設計する
場合、データ品質指標として "完全性" を指定することができます。 独自の指標を指定するか、
定義済みの以下の指標のいずれかを選択することができます。
• 未分類 — この条件を分類しない場合は、このオプションを選択します。
• 完全性 — データに不可欠な属性が欠落しているかどうかを評価します。 例えば、郵便番号が
欠落している住所や、連絡先が欠落しているアカウントなどです。
• 精度 — データを信頼できるソースに対して検証できるかどうかを評価します。 例えば、郵政
当局のデータを使用して住所を検証することはできません。正確ではないので、例外と見なさ
れます。
• 一意性 — 重複データがあるかどうかを評価します。 データフローが重複データを統合できな
かった場合、そのレコードは例外と見なされます。
• 解釈可能性 — データが他のシステムによって解釈可能なデータ構造に正しくパースされてい
るかどうかを評価します。 例えば、社会保障番号に含めることができるのは数値データだけ
です。 このデータに xxx-xx-xxxx などの文字が含まれる場合、データには解釈可能性の問題が
あると見なされます。
• 一貫性 — データが複数のシステム間で一貫しているかどうかを評価します。 例えば、顧客
データ システムでは M と F という性別コードが使用されているが、処理しているデータの性
別コードが 0 と 1 の場合、データには一貫性の問題があると見なされます。
• 最新 — データが最新かどうかを評価します。 例えば、ある個人が引っ越したが、システム内
の住所が古いままの場合、データには最新の問題があると見なされます。
2. 少なくとも 1 つの式を条件に追加する必要があります。 式とは、フィールドの値をチェックする
論理文です。 式を追加するには、[追加] をクリックします。既存の式を変更するには、[変更] を
クリックします。 次のフィールドに必要な値を指定します。
• Expression Builder で作成した式 — このオプションは、基本式を作成する場合に選択します。
• カスタム式 — このオプションは、Groovy スクリプトを使用して式を記述する場合に選択しま
す。 ネストされた評価など、より複雑なロジックを使用する必要がある場合は、カスタム式を
使用します。 詳細については、Groovy スクリプトを使用したカスタム式(422ページ)を参照
してください。
• この条件に対して他の式が既に定義されている場合、[論理演算子] フィールドで演算子を選択す
ることができます。 次のいずれかを選択します。
• And — 条件が真になるには、定義済みの式だけでなくこの式も真である必要があります。
• Or — 定義済みの式が真でなくても、この式が真であれば条件は真になります。
• Expression Builder を使用して式を作成する場合、次のフィールドを利用できます。
• フィールド名 — この式で評価するフィールドを選択します。 Exception Monitor ステージより
上流のステージに基づいて、利用可能なフィールドの一覧が表示されます。
• 演算子 — 評価で使用する演算子を選択します。
• 値 — [演算子] フィールドで選択した演算子を使用して式でチェックする値を指定します。
ユーザ ガイド
421
例外を処理するデータフローの設計
3. [追加] をクリックして式を追加します。 式の追加が終了したら、[閉じる] をクリックします。
4. 式の評価順序を変更するには、[上へ移動] ボタンと [下へ移動] ボタンを使用します。
5. 式に対する作業が完了したら、[OK] をクリックします。
6. 必要に応じて追加の条件を追加または変更します。
7. 条件の評価順序を変更するには、[上へ移動] ボタンと [下へ移動] ボタンを使用します。 条件の評
価順序が重要になるのは、[条件が満たされた時点で評価を停止する] オプションを有効にした場合
のみです。 このオプションの詳細については、オプション(419ページ)を参照してください。
8. 条件に対する作業が完了したら、[OK] をクリックします。
条件または式の削除
•
条件を削除するには、Exception Monitor を開き、削除する条件を選択して、[削除] をクリックし
ます。 条件を削除すると、条件内の式もすべて削除されることに注意してください。
•
式を削除するには、その式を含む条件を開き、式を選択して、[削除] をクリックします。
Groovy スクリプトを使用したカスタム式
Groovy スクリプトを使用して、カスタム式を作成することができます。 Groovy スクリプトの詳細な
情報については、次の Web サイトを参照してください。
groovy.codehaus.org
式は、レコードが例外かどうかを示す boolean 値 (True または False) として評価される必要がありま
す。 例外レコードは例外ポートにルーティングされます。
注: 関数はサポートされていません。 Exception Monitor の Groovy スクリプトで関数を作成しないで
ください。
フィールドに単一の値があるかどうかを確認する
次の式は、Status フィールドの値が 'F' の場合に真として評価されます。 完全一
致が要求されるため、フィールドの値が 'f' の場合は真として評価されません。
return data['Status'] == 'F';
フィールドに複数の値があるかどうかを確認する
次の式は、Status フィールドの値が 'F' または 'f' の場合に真として評価されます。
boolean returnValue = false;
if (data['Status'] == 'F' || data['Status'] == 'f')
{
returnValue = true;
}
return returnValue;
422
Spectrum™ Technology Platform 8.0.0
第 21 章 : Business Steward モジュール
フィールドの長さを評価する
次の式は、PostalCode フィールドの文字数が 6 文字以上の場合に真として評価
されます。
return data['PostalCode'].length() > 5;
フィールド値に含まれる文字を確認する
次の式は、PostalCode フィールドにダッシュが含まれている場合に真として評価
されます。
boolean returnValue = false;
if (data['PostalCode'].indexOf('-') != -1)
{
returnValue = true;
}
return returnValue;
一般的な誤り
次に、スクリプトを使用するときの一般的な誤りを示します。
次の式は誤りです。PostalCode (列名) は、単一引用符または二重引用符で囲む必要があります。
return data[PostalCode];
次の式は誤りです。列が指定されていません。
return data[];
出力
Exception Monitor は、2 つのポートにレコードを返します。 1 つのポートには、Exception Monitor ス
テージで定義したいずれの条件も満たさないレコードが含まれます。 もう一方のポートである例外
ポートには、1 つ以上の例外条件にマッチするすべてのレコードが含まれます。 [例外グループのすべ
てのレコードを返す] オプションが有効な場合、例外ポートに非例外レコードも含まれることがありま
す。 Exception Monitor がレコード内にフィールドを追加したり、フィールドを変更したりすることは
ありません。
例外の読み込み
例外の読み込みは、入力として例外リポジトリのレコードをデータフローに読み込むステージです (例
外リポジトリの詳細については、Business Steward モジュールとは(416ページ)を参照してくださ
い)。
注: 例外の読み込みによってデータフローに読み込まれたレコードは、リポジトリから削除されます。
ユーザ ガイド
423
例外を処理するデータフローの設計
入力
例外の読み込みにより、例外リポジトリからデータが読み込まれます。 データフロー内の別のステー
ジから入力を取得することはありません。
注: Business Steward Portal で "承認済み" とマークされたレコードのみがデータフローに読み込まれ
ます。
オプション
例外の読み込みステージには次のオプションがあります。
[一般] タブ
[一般] タブのオプションで、データフローに読み込む例外レコードを指定します。
[Filter] オプションを使用すると、次の条件を使用して、例外リポジトリからレコードのサブセットを
選択することができます。
• ユーザ: データフローに読み込む例外を生成したデータフローを実行したユーザ。
• データフロー名: データフローに読み込む例外を生成したデータフローの名前。
• ステージ ラベル: Enterprise Designer でデータフローに表示される、Exception Monitor ステージの
ラベル。 この条件は、例外を生成したデータフローに複数の Exception Monitor ステージが含まれ、
それらの Exception Monitor ステージのいずれかからの例外のみを読み込みたい場合に役立ちます。
• 開始日: データフローに読み込む最古のレコードの日時。 例外レコードの日付は、例外レコードが
最後に変更された日付です。
• 終了日: データフローに読み込む最新のレコードの日時。 例外レコードの日付は、例外レコードが
最後に変更された日付です。
[フィールド] リストには、データフローに読み込まれるフィールドが表示されます。 デフォルトでは
すべてのフィールドが含まれますが、[含める] 列のチェック ボックスをクリアすることにより、その
フィールドを除外できます。
[プレビュー] リストには、[Filter] で指定した条件を満たすレコードが表示されます。
注: プレビューには、Business Steward Portal で "承認済み" とマークされ、フィルタ条件を満たすレ
コードのみが表示されます。
[ソート] タブ
フィールド値に基づいて入力レコードをソートするには、[ソート] タブを使用します。
• 追加: ソートの基となるフィールドを追加します。
• [フィールド名] 列: ソートの基となるフィールドの名前が表示されます。 ドロップダウン ボタンを
クリックして、フィールドを選択することができます。
• [順序] 列: 昇順でソートするか降順でソートするかを指定します。
424
Spectrum™ Technology Platform 8.0.0
第 21 章 : Business Steward モジュール
• [上へ] および [下へ]: ソートの順序を変更します。 レコードは、リストの先頭のフィールドによって
まずソートされ、次にリストの 2 番目のフィールドによってソートされます。
• [削除]: ソート フィールドを削除します。
[実行時] タブ
• 開始レコード: データフローに読み込む最初のレコードのリポジトリ内の位置を指定します。 例え
ば、リポジトリ内の最初の 99 レコードをスキップする場合は、100 と指定します。 [一般] タブで
指定した条件にマッチする場合、100 番目のレコードがリポジトリに読み込まれる最初のレコード
になります。 レコードの位置は、Business Steward Portal 内のレコードの順序によって決定されま
す。
• すべてのレコード: [一般] タブで指定した検索条件にマッチするすべてのレコードを読み込む場合
は、このオプションを選択します。
• 最大レコード数: データフローに読み込むレコード数を制限する場合は、このオプションを選択し
ます。 例えば、選択条件にマッチする最初の 1,000 レコードのみを読み込みたい場合は、このオプ
ションを選択して、1000 と指定します。
出力
例外の読み込みステージは、承認済みかつ例外の読み込みオプションで指定した選択条件にマッチす
る例外リポジトリ内のレコードを返します。 例外の読み込みは、レコードのフィールドに加え、
Business Steward Portal でそのレコードに対して最後に行われた変更を説明するフィールドを返しま
す。
表 73 : 例外の読み込みの出力
フィールド名
説明
Exception.Comment
例外の解決者が入力したコメント。 例えば、コメ
ントによって、Business Steward Portal でそのレ
コードに対して行った変更を説明することができ
ます。
Exception.LastModifiedBy
Business Steward Portal で最後にレコードを変更
したユーザ。
Exception.LastModifiedMilliseconds
Business Steward Portal で最後にレコードが変更
された時刻。 時刻は 1970/01/01 0:00 GMT から
のミリ秒で表されます。 これは、Java プログラ
ミング言語で時間を計算する標準的な方法です。
この値を使用してデータの比較を実行したり、ト
ランスフォームを作成してこの値を必要な任意の
日付形式に変換することができます。
ユーザ ガイド
425
例外を処理するデータフローの設計
フィールド名
説明
Exception.LastModifiedString
Business Steward Portal で最後にレコードが変更
された時刻。 このフィールドは、
Exception.LastModifiedMilliseconds フィールドよ
りも理解しやすい表現で日付を表します。 時刻は
次の形式で表されます。
Thu Feb 17 13:34:32 CST 2011
例外の書き出し
例外の書き出しは、Exception Monitor ステージが例外として特定したレコードを取得して、例外リポ
ジトリに書き出すステージです。 例外リポジトリに書き出されたレコードは、Business Steward Portal
を使用して確認および編集できます。
入力
例外の書き出しステージは、Exception Monitor ステージの例外ポートからレコードを取得して、例外
リポジトリに書き出します。 例外の書き出しステージは、Exception Monitor ステージの例外ポートの
下流に配置する必要があります。 例外ポートは Exception Monitor ステージの 1 番下の出力ポートで
す。
オプション
例外の書き出しステージでは、例外リポジトリにどのフィールドのデータを返すかを設定できます。
表示されるフィールドは、データフローの上流にあるステージによって異なります。 例えば、データ
フローに Validate Address ステージがある場合は、AddressLine1、AddressLine2、City、PostalCode
等のフィールドが表示されます。
426
Spectrum™ Technology Platform 8.0.0
第 21 章 : Business Steward モジュール
出力
例外の書き出しは、データフローに出力を返しません。 例外レコードを例外リポジトリに書き出しま
す。
Business Steward Portal
Business Steward Portal とは
Business Steward Portal は、自動処理に失敗したり、十分な信頼性で処理されなかったレコードを確
認するためのツールです。 Business Steward Portal を使用して、正しいデータをレコードに手動で入
力します。 例えば、顧客レコードが住所検証処理に失敗した場合、顧客の住所を特定するのに必要な
調査を行い、正しい住所が含まれるようレコードを変更することができます。 変更したレコードは、
設定に応じて、Spectrum™ Technology Platform で再処理したり、別のデータ検証または強化処理に
送ったり、データベースに書き出したりすることができます。
さらに、Business Steward Portal は、データ ドメイン (名前、住所、空間など) やデータがエラーに
なったデータ品質指標 (完全性、精度、最新など) といった、例外処理をトリガするデータの種類を理
解するためのサマリ グラフも提供します。
例外処理の詳細については、Business Steward モジュールとは(416ページ)を参照してください。
Business Steward Portal へのアクセス
Business Steward Portal を開くには、次の手順に従います。
1. Web ブラウザを開いて、http://<servername>:<port>/bsm-portal に移動します。
例を次に示します。
http://myserver:8080/bsm-portal
サーバー名とポートがわからない場合は、Spectrum™ Technology Platform 管理者に問い合わせて
ください。
2. 管理者権限のある Spectrum™ Technology Platform ユーザ アカウントを使用してログインします。
ログインできない場合は、Spectrum™ Technology Platform 管理者に問い合わせてください。
注: 管理者権限を持つユーザ アカウントのみが例外レコードを編集できます。
例外ダッシュボードの表示
例外ダッシュボードには、データで検出された例外の種類を要約したグラフが表示されます。 データ
ドメインおよびデータ品質指標別や、例外を生成したユーザおよびデータフロー別に、例外の分析結
果を表示することができます。
ユーザ ガイド
427
Business Steward Portal
1. Web ブラウザを開いて、http://<servername>:<port>/bsm-portal に移動します。
例を次に示します。
http://myserver:8080/bsm-portal
サーバー名とポートがわからない場合は、Spectrum™ Technology Platform 管理者に問い合わせて
ください。
2. 管理者権限のある Spectrum™ Technology Platform ユーザ アカウントを使用してログインします。
ログインできない場合は、Spectrum™ Technology Platform 管理者に問い合わせてください。
注: 管理者権限を持つユーザ アカウントのみがログインできます。
次の 4 つのグラフが表示されます。
• 品質指標 — 各データ品質指標カテゴリに分類された例外の割合を示します。
• データ ドメイン — 例外の原因となったデータの種類を示します。
• ユーザ — データフローが例外を生成したユーザを示します。
• データフロー — 例外を生成したデータフローの名前を示します。
拡大したいグラフの部分をクリックすることにより、グラフの各カテゴリにドリルダウンできま
す。 例えば、データ ドメイン グラフでは、"名前" などのドメインをクリックして、名前データに
存在するデータ品質エラーの種類を表示することができます。
3. 円グラフ形式と棒グラフ形式を切り替えるには、該当するボタンをクリックします。
428
Spectrum™ Technology Platform 8.0.0
第 21 章 : Business Steward モジュール
グラフ内で右クリックして、個別のグラフに切り替えることもできます。
4. グラフからカテゴリを削除するには、凡例でそのカテゴリのチェック ボックスをクリアします。
ユーザ ガイド
429
Business Steward Portal
例外レコード表示のフィルタリング
フィルタリングを使用して、関心があるレコードのみを表示することができます。 デフォルトでは、
Business Steward Portal には一度に 1 つの Spectrum™ Technology Platform データフローのレコード
のみが表示されます。 レコード一覧をさらにフィルタリングして、編集したいレコードだけを表示す
ることができます。
レコードの一覧をフィルタリングするには、次の手順に従います。
1. フィルタリング オプションが表示されていない場合は、[Filter を表示] をクリックします。
2. Filter オプションを使用して、編集したいレコードを表示します。
注: 一度に 1 つのデータフローのレコードのみを表示できます。 ウィンドウ上部の [データフロー
名] フィールドに、現在表示されているレコードを生成したデータフローが表示されます。
ユーザ
例外となったデータフローを実行した個人のユーザ ID。
データ ドメイン
例外となったデータのカテゴリ。 住所データや名前データなど。
品質指標
例外となったデータ品質の指標。 完全性や精度など。
データフロー名
例外となったデータフローの名前。 一度に 1 つのデータフローの例外のみ
を表示できます。
ジョブ ID
例外となったジョブの数字のジョブ番号。
ステージ ラベル
レコードを Business Steward Portal にルーティングした Exception Monitor
ステージのラベル。 このラベルは、Enterprise Designer でデータフローに
表示されます。 デフォルトのラベルは "Exception Monitor" ですが、1 つの
データフローに複数の Exception Monitor ステージがある場合は特に、デー
タフロー設計者がステージに意味のある名前を付与することができます。
承認ステータス
承認ステータスは、データ スチュワードがそのレコードを編集し、承認済
みとしてマークしたかどうかを示します。 承認されたレコードは、
Spectrum™ Technology Platform によって再処理できます。
開始日/終了日
データフローが実行された日付 (およびオプションとして時刻)。 時刻を入
力するには、日付に続けて時刻を入力します。
3. フィールドの値に基づいてフィルタリングするには、次の手順に従います。
430
Spectrum™ Technology Platform 8.0.0
第 21 章 : Business Steward モジュール
a) [Field Filter を追加] アイコンをクリックします。
b) [フィールド名] 列で、フィルタリングを実行するフィールドを選択します。
c) [操作] 列で、次のいずれかを選択します。
が次の値と同じ
指定した値と完全に同じ値を持つレコードを探します。 数値またはテキ
スト値を指定できます。 例えば、MatchScore の値が 82、または
LastName の値が "Smith" のレコードを検索できます。
が次の値と異なる
指定した値以外の値を持つレコードを探します。 数値またはテキスト値
を指定できます。 例えば、MatchScore の値が 100 以外、または
LastName が "Smith" 以外のレコードを検索できます。
が次の値より大きい 指定した値より大きい数値を持つレコードを探します。
が次の値以上
指定した値以上の数値を持つレコードを探します。 例えば、50 を指定
した場合、選択したフィールドの値が 50 以上のレコードが表示されま
す。
が次の値より小さい 指定した値より小さい数値を持つレコードを探します。
が次の値以下
指定した値以下の数値を持つレコードを探します。 例えば、50 を指定
した場合、選択したフィールドの値が 50 以下のレコードが表示されま
す。
が次の文字を含む
選択したフィールド内のいずれかの位置に指定した値を含むレコードを
探します。 例えば、AddressLine1 フィールドで "South" をフィルタリ
ングする場合、"12 South Ave."、"9889 Southport St."、"600 South Shore
Dr."、および "4089 5th St. South" という値を持つレコードが表示されま
す。
が次の文字から始ま 選択したフィールドが特定の値で始まるレコードを探します。 例えば、
る
LastName フィールドで "Van" をフィルタリングする場合、"Van Buren"、
Vandenburg"、または "Van Dyck" という値を持つレコードが表示され
ます。
で終わる
選択したフィールドが特定の値で終わるレコードを探します。 例えば、
City フィールドが "burg" で終わるレコードをフィルタリングする場
合、"Gettysburg"、"Fredricksburg"、および "Blacksburg" という値を持
つレコードが表示されます。
d) [フィールド値] 列にフィルタリング条件として使用する値を入力します。
注: 検索値は大文字と小文字が区別されます。 つまり、SMITH を検索すると、"smith" や
"Smith" ではなく、すべて大文字の "SMITH" という値を持つレコードのみが返されます。
ユーザ ガイド
431
Business Steward Portal
e) 複数のフィールドに基づいてフィルタリングを行うには、[Field Filter を追加] アイコンをクリッ
クして、複数のフィルタを追加します。
. 例えば、LastName の値が "SMITH" で State の
値が "NY" のレコードをすべて取得したい場合は、LastName フィールド用と State フィールド
用に 2 つのフィルタを使用することができます。
f) [適用] アイコンをクリックします。
.
この例では、State フィールドの値が "FL" のレコードがすべて返されます。
この例では、PostalCode の値が 60510 ではないレコードがすべて返されます。
この例では、LastName の値が "SMITH" で、シカゴ在住で、郵便番号が 60615 以外のレコードが
すべて返されます。
432
Spectrum™ Technology Platform 8.0.0
第 21 章 : Business Steward モジュール
例外レコードの編集
例外レコードを編集する目的は、レコードを正しく処理できるように訂正することです。 例外レコー
ドの編集は、地図、インターネット、または企業内の他の情報システムなど、他のリソースの参照を
伴うことがあります。 手動確認の目標は、不正なデータを判断し、それを手動で訂正することです。
なぜなら、Spectrum™ Technology Platform は自動データフロー処理の一環として不正なデータを訂
正できないからです。
この手動確認を実行するには、Business Steward Portal を使用します。 このツールは、例外レコード
を表示、調査、および編集することができます。
1. Business Steward Portal で、[エディター] タブをクリックします。
例外レコードの一覧が表示されます。 次のアイコンが 1 つ以上表示されることがあります。
ステータス アイコン
レコードは編集されていません。
レコードは変更されていますが、変更は保存されていません。 変更を
保存するには、[保存] ボタンをクリックします。
レコードは変更され、変更が保存されています。
タイプ アイコン
例外レコードは単一レコードで、グループの一部ではありません。 例えば、
単一レコードの住所検証エラーなどです。
例外レコードはレコード グループの一部です。 つまり、例外は、重複除外デー
タフローなどにおけるマッチング エラーの結果です。 この種の例外の解決方
法については、重複レコードの解決(435ページ)を参照してください。
レコードは新しい Best of Breed レコードです。 Best of Breed レコードは、
重複を手動で結合して単一レコードにする際に使用されます。
コメント アイコン
このレコードに対してコメントが書かれていることを示します。 コ
メントを読むには、このアイコンをクリックします。
2. 作業対象とするレコードを表示するためのフィルタリング オプションを設定します。 フィルタリ
ング オプションについては、を参照してください。 例外レコード表示のフィルタリング(430ペー
ジ)
3. 編集するフィールドをクリックして、そのフィールドに新しい値を入力します。 切り取り、コ
ピー、貼り付けオプションにアクセスするには、フィールドを右クリックします。
レコードをクリックすると、ウィンドウ下部の [詳細] タブに、そのレコードに関するその他の詳
細情報も表示されます。
ユーザ ガイド
433
Business Steward Portal
[詳細] タブには次の情報が表示されます。
ジョブ ID
システムがジョブに割り当てる数字の識別子。 ジョブを実行するたびに、新
しいジョブ ID が割り当てられます。
データフロー名
データフローに付与される、ユーザが定義した名前。
ステージ ラベル
データフロー内の Exception Monitor ステージに付与される、ユーザが定義し
た名前。 データフローに複数の Exception Monitor ステージが含まれる場合、
この情報は特に役立ちます。 データフローの作成者が各 Exception Monitor ス
テージに意味のあるラベルを付与した場合、例外レコードを生成した Exception
Monitor を特定することができます。 デフォルトのラベルは "Exception Monitor"
です。
ユーザ
データフローを実行したユーザ。
例外時間
Exception Monitor がレコードを例外として識別した日時。
グループ化
例外レコード グループ内のすべてのレコードを返すようデータフローが設定
されていた場合、レコードをグループ化しているフィールドが表示されます。
このオプションは、重複レコードを識別するデータフローや、レコードを世
帯にグループ化するデータフローなど、マッチングを実行するデータフロー
にのみ適用されます。
条件名
レコードを例外として識別した条件の名前。 条件名は、データフローの設定
者によって定義されます。
データ ドメイン
例外となったデータの種類。 データ ドメインの例には、名前、住所、電話番
号などがあります。 この情報は、編集する必要があるレコード内のフィール
ドを特定するのに役立ちます。
品質指標
レコードがエラーになった品質指標。 品質指標の例には、精度、完全性、一
意性などがあります。 この情報は、レコードが例外と識別された理由を判断
するのに役立ちます。
4. [コメント] 列に、変更に関するコメントを追加することができます。 コメントは他のユーザも見
ることができ、レコードに対する変更を追跡するのに使用できます。
5. レコードの編集履歴を表示する場合は、ウィンドウ下部の [履歴] タブをクリックします。
434
Spectrum™ Technology Platform 8.0.0
第 21 章 : Business Steward モジュール
[履歴] タブには次の情報が表示されます。
バージョン
変更のリビジョン番号。
作業者
変更を行ったユーザ。
日時
変更が保存された日付および時刻。
コメント
変更を行ったユーザが入力したコメント (任意)。
6. 変更を取り消す場合は、取り消しを行うレコードを選択し、[元に戻す] をクリックします。
7. レコードを有効にするために必要な変更を確実に行ったら、[承認済み] 列のボックスをチェックし
ます。 これにより、Spectrum™ Technology Platform で処理可能としてレコードがマークされま
す。
8. [保存] をクリックします。 変更済みのすべてのレコードの未保存の変更はすべて、例外リポジト
リに保存されます。
重複レコードの解決
レコードが別のレコードの重複かどうかを Spectrum™ Technology Platform が確実に判断できない場
合は、重複解決例外が発生します。 重複レコードの解決方法は 3 つあります。
1 つのアプローチは、重複レコードをコレクションにグループ化することです。 レコードを承認する
と、データの各コレクション内の重複レコードを除外する統合処理によって処理することができます。
ユーザ ガイド
435
Business Steward Portal
もう 1 つのアプローチは、Business Steward Portal で、"Best of Breed" レコードを手動で 作成するこ
とです。 このアプローチでは、互いに重複となっているレコードを判断し、複数の重複レコードの
データを使用して、手動で単一レコードを作成します。 その後、レコードを承認すると、Best of Breed
レコードはサバイビング レコードとして処理されます。
3 番目のアプローチは、例えば通り名のスペルを訂正するなど、レコードを重複として認識しやすく
なるよう編集することです。 レコードを承認すると、Spectrum™ Technology Platform はマッチング
および統合処理によってレコードを再処理します。 レコードを正しく訂正した場合、Spectrum™
Technology Platform はそのレコードを重複として認識できるようになります。
レコードを別のレコードの重複とする
重複レコードは、Business Steward Portal にレコード グループとして表示されます。 レコードを重複
レコードと同じグループに移動することによって、別のレコードの重複とすることができます。
レコードを重複とするには、次の手順に従います。
1. Business Steward Portal で、[エディター] タブをクリックします。
2. 作業対象とするレコードを表示するためのフィルタリング オプションを設定します。 フィルタリ
ング オプションについては、を参照してください。 例外レコード表示のフィルタリング(430ペー
ジ)
3. 作業対象とするレコードを選択し、[重複を解決] をクリックします。
[重複の解決] ビューに重複レコードが表示されます。 レコードは、次のマッチ レコード タイプを
含むコレクションまたは候補グループにグループ化されています。
suspect
互いに重複する関係にあるかどうかを確認するために、他のレコードと比較
するレコード。 1 コレクションにサスペクト レコードは 1 つのみ含まれま
す。
duplicate
サスペクト レコードと重複するレコード。
unique
重複がないレコード。
MatchRecordType 列を見ると、レコードのタイプを判断することができます。
4. 必要に応じて、個々のレコードを訂正します。 詳細については、例外レコードの編集(433ページ)
を参照してください。
5. CollectionNumber フィールドまたは CandidateGroup フィールドに、レコードの移動先とするグ
ループの番号を入力します。 レコードが、グループ内の他のレコードの重複となります。
MatchRecordType の値が "サスペクト" のレコードは、別の重複のコレクションに移動できない場
合があります。
注: レコードは、例外を生成したデータフローで使用されるマッチング ロジックのタイプによっ
て、CollectionNumber フィールドまたは CandidateGroup フィールドでグループ化されます。
マッチングに関する追加情報が必要な場合は、Spectrum™ Technology Platform 管理者に問い
合わせてください。
6. レコードの変更が終了したら、[承認済み] ボックスをチェックします。 これは、レコードを
Spectrum™ Technology Platform で再処理できるようになったことを示します。
436
Spectrum™ Technology Platform 8.0.0
第 21 章 : Business Steward モジュール
7. 変更を保存するには、[保存] をクリックします。
重複レコードの新しいグループの作成
互いに重複とするレコードの新しいグループを作成できる場合があります。 新しいグループを作成で
きない場合もあります。 新しいグループを作成できるかどうかは、例外レコードを生成した Spectrum™
Technology Platform の処理のタイプによって決定されます。
1. Business Steward Portal で、[エディター] タブをクリックします。
2. 作業対象とするレコードを表示するためのフィルタリング オプションを設定します。 フィルタリ
ング オプションについては、を参照してください。 例外レコード表示のフィルタリング(430ペー
ジ)
3. 作業対象とするレコードを選択し、[重複を解決] をクリックします。
[重複の解決] ビューに重複レコードが表示されます。 レコードは、次のマッチ レコード タイプを
含むコレクションまたは候補グループにグループ化されています。
suspect
互いに重複する関係にあるかどうかを確認するために、他のレコードと比較
するレコード。 1 コレクションにサスペクト レコードは 1 つのみ含まれま
す。
duplicate
サスペクト レコードと重複するレコード。
unique
重複がないレコード。
MatchRecordType 列を見ると、レコードのタイプを判断することができます。
4. 必要に応じて、個々のレコードを訂正します。 詳細については、例外レコードの編集(433ページ)
を参照してください。
5. 新しいコレクションに配置するレコードを選択し、[新しいコレクション] をクリックします。 新
しいコレクションには、一意なコレクション番号が自動的に付与されます。選択したレコードは、
サスペクト レコードになります。
注: [新しいコレクション] ボタンが表示されていない場合は、作業中のレコードに対して新しいコ
レクションを作成することはできません。 新しいコレクションを作成できるのは、例外を生
成したデータフローが Interlfow Match または Intraflow Match ステージを含む場合のみで、
Transactional Match ステージを含む場合は作成できません。 これらのマッチング ステージに
関する詳細な情報については、Spectrum™ Technology Platform 管理者に問い合わせてくださ
い。
6. 新しいコレクションの番号をレコードの CollectionNumber フィールドに入力することによって、
レコードをコレクションに追加します。
7. レコードの変更が終了したら、[承認済み] ボックスをチェックします。 これは、レコードを
Spectrum™ Technology Platform で再処理できるようになったことを示します。
8. 変更を保存するには、[保存] をクリックします。
レコードをユニークにする
重複レコードをユニーク レコードに変更するには
ユーザ ガイド
437
Business Steward Portal
1. Business Steward Portal で、[エディター] タブをクリックします。
2. 作業対象とするレコードを表示するためのフィルタリング オプションを設定します。 フィルタリ
ング オプションについては、 を参照してください。 例外レコード表示のフィルタリング(430ペー
ジ)
3. 作業対象とするレコードを選択し、[重複を解決] をクリックします。
[重複を解決] ビューに重複レコードが表示されます。 レコードは、次のマッチ レコード タイプを
含むコレクションまたは候補グループにグループ化されています。
suspect
互いに重複する関係にあるかどうかを確認するために、他のレコードと比較
するレコード。 1 コレクションにサスペクト レコードは 1 つのみ含まれま
す。
duplicate
サスペクト レコードと重複するレコード。
unique
重複がないレコード。
MatchRecordType 列を見ると、レコードのタイプを判断することができます。
4. MatchRecordType フィールドに "Unique" と入力します。
5. レコードの変更が終了したら、[承認済み] ボックスをチェックします。 これは、レコードを
Spectrum™ Technology Platform で再処理できるようになったことを示します。
6. 変更を保存するには、[保存] をクリックします。
Best of Breed レコードに重複レコードを結合する
重複を解決するための方法の 1 つは、Business Steward Portal で "Best of Breed" レコードを手動で作
成することです。 このアプローチでは、互いに重複となっているレコードを判断し、コレクション内
の複数の重複レコードのデータを使用して、手動で単一レコードを作成します。 その後、レコードを
承認すると、Best of Breed レコードはサバイビング レコードとして処理されます。
注: Best of Breed レコードを作成する場合は、ジョブ内の重複レコードの各コレクションに対して、
この操作を行う必要があります。
Best of Breed レコードを作成するには
1. Business Steward Portal で、[エディター] タブをクリックします。
2. 作業対象とするレコードを表示するためのフィルタリング オプションを設定します。 フィルタリ
ング オプションについては、 を参照してください。 例外レコード表示のフィルタリング(430ペー
ジ)
3. 作業対象とするレコードを選択し、[重複を解決] をクリックします。
[重複を解決] ビューに重複レコードが表示されます。 レコードは、次のマッチ レコード タイプを
含むコレクションまたは候補グループにグループ化されています。
438
suspect
互いに重複する関係にあるかどうかを確認するために、他のレコードと比較
するレコード。 1 コレクションにサスペクト レコードは 1 つのみ含まれま
す。
duplicate
サスペクト レコードと重複するレコード。
Spectrum™ Technology Platform 8.0.0
第 21 章 : Business Steward モジュール
unique
重複がないレコード。
MatchRecordType 列を見ると、レコードのタイプを判断することができます。
4. 必要に応じて、個々のレコードを訂正します。 詳細については、例外レコードの編集(433ページ)
を参照してください。
5. 結合レコードの基盤として使用するレコードを選択します。
6. [Best of Breed] をクリックします。 レコードのコピーが作成され、これが "Best of Breed" レコー
ドとなります。 このレコードによって、重複レコードが置き換えられます。 Best of Breed レコー
ドは、CollectionRecordType 列の値が "BestOfBreed" になっています。
7. コレクションの他のレコードから必要な情報をコピーし、Best of Breed レコードに貼り付けます。
8. レコードの変更が終了したら、Best of Breed レコードの横にある [承認済み] ボックスをチェック
します。 これは、レコードを Spectrum™ Technology Platform で再処理できるようになったこと
を示します。
注: 各重複コレクションの Best of Breed レコードのみを承認してください。 また、ユニーク レ
コードのコレクション (コレクション 0) のすべてのレコードを承認する必要があります。
9. 変更を保存するには、[保存] をクリックします。
重複解決時に自動調整されるフィールド
Business Steward Portal の重複解決ビューでレコードを変更すると、レコードの新しい性質を反映す
るよう、一部のフィールドが自動的に調整されます。
表 74 : Interflow Match または Intraflow Match で処理されるレコード
操作
フィールドに自動適用される値
レコードを 1 つのコレクションから別
のコレクションに移動
レコードを重複コレクションに移動する場合
• MatchRecordType: 重複
• MatchScore: 100
• HasDuplicates: D (このフィールドはデータフローに
Interflow Match ステージが含まれる場合にのみ存在しま
す)
重複レコードをユニーク レコードのコレクション (コレク
ション 0) に移動する場合
• MatchRecordType: ユニーク
• MatchScore: 変更なし
• HasDuplicates: U (このフィールドはデータフローに
Interflow Match ステージが含まれる場合にのみ存在しま
す)
ユーザ ガイド
439
Business Steward Portal
操作
フィールドに自動適用される値
サスペクト レコードをユニーク レコードのコレクション
(コレクション 0) に移動する場合
• MatchRecordType: ユニーク
• MatchScore: 0
• HasDuplicates: N (このフィールドはデータフローに
Interflow Match ステージが含まれる場合にのみ存在しま
す)
新しいコレクションの作成
• MatchRecordType: サスペクト
• MatchScore: 値なし
• HasDuplicates: Y (このフィールドはデータフローに
Interflow Match ステージが含まれる場合にのみ存在しま
す)
注: Interflow Match ステージを含むデータフローから得ら
れたレコードの場合、InterflowSourceType フィールド
の値が "input_port_0" のレコードのみがサスペクト レ
コードになることができます。
表 75 : Transactional Match で処理されるレコード
操作
フィールドに自動適用される値
MatchRecordType を重複に変更
• HasDuplicates: D
• MatchScore: 100
MatchRecordType をユニークに変更
• HasDuplicates: U
• MatchScore: 変更なし
HasDuplicates を D に変更
• MatchRecordType: 重複
• MatchScore: 100
HasDuplicates を U に変更
• MatchRecordType: ユニーク
• MatchScore: 変更なし
HasDuplicates を Y に変更
• MatchRecordType: サスペクト
• MatchScore: 空白
440
Spectrum™ Technology Platform 8.0.0
第 21 章 : Business Steward モジュール
操作
フィールドに自動適用される値
HasDuplicates を N に変更
• MatchRecordType: サスペクト
• MatchScore: 空白
検索ツール
検索ツールの設定
検索ツールは、Pitney Bowes Software がホストする外部 Web サービスにアクセスする必要がありま
す。 検索ツールを設定するには、外部 Web サービス用のユーザ ID とパスワードを取得する必要があ
ります。 ユーザ ID とパスワードを要求するには、Pitney Bowes Software アカウント名と連絡先を記
載した電子メールを [email protected] に送信してください。 追加料金が適用される場合が
あります。 詳細については、アカウント エグゼクティブに問い合わせてください。
Business Steward Portal の検索ツールは、Web サービスを使用して、電話番号や企業情報の検索な
ど、各種の検索を実行します。 Spectrum™ Technology Platform サーバー上に外部 Web サービスとし
て設定しなければ、これらの検索ツールは使用できません。
注: この手順は、Spectrum™ Technology Platform 管理者が実行する必要があります。
1. Management Console を開きます。
2. リソースノードを展開し、[外部の Web サービス] をクリックします。
3. [追加] をクリックします。
4. [名前] フィールドに、次の適切な名前を入力します。
検索ツール
名前
Company Lookup
CompanyLookupService
Experian Truvue
ExperianTruvueService
Interactive Address Search (対話型住所検索)
AddressDoctorFastCompletionService
注: Universal Addressing モジュール コンポー
ネントである Validate Address Global がイ
ンストールされている場合、外部 Web サー
ビスの代わりに対話型住所検索ツールとし
て使用することができます。 Validate
Address Global サービスを使用するには、
Management Console で Validate Address
Global サービスを開き、[プロセス] タブへ
移動し、[処理モード] フィールドで「高速
実行」を選択します。
ユーザ ガイド
441
Business Steward Portal
検索ツール
名前
Phone Lookup
PhoneAppendService
Reverse Phone Lookup
ReversePhoneAppendService
5. [外部サービス タイプ] フィールドで、[SOAP] を選択します。
6. [タイムアウト (秒)] フィールドに、10 と入力します。
7. [サービスとしてエクスポーズ] と [SOAP] のチェック ボックスをオンにします。 [REST] チェッ
ク ボックスをクリアします。
8. [URL] フィールドに、以下のように適切な URL を入力します。
検索ツール
URL
Company
Lookup
http://spectrum.pbondemand.com:8080/soap/CompanyLookupService?wsdl
Experian
Truvue
http://spectrum.pbondemand.com:8080/soap/ExperianTruvueService?wsdl
Interactive
http://spectrum.pbondemand.com:8080/soap/AddressFastCompletionService?wsdl
Address
注: Universal Addressing モジュールのコンポーネントである Validate Address
Search (対話
Global がインストールされている場合、外部 Web サービスの代わりにこれ
型住所検索)
を対話型住所検索ツールとして使用することができます。 Validate Address
Global サービスを使用するには、Management Console で Validate Address
Global サービスを開き、[プロセス] タブへ移動し、[処理モード] フィールド
で「高速実行」を選択します。
Phone
Lookup
http://spectrum.pbondemand.com:8080/services/PhoneAppend?wsdl
Reverse
Phone
Lookup
http://spectrum.pbondemand.com:8080/services/ReversePhoneAppend?wsdl
9. [操作] フィールドには、自動的に正しい値が入力されます。 このフィールドに値が表示されない
場合は、URL の入力後に [更新] をクリックします。
10. [ユーザ名] と [パスワード] のフィールドに、OnDemand 認証情報を入力します。 ユーザ名とパス
ワードの取得については、[email protected] にお問い合わせください。
11. [要求] タブをクリックし、次の操作を行います。
442
Spectrum™ Technology Platform 8.0.0
第 21 章 : Business Steward モジュール
検索ツール
環境設定
Company Lookup
[Allow Null] チェック ボックスをオンにして、
列のすべてのチェック ボックスをオンにしま
す。
Experian Truvue
変更は必要ありません。
Interactive Address Search (対話型住所検索)
変更は必要ありません。
Phone Lookup
• account_id フィールドに、[デフォルト値] 列
の OnDemand ユーザ名を入力します。
• account_password フィールドに、[デフォル
ト値] 列の OnDemand パスワードを入力しま
す。
• これら 2 つのフィールドの [エクスポーズ] 列
のチェック ボックスをクリアします。
Reverse Phone Lookup
• account_id フィールドに、[デフォルト値] 列
の OnDemand ユーザ名を入力します。
• account_password フィールドに、[デフォル
ト値] 列の OnDemand パスワードを入力しま
す。
• これら 2 つのフィールドの [エクスポーズ] 列
のチェック ボックスをクリアします。
12. [OK] をクリックします。
Bing Maps の使用
Bing Maps 検索ツールは、住所の位置を地図上に表示し、地図のズームや移動を行うためのコントロー
ルを提供します。 また、地図上をクリックすることにより、住所を取得することができます。
1. Business Steward Portal で、調査したいレコードをクリックします。
2. レコード テーブルの下の [検索ツール] タブをクリックします。
ユーザ ガイド
443
Business Steward Portal
3. [ツール] フィールドで、[Bing Maps] を選択します。
4. 検索に使用するフィールドを選択します。 例えば、地図上で住所を検索する場合は、AddressLine1
と City を選択します。 地図上に都市を表示する場合は、City と StateProvince のみを選択するこ
とができます。 以下に示すように、選択したフィールドの値が検索ボックスに配置されます。
5. [検索] をクリックします。 結果が表示されます。
444
Spectrum™ Technology Platform 8.0.0
第 21 章 : Business Steward モジュール
6. 他の建物の住所を取得するには、地図上をクリックします。 [航空写真] ビューに切り替えると、建
物が検索しやすい場合があります。
Company Lookup の使用
企業名とその企業が所在する州がわかる場合は、企業名、住所、電話番号などの企業情報を確認する
ことができます。
1. Business Steward Portal で、企業情報を検索したいレコードをクリックします。
2. レコード テーブルの下の [検索ツール] タブをクリックします。
3. [ツール] フィールドで [Company Lookup] を選択します。
ユーザ ガイド
445
Business Steward Portal
4. レコードに FirmName、AddressLine1、City、StateProvince、および PostalCode というフィール
ドが含まれる場合、これらのフィールドの値が自動的に検索に使用されます。 これらのフィール
ドが存在しない場合は、[入力ソース] 列のセルをダブルクリックして、このデータを含むフィール
ドを選択します。
5. Country フィールドに 2 文字の ISO 国コードを入力します。 ISO コードの一覧は、各国の ISO
コードとモジュール サポート(1086ページ)を参照してください。
6. [検索] をクリックします。
検索ツールにより、次の情報が表示されます。
DUNS
446
D&B D-U-N-S Number は 9 桁の一意な識別シーケンスで、単一の企業の一意
な識別子となる一方、企業ファミリ構造を結びつけます。 D&B は、全世界で
6,200 万人以上の企業ファミリ メンバーに対して、親会社、子会社、本社、
および支店をリンクします。 世界で最も影響力ある標準化団体が使用してい
るため、D&B は 国連、米国 連邦政府、オーストラリア政府、欧州委員会な
ど、50 を越えるグローバルな企業団体および事業者団体に認識され、推奨さ
れ、必要とされています。
Spectrum™ Technology Platform 8.0.0
第 21 章 : Business Steward モジュール
FirmName
プライマリ企業名。 これは、トレードスタイル名や Doing Business As 名を
表したり、正式に登録された正確な企業名を反映するものではありません。
登録名は、可用性やその地域の申請要件に応じて公記録内に取り込まれます。
AddressLine1
企業の最初の住所行。
City
企業がある都市の名前。一般には現地語で表記。
StateProvince
企業がある州または省の名前。
PostalCode
企業の郵便番号。
CountryCode
2 文字の ISO 国コード。 ISO コードの一覧は、各国の ISO コードとモジュー
ル サポート(1086ページ)を参照してください。
CountryName
企業がある国の英語名。
Phone
企業の電話番号。 米国では、市外局番あり、句読文字なしの直通電話番号で
す。 その他の国では、ローカル データベースに入力されたとおりの番号が表
示されます。これには句読文字が含まれる場合があります。
TradeStyle
企業が宣伝や売買目的で使用するその他の名前。
SubjectDetails
事業所の組織構造を示します。 次のいずれかを選択します。
BranchDivision
事業所は本社に直属する支店または部門です。
ParentHeadquarters 事業所は親会社または本社です。 親会社とは、別の企
業の株式の 50 % 超を所有する企業です。 親会社は、
別の企業の子会社でもかまいません。 支店も有する場
合は、親会社であるだけでなく本社にもなります。 本
社とは、直属する支店または部門を持つ事業所で、そ
れらの支店または部門に対する支払責任を負います。
株式の 50 % 超を別の企業に所有されている場合、そ
の本社は子会社でもあります。 別の企業の株式の 50
% 超を所有している場合、その本社は親会社でもあり
ます。
SingleLocation
事業所は本社に直属していません。
ConfidenceCode 品質の近似一致をグループ化するのに使用される 2 桁のコード。多数の
MatchGrade が 1 つの ConfidenceCode に関連付けられます。
BestMatchFlag
マッチ グレードと信頼性コードに基づいて、入力に最も一致するレコードを
示します。
MatchGradeString データと比較して、要素がどれくらい似ているか、または異なっているかを
示す、6 文字または 11 文字。 各要素には、次のいずれかの値が付与されま
す。
• A: 返される要素は入力と同じです。
• B: 返される要素は入力に似ています。
ユーザ ガイド
447
Business Steward Portal
• F: 返される要素は入力と異なります。 F は入力データと参照データに違い
があることを表しますが、目で見て確認すると、F が割り当てられていて
も "良好な" マッチと判断される場合があることに注意してください。
• Z: 要素が入力に存在しませんでした。
マッチ グレード文字列内のそれぞれの位置は、次のように、レコード内の
フィールドを表します。
• 位置 1: 企業名
• 位置 2: ビルの番号
• 位置 3: 通り名
• 位置 4: 都市名
• 位置 5: 米国では州。 カナダでは州。 日本では県。それ以外の国では国。
• 位置 6: P.O. Box。
• 位置 7: 電話番号。
• 位置 8: 郵便番号。
1
• 位置 9: 企業密度。
1
• 位置 10: 一意性。同じ州 (米国)、州 (カナダ)、または国 (その他の国) にあ
1
る同じ企業名の数を示します。
1
• 位置 11: 標準産業分類 (SIC) に従い、企業が属する産業。
MDPProfile
検索した企業が既知の企業にどれくらい一致するかを示すコード。 詳細につ
いては、MDP プロファイル(449ページ)を参照してください。
Status
クエリの結果を表す数字のコード。 次のいずれかを選択します。
• NULL: Status フィールドが空の場合、呼び出しは成功しました。
• 0: エラー。 呼び出しは失敗しました。
• 7: 候補なし - マッチが見つかりませんでした。
• 8: パートナー ID が無効です。
• 9: 顧客 ID が無効または欠落しています。
• 10: 契約の有効期限が切れています。
• 11: トランザクションの最大数を超えています。
• 12: 試用版の有効期限が切れています。
• 13: 国コードが無効です。
• 14: アカウント ID が欠落しています。
• 15: データに制約があります。
StatusDescription 検索結果の詳細な説明。
1
448
このフィールドは、カナダ、米国、英国、ベネルクス諸国、スペイン、ポルトガル、アンドラ、イタ
リア、サンマリノでのみ有効です。
Spectrum™ Technology Platform 8.0.0
第 21 章 : Business Steward モジュール
MDP プロファイル
MDP プロファイルは 28 文字のコードです。 前半の 14 個の数字は、検索した企業が既知の企業にど
の程度一致するかを示します。 後半の 14 個の数字は、現在は意味がありませんが、将来のリリース
で使用される可能性があります。
表 76 : MDP プロファイル - 1〜2 桁 (名前)
コード
説明
00-xx-xx-xx-xx-xx-xx
プライマリ企業名に一致しています。
01-xx-xx-xx-xx-xx-xx
登録されている企業名に一致しています。
02-xx-xx-xx-xx-xx-xx
トレードスタイル、セカンダリ名、または企業が使用するその他の名
前に一致しています。 トレードスタイルは、正式名称以外に企業が知
られている名前です。 例えば、D&B は Dun & Bradstreet のトレード
スタイルです。
03-xx-xx-xx-xx-xx-xx
CEO 名または他のプライマリ連絡先に一致しています。
04-xx-xx-xx-xx-xx-xx
その他のエグゼクティブ名に一致しています。
05-xx-xx-xx-xx-xx-xx
以前の企業名に一致しています。
06-xx-xx-xx-xx-xx-xx
以前のトレードスタイル名に一致しています。これは、企業が正式名
称以外に使用するその他の名前です。 例えば、D&B は Dun &
Bradstreet のトレードスタイルです。
07-xx-xx-xx-xx-xx-xx
以前の CEO 名または他のプライマリ連絡先に一致しています。
08-xx-xx-xx-xx-xx-xx
以前のエグゼクティブ名に一致しています。
09-xx-xx-xx-xx-xx-xx
企業の省略名または略称に一致しています。
10-xx-xx-xx-xx-xx-xx
登録されている頭字語に一致しています。これは、他の単語の音節の
先頭の文字で構成される単語です。例えば、NATO は North Atlantic
Treaty Organization の頭字語です。 通常、頭字語は、BBC、CIA、FBI
のように個々の文字として発音される頭文字語とは異なり、それ自体
で単語として発音されます。 頭文字語はトレードスタイルです。
ユーザ ガイド
449
Business Steward Portal
450
コード
説明
11-xx-xx-xx-xx-xx-xx
ブランド名に一致しています。これは、対象が所有する特定のブラン
ドまたは製品の名前です。 例としては、 Coke、Snickers、Big Mac
などがあります。
12-xx-xx-xx-xx-xx-xx
検索名に一致しています。これは、企業の検索を容易にするため、作
業者が手動で入力するものです。 以前の名前であることもあれば、頭
字語、名前の一部、または名前の省略形や拡張名のこともあります。
13-xx-xx-xx-xx-xx-xx
商標名に一致しています。これは、(完全登録商標として) 特に正式に
登録され、法によって保護される名前、単語、またはシンボルなど
で、企業、個人、または製品を表すために使用されます。 商標には、
そのマークが登録済みであることを表す記号 R がしばしば含まれま
す。 商標は、Coke や Ford のロゴや、ハイフンで結ばれた D-U-N-S
Number の商標のように、正確なフォーマットを含む傾向があります。
14-xx-xx-xx-xx-xx-xx
マーケティング名に一致しています。これは、マーケティング目的で
企業に割りあてられた名前です。 通常、企業はこの名前を正式には使
用していません。
15-xx-xx-xx-xx-xx-xx
"通称" 名に一致しています。これは、事業体が知られている他の名前
です。名前のカテゴリが既存のタイプに含まれないため、または正確
な名前タイプを特定できないために、他の名前タイプのいずれかに分
類できません。
16-xx-xx-xx-xx-xx-xx
証券取引所のティッカー名に一致しています。
17-xx-xx-xx-xx-xx-xx
本社名に一致しています。
18-xx-xx-xx-xx-xx-xx
登録されているトレードスタイル名に一致しています。これは、企業
が使用していて、正式名称以外に知られている名前です。 例えば、
D&B は Dun & Bradstreet のトレードスタイルです。 一般的に知られ
ているが、企業自身が使用または宣伝していない名前は含まれませ
ん。 このコードは、登録されているトレードスタイルに対してのみ使
用されます。
19-xx-xx-xx-xx-xx-xx
代替言語名に一致しています。これは、事業体のプライマリ言語以外
の言語での事業体名です。 企業のプライマリ言語は現地国によって決
定され、複数の言語を持つ国で使用されます。
Spectrum™ Technology Platform 8.0.0
第 21 章 : Business Steward モジュール
コード
説明
20-xx-xx-xx-xx-xx-xx
問い合わせのナショナル ID 番号が候補のナショナル ID 番号に完全に
一致しました。 ナショナル ID 番号は、一部の国で企業の登録と徴税
に使用される、企業識別番号です。 例としては、英国の CRO 番号や
フランスの Siren 番号があります。
21-xx-xx-xx-xx-xx-xx
問い合わせのナショナル ID 番号が候補のナショナル ID 番号に部分的
に一致しました。 ナショナル ID 番号は、一部の国で企業の登録と徴
税に使用される、企業識別番号です。 例としては、英国の CRO 番号
やフランスの Siren 番号があります。
30-xx-xx-xx-xx-xx-xx
プライマリ企業名に一致していますが、候補の法的指定子 (企業タイ
プ) は問い合わせの企業タイプに一致しません。
31-xx-xx-xx-xx-xx-xx
登録されている企業名に一致していますが、候補の法的指定子 (企業
タイプ) は問い合わせの企業タイプに一致しません。
32-xx-xx-xx-xx-xx-xx
現在のトレードスタイル、企業が使用するセカンダリ名またはその他
の名前に一致していますが、候補の法的指定子 (企業タイプ) は問い合
わせの企業タイプに一致しません。 トレードスタイルは、企業が使用
していて、正式名称以外に知られている名前です。 例えば、D&B は
Dun & Bradstreet のトレードスタイルです。
33-xx-xx-xx-xx-xx-xx
以前の企業名に一致していますが、候補の法的指定子 (企業タイプ) は
問い合わせの企業タイプに一致しません。
34-xx-xx-xx-xx-xx-xx
以前のトレードスタイル名に一致していますが、候補の法的指示子 (企
業タイプ) は問い合わせの企業タイプに一致しません。 トレードスタ
イルは、企業が使用していて、正式名称以外に知られている名前で
す。 例えば、D&B は Dun & Bradstreet のトレードスタイルです。
35-xx-xx-xx-xx-xx-xx
企業の省略名または略称に一致していますが、候補の法的指定子 (企
業タイプ) は問い合わせの企業タイプに一致しません。
36-xx-xx-xx-xx-xx-xx
登録されている頭字語に一致していますが、候補の法的指定子 (企業
タイプ) は問い合わせの企業タイプに一致しません。 頭字語は、他の
単語の音節の先頭の文字で構成される単語です。例えば、NATO は
North Atlantic Treaty Organization の頭字語です。 通常、頭字語は、
BBC、CIA、FBI のように個々の文字として発音される頭文字語とは
ユーザ ガイド
451
Business Steward Portal
コード
説明
異なり、それ自体で単語として発音されます。 頭文字語はトレードス
タイルです。
452
37-xx-xx-xx-xx-xx-xx
ブランド名に一致していますが、候補の法的指定子 (企業タイプ) は問
い合わせの企業タイプに一致しません。 ブランド名は、対象が所有す
る特定のブランドまたは製品の名前です。 例としては、 Coke、
Snickers、Big Mac などがあります。
38-xx-xx-xx-xx-xx-xx
検索名に一致していますが、候補の法的指定子 (企業タイプ) は問い合
わせの企業タイプに一致しません。 検索名は、企業の検索を容易にす
るため、作業者が手動で入力するものです。 以前の名前であることも
あれば、頭字語、名前の一部、または名前の省略形や拡張名のことも
あります。
39-xx-xx-xx-xx-xx-xx
商標に一致していますが、候補の法的指定子 (企業タイプ) は問い合わ
せの企業タイプに一致しません。 商標名は、(完全登録商標として) 特
に正式に登録され、法によって保護される名前、単語、またはシンボ
ルなどで、企業、個人、または製品を表すために使用されます。 商標
には、そのマークが登録済みであることを表す記号 R がしばしば含ま
れます。 商標は、Coke や Ford のロゴや、ハイフンで結ばれた D-UN-S Number の商標のように、正確なフォーマットを含む傾向があり
ます。
40-xx-xx-xx-xx-xx-xx
マーケティング名に一致していますが、候補の法的指定子 (企業タイ
プ) は問い合わせの企業タイプに一致しません。 マーケティング名は、
マーケティング目的で企業に割りあてられた名前です。 通常、企業は
この名前を正式には使用していません。
41-xx-xx-xx-xx-xx-xx
"通称" 名に一致していますが、候補の法的指定子 (企業タイプ) は問い
合わせの企業タイプに一致しません。 "通称" 名は、対象が知られてい
るの他の名前で、名前のカテゴリが既存のタイプに含まれないため、
または正確な名前タイプを特定できないために、他の名前タイプのい
ずれかに分類できません。
42-xx-xx-xx-xx-xx-xx
本社名に一致していますが、候補の法的指定子 (企業タイプ) は問い合
わせの企業タイプに一致しません。
43-xx-xx-xx-xx-xx-xx
登録されているトレードスタイル名に一致していますが、候補の法的
指定子 (企業タイプ) は問い合わせの企業タイプに一致しません。 登
録されているトレードスタイル名は、企業が使用していて、正式名称
Spectrum™ Technology Platform 8.0.0
第 21 章 : Business Steward モジュール
コード
説明
以外に知られている名前です。 例えば、D&B は Dun & Bradstreet の
トレードスタイルです。 一般的に知られているが、企業自身が使用ま
たは宣伝していない名前は含まれません。 このコードは、登録されて
いるトレードスタイルに対してのみ使用されます。
44-xx-xx-xx-xx-xx-xx
代替言語名に一致していますが、候補の法的指定子 (企業タイプ) は問
い合わせの企業タイプに一致しません。 代替言語名は、事業体のプラ
イマリ言語以外の言語での事業体の名前ですが、候補の法的指定子 (企
業タイプ) は問い合わせの企業タイプに一致しません。 企業のプライ
マリ言語は現地国によって決定され、複数の言語を持つ国で使用され
ます。
97-xx-xx-xx-xx-xx-xx
照合する名前のタイプが指定されていません。 これは、企業名コン
ポーネントに対してのみ適用できます。
表 77 : MDP プロファイル - 3〜10 桁 (実際の住所)
コード
説明
xx-00-00-00-00-xx-xx
現住所に一致しています。
xx-01-01-01-01-xx-xx
登録されている住所に一致しています。これは、登録済みの住所のみ
を持つヨーロッパの公共登録ソースに基づいています。
xx-02-02-02-02-xx-xx
以前の住所に一致しています。
xx-03-03-03-03-xx-xx
その他の住所に一致しています。
表 78 : MDP プロファイル - 11〜12 桁 (郵便番号)
コード
説明
xx-xx-xx-xx-xx-00-xx
現在の郵便番号 (PO Box) に一致しています。
xx-xx-xx-xx-xx-02-xx
以前の郵便番号 (PO Box) に一致しています。
xx-xx-xx-xx-xx-03-xx
その他の郵便番号 (PO Box) に一致しています。
ユーザ ガイド
453
Business Steward Portal
表 79 : MDP プロファイル - 13〜14 桁 (電話)
コード
説明
xx-xx-xx-xx-xx-xx-00
現在の電話番号に一致しています。
xx-xx-xx-xx-xx-xx-02
以前の電話番号に一致しています。
表 80 : MDP プロファイル - その他のコード
98-98-98-98-98-98-98
マッチしたレコードに特定の要素が欠落している場合に指定します。
すべてのコンポーネントに適用可能です。
99-99-99-99-99-99-99
問い合わせレコードに特定の要素が欠落している場合に指定します。
すべてのコンポーネントに適用可能です。
-96-96-96-96-96-
問い合わせレコードの住所要素が検証または正規化できなかった場合
に指定します。 次の問い合わせコンポーネントに適用可能です。 通
り番号、通り名、PO Box、都市、州、および ZIP Code
Experian Truvue の使用
個人の名前と住所がわかっている場合は、Experian Truvue 検索ツールを使用して、その個人の直近 3
つの住所を検索できます。
1. Business Steward Portal で、検索したい個人のレコードをクリックします。
2. レコード テーブルの下の [検索ツール] タブをクリックします。
454
Spectrum™ Technology Platform 8.0.0
第 21 章 : Business Steward モジュール
3. [ツール] フィールドで、[Experian Truvue] を選択します。
4. レコードに FirstName、LastName、MiddleName、AddressLine、City、StateProvince、PostalCode、
PhoneNumber、および DateOfBirth というフィールドがある場合、これらのフィールドの値が自
動的に検索に使用されます。 これらのフィールドが存在しない場合は、[入力ソース] 列のセルをダ
ブルクリックして、この情報を含むデータ内のフィールドを選択します。
注: 検索を実行するには、名前、住所、都市および州、または郵便番号の少なくとも 1 つが必要
です。
電話番号は、7 桁または 10 桁で構成され、ハイフン、括弧、ピリオドを含めることができます。
ユーザ ガイド
455
Business Steward Portal
生年月日のフォーマットは MMDDYYYY でなければなりません。 例えば、07041976 は 1976/07/04
を意味します。
5. [検索] をクリックします。
検索ツールにより、次の情報が表示されます。
456
名前フィールド
説明
FirstName
個人の名。 複数の名が表示される場合、その個人は代替名を使用しています。
例えば、名が Matthew の場合、Matt という名の派生形がありえます。
MiddleName
個人のミドル ネームまたは頭文字。 複数のミドル ネームがある場合、ミドル
ネームの頭文字と完全なミドル ネームなど、ミドル ネームの派生形がありま
す。
LastName
個人の姓。 複数の姓がある場合、その個人には旧姓など姓の派生形がありま
す。
住所フィールド
説明
IsCurrent
住所がその個人の現住所であるか、以前の住所であるかを示します。 次
のいずれかを選択します。
Y
はい、この住所は現住所です。
N
いいえ、この住所は現住所ではありません。 以前の住所です。
HouseNumber
家またはビルの番号。 家番号の例は次のようになります。 123 E Main St.
LeadingDirectional
通り名の前に付く通りの方向指示。 例えば、N State St. などです。
StreetName
方向指示および接尾語を除いた通りの名前。 例えば、住所が N State St.
にある場合、通り名は State です。
StreetSuffix
通りの種類。 例えば、Ave.、St.、Blvd. などです。
TrailingDirectional
通りの後ろに表示される方向指示。 例えば、First St. NW などです。
ApartmentLabel
アパートの建物や、Apt. または Ste. といったユニットの種類など、複数
の住所を含む建物用。
ApartmentNumber
アパートの建物やユニット番号など、複数の住所を含む建物用。
City
住所がある市町村の名前。
StateProvince
住所がある州または省の郵便略号。
PostalCode
米国の住所の場合は ZIP Code など、その住所の郵便番号。
Spectrum™ Technology Platform 8.0.0
第 21 章 : Business Steward モジュール
その他のフィールド
説明
AuthenticationCode
このコードは、Truvue ID を持つ消費者が 1 つ以上の信頼できる
Experian データ ソースによって報告されているかどうかを表しま
す。認証コードには次のものがあります。
NameVerification
Y
認証済み
N
未認証
入力された名前が Truvue のデータにどれくらいマッチしたかを示
します。 次のコードがあります。
N1
入力された名前は、Truvue 最良名前に完全に一致しま
す。
N2
入力された名前は、Truvue 最良名前に近似一致します。
N4
入力された名前は、Truvue 名前の派生形に完全に一致
します。
N7
入力された名前は、Truvue 最良名前または名前の派生
形に一致しません。
NameVerificationDescription
NameVerification コードの説明。 前述の NameVerification を参照
してください。
DateOfBirth
検索に MMDDYYYY のフォーマットで入力された生年月日。 例え
ば、07041976 は 1976/07/04 を意味します。
DOBVerification
検索に入力された生年月日が Truvue 生年月日にどれくらいマッチ
したかを示します。 次のいずれかを選択します。
DOBVerificationDescription
ユーザ ガイド
B1
入力された生年月日は、Truvue 生年月日に完全に一致
します。
B2
入力された生年月日は、Truvue 生年月日に近似一致し
ます。
B7
入力された生年月日は、Truvue 生年月日に一致しませ
ん。
B8
生年月日が存在しません。
DOBVerification フィールドのコードの説明。
457
Business Steward Portal
その他のフィールド
説明
AddressVerification
入力された住所が Truvue のデータにどれくらいマッチしたかを示
します。 次のコードがあります。
C1
入力された現住所は、Truvue 最良住所に完全に一致し
ます。
C2
入力された現住所は、Truvue 最良住所に近似一致しま
す。
C4
入力された現住所は、Truvue 履歴住所に完全に一致し
ます。
C7
入力された現住所は、Truvue の最良または履歴住所に
一致しません。
AddressVerificationDescription AddressVerification コードの説明。 前述の AddressVerification の
説明を参照してください。
458
PhoneNumber
個人の現在の電話番号。
PhoneVerification
入力された電話番号が Truvue のデータにどれくらいマッチしたか
を示します。 次のコードがあります。
T1
入力された電話番号は、Truvue 最良電話番号に完全に一
致します。
T2
入力された電話番号は、Truvue 最良電話番号に近似一致
します。
T3
入力された電話番号は、Truvue 最良電話番号の派生形に
一致します。
T4
入力された電話番号は、Truvue 履歴電話番号に完全に一
致します。
T5
入力された電話番号は、Truvue 履歴電話番号に近似一致
します。
T6
入力された電話番号は、Truvue 履歴電話番号の派生形に
一致します。
T7
入力された電話番号は、Truvue 最良または履歴電話番号
に一致しません。
T8
電話番号は Truvue ID に存在しません。
TE
入力された電話番号は無効であり、確認できません。
Spectrum™ Technology Platform 8.0.0
第 21 章 : Business Steward モジュール
その他のフィールド
説明
PhoneVerificationDescription PhoneVerification フィールドのコードの説明。 前述の
PhoneVerification を参照してください。
ARFVersion
検索ツールが使用している Experian Automated Response Format
(ARF) のバージョン。 例えば、"08" は ARF バージョン 8 を意味し
ます。
Preamble
入力住所の大まかな位置を表すコード。
ReportDate
Truvue 応答が送信された日付。フォーマットは MMDDYYYY。 例
えば、07102011 は 2011 年 7 月 10 日を表します。 日付は、米国
中部時間におけるその時点の日付になります。
ReportTime
Truvue 応答が送信された時間。フォーマットは HHMMSS。 例え
ば、022345 は 2:23:54 AM、163010 は 4:30:10 PM を表します。
時間は、米国中部時間におけるその時点の時間になります。
ErrorCode
検索に問題があった場合のエラーを表すコード。
ErrorDescription
検索に問題があった場合のエラーの簡単な説明。
Interactive Address Search (対話型住所検索) の使用
対話型住所検索ツールを使用することにより、住所の一部を入力して住所を検索することができます。
都市や通り名といった住所の一部を入力すると、検索ツールがその候補となり得る住所を検索します。
以下に、郵便番号のない住所の例を示します。 対話型住所検索ツールは、類似の住所を検索します。
1. Business Steward Portal で、検索したい個人のレコードをクリックします。
2. レコード テーブルの下の [検索ツール] タブをクリックします。
ユーザ ガイド
459
Business Steward Portal
3. [ツール] フィールドで、[Interactive Address Search (対話型住所検索)] を選択します。
4. レコードに AddressLine1、City、StateProvince、PostalCode、および Country というフィールド
が含まれる場合、これらのフィールドの値が自動的に検索に使用されます。 これらのフィールド
が存在しない場合は、[入力ソース] 列のセルをダブルクリックして、この情報を含むデータ内の
フィールドを選択します。
注: 検索を実行するには、国を入力する必要があります。
460
Spectrum™ Technology Platform 8.0.0
第 21 章 : Business Steward モジュール
5. [検索] をクリックします。
検索ツールにより、次の情報が表示されます。
AddressLine1
住所の第 1 行。通常は、ビルの番号と通り名が含まれます。
City
正式な都市名。
SateProvince
住所で使われる州または省の略称。
PostalCode
住所の郵便番号。 米国では、ZIP Code になります。
Country
国名。
ユーザ ガイド
461
Business Steward Portal
Confidence
返された住所に割り当てられた確信レベル。 範囲は 0 〜 100 です。0 は失
敗を表し、100 はマッチ結果が正しいことに対する確信レベルが非常に高
いことを表します。
Status
マッチが成功したか失敗したかを表します。 次のいずれかが入ります。
StatusDescription
NULL
成功
F
失敗
発生したエラーに関する説明。
電話番号の検索
Business Steward Portal の Phone Lookup ツールを使用して、住所に対する電話番号を検索できます。
Phone Lookup ツールは、個人住所および企業住所に対して適用できます。
1. Business Steward Portal で、電話番号を検索したいレコードをクリックします。
2. レコード テーブルの下の [検索ツール] タブをクリックします。
3. [ツール] フィールドで、[Phone Lookup] を選択します。
4. レコードに AddressLine1、City、StateProvince、および PostalCode というフィールドが含まれる
場合、これらのフィールドの値が自動的に検索に使用されます。 これらのフィールドが存在しな
い場合は、[入力ソース] 列のセルをダブルクリックして、このデータを含むフィールドを選択しま
す。
462
Spectrum™ Technology Platform 8.0.0
第 21 章 : Business Steward モジュール
5. [検索] をクリックします。
検索ツールにより、次の情報が表示されます。
PhoneNumber その住所の電話番号 (句読文字なし)。 例えば、3019180955 などです。
PhoneType
その電話番号に関連付けられている電話サービスのタイプを示す数字のコード。
電話タイプには次のものがあります。
• 0 POTS (Plain Old Telephone Service)
• 1 モバイル (Improved Mobile Telephone Service - IMTS)
• 2 完全専用ページング
• 3 パケット スイッチング
• 4 完全専用セルラー
• 5 テスト コード
• 6 船舶
• 7 航空機
• 8 800 サービス
• 9 900 サービス
ユーザ ガイド
463
Business Steward Portal
• 10 被呼者支払
• 11 情報プロバイダのサービス
• 13 電話番号案内
• 14 特殊なテレホン カード
• 15 正式な電話会社のサービス
• 16 発信のみ
• 17 課金のみ
• 18 800 データベース
• 30 ブロードバンド
• 50 3 つ以上で共有 (POTS、セルラー、ページング、モバイル)
• 51 POTS とモバイルで共有
• 52 POTS とページング共有
• 54 POTS とセルラーで共有
• 55 特殊課金オプション - セルラー
• 56 特殊課金オプション - ページング
• 57 特殊課金オプション - モバイル
• 58 2 つ以上で共有する特殊課金オプション - (セルラー、ページング、モバイル)
• 60 サービス プロバイダが選択的に要求する地域電話会社の LATA 内特殊課金
オプション - セルラー
• 61 サービス プロバイダが選択的に要求する地域電話会社の LATA 内特殊課金
オプション - ページング
• 62 サービス プロバイダが選択的に要求する地域電話会社の LATA 内特殊課金
オプション - モバイル
• 63 60、61、62 の組み合わせ
• 64 個人通信サービス
• 65 その他のサービス (500 以外、PCS など)
• 66 POTS とその他のサービスで共有
• 67 特殊課金オプション - PCS/その他のサービス
• 68 サービス プロバイダが選択的に要求する地域電話会社の LATA 内特殊課金
オプション - PCS/その他
• 88 トール ステーション - リング ダウン
• 99 不明のタイプ
PhoneStatus その電話番号に提供されているサービスのステータスを示します。 次のいずれか
を選択します。
• 接続済み
• リストから削除済み
• 公開済み
• 不明
464
Spectrum™ Technology Platform 8.0.0
第 21 章 : Business Steward モジュール
電話番号から住所を検索
Business Steward Portal の Reverse Phone Lookup ツールを使用して、指定された電話番号から住所
を検索できます。 このツールを使用すると、個人および企業の住所を検索することができます。
1. Business Steward Portal で、調査したいレコードをクリックします。
2. レコード テーブルの下の [検索ツール] タブをクリックします。
3. [ツール] フィールドで、[Reverse Phone Lookup] を選択します。
4. [入力ソース] 列でフィールドが選択されていない場合は、電話番号が格納されているフィールドを
選択します。
5. [検索] をクリックします。
ユーザ ガイド
465
Data Hub モジュール
このセクションの構成
• Data Hub モジュールとは . . . . . . . . . . . . . . . . . . . . . . . . .468
• Write to Hub . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .470
• Read From Hub . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .473
• Query Hub . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .478
• Relationship Analysis Client . . . . . . . . . . . . . . . . . . . . . .483
22
Data Hub モジュールとは
Data Hub モジュールとは
Data Hub モジュールは、処理環境内のさまざまなエンティティ間の関係を視覚化して、その相互依存
性と相互に及ぼす影響を理解できるようにするものです。
Data Hub の概念
Data Hub モジュールは、個人、集団、その他あらゆる種類のエンティティの間の関係を特定し、それ
を数量的に評価します。 個人、集団、組織の間の隠れた明白でない潜在的な結び付きを特定できま
す。 さらに、連結性、距離、中心性、感化状況、重要性が次々に変化していくパターンを特定するこ
ともできます。 この情報を用いて、顧客による影響の感化性やインパクトを予測し、顧客をリーダー
(leader)、フォロワー (follower)、インフルエンサー (influencer)、レイト アダプター (late adopter) な
どに分類できます。 Write to Hub ステージにデータを入力して、エンティティの間の関係を表現する
モデルを作成します。 Relationship Analysis Client によって、このモデルのマニフェステーション
(manifestation)、つまり深層の潜在的な構造を見ることができます。 これによって次のようなことが
可能になります。
• 顧客のニーズを先に見込んで提供物をカスタマイズすることにより、個人志向をより意識した顧客
サービスを提供する
• 顧客による影響の感化性やインパクトを予測する
• 顧客をリーダー (leader)、フォロワー (follower)、インフルエンサー (influencer)、レイト アダプター
(late adopter) に分類する
• 個人、集団、組織の間の隠れた明白でない潜在的な結び付きを特定する
• 連結性、距離、中心性、感化状況、重要性が次々に変化していくパターンを特定する
Data Hub の応用
Data Hub モジュールはさまざまな分野に応用できます。 次のような分野があります。
• ソーシャル ネットワーキング
• 不正検出
• テロ対策
• マスター データ管理 (MDM)
• 文書管理
• 併売チャンスの特定
• 犯罪分析
Data Hub データベース
Data Hub モジュールはグラフ データベースを使用します。これらは関係データベースと多くの点で
異なります。
468
Spectrum™ Technology Platform 8.0.0
第 22 章 : Data Hub モジュール
• テーブル/階層性 vs. 無構造
• リンクを即座に辿れる
• モデルによって関係が自動的に特定される vs. 関係を事前に把握しておくことが必要
Data Hub モデルのバックアップ
After you have created a model, you can back it up for use if the original model becomes corrupt or is somehow
deleted from your server. After first enabling the use of model backups, you can use the JMX Console to
configure the backup.
バックアップの使用の有効化
バックアップを実行するには、管理者がモデルごとにユニークなポートを割り当てて、モデル バック
アップの使用を有効化する必要があります。 これらのポートは、自動または手動で選択できます。
自動割り当て
1. <Spectrum™ Technology Platformインストール パス
>/server/modules/hub/db/neo4j.properties ファイルで開始ベース ポート番号を指定し
ます。 ポートはこのベース ポート + 1 から始まって連続して増え、モデルが作成またはアクセス
されるときに割り当てられます。
2. online.backup.base.port プロパティを非コメント化して設定します。
手動割り当て
1. neo4j.properties ファイルを <Spectrum™ Technology Platformインストール パス
>/server/modules/hub/db/neo4j.properties から <Spectrum™ Technology Platform
インストール パス>/server/modules/hub/db/model.<モデル名>/neo4j.properties へ
コピーします。
2. online.backup.port プロパティを非コメント化して、このモデルのオンライン バックアップに使
用するポート番号に変更することによって、このモデル固有のプロパティ ファイルを編集します。
バックアップの実行
モデル バックアップの使用を有効化したら、JMX コンソールを使用して特定のモデルのバックアップ
を実行できます。
1. Web ブラウザを開いて、http://<サーバー>:<ポート>/jmx-console に移動します。
WHERE:
<サーバー> は Spectrum™ Technology Platform サーバーの IP アドレスまたはホスト名です。
<ポート> は Spectrum™ Technology Platform が使用する HTTP ポートです。 デフォルト値は 8080
です。
2. 管理者権限を持つ Spectrum™ Technology Platform アカウントのユーザ名とパスワードを入力しま
す。 デフォルトでは、ユーザ名とパスワードのどちらも "admin" です。
3. dcg.manager:service=HubEngine のリンクをクリックします。
ユーザ ガイド
469
Write to Hub
4. backupGraph 操作 の name パラメータをバックアップするモデルの名前に設定します。
5. true または false をクリックして、完全バックアップを実行するかどうかを指定します。
注: 最初は完全バックアップを作成する必要があります。その後は、増分バックアップを作成で
きます。
6. backupPath パラメータにパスとモデル名を入力します。 完全バックアップを作成するには、こ
のフォルダは空でなければなりません。 増分バックアップを作成するには、このフォルダに最初
は完全バックアップが含まれていなければなりません。
注: モデル名は "model." で始まる必要があります。 例えば、バックアップするモデルが "customers"
という場合は、このフィールドに "C:\ModelBackups\model.customers" と入力します。
7. [Invoke] をクリックします。
Data Hub コンポーネント
Data Hub モジュールは、4 つのコンポーネントで構成されています。 これらのステージは非常に似て
いて、どちらも Gremlin を使用しますが、デフォルトでは、Gremlin はクエリ ビルダを使用するユー
ザ向けに生成されています。 主な違いは、Read はソース ステージであることです。 しかし、Query
は中間ステージで、入力データ行を使用してクエリに影響を与えることができます。 この点に言及す
るのは、ここでの説明はステージごとに異なりますが、実際には他のステージにも該当し、違いに目
を向けることがないためです。
• Write to Hub — このシンク ステージでは、データを相互にリンクして、複雑な関係ネットワークを
作成できます。 詳細については、Write to Hub ステージを参照してください。
• Read From Hub — このソース ステージでは、Gremlin モデル追跡言語によるハブへのクエリを使
用して、エンティティや関係をデータフローの出力内のフィールドに返すことができます。 詳細に
ついては、Read From Hub ステージを参照してください。
• Query Hub — この中間ステージでも、Gremlin を使用して既存のハブ データベースへのクエリを実
行し、データをデータフローの出力として返すことができますが、このステージでは、入力データ
行を使用してクエリに影響を与えることもできます。 詳細については、Query Hub ステージを参照
してください。
• Relationship Analysis Client — モデルまたはサブモデルを表示して、他の方法では到底見つから
ないような関係やトレンドを特定できます。 詳細については、Relationship Analysis Client(483ペー
ジ)を参照してください。
Write to Hub
Write to Hub ステージは、データを相互にリンクして、モデルに表示可能な複雑な関係ネットワーク
を作成するために使われます。 これで作成されたモデルに対して、クエリ (情報照会) を実行する、ま
たはそれを視覚化して、他の方法では到底見つからないような関係やトレンドを特定できます。
470
Spectrum™ Technology Platform 8.0.0
第 22 章 : Data Hub モジュール
[エンティティ] タブ
[エンティティ] タブでは、エンティティの作成と更新の方法を設定できます。 これらのエンティティ
でオブジェクトやイベントを表現し、それらを後に 1 つ以上の関係で相互にリンクして関係を作成で
きます。 モデルのためのエンティティを作成するには、次の情報を完成させる必要があります。
1. モデルの名前を [モデル] フィールドに入力します。
2. [追加] をクリックして、新しいエンティティを作成します。 [エンティティを追加] ダイアログ ボッ
クスが表示されます。
3. エンティティ ID の生成に使用するフィールド名を [入力フィールド] フィールドで選択します。
4. エンティティに付ける名前を自動的に生成されるもの以外にする場合は、[タイプ] フィールドの内
容を好きな名前に変更します。
5. [プロパティ] タブで、エンティティにデータを関連付けるために使うフィールドを選択します。具
体的には、当該フィールドの [含める] チェック ボックスをクリックします。 Spectrum は、基本
的なデータ タイプと複合的なデータ タイプの両方をサポートしています。入力ファイルの階層構
造の深部にあるフィールドをエンティティとして使用できます。 階層データを使用している場合
は、 [フィルタ] コントロールも表示され、これでフィールドのパスに基づいて [プロパティ] リス
ト上のデータをフィルタリングできます。 同様に、基本フィールド以外を非表示にできるコント
ロールも表示されます。
6. 生成されたフィールド名以外の名前を使いたいときは、フィールドの名前を [名前] 列で変更しま
す。
7. [更新] タブをクリックします。 作成されたエンティティは、その後、Write to Graph ステージに
ID の同じデータが入力されると更新されます。 Write to Graph による更新の方法を選択します。
• [プロパティを常に更新] — プロパティを最新の情報で常に更新します。 これには null または空
文字列による更新も含まれます。
• [入力がすべて null でなければプロパティを更新] — 選択したプロパティに対応する入力フィー
ルドがすべて null でない限り、常にプロパティを更新します。
• [プロパティを空データで上書きしない] — 入力が null または空文字列でない限り、プロパティ
を常に更新します。
• [空でないプロパティを上書きしない] — 空でないデータが設定されたプロパティを更新しませ
ん。
8. ステップ 4 〜 7 を繰り返して他のエンティティを追加します。 エンティティの追加が完了したら、
[閉じる] をクリックします。
[関連性] タブ
[関連性] タブでは、ソースとターゲットのエンティティの間に関係を作成する方法を設定できます。
これらの関係は 2 つのエンティティの間の関係 (例えば、「John は Mary を知っている」) を表しま
す。 モデルのために関係を作成するには、次の情報を完成させる必要があります。
1. [追加] をクリックします。
ユーザ ガイド
471
Write to Hub
2. 関係のソースとなるエンティティを [ソース] フィールドで選択します。
3. 関係に設定する適切なラベル タイプ (文字列またはフィールド) を クリックします。 文字列の場合
は、下にあるテキスト ボックスに文字列を入力します。 フィールドの場合は、ドロップダウン
ボックスで、この関係のラベルの生成に使うフィールドを選択します。
4. その後、ソースとターゲットのエンティティの間に複数の関係を作成できるようにする場合は、
[ボックス上に複数の関係を許可] をクリックし、関係のベースとなるフィールドを [Id] フィールド
で選択します。
5. 関係のターゲットとなるエンティティを [ターゲット] フィールドで選択します。
6. [プロパティ] タブで、関係にデータを関連付けるために使うフィールドを選択します。具体的に
は、当該フィールドの [含める] チェック ボックスをクリックします。
7. [条件] タブで、ソースとターゲットのエンティティの間に関係を作成するタイミングをコントロー
ルする条件を指定します。 [追加] をクリックして、新しい条件を追加します。 [条件を追加] ダイ
アログ ボックスが表示されます。
8. 最初の条件を作成している場合、[論理演算子] フィールドはグレー表示されます。 以降の条件を
作成している場合は、この条件を前の条件と併用するか、前の条件の代わりに使用するかを指定し
ます。
9. 条件のベースとなる要素を [データ ソース] フィールドで選択します。
10. 条件のベースとなるフィールドを [フィールド名] フィールドで選択します。
11. 条件の演算子を [演算子] フィールドで選択します。
12. 条件の値を [値] フィールドに入力し、[追加] をクリックします。
13. ステップ 7 〜 12 を繰り返して他の条件を追加します。 条件の追加が完了したら、[閉じる] をク
リックします。
14. [更新] タブをクリックします。
15. プロパティの更新と上書きに関する適切なアクションを選択します。 作成された関係は、その後、
Write to Graph ステージにソースおよびターゲットの ID がそれと同じデータが入力されると更新
されます。 Write to Graph による更新の方法を選択します。
• [プロパティを常に更新] — プロパティを最新の情報で常に更新します。 これには null または空
文字列による更新も含まれます。
• [入力がすべて null でなければプロパティを更新] — 選択したプロパティに対応する入力フィー
ルドがすべて null でない限り、常にプロパティを更新します。
• [プロパティを空データで上書きしない] — 入力が null または空文字列でない限り、プロパティ
を常に更新します。
• [空でないプロパティを上書きしない] — 空でないデータが設定されたプロパティを更新しませ
ん。
16. [追加] をクリックします。
17. ステップ 1 〜 16 を繰り返して他の関係を追加します。 関係の追加が完了したら、[閉じる] をク
リックします。
472
Spectrum™ Technology Platform 8.0.0
第 22 章 : Data Hub モジュール
[オプション] タブ
[オプション] タブでは、オプションの処理をコントロールできます。
1. モデルを初めてロードする場合は、[最初にロード] をクリックします。 モデルはロックされ、他
の Write to Hub ステージによって書き込むことができなくなります。 このモードがオンの場合、
[エンティティを追加] ダイアログ ボックスの [更新] タブで使用できる唯一のオプションは、[空で
はないプロパティを上書きしない] です。 したがって、データフローに複数の入力ファイルがある
場合は、すべてがプロパティを作成できますが、既存のプロパティを新しい値で更新することはで
きません。 最初にモデルをロードするとき、このモードを選択するとパフォーマンスが向上しま
す。 既存のデータがある場合は、書き込みの前に削除されます。
2. 複数の Write to Hub ステージで同時にモデルに書き込めるようにしたい場合は、[同時書き込み] を
クリックします。 このモードがオンの場合、[処理前にモデルを削除] オプションは無効になり、
ジョブを実行する前にモデルが作成されます。 モデルがまだ存在しない場合は、ステージを閉じ
るとモデルが作成されます。
3. 複数の Write to Hub ステージでモデルに書き込めるようにしたくない場合は、[排他ロック] (デフォ
ルト) をクリックします。 このモードがオンの場合、プロパティを作成後に更新できます。
4. 既存のエンティティや関係をすべて削除してから新しいデータを処理したいときは、[処理前にモ
デルを削除] をオンにします。 これがオンでないとき、新しい情報は既存のエンティティや関係を
更新するために使われます。
5. 関係を持たないエンティティを削除したいときは、[処理後に親のないノードを削除する] をオンに
します。
6. [OK] をクリックします。
入力要件
Write to Hub ステージでは、モデルの作成に使用できる定義済みのフィールドを持つ入力ステージが
データフローに含まれている必要があります。
Read From Hub
Read From Hub ステージは、カスタム クエリまたはクエリ ビルダを使用して既存のハブへのクエリ
を実行し、データをデータフローの出力内のフィールドとして返すことができます。
[クエリ] タブ
[クエリ] タブでは、選択したモデルからデータを取得するクエリを作成できます。 モデル データは、
データフローの出力内のデータ行として返されます。 標準提供のクエリ ビルダを使うだけでなく、カ
スタム クエリを作成することもできます。
Read From Hub ステージでクエリ ビルダを使う手順は次のとおりです。
ユーザ ガイド
473
Read From Hub
1. クエリを行うモデルを [モデル] ドロップダウン ボックスで選択します。
2. [全てのエンティティ]、[全ての関係]、または [最初のエンティティを指定] をクリックして、クエ
リで何を特定するかを指定します。 [最初のエンティティを指定] を選択すると、モデル内のどのポ
イントで検索を開始するかを決定できます。 例えば、特定の期間にわたる世界のテロ活動を表現
するモデルを対象とする場合、エンティティは国の名前になるでしょう。 このときモデル全体を
クエリの対象とするのではなく、アフガニスタンにおける活動だけに注目したいことがあります。
その場合には "国" をプロパティ名として選択し、 "アフガニスタン" をプロパティ値として選択し
ます。
注: このフィールドの値は、大文字と小文字が区別され、完全に一致している必要があります。
3. クエリにその他の制約を設定する場合は、[条件] フィールドに必要な情報を入力します。 例えば、
2001 年から 2010 年までのアフガニスタンにおけるテロ活動を対象とする場合は、2 つの条件を作
成します。 最初に、"日付" をプロパティ名として選択し、"が次の値以上" を選択し、 "2001" と入
力します。 次の条件も同様で、"And"、"日付"、"が次の値以下"、"2010" というように設定します。
条件の追加、削除、順序変更は、条件の横にあるどちらかのアイコンを使って行います。
4. すべてのステップの結果を出力に含めたければ、[結果を含める] チェック ボックスをクリックし
ます。 このチェック ボックスをオフにすると、最後のステップの結果だけが含められます。
5. クエリに実行させたい手順を指定します。具体的には、[処理を追加] ドロップダウン ボックスで、
適切なオプションを選択します。 選択するオプションは、ルート要素がエンティティか関係かに
よって異なることに注意してください。
• [エンティティからエンティティへ] ([全てのエンティティ] と [最初のエンティティを指定] で有
効) を選択した場合は、2 エンティティ (Connected)、前エンティティ (Predecessors)、または
後エンティティ (Successors) の間の関係ラベルに基づいて、検索結果を絞り込むことができま
す。 例えば、家族メンバーのモデルでクエリを実行していて、関係ラベルとして "父" を選択す
ると、Connected クエリはエンティティ間に "父" ラベルがあるすべてのエンティティ (つまり、
父、息子、娘) を返します。 Predecessors クエリは、"父" という関係で別のエンティティに接
続するときのソース エンティティとなるすべてのエンティティ (つまり、父) を返します。
Successors クエリは、"父" という関係で別のエンティティに接続するときのターゲット エン
ティティとなるすべてのエンティティ (つまり、息子と娘) を返します。
このクエリに条件を追加できます。 例えば、州プロパティがテキサスに等しいという条件を付
加すれば、テキサス州に住む人物というソース エンティティとして父を検索できます。
クエリによる検索の繰り返し回数も定義できます。 繰り返し回数として 2 を選択し、クエリで
見つかったソース エンティティがユーザのクエリとマッチした場合、検索はソース エンティティ
に接続されたエンティティと、第 2 のエンティティに接続されたエンティティに対して行われま
す。
• [Entity to Relationship] ([全てのエンティティ] と [最初のエンティティを指定] で有効) を選択し
た場合、使用できるオプションは [Entity to Entity] の場合とよく似ています。 2 エンティティ
(Connected)、前エンティティ (Predecessors)、または後エンティティ (Successors) の間の関係
ラベルに基づいて、検索結果を絞り込むことができます。 このクエリに条件を追加することも
できます。
474
Spectrum™ Technology Platform 8.0.0
第 22 章 : Data Hub モジュール
• [Relationship to Entity] ([全ての関係] で有効) を選択した場合は、自分の設定する条件に基づい
て検索結果を絞り込むことができます。 データを取得できるのは、条件が成立したときのその
エンティティが別のエンティティに接続されたエンティティ (Connected) である場合か、そのエ
ンティティ自体がソースとして別の関係 (Predecessors) を持つ場合か、そのエンティティが関
係 (Successors) のターゲットである場合です。
6. [フィールド] タブに必要な情報を入力します。 詳しくは、ここ をクリックしてください。クエリ
で取得するフィールドの指定のしかたと、それをデータフローに出力する方法を説明しています。
7. [OK] をクリックします。
このステージのカスタム クエリの作成に Gremlin を使う場合は、以下の情報を参照してください。こ
れは Groovy のクラスを利用するモデル追跡言語です。
• Gremlin のコマンド
• Transform-Based Steps(476ページ)
• フィルタ(477ページ)
Gremlin のコマンド
一般的なアクションを実行する Gremlin コマンドを次に示します。
特定のノードの Gremlin パイプラインを取得
g.idx('entities')[['propertyName':propertyValue]]
Gremlin パイプラインを ArrayList に変換
toList()
タイプを Gremlin パイプラインに変換
_()
入力と出力の設定
入力と出力にアクセスするには、Gremlin スクリプト内でデータ変数を使用します。 例:
def name=data["FirstName"];
data["Variants"]=g.idx('entities')[['Name':name]].both.Name.toList()
プロパティの取得
頂点と関係は複数のプロパティを持つことができ、ここでキーには文字列、値には OrientDB のサポー
トされている任意のタイプを使用できます。 プロパティを設定するには、次のメソッドを使用しま
す。
void setProperty(String key, Object value)
プロパティを取得するには、次のメソッドを使用します。
Object getProperty(String key)
サンプル スクリプト
次のサンプルはスクリプトの体裁を完全に整えています。
// Assigns the value of FirstName from an incoming data row to a variable
def name=data["FirstName"]
ユーザ ガイド
475
Read From Hub
// Returns a pipeline of all Nodes that have a Name property equal to the
name variable
g.idx('entities')[['Name':name]]
// Returns all adjacent Nodes (Gremlin calls them Vertices)
g.idx('entities')[['Name':name]].both
// Returns a pipeline containing the Names for all adjacent Nodes
g.idx('entities')[['Name':name]].both.Name
// Converts the pipeline containing the Names to a List of Strings
g.idx('entities')[['Name':name]].both.Name.toList()
// Converts the entities pipeline to a list (so it can be used over and over)
g.idx('entities')[['Name':name]].toList()
// Converts the entities pipeline to a list and assigns to a variable
def entities = g.idx('entities')[['Name':name]].toList()
// Converts the entities list back to a pipeline (so it can be used with
other Gremlin steps)
entities._()
// Assigns the Names List (List of string) to an output field
data["Variants"]=entities._().both.Name.toList()
Gremlin モデル追跡言語の詳細については、ここをクリックしてください。
Groovy スクリプトの作成の詳細については、ここをクリックしてください。
Transform-Based Steps
これは Gremlin に同梱されている定義済みステップのコレクションで、ここではパイプへのマッピン
グとパイプラインの作成が行われます。 Transform-Based Steps は、オブジェクトを受け取り、それ
らに対して変形操作 (トランスフォーム) を行います。 in、out、both の各トランスフォーム ステップ
を次に示します。
表 81 : Transform-Based Steps
476
ステップ
Filter?
説明
Pipe
out
はい
隣接頂点から頂点へ出る
OutPipe
outE
はい
頂点の関係 (出方向)
OutEdgesPipe
in
はい
隣接頂点から頂点へ入る
InPipe
inE
はい
頂点の関係 (入方向)
InEdgesPipe
both
はい
頂点の隣接頂点 (双方向)
BothPipe
bothE
はい
頂点の関係 (入と出の双方向)
BothEdgesPipe
outV
はい
関係の始点の頂点 (出方向)
OutVertexPipe()
inV
はい
関係の終点の頂点 (出方向)
InVertexPipe()
Spectrum™ Technology Platform 8.0.0
第 22 章 : Data Hub モジュール
ステップ
Filter?
説明
Pipe
bothV
はい
関係の頂点 (入と出の双方向)
BothVerticesPipe()
フィルタ
Filter-Based Steps は、モデルからオブジェクトまたはパスを削除するために使われます。 総称的な
フィルタ ステップは "filter" です。 ただし、次の例に示すように、その他のステップもあります。
• 数値配列: outE[10] は、このステップで 11 番目の関係をエミットします。
• 範囲配列: outE[0..10] は、このステップで最初の 11 個の関係をエミットします。
• マップ配列: outE[ [weight:1.0]] は、すべての関係を加重プロパティ 1.0 でエミットします。
• 閉包: outE{it.label=='knows' | it.weight > 0.5} は、すべての関係をラベル = 'knows'、または加重 > 0.5
でエミットします。
サンプル フィルタ スクリプト
Name=data['Name']
g.idx('entities')[['Name':Name]].outE.filter{it.label=='Roomate'}.inV.toList()
[フィールド] タブ
[フィールド] タブでは、取得するフィールドを指定し、それらのフィールドをデータフローに出力で
きます。
1. クエリを [クエリ] タブで入力します。
注: このステップを完了してから [フィールド] タブへの入力を行ってください。
2. [フィールド] タブをクリックします。
3. カスタム スクリプトを作成する場合は、[エンティティ] または [関係] を選択して、クエリを行う
要素を識別します。 これらのボタンは、クエリ ビルダを使用している場合はグレー表示されます。
4. どのフィールドを出力に返すかを指定します。 デフォルトでは、すべてのフィールドが選択され
ています。 少なくとも、検索するデータに含まれているフィールドを指定する必要があります。
5. 出力するフィールドの名前を変更したければ、新しい名前を [フィールド名] 列に入力します。
6. [OK] をクリックします。
出力要件
Read From Hub ステージでは、データフローの出力ステージで少なくともフィールドを 1 つ以上定義
し、これをクエリの対象としておく必要があります。 そうしないと、そのデータは出力に現れませ
ん。 例えば、Read From Hub ステージのクエリの対象がハブ内の _stp_id フィールドであるときは、
出力ステージにそのデータをキャプチャするフィールドが含まれていなければなりません。
ユーザ ガイド
477
Query Hub
Query Hub
Query Hub ステージは、カスタム クエリまたはクエリ ビルダを使用して既存のハブへのクエリを実行
し、データをデータフローの出力として返すことができます。
[クエリ] タブ
[クエリ] タブでは、選択したモデルからデータを取得するクエリを作成できます。 モデル データは、
データフローの出力内のデータ行として返されます。 標準提供のクエリ ビルダを使うだけでなく、カ
スタム クエリを作成することもできます。
次の手順で Spectrum Technology Platform のハブへのクエリを実行します。
1. クエリを行うモデルを [モデル] ドロップダウン ボックスで選択します。
2. [全てのエンティティ]、[全ての関係]、または [最初のエンティティを指定] をクリックして、クエ
リで何を特定するかを指定します。 [最初のエンティティを指定] を選択すると、モデル内のどのポ
イントで検索を開始するかを決定できます。 例えば、特定の期間にわたる世界のテロ活動を表現
するモデルを対象とする場合、エンティティは国の名前になるでしょう。 このときモデル全体を
クエリの対象とするのではなく、アフガニスタンにおける活動だけに注目したいことがあります。
このケースでは、"国" をプロパティ名として選択し、[リテラル] ボタンをクリックし、"アフガニ
スタン" をプロパティ値として入力します。 また、[フィールド] をオンのままにしておき、"場所"
を選択すれば、個別に値を入力しなくても済みます。
注: このフィールドの値は、大文字と小文字が区別され、完全に一致している必要があります。
3. クエリにその他の制約を設定する場合は、[条件] フィールドに必要な情報を入力します。 例えば、
2001 年から 2010 年までのアフガニスタンにおけるテロ活動を対象とする場合は、2 つの条件を作
成します。 最初に、"日付" をプロパティ名として選択し、"が次の値以上" を選択し、 "2001" と入
力します。 次の条件も同様で、"And"、"日付"、"が次の値以下"、"2010" というように設定します。
条件の追加、削除、順序変更は、条件の横にあるどちらかのアイコンを使って行います。
4. すべてのステップの結果を出力に含めたければ、[結果を含める] チェック ボックスをクリックし
ます。 このチェック ボックスをオフにすると、最後のステップの結果だけが含められます。
5. クエリに実行させたい手順を指定します。具体的には、[処理を追加] ドロップダウン ボックスで、
適切なオプションを選択します。 選択するオプションは、ルート要素がエンティティか関係かに
よって異なることに注意してください。
• [エンティティからエンティティへ] ([全てのエンティティ] と [最初のエンティティを指定] で有
効) を選択した場合は、2 エンティティ (Connected)、前エンティティ (Predecessors)、または
後エンティティ (Successors) の間の関係ラベルに基づいて、検索結果を絞り込むことができま
す。 例えば、家族メンバーのモデルでクエリを実行していて、関係ラベルとして "父" を選択す
ると、Connected クエリはエンティティ間に "父" ラベルがあるすべてのエンティティ (つまり、
父、息子、娘) を返します。 Predecessors クエリは、"父" という関係で別のエンティティに接
続するときのソース エンティティとなるすべてのエンティティ (つまり、父) を返します。
478
Spectrum™ Technology Platform 8.0.0
第 22 章 : Data Hub モジュール
Successors クエリは、"父" という関係で別のエンティティに接続するときのターゲット エン
ティティとなるすべてのエンティティ (つまり、息子と娘) を返します。
このクエリに条件を追加できます。 例えば、州プロパティがテキサスに等しいという条件を付
加すれば、テキサス州に住む人物というソース エンティティとして父を検索できます。
クエリによる検索の繰り返し回数も定義できます。 繰り返し回数として 2 を選択し、クエリで
見つかったソース エンティティがユーザのクエリとマッチした場合、検索はソース エンティティ
に接続されたエンティティと、第 2 のエンティティに接続されたエンティティに対して行われま
す。
• [Entity to Relationship] ([全てのエンティティ] と [最初のエンティティを指定] で有効) を選択し
た場合、使用できるオプションは [Entity to Entity] の場合とよく似ています。 2 エンティティ
(Connected)、前エンティティ (Predecessors)、または後エンティティ (Successors) の間の関係
ラベルに基づいて、検索結果を絞り込むことができます。 このクエリに条件を追加することも
できます。
• [Relationship to Entity] ([全ての関係] で有効) を選択した場合は、自分の設定する条件に基づい
て検索結果を絞り込むことができます。 データを取得できるのは、条件が成立したときのその
エンティティが別のエンティティに接続されたエンティティ (Connected) である場合か、そのエ
ンティティ自体がソースとして別の関係 (Predecessors) を持つ場合か、そのエンティティが関
係 (Successors) のターゲットである場合です。
6. [フィールド] タブに必要な情報を入力します。 詳しくは、ここ をクリックしてください。クエリ
で取得するフィールドの指定のしかたと、それをデータフローに出力する方法を説明しています。
注: このステップを実行するのは、[クエリ] タブへの入力前でも入力後でもかまいません。
7. [OK] をクリックします。
このステージのカスタム クエリの作成に Gremlin を使う場合は、以下の情報を参照してください。こ
れは Groovy のクラスを利用するモデル追跡言語です。
• Gremlin のコマンド
• Transform-Based Steps
• フィルタ
Gremlin のコマンド
一般的なアクションを実行する Gremlin コマンドを次に示します。
特定のノードの Gremlin パイプラインを取得
g.idx('entities')[['propertyName':propertyValue]]
Gremlin パイプラインを ArrayList に変換
toList()
タイプを Gremlin パイプラインに変換
_()
ユーザ ガイド
479
Query Hub
入力と出力の設定
入力と出力にアクセスするには、Gremlin スクリプト内でデータ変数を使用します。 例:
def name=data["FirstName"];
data["Variants"]=g.idx('entities')[['Name':name]].both.Name.toList()
サンプル スクリプト
次のサンプルはスクリプトの体裁を完全に整えています。
// Assigns the value of FirstName from an incoming data row to a variable
def name=data["FirstName"]
// Returns a pipeline of all Nodes that have a Name property equal to the
name variable
g.idx('entities')[['Name':name]]
// Returns all adjacent Nodes (Gremlin calls them Vertices)
g.idx('entities')[['Name':name]].both
// Returns a pipeline containing the Names for all adjacent Nodes
g.idx('entities')[['Name':name]].both.Name
// Converts the pipeline containing the Names to a List of Strings
g.idx('entities')[['Name':name]].both.Name.toList()
// Converts the entities pipeline to a list (so it can be used over and over)
g.idx('entities')[['Name':name]].toList()
// Converts the entities pipeline to a list and assigns to a variable
def entities = g.idx('entities')[['Name':name]].toList()
// Converts the entities list back to a pipeline (so it can be used with
other Gremlin steps)
entities._()
// Assigns the Names List (List of string) to an output field
data["Variants"]=entities._().both.Name.toList()
Gremlin モデル追跡言語の詳細については、ここをクリックしてください。
Groovy スクリプトの作成の詳細については、ここをクリックしてください。
Transform-Based Steps
これは Gremlin に同梱されている定義済みステップのコレクションで、ここではパイプへのマッピン
グとパイプラインの作成が行われます。 Transform-Based Steps は、オブジェクトを受け取り、それ
らに対して変形操作 (トランスフォーム) を行います。 in、out、both の各トランスフォーム ステップ
を次に示します。
表 82 : Transform-Based Steps
480
ステップ
Filter?
説明
Pipe
out
はい
隣接頂点から頂点へ出る
OutPipe
outE
はい
頂点の関係 (出方向)
OutEdgesPipe
Spectrum™ Technology Platform 8.0.0
第 22 章 : Data Hub モジュール
ステップ
Filter?
説明
Pipe
in
はい
隣接頂点から頂点へ入る
InPipe
inE
はい
頂点の関係 (入方向)
InEdgesPipe
both
はい
頂点の隣接頂点 (双方向)
BothPipe
bothE
はい
頂点の関係 (入と出の双方向)
BothEdgesPipe
outV
はい
関係の始点の頂点 (出方向)
OutVertexPipe()
inV
はい
関係の終点の頂点 (出方向)
InVertexPipe()
bothV
はい
関係の頂点 (入と出の双方向)
BothVerticesPipe()
フィルタ
Filter-Based Steps は、モデルからオブジェクトまたはパスを削除するために使われます。 総称的な
フィルタ ステップは "filter" です。 ただし、次の例に示すように、その他のステップもあります。
• 数値配列: outE[10] は、このステップで 11 番目の関係をエミットします。
• 範囲配列: outE[0..10] は、このステップで最初の 11 個の関係をエミットします。
• マップ配列: outE[ [weight:1.0]] は、すべての関係を加重プロパティ 1.0 でエミットします。
• 閉包: outE{it.label=='knows' | it.weight > 0.5} は、すべての関係をラベル = 'knows'、または加重 > 0.5
でエミットします。
サンプル フィルタ スクリプト
Name=data['Name']
g.idx('entities')[['Name':Name]].outE.filter{it.label=='Roommate'}.inV.toList()
[フィールド] タブ
[フィールド] タブでは、取得するフィールドを指定し、それらのフィールドをデータフローに出力で
きます。 カスタム スクリプトを作成する場合は、フィールドを追加、変更、または削除できます。
クエリ ビルダを使用している場合、フィールドには値が設定されますが、自動設定されたエンティ
ティおよび関係の名前とプロパティを変更できます。
1. クエリを [クエリ] タブで作成します。
注: このステップを実行するのは、[フィールド] タブへの入力前でも入力後でもかまいません。
2. [フィールド] タブをクリックします。
3. [追加] をクリックして、[入力フィールドを追加] ダイアログ ボックスを表示します。
4. [フィールド] ドロップダウン ボックスと [追加] ボタンを使用して、モデル内のクエリの対象とな
るフィールドを選択します。 選択できるフィールドは、データフローの入力ステージで設定した
フィールドによって異なります。 Spectrum は、基本的なデータ タイプと複合的なデータ タイプ
ユーザ ガイド
481
Query Hub
の両方をサポートしています。入力ファイルの階層構造の深部にあるフィールドをクエリで使用で
きます。
5. 入力フィールドの追加を完了したら、[閉じる] をクリックします。
6. [追加] をクリックして、[出力フィールドを追加] ダイアログ ボックスを開きます。
7. 追加したい出力フィールドのタイプを [タイプ] ドロップダウン ボックスから選択します。 次の
データ タイプがサポートされています。
データ タイプ
説明
boolean
true と false の 2 つの 値を持つ論理タイプ。
double
-1074
正と負の倍精度数を含む数値データ タイプ。値の範囲は、2
-52
(2-2
〜
1023
。 指数表記すると、値の範囲は、4.9E-324 〜
)×2
1.7976931348623157E308 となります。 指数表記については、次のサ
イトを参照してください。
http://en.wikipedia.org/wiki/Scientific_notation#E_notation
関係
エンティティ間のリンク。そこで他のエンティティと共有される要因。
このタイプの出力フィールドを選ぶと、フィールドの名前を変更したり、
出力にどの関係を含めるかを決めたりすることができます。 Gremlin ス
クリプトに、関係のリストを取得して、データ タイプを設定するコマン
ドを含める必要があります。次に、例を示します。
data["Variants"]=g.idx('entities')[['Name':name]].bothE
注: このようにして出力フィールドを作成した場合、Query Graph はス
キーマを自動的に設定します。
float
-149
正と負の単精度数を含む数値データ タイプ。値の範囲は、2
23
〜
127
(2-2 )×2
。 指数表記すると、値の範囲は、1.4E-45 〜 3.4028235E38
となります。 指数表記については、次のサイトを参照してください。
http://en.wikipedia.org/wiki/Scientific_notation#E_notation
integer
31
正と負の整数を含む数値データ タイプ。値の範囲は、-2 (-2,147,483,648)
31
〜 2 -1 (2,147,483,647)。
long
63
正と負の自然数を含む数値データ タイプ。値の範囲は、-2
63
(-9,223,372,036,854,775,808) 〜 2 -1 (9,223,372,036,854,775,807)。
エンティティ
特定すべき関係を持つ個々のエンティティ。 このタイプの出力フィール
ドを選択すると、フィールドの名前を変更したり、出力にどのエンティ
ティを含めるかを決めたりすることができます。 Gremlin スクリプトに、
エンティティ (すなわち、頂点) のリストを取得してデータ タイプを設定
するコマンドを含める必要があります。次に例を示します。
data["Variants"]=g.idx('entities')[['Name':name]].both
482
Spectrum™ Technology Platform 8.0.0
第 22 章 : Data Hub モジュール
データ タイプ
説明
注: このようにして出力フィールドを作成した場合、Query Graph はス
キーマを自動的に設定します。
string
文字シーケンス。
必要なら、新しいユーザ定義のカスタム データ タイプを追加することもできます。 データ タイプ
に関しては、定義済みの任意のデータ タイプのリストを新しいタイプとすることができます (とは
いえ、string、double、integer、long、float、Boolean の各タイプについては、データ タイプをド
ロップダウン ボックスから選択し、[リスト] チェック ボックスをクリックするだけです)。 モデル
内のエンティティや関係に基づいて出力フィールドを選択することもできます。 このようにして
出力フィールドを作成した場合、Query Graph はスキーマを自動的に設定します。 また、エンティ
ティや関係を Gremlin から取得し、ループを作成して反復的に処理する場合もあります。 こうし
てフィールドの子レベルの行を作成し、データを割り当てていきます。
8. 追加したい出力フィールドの名前を [名前] フィールドで指定します。
9. リスト形式のカスタム データ タイプを作成した場合は、[リスト] チェック ボックスをクリックし
ます。
10. 出力フィールドの追加が完了したら、[閉じる] をクリックします。
11. [OK] をクリックします。
入力/出力の要件
Query Graph ステージでは、データフローの入力ステージに data[“input”] を使ってアクセスされる入
力フィールドを定義しておく必要があります。 また、データ コマンドでアクセスされる任意の入力
フィールドまたは出力フィールドは、入力および出力ステージの [フィールド] タブで定義する必要が
あります。 これを定義しておかないと、データフローの他のステージで入力フィールドまたは出力
フィールドとして現れません。
Relationship Analysis Client
Data Hub モジュールの Relationship Analysis Client コンポーネントは、エンティティ間の構造や関係
を特定して表現するデータを図形的に表示するために使われます。 プロパティおよび値に基づいてエ
ンティティや関係を操作することもできます。
• Relationshop Analysis Client キャンバスの概要については、ここをクリックしてください。
• 次の内容を含む、モデルの管理については、ここをクリックしてください。
• 各モデルのデータの概要
• モデルへの中心性尺度の追加に関する情報、およびそれらの尺度適用後に [ジョブ] タブに表示さ
れる詳細の一覧
ユーザ ガイド
483
Relationship Analysis Client
• 特定の条件を満たすデータに変更がないか監視するモニターの定義に関する情報
• 次の内容を含む、モデルのコンテンツを表示および操作するすべての方法については、ここをクリッ
クしてください。
• [モデルを開く] ウィンドウの [モデル詳細] タブおよび [クエリ] タブの機能
• [キャンバス オプション] リボンのボタン
• 選択ツールとクエリ ツールの使用
• フィルタの使用
• 次の内容を含む、モデルの要素の外観を変更する方法については、ここをクリックしてください。
• 1 つのモデルを複数の方法で同時に表示する
• エンティティと関係の外観を決定する
• 値の範囲を視覚的に表現するグラデーション設定を行う
• モデルのエンティティにパネル スタイルを適用してプロパティ データを表示する
• テーマを設定してモデルに適用し、複数のモデルを同じように見せたい場合に時間を短縮できる
ようにする
• 強調したい部分 (グループ構造、階層、場所など) に基づいてモデルの視覚的構造を変更するレイ
アウトを適用する
• 次の内容を含む、モデルのデータを分析する方法については、ここをクリックしてください。
•
• Discovery 機能を使用して、設定した条件に基づいて特定の情報をロードし、元のロードでは除外
されていた要素に追加し直す
• モデルに対して中心性アルゴリズムを実行する
• グループを使用して潜在的な関係を明らかにする
• エンティティと関係、およびそれらの要素に結び付いているプロパティを追加および削除する
Relationship Analysis Client キャンバスへのアクセス
Relationship Analysis Client にアクセスするには
1. <keyword keyref="productname"/> サーバーが実行されていることを確認します。
2. Web ブラウザを開き、 http://<サーバー名>:<ポート>/hub/RelationshipAnalysis にアク
セスします。 たとえば、サーバーの名前が "myserver" であり、既定の HTTP ポート 8080 を使う
場合は、 http://myserver:8080/hub/RelationshipAnalysis.html になります。
3. ログイン画面が表示されたら、モデルの作成時に Enterprise Designer の起動に使用したユーザ名
とパスワードを入力します。 [OK] をクリックします。
4. [ホーム] タブの [開く] ボタンをクリックして、一覧からモデルを選択します。 [OK] をクリックし
ます。
Relationship Analysis Client 内のすべての機能が使用できるようになりました。
484
Spectrum™ Technology Platform 8.0.0
第 22 章 : Data Hub モジュール
Relationship Analysis Client キャンバス
初期状態の Relationship Analysis Client キャンバスは、次の要素で構成されています。
• キャンバス ボタン
• キャンバス メニュー
• 概要ペイン
• モデルの詳細ペイン
• プライマリ ペイン
• モデル コンポーネント ペイン
• 選択ペイン
• クエリ ペイン
キャンバス ボタン
以下のボタンは Relationship Analysis Client キャンバスに常に表示されます。
アイコン 説明
最後のアクションを取り消すことができます。 [デフォルト オプション] ダイアログ ボッ
クスで、取り消しの回数を設定できます。 デフォルト値は 5 です。
取り消した最後のアクションをやり直すことができます。 [デフォルト オプション] ダイア
ログ ボックスで、やり直しの回数を設定できます。 デフォルト値は 5 です。
デフォルト オプションを設定できます。
イベント ログを開きます。 デバッグ モードでは、システム内で何が起きているかに関す
る詳細が表示されます。
次の 2 つを行えます。
• ボタン バーをリボンの下に移動する
• リボンを最小化/復元する
キャンバス メニュー
Relationship Analysis Client キャンバスでは次のメニューを使用できます。
注: メニュー アイテムのホット キーを有効にするには、Ctrl と Q と Tab を同時に押します。
ユーザ ガイド
485
Relationship Analysis Client
メニュー アイテ 説明
ム
Home
モデルの管理、キャンバス コンテンツの表示、およびモデル要素の選択を行うた
めのオプションがあります。
表示
選択によるフィルタリングおよびタイプによるフィルタリングのためのツールと
オプションを有効にできます。
データ
モデルを操作および分析するためのオプションがあります。
スタイル設定
エンティティおよび関係のスタイルを設定できます。
レイアウト
複数のレイアウトから選択し、そのレイアウトに対するオプションを設定できま
す。
概要ペイン
概要ペインでは、プライマリ ペインのフォーカスをモデルのどの部分に当てるかを決定できます。 概
要ペインには、モデルのサブセットである現在のビューポートを表す色の付いた長方形のエリアとと
もに、モデル全体のビューが表示されます。 モデルのフォーカスを当てたい部分の近くをカーソルで
クリックし、モデルをプライマリ ペインまでドラッグします。 モデル全体にフォーカスを当てるに
は、モデルの中央をクリックします。 .
モデルの詳細ペイン
モデルの詳細ペインには、モデルに関する分析の詳細が表示されます。 このペインには以下の特性の
情報が表示されます。
• 名前 — データを表示しているモデルの名前
• エンティティ — エンティティの数
• 関連性 — 関係の数
• 非循環 — 各関係によって集合内の別のエンティティと結ばれるエンティティと有向関係の集合で、
どこかのエンティティ v からスタートして関係のシーケンスを追っても、結局、v に再び戻ること
が決してない、そのような集合の状態。
• 二重接続される — 連結して分離不可分な状態。例えば、モデルからエンティティをすべて取り除い
たとすると、そのモデルは連結したままになります。
• バイパーティション — 集合 U 内のエンティティに接続する関係すべてが集合 V 内の別のエンティ
ティに接続するというように、エンティティ (の集合) を、互いに交わらない 2 つの集合 U と V に
分割できること。 等価的には、二部グラフ モデルは奇数長サイクルを持たないモデルと同じです。
• 接続される — モデル内の 1 つのエンティティからモデル内の他のエンティティへのパスが存在しま
す。
• 循環 — 単一のサイクルからなること。別の言い方をすると、エンティティがいくつか連結して閉じ
たチェーンが形成されることです。
486
Spectrum™ Technology Platform 8.0.0
第 22 章 : Data Hub モジュール
• フォレスト — 連結コンポーネントがすべてツリー (Tree) の無向モデル。つまり、ツリーの直和。
等価的に、フォレストはサイクルのない無向モデルと同じです。
• 複数の関連性を持たない — 2 つ以上の関係が同じエンティティで鉢合わせしないこと。
• 平面的 — どの関係とも交わらないように描けること。
• ルート付きツリー — 1 つのエンティティが根 (root) とされ、関係がそこから上へ広がっていくこ
と。
• 強く接続される — モデル内の各エンティティを他のあらゆるエンティティと結ぶパスが存在するこ
と。 特に、これは、どちら向きのパスもあり、つまり、a から b へのパスも、b から a へのパスも
ありを意味します。
• ツリー — 任意の 2 つのエンティティが 1 つの単純パスで連結される無向モデル。
プライマリ ペイン
プライマリ ペインには、概要ペインでフォーカスが当たるように設定したモデルの部分が表示されま
す。 このペインでエンティティ、関係、およびラベルを手動で選択できます。また、選択ペインで
データ内の装飾プロパティを確認し、選択ツールによって適切なモデル要素を選択できます。 モデル
内の要素をダブルクリックすると、自動的にズームインしてその要素が中央に表示されます。 選択さ
れた複数の要素をズームインするには、Ctrl キーを押しながらペイン内の任意の場所をダブルクリッ
クします。
モデル コンポーネント ペイン
モデル コンポーネント ペインには、モデル データがグリッド形式で表示されます。 エンティティ
データと関係データは 2 つのタブに表示されます。 ただし、エンティティ グリッドには各エンティ
ティの先行および後続のデータも含まれます。 緑色の矢印が指す方向によって、どちらが先行でどち
らが後続かを判断できます。
保険データを持つモデルを調べて、潜在的な詐欺を特定したいことがあります。 治療を求めた個人を
表すエンティティは、その個人が訪れた医者または診療所を表すエンティティに連結されています。
モデル コンポーネント ペインの [エンティティ] タブで、エンティティの横の [+] 記号をクリックして
データを展開すると、その個人が訪れた医者や診療所が表示されます。 また、いずれかの医者や診療
所のエンティティの横の [+] 記号をクリックすると、そのエンティティに関連付けられたすべてのメタ
データが表示されます。
関係グリッドには、エンティティ間の関係によってグループ化されたデータが表示されます。 保険金
詐欺の例では、関係グリッドの最初の列には、その個人が医者または診療所を訪れたことを表す "visited"
が表示されます。
選択ペイン
選択ペインでは、選択ツールを使って、データ内の装飾プロパティを特定し、それらのプロパティを
含むモデル要素 ("項目" とも呼ばれる) を選択できます。 選択ペインには、選択した要素のプロパティ
と関係も表示されます。 複数の要素が選択されている場合は、最後に選択された要素のプロパティと
関係が表示されます。 詳細については、選択ペインの使用を参照してください。
ユーザ ガイド
487
Relationship Analysis Client
クエリ ペイン
クエリ ペインでは、クエリ ツールを使ってクエリを実行できます。 クエリ ツールの使用の詳細につ
いては、クエリ ツールの使用(499ページ)を参照してください。
モデルの管理
[モデル管理] では、モデルを開かなくても各モデルの概要データを表示できます。 モデル情報の表示、
アルゴリズムを用いた中心性尺度の追加と更新、モニターの定義、およびモデルの削除が可能です。
[モデル アルゴリズム] タブで実行されたジョブの詳細情報も表示されます。
• モデル情報の表示
• モデルへの中心性尺度の適用
• モデルの監視
• モデルの削除
• ジョブ情報の表示
モデル管理にアクセスするには、以下の手順に従います。
1. [ホーム] タブが選択された状態で、[管理] ボタンをクリックします。
2. [モデル管理] ダイアログ ボックスのリスト内のモデルをクリックして選択します。
[モデル] タブ
[モデル] タブには、各モデルのエンティティおよび関係の数が表示されます。 特定のモデルの行のど
こか (例えば、[名前]、[エンティティ]、または [関係] 列内) をクリックすると、そのモデルが開きま
す。 列ヘッダをクリックすると、その列のモデル データが昇順ソートされます。 列ヘッダを 2 回ク
リックすると、その列のモデル データが降順ソートされます。
[モデル詳細] タブ
[モデル詳細] タブには、選択したモデルのエンティティの数と関係の数が表示されます。 列ヘッダを
クリックすると、その列のモデル データが昇順ソートされます。 列ヘッダを 2 回クリックすると、そ
の列のモデル データが降順ソートされます。
このタブには、グリッド形式でモデル メタデータも表示されます。 エンティティ データと関係デー
タは 2 つのタブに表示されます。 エンティティ グリッドには、各エンティティの先行と後続のデータ
や、各エンティティに関連付けられたプロパティが含まれます。 関係グリッドには、モデル内に存在
する関係のタイプや、各関係に関連付けられたプロパティが含まれます。
保険データを持つモデルを調べて、潜在的な詐欺を特定したいことがあります。 治療を求めた個人を
表すエンティティは、その個人が訪れた医者または診療所を表すエンティティに連結されています。
[エンティティ] タブの [ソース関連性] セクションで、エンティティの横の [+] 記号をクリックしてデー
タを展開すると、[ソース] 列に "Person"、[タイプ] 列に "Visited"、[ターゲット] 列に "Doctor" と表示
され、その後に医者を訪問した回数が表示されます。
488
Spectrum™ Technology Platform 8.0.0
第 22 章 : Data Hub モジュール
関係グリッドには、エンティティ間の関係によってグループ化されたデータが表示されます。 保険金
詐欺の例では、関係グリッドに "Visited" と表示されており、その関係の横の [+] 記号をクリックして
データを展開すると、[ソース] 列に "Claimant"、[タイプ] 列に "Visited"、[ターゲット] 列に "Provider"
と表示され、[カウント] 列にはモデル内のその関係のインスタンス数が表示されます。
[エンティティ] タブ
[エンティティ] タブには、モデル内の各エンティティに関するリストがあり、そこにエンティティの
モデル内での出現回数が表示されます。
特定のエンティティの横の + 記号をクリックすると、そのエンティティに関して以下に説明する情報
が表示されます。 "All" の横の + 記号をクリックすると、すべてのエンティティに関して以下に説明す
る情報が表示されます。
• [関係始点] タブには、選択したエンティティ タイプが「"from," or source, position」という形式の、
モデル内の関係に関する情報が表示されます。 このタブで、[始点] 列は常に、ここで確認している
データが帰属するエンティティです。 その後、情報が [タイプ] 別に整理され、[始点] エンティティ
と [終点] エンティティの間の関係が表現されます。 上の例で、タイプは 2 人の人物の間の関係を表
しています。 [終点] 列に含まれているエンティティ タイプは、「"to," or target, position」(関係内)
という形式です。 上の例では、ある人物エンティティが他の人物エンティティのところにやってく
る状況を調べています。 このタブには関係タイプごとに [カウント] もあり、これは今見ているデー
タの帰属するエンティティに関して、その関係タイプがどれだけ出現するかを示します。 ここで説
ユーザ ガイド
489
Relationship Analysis Client
明している例には、他の人物にお金を提供する人物についての 6 件の出来事と、別の人物の父親で
ある人物についての 2 件の出来事が含まれています。
• [関係終点] タブには、選択したエンティティ タイプが「"to," or target, position」という形式の、モ
デル内の関係に関する情報が表示されます。 この [始点] 列に含まれているエンティティ タイプは
「"from," or source, position」(関係内) という形式です。 前のタブと同じく、その後、情報が [タイ
プ] 別に整理されます。 このタブで、[終点] 列は常に、ここで確認しているデータの帰属するエン
ティティになります。 [カウント] 列は、前のタブで説明したものと同じです。
• [プロパティ] タブには、ここで確認しているデータの帰属するエンティティに関連するすべてのプ
ロパティの情報が表示されます。 このタブには、プロパティごとに [タイプ] と、ここで確認してい
るデータの帰属するエンティティの各プロパティの出現回数を表す [カウント] も表示されます。 リ
スト内のすべてのプロパティがどれか 1 つのエンティティに含まれることはなくても、少なくとも、
リスト内の各プロパティはどれか 1 つのエンティティに含まれます。
[関係] タブ
[関係] タブには、タブには、モデル内の各エンティティに関するリストがあり、そこにエンティティ
のモデル内での出現回数が表示されます。
特定の関係の横の + 記号をクリックすると、その関係に関して以下に説明する情報が表示されます。
"All" の横の + 記号をクリックすると、すべての関係に関して以下に説明する情報が表示されます。
• [関係] タブには、モデル内で選択した関係に関する情報を表示されます。 このタブで、[始点] 列は
関係のソース エンティティを表します。 その後、情報が [タイプ] 別に整理され、[始点] エンティ
ティと [終点] エンティティの間の関係が表現されます。 上の例で、タイプは 2 人の人物の間の関係
を表しています。 [終点] 列には、「"to," or receiving, position」(関係内) という形式のエンティティ
タイプが含まれています。 上の例では、人物エンティティがイベントと場所のエンティティのとこ
ろにやってくるという状況を調べています。 このタブには関係ごとに [カウント] もあり、これは今
見ているデータの帰属するエンティティに関して、その関係タイプがどれだけ出現するかを示しま
す。 ここで示した例には、人物とイベントに関する 19 件の出来事と、ある人物がある場所に向か
う 37 件の出来事が含まれています。
• [プロパティ] タブには、ここで確認しているデータの帰属する関係に関連するすべてのプロパティ
の情報が表示されます。 このタブには、プロパティごとに [タイプ] と、ここで確認しているデータ
の帰属する関係の各プロパティの出現回数を表す[カウント] も表示されます。 リスト内のすべての
490
Spectrum™ Technology Platform 8.0.0
第 22 章 : Data Hub モジュール
プロパティがどれか 1 つの関係に含まれることはなくても、少なくとも、リスト内の各プロパティ
はどれか 1 つの関係に含まれます。
[モデル アルゴリズム] タブ
1. 管理アイコンをクリックして [グラフ管理] ダイアログ ボックスにアクセスします。
2. 中心性尺度を適用するモデルをクリックします。
3. [アルゴリズム] をクリックします。
4. モデルに適用したい中心性尺度の種類を選択します。 この値は要素の重要度を表します。値が大
きいほど、要素の重要度が増します。
• [媒介性] — ネットワーク内のさまざまな部分間の情報フローを制御するエンティティを識別す
るのに使われます。
• [近接性] — ネットワークの他の部分へのアクセスに最も優れ、ネットワークのその他の部分に
おけるアクティビティを視覚化できるエンティティを識別するのに使われます。
• [次数] — 他のエンティティに最も直接的なリンクを持つエンティティを識別するのに使われま
す。
• [影響性] — 他のきわめてアクティブなエンティティ、または広く接続されたエンティティへの
リンクによって、ネットワーク内に強い影響を持つエンティティを識別するのに使われます。
5. アルゴリズムに適用したい方向を選択します。
• 入方向 (Incoming)— エンティティに入る関係によって結果が生じます。
• 出方向 (Outgoing) — エンティティから出る関係によって結果が生じます。
• 両方 — 入る関係と出る関係によって結果が生じます。
6. 影響性アルゴリズムを使用する場合は、[精度] スケールを動かして結果の精度を決定します。 精
度が低ければより正確な結果が返されますが、アルゴリズムの実行速度は遅くなります。
7. 近接性アルゴリズムを使用する場合は、結果を返す方法に適したボタンをクリックします。
• [標準] — エンティティの連結 (すなわち、関係) の数と、各エンティティへの最短パスの合計の
逆数に基づいて結果が生じます。
• [Dangalchev] — 別のエンティティにリンクされたエンティティの数だけでなく、リンクされた
各エンティティの関係の数も結果に影響します。
• [Opsah]— 各エンティティへの最短パスの逆数の合計に基づいて結果が生じます。
8. 関係の不利度を測りたい場合は、[重みとして関係プロパティを使用] をクリックし、使いたい関係
プロパティを [プロパティ] ドロップダウンから選択します。 この場合は、値が大きいほど、否定
的な関係性が高まります。
9. 関係プロパティを重みとして使用し、そのプロパティで低い値が高い値よりも良いと見なされてい
る場合は、[値が低いほど有意性が高い] ボックスをクリックします。 例えば、そのプロパティが
ある種のランク付けシステムの場合、通常は 1 または第 1 位が最も良い値です。 もう 1 つの例は、
そのプロパティが距離で、最短経路を決定しようとしている場合で、 5 マイルは 10 マイルより良
いと見なされます。
ユーザ ガイド
491
Relationship Analysis Client
10. 出力プロパティ名を選択したアルゴリズム以外の名前にしたい場合は、[デフォルトの出力プロパ
ティ名のオーバーライド] をクリックします。 次に、新しい名前を [プロパティ] フィールドに入力
します。
11. [実行] をクリックします。
12. アルゴリズム実行後のジョブの詳細を確認するには、[ジョブ] タブをクリックします。 これでジョ
ブ ID、モデル名、使用アルゴリズム、ジョブ ステータス、開始時刻、および終了時刻が与えられ
ます。 モデルが大きくなればなるほど、アルゴリズムの実行に時間がかかることに注意してくだ
さい。[ステータス] 列を監視して、ジョブがまだ実行中かどうか判断してください。
注:
Results are not stored over time. If you close Relationship Analysis and reopen it, the information
on the Jobs tab is cleared.
[モデル モニター] タブ
Relationship Analysis Client ツールでは、特定の条件を満たすデータに変更がないか、モデルを監視し
て調べることができます。 エンティティまたは関係に対して、監視を設定できます。
エンティティ モニターの条件はエンティティ プロパティに基づいていて、リテラルまたは絶対値に対
して評価されます。 例えば、 "Nationality" というプロパティに対して条件を設定し、エンティティの
国籍が "Canadian" のときにサービスを実行することができます。
関係モニターの条件は、関係プロパティと、その関係に接続されたソースとターゲットのエンティティ
のプロパティに基づいています。 エンティティ モニターの場合と同様に、これらのプロパティはリテ
ラルに対して評価されますが、プロパティ自体に対しても評価できます。 例えば、関係プロパティが
ソースまはターゲットのエンティティの同じプロパティと等しい場合を探す条件を設定できます。 同
様に、ソース エンティティのプロパティがターゲット エンティティの同じプロパティと等しい場合を
探す条件を設定できます。
監視を実施するためには、特定の名前をモニタに割り当て、アクションを行わせたい条件を設定し、
さらに電子メール通知か、起動するサービスをセットアップする必要があります。
注: Email Action モニタを作成する前に、まず Management Console でセットアップしなければなり
ません。 詳細については、を参照してください。 電子メール通知(201ページ)
モニタを追加する手順は次のとおりです。
1. Relationship Analysis Client を開いた状態で、[管理] ボタンをクリックします。
2. [モデル モニター] をクリックします。
3. [追加] をクリックし、エンティティ モニタと関係モニタのどちらを作成するかを決めます。
4. 作成するモニタの名前を入力します。
5. [条件を追加] をクリックして、アクションのシナリオを作成します。
• 関係モニターを作成する場合は、ソース タイプ ([プロパティ]、[ソース エンティティ]、または
[ターゲット エンティティ]) を選択します。
• 監視するデータのプロパティを選択します。
492
Spectrum™ Technology Platform 8.0.0
第 22 章 : Data Hub モジュール
• 条件の作成に使うオペランドを選択します。
• 電子メールまたはサービスの起動ポイントの値を入力します。
• モデル データの評価時にモニタに大文字と小文字を区別させない場合は、[大文字と小文字を区
別しない] チェック ボックスをクリックします。
6. ステップ 5 を繰り返して、他の条件を追加します。 優先順位を変更するために条件を上または下
へ移動させるには、条件を選択して上矢印または下矢印を使用します。
7. [アクション] で、[追加] をクリックし、実行するアクションの種類を選択します。
8. 電子メール アクションまたは サービス アクションの作成に必要な手順を実行します。
電子メール アクションの作成
1. 有効な電子メール アドレスを [宛先] フィールドに入力します。
2. 電子メール アクションの件名を [表題] フィールドに入力します。 また、右クリックで [切り取
り]、[コピー]、および[貼り付け] 機能を使用するか、[挿入] を選択して、トークンのリストから選
択します。
注: $ を押すと、トークンのリストが表示されます。
3. 電子メール アクションの本文に表示するテキストを入力します。 メッセージは、手動で自由に入
力する方法と、トークンのリストで構成するやり方があります。 トークンを使うと、実行時に実
際の値が入る変数で電子メールの書式を設定できます。 トークンを追加していくと、電子メール
アクションの[メッセージ] ボックス内でコードが動的に更新される様子がわかります。
4. [OK] を 2 回クリックします。 これで電子メール モニタが作成されました。
サービス アクションの作成
1. 監視対象のデータや条件が見つかった場合に実行するサービスを選択します。 Spectrum のサービ
スとカスタム サービスのどちらもドロップダウン リストから指定できます。 このサービス内の
フィールドは フィールド マッピング テーブルに記載されます。
2. モデル内のフィールドを、このサービスの入力フィールドにマッピングします。
• [ソース タイプ] のデフォルトは、サービス アクションがエンティティ用か関係用かに応じて、
[エンティティ プロパティ] または [関連性プロパティ] に設定されます。[リテラル] を選択して、
特定のテキストを探すよう、モニターに指示することもできます。 サービス アクションが関係用
の場合、[ソース エンティティ] または [ターゲット エンティティ] をソース タイプとして選択す
ることもできます。
• 適切なプロパティを [ソース] 列のドロップダウンから選択して、[フィールド] 列のフィールドに
マッピングします。 "Literal" をソース タイプとして選択した場合は、モニタに検索させたいテ
キストを正確に入力します。
3. 起動するサービスのデフォルトのオプションをオーバーライドするために、[オプション] をクリッ
クします。 フィールドは、名前または値でソートできます。
注: エクスポーズしたオプションだけが、このテーブルに表示されます。
4. [OK] を 2 回クリックします。 これでサービス モニタが作成されました。
ユーザ ガイド
493
Relationship Analysis Client
モデルの削除
次の手順でこの情報にアクセスします。
1. Relationship Analysis Client を開いた状態で、[管理] ボタンをクリックします。
2. [グラフ管理] ダイアログ ボックスのリスト内のモデルをクリックして選択します。
3. [削除] ボタンをクリックします。
4. [はい] をクリックして、モデルを削除します。
[ジョブ] タブ
[ジョブ] タブには、[モデル] タブで実行したアルゴリズムの詳細が表示されます。 以下の情報が表示
されます。
• ジョブ ID
• アルゴリズムが実行されたモデルの名前
• 実行されたアルゴリズムの名前
• ジョブのステータス
• 開始時刻と終了時刻
• ジョブが実行されたときに返された可能性があるメッセージ
モデルの表示
Relationship Analysis Client は、いくつかの方法でモデル データを表示します。
• モデルを開く
• キャンバス オプション
• 選択ツールの使用
• クエリ ツールの使用
• フィルタの使用
モデルを開く
Relationship Analysis Client ツールの [モデルを開く] ダイアログ ボックスには、モデルを開く前でも、
各モデルのデータの概要が表示されます。 選択したモデルからデータを取得するクエリを作成するこ
ともできます。
次の手順でこの情報にアクセスします。
1. Relationship Analysis Client を開いた状態で、[開く] ボタンをクリックします。
2. リスト内のモデルをクリックして選択します。
3. [モデル] タブをそのまま使うか、他の 2 つのタブのどちらかをクリックします。
494
Spectrum™ Technology Platform 8.0.0
第 22 章 : Data Hub モジュール
[モデル] タブ
[モデル] タブには、各モデルのエンティティおよび関係の数が表示されます。 特定のモデルの行のど
こか (例えば、[名前]、[エンティティ]、または [関係] 列内) をクリックすると、そのモデルが開きま
す。 列ヘッダをクリックすると、その列のモデル データが昇順ソートされます。 列ヘッダを 2 回ク
リックすると、その列のモデル データが降順ソートされます。
[モデル詳細] タブ
[モデル詳細] タブには、選択したモデルのエンティティの数と関係の数が表示されます。 列ヘッダを
クリックすると、その列のモデル データが昇順ソートされます。 列ヘッダを 2 回クリックすると、そ
の列のモデル データが降順ソートされます。
このタブには、グリッド形式でモデル メタデータも表示されます。 エンティティ データと関係デー
タは 2 つのタブに表示されます。 エンティティ グリッドには、各エンティティの先行と後続のデータ
や、各エンティティに関連付けられたプロパティが含まれます。 関係グリッドには、モデル内に存在
する関係のタイプや、各関係に関連付けられたプロパティが含まれます。
保険データを持つモデルを調べて、潜在的な詐欺を特定したいことがあります。 治療を求めた個人を
表すエンティティは、その個人が訪れた医者または診療所を表すエンティティに連結されています。
[エンティティ] タブの [ソース関連性] セクションで、エンティティの横の [+] 記号をクリックしてデー
タを展開すると、[ソース] 列に "Person"、[タイプ] 列に "Visited"、[ターゲット] 列に "Doctor" と表示
され、その後に医者を訪問した回数が表示されます。
関係グリッドには、エンティティ間の関係によってグループ化されたデータが表示されます。 保険金
詐欺の例では、関係グリッドに "Visited" と表示されており、その関係の横の [+] 記号をクリックして
データを展開すると、[ソース] 列に "Claimant"、[タイプ] 列に "Visited"、[ターゲット] 列に "Provider"
と表示され、[カウント] 列にはモデル内のその関係のインスタンス数が表示されます。
[クエリ] タブ
[クエリ] タブでは、選択したモデルからデータを取得するクエリを作成できます。 標準提供のクエリ
ビルダを使うだけでなく、手動クエリを作成することもできます。
クエリ ビルダを使う手順は次のとおりです。
1. [全てのエンティティ]、[全ての関係]、または [最初のエンティティを指定] をクリックして、クエ
リで何を特定するかを指定します。 [最初のエンティティを指定] を選択すると、モデル内のどのポ
イントで検索を開始するかを決定できます。 例えば、特定の期間にわたる世界のテロ活動を表現
するモデルを対象とする場合、エンティティは国の名前になるでしょう。 このときモデル全体を
クエリの対象とするのではなく、アフガニスタンにおける活動だけに注目したいことがあります。
その場合には "国" をプロパティ名として選択し、 "アフガニスタン" をプロパティ値として選択し
ます。
2. クエリにその他の制約を設定する場合は、[条件] フィールドに必要な情報を入力します。 例えば、
2001 年から 2010 年までのアフガニスタンにおけるテロ活動を対象とする場合は、2 つの条件を作
成します。 最初に、"日付" をプロパティ名として選択し、"が次の値以上" を選択し、 "2001" と入
ユーザ ガイド
495
Relationship Analysis Client
力します。 次の条件も同様で、"And"、"日付"、"が次の値以下"、"2010" というように設定します。
条件の追加、削除、順序変更は、条件の横にあるどちらかのアイコンを使って行います。
3. クエリに実行させたい手順を指定します。具体的には、[処理を追加] ドロップダウン ボックスで、
適切なオプションを選択します。 選択するオプションは、ルート要素がエンティティか関係かに
よって異なることに注意してください。
• [エンティティからエンティティへ] ([全てのエンティティ] と [最初のエンティティを指定] で有
効) を選択した場合は、2 エンティティ (Connected)、前エンティティ (Predecessors)、または
後エンティティ (Successors) の間の関係ラベルに基づいて、検索結果を絞り込むことができま
す。 例えば、家族メンバーのモデルでクエリを実行していて、関係ラベルとして "父" を選択す
ると、Connected クエリはエンティティ間に "父" ラベルがあるすべてのエンティティ (つまり、
父、息子、娘) を返します。 Predecessors クエリは、"父" という関係で別のエンティティに接
続するときのソース エンティティとなるすべてのエンティティ (つまり、父) を返します。
Successors クエリは、"父" という関係で別のエンティティに接続するときのターゲット エン
ティティとなるすべてのエンティティ (つまり、息子と娘) を返します。
このクエリに条件を追加できます。 例えば、州プロパティがテキサスに等しいという条件を付
加すれば、テキサス州に住む人物というソース エンティティとして父を検索できます。
クエリによる検索の繰り返し回数も定義できます。 繰り返し回数として 2 を選択し、クエリで
見つかったソース エンティティがユーザのクエリとマッチした場合、検索はソース エンティティ
に接続されたエンティティと、第 2 のエンティティに接続されたエンティティに対して行われま
す。
• [Entity to Relationship] ([全てのエンティティ] と [最初のエンティティを指定] で有効) を選択し
た場合、使用できるオプションは [Entity to Entity] の場合とよく似ています。 2 エンティティ
(Connected)、前エンティティ (Predecessors)、または後エンティティ (Successors) の間の関係
ラベルに基づいて、検索結果を絞り込むことができます。 このクエリに条件を追加することも
できます。
• [Relationship to Entity] ([全ての関係] で有効) を選択した場合は、自分の設定する条件に基づい
て検索結果を絞り込むことができます。 データを取得できるのは、条件が成立したときのその
エンティティが別のエンティティに接続されたエンティティ (Connected) である場合か、そのエ
ンティティ自体がソースとして別の関係 (Predecessors) を持つ場合か、そのエンティティが関
係 (Successors) のターゲットである場合です。
4. [OK] をクリックします。
Use the information below if you prefer to write a manual query for this stage via Gremlin, a model
traversal language using Groovy classes:
• Gremlin のコマンド
• Transform-Based Steps
• フィルタ
キャンバス オプション
Relationship Analysis Client のキャンバス オプションには、次のものがあります。
496
Spectrum™ Technology Platform 8.0.0
第 22 章 : Data Hub モジュール
• [ズームイン] — フォーカスを現在のビューの中央に寄せてズームインします。 モデルの特定のエリ
アにフォーカスを移動するときは、概要ペインを使用してください。
• [ズームアウト] — フォーカスを引いてモデルの全体が見えるようにします。 状況によって、ズーム
インの取り消しのように機能します。
• [自動ズームを切り替え] — 自動ズームのオン/オフを切り替えます。 自動ズームは、選択されたアイ
テムがすべてビューポートに収まるようにズームインします。
• [境界に合わせる] — モデル ビューの枠内にモデル全体がぴったり収まるようにします。
• [フェードを選択] — 選択されていない項目を背面にフェードアウトさせます。 何も選択されていな
いときは、すべての項目が前面に置かれます。
選択ツールの使用
選択ツールでは、特定の条件に基づいてモデル内の要素を選択できます。 [選択] リボンを使用して、
要素のタイプ (エンティティまたは関係) を選択できます。現在の (または最後に選択した) 要素との接
続に基づいて (すべての接続、先行、または後続)、エンティティを選択することもできます。 選択ペ
インには、モデル内の要素を見つけるための検索機能があります。
[選択] リボンの使用
[選択] リボンを使用すると、モデル内の要素または要素のグループを簡単に選択できます。
• [すべて選択] — キャンバス上のすべての要素を選択します。
• [すべてのエンティティを選択] — キャンバス上のすべてのエンティティを選択します。
• [すべての関連性を選択] — キャンバス上のすべての関係を選択します。
• [選択状態の維持] — 他のアクションを実行する際に、ハイライト表示されている要素の選択状態を
維持します。 例えば、あるエンティティを選択し、[選択状態の維持] をクリックしてから [接続を選
択] をクリックした場合、そのエンティティに加え、そのエンティティに対して接続されているすべ
ての要素が選択されます。
• [現在の項目] — 選択されている要素に対してのみアクションを実行します。 例えば、あるエンティ
ティを選択し、[現在の項目] をクリックしてから [先行を選択] をクリックした場合、その項目に入っ
てくるすべての要素が選択されます。 次に [後続を選択] をクリックすると、最初のエンティティの
後続のみが取得されます。 [先行を選択] をクリックしたときに取り込まれたエンティティの後続は
取得されません。
• [接続を選択] — 選択された要素に接続されているすべての要素を選択します。
• [先行を選択] — 選択された要素に入ってくるすべての要素を選択します。
• [後続を選択] — 選択された要素から出ていくすべての要素を選択します。
プライマリ ペインを右クリックすることによっても、これらのオプションにアクセスできます。
選択ペインの使用
選択ペインでは、データ内の装飾プロパティを指定し、そのプロパティを含むモデル要素を選択でき
ます。 例えば、米国に関するデータを調べて、人口が 10,000,000 人を超えるのはどの州か知りたい
ことがあります。
ユーザ ガイド
497
Relationship Analysis Client
単純な WHERE 文に基づいてモデル内の要素を選択するには、[検索] タブを使用します。 現在選択さ
れている要素に何らかの方法で接続されているモデル内の要素を選択するには、[詳細設定] タブを使
用します。
[検索] タブ
1. 検索するデータのモデル要素として、[エンティティ] か [関係] を選択します。
2. [WHERE] ステップを設定します。具体的には、検索するデータが含まれているプロパティ、選択
時に使う演算子、項目を返すかどうか判断するための値を選択します。 上の人口の例で言えば、
この [検索条件] ステップは「州の人口、"が次の値より大きい"、10,000,000」となります。 これ
は、人口が 10,000,000 より大きい州について、データを返したりエンティティを選択したりする、
ということを意味します。
3. [実行] ボタンをクリックします。
. この選択タスクの要件を満たすデータが含まれている項目
が [選択されたアイテム] リスト ボックスに表示されます (同様に、選択された各エンティティの
データはすべてモデル コンポーネント ペインに表示されます)。
4. [選択されたアイテム] リスト ボックス内のいずれかの項目をクリックすると、その項目のすべて
のデータが [プロパティ] タブに表示されます。
5. [関係] タブをクリックします。ステップ 4 でクリックした項目にリンクしている項目のリストが表
示されます。 上の人口の例を再び考えます。今度は、テキサス州の情報を返すような設定です。
[選択されたアイテム] リストでテキサスをクリックし、[関係] タブをクリックすると、テキサス州
は境界州のアラスカ、ルイジアナ、ニューメキシコ、およびオクラホマと関係があるというような
ことがわかります。 このビューでは、関係またはエンティティによってソートできます。
最初の選択タスクと反対の結果を返す選択タスクを続けて実行できます。 例えば、人口の例では、後
続の反対の選択タスクによって、人口が 10,000,000 人未満のすべての州が選択されます。 最初の選
択タスクで返された選択内容を保持することもできます。 最初の選択タスクを実行した後、[現在の選
択を維持] チェック ボックスをオンにすれば、最初の選択タスクの選択結果が保持されます。 最初の
選択結果を保持したくなければ、このチェック ボックスをオフにしてください。 [選択状態の反転]
ボックスをオンにして、[実行] ボタンをクリックします。
この反転機能をフィルタ ツールと組み合わせれば、不要なエンティティや関係を選択して取り除き、
目的のエンティティと関係だけを分離できます。 例えば、州データを照合するモデルを使い、選挙人
票が 4 より大きいのはどの州か知りたいとします。 大統領選挙人団の選挙人票が 4 票に等しいという
条件でエンティティの選択を行い、[反転を選択] チェック ボックスをオンにして、[適用] ボタンをク
リックします。 こうして選択された州は、選挙人票が 4 より大きいものと、それより小さいものばか
りになります。 ここから、[フィルタ] タブをクリックし、[選択] ボックスで [エンティティ] をクリッ
クすると、選挙人票が 4 のエンティティだけが残ります。
[詳細設定] タブ
モデルの 1 つ以上の要素を選択したら、これらの詳細設定機能を使用して、追加要素を選択できます。
現在選択されているエンティティに接続されている要素、先行する要素、または後続の要素を返すよ
う指定します。 最初の階層以上の接続を選択したい場合は、返す接続の階層数を [深さ] フィールドで
指定します。 深さ 1 は、選択されたエンティティに接続されているエンティティのみを返します。 深
さ 2 は、これらのエンティティに加え、そのエンティティに接続されているエンティティも返します。
以降も同様です。
498
Spectrum™ Technology Platform 8.0.0
第 22 章 : Data Hub モジュール
他のアクションを実行する際に、現在の要素の選択状態を維持できます。 例えば、あるエンティティ
を選択し、[現在の選択状態を維持] をクリックしてから [接続] を選択した場合、そのエンティティに
加え、すべての関係が選択されます。
現在選択されている要素に対してのみアクションを実行することもできます。 例えば、あるエンティ
ティを選択し、[現在の項目のみ] をクリックしてから [先行] をクリックした場合、その項目に入って
くるすべての要素が選択されます。 次に [後続] をクリックすると、最初のエンティティの後続のみが
取得されます。 [先行を選択] をクリックしたときに取り込まれたエンティティの後続は取得されませ
ん。
[詳細設定] タブのもう 1 つのオプションは、[最短パス] によって、現在選択されているエンティティ
に接続されたすべての項目を返すものです。 [有向] ボックスをオンにした場合、パスは一方向にのみ
進みます。 このボックスをオフのままにした場合、パスは複数の方向に進むことができます。 [重み]
ドロップダウンで、最短パスを決定する際に選択ツールが探すプロパティを選択できます。
選択を行ってから、[実行] ボタンをクリックします。
. この選択タスクの要件を満たすデータが
含まれている項目が [選択されたアイテム] リスト ボックスに表示されます (同様に、選択された各エ
ンティティのデータはすべてモデル コンポーネント ペインに表示されます)。 [選択されたアイテム]
リスト ボックス内のいずれかの項目をクリックすると、その項目のすべてのデータが [プロパティ] タ
ブに表示されます。 [関係] タブをクリックします。ステップ 4 でクリックした項目にリンクしている
項目のリストが表示されます。 人口の例を続けます。今度は、テキサス州の情報を返すような設定で
す。 [選択されたアイテム] リストでテキサスをクリックし、[関係] タブをクリックすると、テキサス
州は境界州のアラスカ、ルイジアナ、ニューメキシコ、およびオクラホマと関係があるというような
ことがわかります。 このビューでは、関係またはエンティティによってソートできます。
クエリ ツールの使用
クエリ ツールでは、開かれているモデルのデータを返すクエリを作成できます。 標準提供のクエリ
ビルダを使うだけでなく、カスタム クエリを作成することもできます。
クエリを作成する前に、結果の取得方法を決めておく必要があります。 使用できるオプションは、
Relationship Analysis Client にフル モデルと部分モデルのどちらをロードしたかによって異なります。
フル モデルとは、すべてのエンティティと関係がキャンバス上に存在するモデルのことです。 部分モ
デルとは、エンティティおよび関係の一部はあるが、クエリ、選択、フィルタ機能を使ってモデルの
要素の一部だけを取得したために、そのすべてがキャンバス上に存在するわけではないモデルのこと
です。
• [要素の選択] — このオプションを使用すると、クエリで特定された要素がキャンバス上で選択され
ます。
• [要素の追加] — このオプションを使用すると、クエリで特定され、まだロードされていない要素が
キャンバスに追加されます。
注: フル モデルでは、すべての要素が既に存在するので、このオプションは使えません。
• [結果の表示] — このオプションを使用すると、クエリから返された未加工データが Relationship
Analysis Client の [結果] ウィンドウに表示されます。
ユーザ ガイド
499
Relationship Analysis Client
クエリ ビルダを使う手順は次のとおりです。
1. [全てのエンティティ]、[全ての関係]、または [最初のエンティティを指定] をクリックして、クエ
リで何を特定するかを指定します。 [最初のエンティティを指定] を選択すると、モデル内のどのポ
イントで検索を開始するかを決定できます。 例えば、特定の期間にわたる世界のテロ活動を表現
するモデルを対象とする場合、エンティティは国の名前になるでしょう。 このときモデル全体を
クエリの対象とするのではなく、アフガニスタンにおける活動だけに注目したいことがあります。
その場合には "国" をプロパティ名として選択し、 "アフガニスタン" をプロパティ値として選択し
ます。
2. クエリにその他の制約を設定する場合は、[条件] フィールドに必要な情報を入力します。 例えば、
2001 年から 2010 年までのアフガニスタンにおけるテロ活動を対象とする場合は、2 つの条件を作
成します。 最初に、"日付" をプロパティ名として選択し、"が次の値以上" を選択し、 "2001" と入
力します。 次の条件も同様で、"And"、"日付"、"が次の値以下"、"2010" というように設定します。
条件の追加、削除、順序変更は、条件の横にあるどちらかのアイコンを使って行います。
3. クエリに実行させたい手順を指定します。具体的には、[処理を追加] ドロップダウン ボックスで、
適切なオプションを選択します。 選択するオプションは、ルート要素がエンティティか関係かに
よって異なることに注意してください。
• [エンティティからエンティティへ] ([全てのエンティティ] と [最初のエンティティを指定] で有
効) を選択した場合は、2 エンティティ (Connected)、前エンティティ (Predecessors)、または
後エンティティ (Successors) の間の関係ラベルに基づいて、検索結果を絞り込むことができま
す。 例えば、家族メンバーのモデルでクエリを実行していて、関係ラベルとして "父" を選択す
ると、Connected クエリはエンティティ間に "父" ラベルがあるすべてのエンティティ (つまり、
父、息子、娘) を返します。 Predecessors クエリは、"父" という関係で別のエンティティに接
続するときのソース エンティティとなるすべてのエンティティ (つまり、父) を返します。
Successors クエリは、"父" という関係で別のエンティティに接続するときのターゲット エン
ティティとなるすべてのエンティティ (つまり、息子と娘) を返します。
このクエリに条件を追加できます。 例えば、州プロパティがテキサスに等しいという条件を付
加すれば、テキサス州に住む人物というソース エンティティとして父を検索できます。
クエリによる検索の繰り返し回数も定義できます。 繰り返し回数として 2 を選択し、クエリで
見つかったソース エンティティがユーザのクエリとマッチした場合、検索はソース エンティティ
に接続されたエンティティと、第 2 のエンティティに接続されたエンティティに対して行われま
す。
• [Entity to Relationship] ([全てのエンティティ] と [最初のエンティティを指定] で有効) を選択し
た場合、使用できるオプションは [Entity to Entity] の場合とよく似ています。 2 エンティティ
(Connected)、前エンティティ (Predecessors)、または後エンティティ (Successors) の間の関係
ラベルに基づいて、検索結果を絞り込むことができます。 このクエリに条件を追加することも
できます。
• [Relationship to Entity] ([全ての関係] で有効) を選択した場合は、自分の設定する条件に基づい
て検索結果を絞り込むことができます。 データを取得できるのは、条件が成立したときのその
エンティティが別のエンティティに接続されたエンティティ (Connected) である場合か、そのエ
500
Spectrum™ Technology Platform 8.0.0
第 22 章 : Data Hub モジュール
ンティティ自体がソースとして別の関係 (Predecessors) を持つ場合か、そのエンティティが関
係 (Successors) のターゲットである場合です。
4. [OK] をクリックします。
Use the information below if you prefer to write a manual query for this stage via Gremlin, a model
traversal language using Groovy classes:
• Gremlin のコマンド
• Transform-Based Steps
• フィルタ
このツールでは、双方が互いに依存するような反復的な文を入力できます。 これを利用すると、中間
的な検証によって結果を 1 行に 1 つずつ返しながら動作する複雑なクエリを開発できます。
Gremlin のコマンド
一般的なアクションを実行する Gremlin コマンドを次に示します。
特定のノードの Gremlin パイプラインを取得
g.idx('entities')[['propertyName':propertyValue]]
Gremlin パイプラインを ArrayList に変換
toList()
タイプを Gremlin パイプラインに変換
_()
入力と出力の設定
入力と出力にアクセスするには、Gremlin スクリプト内でデータ変数を使用します。 例:
def name=data["FirstName"];
data["Variants"]=g.idx('entities')[['Name':name]].both.Name.toList()
サンプル スクリプト
次のサンプルはスクリプトの体裁を完全に整えています。
// Assigns the value of FirstName from an incoming data row to a variable
def name=data["FirstName"]
// Returns a pipeline of all Nodes that have a Name property equal to the
name variable
g.idx('entities')[['Name':name]]
// Returns all adjacent Nodes (Gremlin calls them Vertices)
g.idx('entities')[['Name':name]].both
// Returns a pipeline containing the Names for all adjacent Nodes
g.idx('entities')[['Name':name]].both.Name
// Converts the pipeline containing the Names to a List of Strings
g.idx('entities')[['Name':name]].both.Name.toList()
// Converts the entities pipeline to a list (so it can be used over and over)
g.idx('entities')[['Name':name]].toList()
ユーザ ガイド
501
Relationship Analysis Client
// Converts the entities pipeline to a list and assigns to a variable
def entities = g.idx('entities')[['Name':name]].toList()
// Converts the entities list back to a pipeline (so it can be used with
other Gremlin steps)
entities._()
// Assigns the Names List (List of string) to an output field
data["Variants"]=entities._().both.Name.toList()
Gremlin モデル追跡言語の詳細については、ここをクリックしてください。
Groovy スクリプトの作成の詳細については、ここをクリックしてください。
Transform-Based Steps
これは Gremlin に同梱されている定義済みステップのコレクションで、ここではパイプへのマッピン
グとパイプラインの作成が行われます。 Transform-Based Steps は、オブジェクトを受け取り、それ
らに対して変形操作 (トランスフォーム) を行います。 in、out、both の各トランスフォーム ステップ
を次に示します。
表 83 : Transform-Based Steps
ステップ
Filter?
説明
Pipe
out
はい
エンティティの隣接エンティティ (出方向)
OutPipe
outE
はい
エンティティの関係 (出方向)
OutEdgesPipe
in
はい
エンティティの隣接エンティティ (入方向)
InPipe
inE
はい
エンティティの関係 (入方向)
InEdgesPipe
both
はい
エンティティの隣接エンティティ (入と出の BothPipe
双方向)
bothE
はい
エンティティの関係 (入と出の双方向)
BothEdgesPipe
outV
はい
関係の始点のエンティティ (出方向)
OutVertexPipe()
inV
はい
関係の終点のエンティティ (入方向)
InVertexPipe()
bothV
はい
関係のエンティティ (入と出の双方向)
BothVerticesPipe()
フィルタ
Filter-Based Steps は、モデルからオブジェクトまたはパスを削除するために使われます。 総称的な
フィルタ ステップは "filter" です。 ただし、次の例に示すように、その他のステップもあります。
• 数値配列: outE[10] は、このステップで 11 番目の関係をエミットします。
• 範囲配列: outE[0..10] は、このステップで最初の 11 個の関係をエミットします。
• マップ配列: outE[ [weight:1.0]] は、すべての関係を加重プロパティ 1.0 でエミットします。
502
Spectrum™ Technology Platform 8.0.0
第 22 章 : Data Hub モジュール
• 閉包: outE{it.label=='knows' | it.weight > 0.5} は、すべての関係をラベル = 'knows'、または加重 > 0.5
でエミットします。
サンプル フィルタ スクリプト
Name=JohnDoe
g.idx('entities')[['Name':Name]].outE.filter{it.label=='Roommate'}.inV.toList()
フィルタの使用
Relationship Analysis Client の [フィルタ] セクションでは、選択したエンティティまたは関係をキャン
バスから非表示にできます。 選択フィルタとタイプ フィルタを使用して、無関係な要素 (そのプロパ
ティが要件を満たさない要素や、そのデータが当面の関心の対象から外れている要素) を消去すること
ができます。 これらのフィルタを使用すると、後に残された要素の間に重要な関係が見つかることが
あります。 時間フィルタは、特定のタイム フレーム内のデータ セグメントをキャプチャします。 こ
れでネットワークの活動状況の時間的な変化を比較できます。 数値フィルタは、プロパティの値が指
定の範囲に入るデータをキャプチャします。 例えば、保険金請求に関する情報を含むデータに
"NumberOfVisits" というフィールドがあり、これは医者が特定の患者の治療で請求を行った回数を示
しているとき、ここでの関係性がモデルにどう反映するかを見てみます。 訪問回数が 10 回を超える
事例を分離する場合は、このフィールドでデータをフィルタリングし、その最小値を 10 に設定しま
す。 これで NuberOfVisits フィールドの値が 10 より小さいという関係性は除外されます。
注: エンティティをフィルタリングすると、すべての接続関係もフィルタリングされます。 関係を
フィルタリングしても、その接続エンティティはフィルタリングされません。
選択フィルタの使用
選択フィルタの使用手順は次のとおりです。
1. モデルを開いた状態で、[表示] タブをクリックします。
2. 非表示にしたいエンティティまたは関係を、プライマリ キャンバスでクリックするか、選択を実
行して選択します。
3. [フィルタの選択] グループで、[エンティティ] か [関連性]、どちらか適切な方をクリックします。
4. [選択状態] または [非選択状態] をクリックします。どちらをクリックするかは、選択されたエン
ティティと関係のどちらを削除するか、あるいは、選択されていないエンティティまたは関係を削
除するかどうかによります。
削除したエンティティまたは関係を復元する場合は、[選択] グループ内の [全てをクリア—] をクリッ
クします。
注: この復元機能は、選択フィルタで削除されたエンティティまたは関係に対してだけ有効です。
タイプ フィルタの使用
タイプ フィルタの使用手順は次のとおりです。
1. モデルを開いた状態で、[表示] タブをクリックします。
ユーザ ガイド
503
Relationship Analysis Client
2. [タイプでフィルタリング] グループで、[エンティティ] または [関連性] をクリックします。
3. エンティティ タイプ (個人、場所、イベントなど) または関係プロパティ (兄弟、アフガニスタン、
爆撃など) をクリックします。 これらのタイプは Write to Hub ステージで指定され、要素の _stp_type
プロパティに表示されます。 フィルタの条件を満たす要素がビューから非表示になります。
時間フィルタの使用
次の図は、時間フィルタの一部を示しています。 時間フィルタをアクティブにすると、このペイン全体が見
えるはずです。 ペインの最下部に [タイムスパンのスクロールバー] が表示されていない場合は、フィルタ
ペインの縦サイズを拡大してペイン全体が見えるようにしてください。
[ビューポート] には、選択した期間の広がりが視覚的に表現されます。 ここには [選択部分] があり、この選
択部分のどちらかの端のハンドルをクリック アンド ドラッグしてフィルタの対象期間を変更できます。 [開
始日の選択] フィールドと [終了日の選択] フィールドが、ハンドルの動きに応じて動的に更新されることに
注意してください。
[ビューポート] には [タイムスパンのスクロールバー] もあり、このスクロール バーのどちらかの端のハンド
ルをクリック アンド ドラッグして選択期間をズームイン/ズームアウトできます。 次の 2 つの例に示すよう
に、ドラッグして互いのハンドルの間を近づけると、年が月、月が週、週が日、というように、時間のス
ケールが変化します。 ドラッグして互いのハンドルの間を離すと、これと逆のことが起こります。 このツー
ルのよいところは、[タイムスパンのスクロールバー] でズームイン/ズームアウトしてから、[選択部分] の対
象期間を柔軟にコントロールできることです。スクロール バーでの変更が選択部分に動的に反映されます。
初期状態で選択部分の範囲が年または月になっている場合は、スクロールバーで表示範囲を調整してから、
週または日の範囲でつまみを操作をするとよいでしょう。
504
Spectrum™ Technology Platform 8.0.0
第 22 章 : Data Hub モジュール
時間フィルタを使用する手順を次に示します。
1. モデルを開いた状態で、[表示] タブをクリックします。
2. [ツール] グループで、[範囲のフィルタリング] をクリックします。 範囲のフィルタリング ペイン
がプライマリ ペインの下に開きます。 このペインは上の図のように見えます。 同じように見えな
いときは、ペインのサイズを拡大すれば、下の部分に現れるはずです。
3. [エンティティ] と [関連性]、またはそのどちらかを、フィルタリングするデータ セットに応じて
選択します。
4. 日付情報を含む [エンティティ プロパティ] と [関連性プロパティ]、またはそのどちらかを選択し
ます。 注意: ここで選択したプロパティに有効なデータがないエンティティや関係はフィルタリン
グされず、モデル内にそのまま表示されます。
5. デフォルトで選択されていなければ、[データタイプの値] ドロップダウンで、 "Temporal" を選択
します。 次に、日付の書式化に使う言語を選択します。
6. [開始日の選択] フィールドは、ステップ 4 が終了した段階で自動的に設定されますが、範囲の最小
値を大きくしたければ、ここで別の値を入力できます。 例えば、保険データを探しているとき、
保険請求の提出された期間を日付でフィルタリングする場合、データ内の一番古い日付が 01/01/02
であったとします。 しかし、最初の数年の保険請求を見る必要はありません。 そこで仮に、[開始
日の選択] を 04/01/02 とします。 これで 04/01/01 以前のデータはすべてモデルから削除されま
す。
7. [終了日の選択] フィールドは、ステップ 4 の終了後は自動的に設定されますが、範囲の最大値を小
さくしたければ、ここで別の値を入力できます。 例えば、保険データを探していて、保険請求の
提出された期間でフィルタリングするとき、データ内の一番新しい日付が 10/12/31 であったとし
ます。 しかし、最近の数年の保険請求を見る必要はありません。 そこで仮に、[終了日の選択] を
07/12/31 とします。 これで 08/01/01 以後のデータはすべてモデルから削除されます。
8. [選択部分] と [タイムスパンのスクロールバー] を使って、結果を返す期間をより詳細に設定しま
す。 スライダーを動かし、ハンドルから手を放すと、エンティティと関係が削除されてモデルが
動的に更新されます。
数値フィルタの使用
Follow the steps below to use Numeric filters.
1. [表示] タブをクリックします。
2. [ツール] リボンで、[範囲のフィルタリング] をクリックします。 範囲フィルタ ペインが表示され
ます。
3. [エンティティ] と [関連性]、またはそのどちらかを、フィルタリングするデータ セットに応じて
選択します。
4. 数値情報を含む [エンティティ プロパティ] と [関連性プロパティ]、またはそのどちらかを選択し
ます。 注意: ここで選択したプロパティに有効なデータがないエンティティや関係はフィルタリン
グされず、モデル内にそのまま表示されます。
5. [データタイプの値] ドロップダウンで、"Numeric" を選択します。
6. [最小値] フィールドは、ステップ 4 の終了後は自動的に設定されますが、範囲の最小値を大きくし
たければ、ここで別の値を入力できます。 例えば、保険データを探していて、請求番号でフィル
タリングするとき、データ内の一番小さい請求番号が 1001 だとします。 ただし、最初の千件の請
ユーザ ガイド
505
Relationship Analysis Client
求を見る必要はありません。 そこで、仮に [最小値] を 2001 変更します。 これで請求番号が 2000
以下のデータはモデルからすべて削除されます。
7. [最大値] フィールドは、ステップ 4 の終了後は自動的に設定されますが、範囲の最大値を小さくし
たければ、ここで別の値を入力できます。 ステップ 6 の例で、データ内の最も大きい請求番号は
9000 で、最後の千件の請求は見なくてよいかもしれません。 そこで、仮に [最大値] を 8000 に変
更します。 これで請求番号が 8001 以上のデータはモデルからすべて削除されます。
8. どの範囲の値を返すかをスライダで設定します。 スライダーを動かすと、それに応じてエンティ
ティと関係が削除され、モデルが動的に更新されます。
モデル データの外観の変更
Data Hub モジュールの Relationship Analysis Client には、モデル データの外観の変更に使用できるい
くつかのツールがあります。 これを用いると、集中したいエンティティや関係を強調したり、コール
アウトを付けたりすることができます。
• 複数ビューの使用
• デフォルトのオプションの使用
• 選択したエンティティの外観の変更
• 選択した関係の外観の変更
• グラデーション設定の使用
• テーマの使用
• レイアウトの使用
複数ビューの使用
Relationship Analysis Client では、同じモデルの複数のビューを作成できます。 同様に、複数のビュー
を使用して、同じモデルの異なるパーツを比較できます。 これにより、最初のモデルの一貫性を保ち
ながらモデル データを操作できます。 複数のビューを切り替えながらモデルを比較することで、可能
な関係を特定する、特定のタイプのイベント (例えば、特定の国へのフライトなど) が特定の日時にど
の頻度で起こるか確かめる、レイアウトをいろいろ変えて同じデータを検討する、等々のことが可能
になります。
モデルの追加ビューを作成するには、グラフ ペインで [新規ビュー] をクリックします。 新しいタブ
に、同じモデルが "View 1" という名前で開きます。 このビューで、元のモデルと同じようにデータを
操作できます。 元のモデルまたはモデルの別のビューに変更を加えた後に、そのタブをクリックして
ビューを前面に移動すると、そのたびに周囲のペインが更新されることに気付きます。この更新はそ
のビューの情報に基づいて行われます。
エンティティや関係を追加または削除するか、加重として使われている関係プロパティを変更すると、
モデルの中心性尺度の扱いに変化が生じます。 複数のビューを作成し、その後の方のビューでモデル
に変更を加えることで中心性のアルゴリズムを再実行させると、変更がモデルにどう影響するかを確
認できます。 例えば、オサマ・ビンラディンがテロリズム モデルの特に中心的なエンティティだった
として、彼をこのモデルから取り除けば、もう特別に中心的なエンティティでなくなるのは明らかで
す。 前のビューでは人目を引かなかった別のプライマリ エンティティが発見される可能性もありま
506
Spectrum™ Technology Platform 8.0.0
第 22 章 : Data Hub モジュール
す。 複数のビューを使用すると、元のモデルをそのままにしながらこうした変更を行い、シナリオを
いろいろ切り替えて調べることができます。
中心性尺度の詳細については、ここ をクリックしてください。
デフォルトのオプションの使用
次の項目でデフォルトのオプションを指定できます。
• [汎用設定]
• エンティティの設定
• 関連性の設定
[汎用設定] の使用
ここでは、アニメーションと取り消し/やり直しについて、デフォルトのオプションを設定できます。
アニメーション
1. Relationship Analysis Client でビューから別のビューへの遷移過程をアニメーションで表示する場
合は、[レイアウトの移行をアニメーションで表示] チェック ボックスをクリックします。
2. ステップ 1 でチェック ボックスをクリックした場合は、[間隔] コントロールでアニメーションの
表示秒数を選択します。 デフォルト値は 1 秒で、最大 10 秒です。
取り消し
1. 取り消し/やり直し機能を使う場合は、[取り消し/やり直しのために履歴を変更] チェック ボック
スをクリックします。
2. ステップ 1 でチェック ボックスをクリックした場合は、Relationship Analysis Client に追跡させた
いインスタンスの数を [最大変更数] コントロールで選択します。 デフォルト値は 5 インスタンス
で、最大 25 インスタンスです。
[選択されたアイテム] このオプションでは、選択されたエンティティまたは関係の表現方法を変更で
きます。 カラーと輪郭の線幅を変更できます。
[現在のアイテム] このオプションでは、現在のエンティティまたは関係の表現方法を変更できます。
複数の項目が選択してある場合は最後の項目が現在の項目と見なされます。 この項目の情報は、
Relationship Analysis Client の選択ペインに表示されます。 選択項目と同様、現在の項目のカラーと
輪郭の線幅を変更できます。
[クエリ結果の制限] このオプションでは、Relationship Analysis Client にロードできるエンティティま
たは関係の数を制限できます。 どちらのフィールドも最大値は 1,000 で、これは Relationship Analysis
Client ツールに負荷がかかりすぎないようにするためです。
[エンティティ パネル スタイル オプション] このオプションでは、エンティティにスタイルを設定す
るときにパネル スタイル ツールに表示されるプロパティの最大数を決定できます。 デフォルトは 5
プロパティで、最大値は 10 です。
ユーザ ガイド
507
Relationship Analysis Client
エンティティ装飾の使用
ここでは、エンティティのデフォルトの形状とラベルの設定を決定できます。
エンティティの形状設定
• [形状]— エンティティのデフォルトの形状を設定します。
• [イメージ] — エンティティを表すイメージを設定します。
• [幅] — エンティティのデフォルトの幅を設定します。
• [アスペクト比を維持] — エンティティの幅に基づき、高さを自動的に調整してアスペクト比を維持
します。
• [高さ] — エンティティのデフォルトの高さを設定します。
• [塗りつぶし] — エンティティのデフォルトの面の色を設定します。
• [影] — エンティティの背後に影を付けます。
• [境界色]— エンティティの境界線のデフォルトの色を設定します。
• [線幅]— エンティティの境界線のデフォルトの線幅を設定します。
エンティティ ラベル設定
• [ラベルを表示] — モデルのラベルの表示をオンにします。
• [フォント] — ラベルのデフォルトのフォントを設定します。
• [フォント サイズ] — ラベルのデフォルトのフォント サイズを設定します。
• [位置] — エンティティ ラベルのデフォルトの位置をエンティティの内側または外側として設定しま
す。
• [ラベルの位置]— エンティティ ラベルのエンティティに対するデフォルトの相対位置を設定します。
ラベルは、エンティティの横または角に表示できます。
• [色] — ラベルのデフォルトの色を設定します。
• [Wrap label] — 最大幅を超えるラベルを複数行に分割します。
• [Trim label] — 最大幅を越えるラベルをトリムします。
• [最大幅] — ラベルに許容できる最大幅を設定します。
関係装飾の使用
ここでは、関係のラインおよびラベルの設定を決定できます。
関連線設定
• [線色] — 関係のデフォルトのカラーを設定します。
• [交差スタイル] — 交差したラインのデフォルトの外観を設定します。
• [線種] — エッジのデフォルトの外観を設定します。
• [線幅]— 関係のデフォルトの線幅を設定します。
• [始点の矢印] — 関係の始点 (ソース) のデフォルトの外観を設定します。
• [スケール] — 始点の矢印のデフォルトのサイズを設定します。
• [終点の矢印] — 関係の終点 (ターゲット) のデフォルトの外観を設定します。
508
Spectrum™ Technology Platform 8.0.0
第 22 章 : Data Hub モジュール
• [スケール] — 終点の矢印のデフォルトのサイズを設定します。
関連性ラベル設定
• [ラベルを表示] — モデルの関係ラベルの表示をオンにします。
• [色] — 関係ラベルのデフォルトの色を設定します。
• [フォント] — 関係ラベルのデフォルトのフォントを設定します。
• [フォント サイズ] — 関係ラベルのデフォルトのサイズを設定します。
• [関係からの距離] — ラベルと関係の間の距離を設定します。
• [Wrap label] — 最大幅を超えるラベルを複数行に分割します。
• [Trim label] — 最大幅を越えるラベルをトリムします。
• [最大幅] — ラベルに許容できる最大幅を設定します。
選択したエンティティの外観の変更
[スタイル設定] タブの [選択中のエンティティの設定] リボンを使用して、エンティティの外観を決定
できます。 ここでは、データの管理性を高めるために、特定のエンティティのサイズ、カラー、輪郭
線などを手動で変更して目立たせるといった作業を行えます。 例えば、米国関係のデータを調べてい
るとき、選択ツールで、人口が 10,000,000 より大きい州を特定して選択したとします。 次に、それ
らの州のエンティティを変更して、エンティティのフォントと形状を、人口が 10,000,000 未満の州と
異なるように変更します。
ここでの設定は選択したエンティティにだけ適用されます。一方、グラデーション設定はすべてに適
用されます。
いくつかのエンティティを選択した状態で、次のいずれかの設定を変更します。
エンティティの形状
選択したエンティティの形状を変更できます。
イメージ
選択したエンティティのイメージを変更できます。
プロパティ
選択したエンティティの現在のラベルを異なるプロパティに変更できます。
ラベル表示の切り替え
選択したエンティティのラベルの表示をオン/オフできます。
塗りつぶす色
選択したエンティティの面の色を変更できます。
エンティティ設定
リボンのエンティティ設定領域の右下隅にある矢印をクリックすると、以下の設定にアクセスできま
す。 形状設定とラベル設定を使ってエンティティの外観を変更できます。
ユーザ ガイド
509
Relationship Analysis Client
形状設定
• [形状]— エンティティの形状を設定します。
• [イメージ] — 選択したエンティティのイメージを変更できます。
• [幅]— エンティティの線幅を設定します。
• [アスペクト比維持のチェックボックス] — エンティティの幅に基づいて高さを自動的に調整し、ア
スペクト比を維持します。
• [高さ] — エンティティの高さを設定します。
• [塗りつぶし] — 選択したエンティティの面の色を設定します。
• [影] — 選択したエンティティの背後に影を付けます。
• [境界色] — 選択したエンティティの境界線の色を設定します。
• [線幅] — 選択したエンティティの境界線の線幅を設定します。
ラベル設定
• [ラベルを表示] — モデルのラベルの表示をオンにします。
注: エンティティと関係の両方でラベルの表示をオフにすると、大きなグラフの読み込みや変更に
かかる時間が短くなります。
• [フォント] — ラベルのフォントを設定します。
• [フォント サイズ] — ラベルのフォント サイズを設定します。
• [ラベルの位置] — エンティティ ラベルの位置をエンティティの内側または外側として設定します。
• [ラベルの位置] — エンティティ ラベルのエンティティに対する相対位置を設定します。 ラベルは、
エンティティの横または角に表示できます。
• [色のドロップダウンのボックス] — ラベルの色を設定します。
• [Wrap label] — 最大幅を超えるラベルを複数行に分割します。
• [Trim label] — 最大幅を越えるラベルをトリムします。
• [最大幅] — ラベルに許容できる最大幅を設定します。
[適用] をクリックして、形状およびラベルの設定の変更をモデルに適用します。
選択した関係の外観の変更
[スタイル設定] タブの [選択中の関連性の設定] リボンを使用して、関係の外観を決定できます。 ここ
では、データの管理性を高めるために特定の関係の色、線種、矢印などを手動で変更して目立たせる
といった作業を行えます。 ラベルの表示のオン/オフやエンティティとラベルの距離も設定できます。
例えば、保険請求に関するデータを調査しているとき、選択ツールで、"受給者" というラベルの付い
ている関係を特定して選択します。 次に、それらの関係の種類と色を他のラベルが付いている関係と
異なるものにします。 選択した関係のラベルのフォントとサイズを変更することもできます。
ここで行った設定は選択した関係にだけ適用されます。一方、グラデーション設定はすべての関係に
適用されます。
1 つ以上の関係を選択した状態で、次のいずれかの設定を変更します。
510
Spectrum™ Technology Platform 8.0.0
第 22 章 : Data Hub モジュール
線
選択した関係の外観を設定します。
ソース
選択した関係の始点 (ソース) の外観を設定します。
ターゲット
選択した関係の終点 (ターゲット) の外観を設定します。
プロパティ
選択した関係の現在のラベルを異なるプロパティに変更できます。
ラベル表示の切り替え
選択した関係のラベルの表示をオン/オフします。
[線色]
選択した関係の色を設定します。
[エッジ設定]
リボン上のエッジ設定領域の右下隅にある矢印をクリックすると、以下の設定にアクセスできます。
線の設定とラベルの設定を使って関係の外観を変更できます。
線の設定
• [線色]— 関係の色を設定します。
• [線種] — 関係の外観を設定します。
• [線幅—関係の線幅を設定します。
• [始点の矢印] — 選択した関係の始点 (ソース) の外観を設定します。
• [スケール] — 始点の矢印のサイズを設定します。
• [終点の矢印] — 選択した関係の終点 (ターゲット) の外観を設定します。
• [スケール] — 終点の矢印のサイズを設定します。
ラベル設定
• [ラベルのチェックボックスを表示] — モデルの関係ラベルの表示をオンにします。
注: エンティティと関係の両方でラベルの表示をオフにすると、大きなグラフの読み込みや変更に
かかる時間が短くなります。
• [色のドロップダウンのボックス] — 関係ラベルの色を設定します。
• [フォント] — 関係ラベルのフォントを設定します。
• [フォント サイズ] — 関係ラベルのサイズを設定します。
• [関係からの距離] — ラベルと関係の間の距離を設定します。
• [Wrap label] — 最大幅を超えるラベルを複数行に分割します。
• [Trim label] — 最大幅を越えるラベルをトリムします。
ユーザ ガイド
511
Relationship Analysis Client
• [最大幅] — ラベルに許容できる最大幅を設定します。
[適用] をクリックして、線およびラベルの設定の変更をモデルに適用します。
グラデーション設定の使用
[スタイル設定] タブの [グラデーション] リボンでは、データ内の実際の値を使用して、モデルのスタ
イルを視覚的に変更できます。 最小値と最大値で異なる設定を使用し、値に基づいてモデル要素を表
現したり、重要な要素をハイライト表示したりできます。 エンティティや関係の外観を変えることで
これを行います。 例えば、保険請求データを使用するモデルで、エンティティのいずれかのプロパ
ティが事故日であるとき、そのエンティティの色を期間の最初はピンク、最後は赤になるように設定
し、期間の途中で徐々にピンクから赤へ色を変化させることができます。
ここでの設定はすべてのエンティティまたは関係に適用されます。一方、エンティティ設定と関係設
定は選択したエンティティや関係にだけ適用されます。
グラデーション設定の詳細については、以下を参照してください。
• エンティティにグラデーション設定を使用する
• 関係にグラデーション設定を使用する
エンティティのグラデーション設定
これらの設定では、色と線の設定を用いて、エンティティ間の差異の変動幅を表現できます。 例え
ば、都市をエンティティで表現するモデルで、そのモデルのデータベースのいずれかのフィールドが
人口を表しているとき、黄色 (小都市) から緑色 (大都市) まで色のグラデーションを付けて人口の違い
を表現することができます。 同様に、形状を星型にして、小都市は小さな星、大都市は大きな星とい
うような設定も可能です (最大の星と最小の星の大きさを決めると、後は、その間でサイズが変化しま
す)。
グラデーション値
• [グラデーション プロパティ] — グラデーションのベースとなるフィールドを設定します。
• [最大値/最小値のオーバーライド] — グラデーションに使用されるデフォルトの最小値と最大値を
オーバーライドします。
• [最小値] — 最小のグラデーション プロパティの値を示します。
• [最大値] — 最大のグラデーション プロパティの値を示します。
• [値が低いほど有意性が高い] — 1 〜 5 のスケールで "1" が最高のレーティングの場合など、低い値
の方が高い値より望ましいということを指定します。
カラー設定
• [エンティティの色に適用] — カラー設定オプションを有効にします。
• [使用する色] — 既存の要素の色をオーバーライドします。
• [小さい値] — 小さい値のエンティティの色を設定します。
• [大きい値] — 大きい値のエンティティの色を設定します。
• [色の範囲の削減] —
512
Spectrum™ Technology Platform 8.0.0
第 22 章 : Data Hub モジュール
• [エンティティ色の調節方法] — エンティティの塗りつぶしの色は変えずに、(各エンティティのグラ
デーション値に基づき) 色調、彩度、または輝度を変化させます。
• [小さい] — スケールの最小値側の比率を設定します。 例えば、この値が "20" のとき、前のフィー
ルドで "Saturation" (彩色飽和) を選択し、塗りつぶしの色を赤に設定すると、グラデーション値の最
も小さいエンティティの色は 20% 赤になります
• [大きい] — スケールの最大値側の比率を設定します。 例えば、この値が "100" のとき、前のフィー
ルドで "Saturation" (彩色飽和) を選択し、塗りつぶしの色を赤に設定すると、グラデーション値の最
も大きいエンティティの色は 100% 赤になります。
サイズ設定
• [エンティティのサイズに適用] — サイズ設定オプションを有効にします。
• [使用するサイズ] — グラデーション設定に使うサイズを選択します。
• [小さい値] — 小さい値のエンティティのサイズを設定します。
• [大きい値] — 大きい値のエンティティのサイズを設定します。
• [エンティティ サイズの調節方法] — (各エンティティのグラデーション値に基づき) エンティティの
高さまたは幅を全体的に変化させます。
• [小さい] — スケールの最小値側の比率を設定します。 例えば、この値が "20" のとき、前のフィー
ルドで "幅" を選択すると、グラデーション値が最小のエンティティは、最大値の 20% の幅を持ち
ます。
• [大きい] — スケールの最大値側の比率を設定します。 例えば、この値が "100" のとき、前のフィー
ルドで "幅" を選択すると、グラデーション値が最大のエンティティは、100% の幅を持ちます。
• [ラベル サイズの調整] — エンティティのサイズに比例してエンティティのラベルのサイズを変化さ
せます。
[OK] をクリックして、形状およびラベルの設定の変更をモデルに適用します。
関係のグラデーション設定
これらの設定では、色と線の設定を用いて、関係間の差異の変動幅を表現できます。 都市データを扱
うモデルのいずれかの関係が人口を表しているとき、黄色 (小都市) から緑色 (大都市) まで色の勾配を
付けて人口の違いを表現することができます。 同様に、関係の線幅を細線 (人口の少ない都市) から太
線 (人口の多い都市) まで変化させることもできます。 最大の線幅と最小の線幅を決めると、後は、そ
の間で線幅が変化します。
グラデーション値
• [グラデーション プロパティ] — グラデーションのベースとなるフィールドを設定します。
• [最大値/最小値のオーバーライド] — ??? できます。
• [最小値] — 最小のグラデーション プロパティの値を示します。
• [最大値] — 最大のグラデーション プロパティの値を示します。
• [値が低いほど有意性が高い] — 1 〜 5 のスケールで "1" が最高のレーティングの場合など、低い値
の方が高い値より望ましいということを指定します。
カラー設定
ユーザ ガイド
513
Relationship Analysis Client
• [関連色に適用] — カラー設定オプションを有効にします。
• [使用する色] — グラデーション設定に使う色を選択できます。
• [小さい値]— 小さい値の関係の色を設定します。
• [大きい値] — 大きい値の関係の色を設定します。
• [関連色の調節方法] — 関係の色は変えずに、(各エンティティのグラデーション値に基づき) 色調、
彩度、または輝度を変化させます。
• [小さい] — スケールの最小値側の比率を設定します。 例えば、この値が "20" のとき、前のフィー
ルドで "Saturation" (彩色飽和) を選択し、塗りつぶしの色を赤に設定すると、グラデーション値の最
も小さい関係の色は 20% 赤になります。
• [大きい] — スケールの最大値側の比率を設定します。 例えば、この値が "100" のとき、前のフィー
ルドで "Saturation" (彩色飽和) を選択し、塗りつぶしの色を赤に設定すると、グラデーション値の最
も大きい関係の色は 100% 赤になります。
線の設定
• [関連線の太さに適用] — 線の設定オプションを有効にします。
• [使用するサイズ] — グラデーション設定に使うサイズを選択します。
• [小さい値] — 小さい値の関係のサイズを設定します。
• [大きい値] — 大きい値の関係のサイズを設定します。
• [関連線の太さの調節方法] — 関係のサイズを (各エンティティのグラデーション値に基づき) 変化さ
せます。
• [小さい] — スケールの最小値側の比率を設定します。 例えば、この値が "20" のとき、グラデーショ
ン値が最小の関係のサイズは最大サイズの 20% になります。
• [大きい] — スケールの最大値側の比率を設定します。 例えば、この値が "100" のとき、グラデー
ション値が最大の関係は 100% のサイズを持ちます。
• [ラベル サイズの調整] — 関係のサイズに比例して関係のラベルのサイズを変化させます。
[OK] をクリックして、色と線の設定の変更をモデルに適用します。
パネル スタイルの使用
[スタイル設定] タブの [パネル スタイル] リボンを使用すると、キャンバス内の各エンティティのプロ
パティ データを表示できます。モデル コンポーネント ペインや選択ペインに表示できるより多くの
モデル データが表示されます。
パネルにはタイトルが表示されます。これはエンティティの ID で、モデルの _stp_id フィールドから
得られます。 タイトルは最大 300 文字です。 パネルには、そのタイプに対して最もよく使われる最
大 10 のプロパティのデータも含まれます。エンティティに 10 を越えるプロパティが含まれる場合、
パネルには最も頻繁に使われる 10 のプロパティのデータが表示されます。 パネルに表示されるプロ
パティ数の設定の詳細については、ここを参照してください。 各プロパティ データは最大 200 文字
です。 パネルには、エンティティが持つ接続の数も表示されます。接続の合計数、入ってくるエン
ティティ (先行) の数、および出ていくエンティティ (後続) の数が表示されます。
514
Spectrum™ Technology Platform 8.0.0
第 22 章 : Data Hub モジュール
上の図で、パネルのタイトル、すなわちエンティティの ID は Khalid al-Mihdhar で、彼が個人である
ことがわかります。 Name、Associate、Nationality、Role、および Residence の各フィールドは、エ
ンティティ Khalid al-Mihdhar に関連付けられたプロパティです。 パネル下部の 13 という数字は、こ
のエンティティに入ってくる接続と出ていく接続の合計数を表しています。 パネル下部の入ってくる
矢印と "6" という数字によって、このエンティティに 6 つの先行があることがわかります。 同様に、
7 つの後続があります。 先行の数と後続の数を足すと、必ず接続の合計数になります。
手動で、または Discovery 機能を使用して、プロパティの値を編集したり、エンティティを追加した
りすると、パネル スタイル ビューは動的に更新されます。
[スタイル設定] タブの [パネル スタイル] リボンの [エンティティ] ボタンをクリックするだけで、パネ
ル スタイルを有効にできます。 このボタンを再度クリックすると、パネル スタイルを無効にできま
す。
パネル スタイルを使用している場合に他のエンティティに接続されているエンティティを削除する
と、次の図に赤い矢印で示すように、失われた接続を持つ選択されたエンティティに対して、パネル
の右下隅に小さい [+] 記号が表示されます。 失われたエンティティである部分モデルを開き、それが
部分モデルに返されたエンティティに以前接続されていた場合も同様です。 選択されたエンティティ
に以前接続されていたエンティティを復元したい場合は、[+] 記号をクリックします。 接続されていた
エンティティがモデルに再ロードされます。
テーマの使用
[スタイル設定] タブの [テーマ] リボンを使用すると、設定した条件に基づいて、モデル内の要素にス
タイルとフィルタを適用できます。 条件に設定した基準を満たす、エンティティや関係の美的な値を
あらかじめ決め、フィルタを使用してそれらの要素を自動的にモデルから非表示にできます。
1. [スタイル設定] タブの [テーマ] リボンの [定義] ボタンをクリックします。
2. [追加] をクリックします。
3. テーマの名前を入力して、[追加] をクリックします。
4. テーマに含めたいスタイルまたはフィルタの一覧から選択します。 エンティティの装飾、関連性
の装飾、グラデーション、またはフィルタから選択できます。
5. [条件の追加] をクリックします。
6. 条件を作成してテーマを適用するプロパティを選択します。 例えば、"Date" というプロパティを
選択し、"Equals" と "01/09/11" で式を完成させることができます。
ユーザ ガイド
515
Relationship Analysis Client
7. スタイルまたはフィルタのオプションを編集して、テーマを設定します。
8. [OK] を 2 回クリックします。
テーマを定義したら、[定義] > [適用] の順にクリックするか、[テーマ] ドロップダウンからテーマを選
択して、モデルに適用できます。 [定義] をクリックし、テーマを選択し、[変更] または [削除] をク
リックして、テーマを変更および削除することもできます。
別のテーマにも含めたい特性を含むテーマがある場合は、最初のテーマのコピーを作成し、名前を変
更し、変更できます。 例えば、州を表すエンティティがあり、モデルのデータベース内のフィールド
の 1 つが人口であるモデルがあるとします。 人口が 10,000,000 人を越える州に対して "Theme 10" を
作成し、これらのエンティティの塗りつぶし色として緑を設定できます (エンティティの形状や形状の
代わりに使用するイメージなどの設定の中で)。 人口 500 万人以上 1,000 万人未満の州を探したい場
合は、Theme 10 をコピーし、"Theme 5" として保存して、塗りつぶし色を青に変更できます。 この
ようにすると、大きい州を表すエンティティはモデル内の他の州とは異なって表示され、互いに似て
見えますが、人口 500 万人〜 1,000 万人の州と人口 1,000 万人以上の州を見分けることができます。
テーマをコピーするには
1. [定義] をクリックします。
2. 一覧からテーマを選択して、[コピー] をクリックします。
3. 新しいテーマの名前を [名前] フィールドに入力します。
4. [追加] をクリックして追加した設定をテーマに適用するか、[変更] をクリックして既存の設定をそ
のテーマ用に変更します。
レイアウトの使用
Relationship Analysis Client 内のレイアウト機能を使用して、エンティティと関係を視覚的に表示する
ようにモデル要素の外観を変更できます。 データによってはレンダリングの具合がモデルのレイアウ
トに左右されます。 Relationship Analysis Client には、モデルに対して 5 つのレイアウトが用意され
ています。 各レイアウトごとのオプションと、すべてのレイアウトに共通のオプションもあります。
各レイアウトの詳しい情報は、以下のリンクから入手してください。レイアウトに適したデータの種
類についての説明もあります。
• 共通オプション
• 循環レイアウト
• 階層レイアウト
• 有機レイアウト
• 直交レイアウト
• マップ レイアウト
共通オプション
次のオプションは、すべてのレイアウトに共通です。
• デフォルト — 最短の直線を使用して、関係をルーティングします。
516
Spectrum™ Technology Platform 8.0.0
第 22 章 : Data Hub モジュール
• オーガニック — エンティティが互いに重ならず、指定可能な最小限の距離を保つようにオーガニッ
クな方法で関係の経路を作成します。 このアルゴリズムは、モデル内のエンティティ ペアの間に十
分な空間がある場合にのみ有効です。
• 直交 — 垂直線と水平線のセグメントのみを使用してダイアグラムの関係の経路を作成します。 ダ
イアグラムのエンティティの位置は、そのまま固定されます。 通常、ルーティングされる関係は、
エンティティを横切ったり、他のエンティティと重なったりすることはありません。 ユーザーがエ
ンティティを動かした後に、一部の関係が再描画されることがあります。また、後に、追加された
関係が既存のダイアグラムのフィッティングのために描画されることもあります。
• Consider entity labels — エンティティ ラベルがモデル内のエンティティと重複しないことを保証
します。
• Use existing layout as a sketch — 初期のモデル レイアウトを望ましいレイアウトを生成するため
の略図と解釈します。 このアルゴリズムは、エンティティ パーティションのサークル境界に置くべ
きエンティティの特定を試み、エンティティ パーティションの中心を取り巻くようにそれらの循環
的な順序を維持しようとします。
• Selected elements only — 選択された要素にだけ設定を適用し、すべての要素には適用しません。
循環レイアウト
円形レイアウトでは、ネットワーク内のグループとツリー構造が強調されます。 ネットワークの接続
構造が解析され、パーティションが独立サークルとして整理されます。
円形レイアウトは、ソーシャル ネットワーク、ネットワーク管理、電子商取引などのモデル化に向い
ています。
レイアウト スタイル
• コンパクト (デフォルト) — 各パーティションが、モデルのいわゆる、二重連結コンポーネントを表
します。 このコンポーネントは、互いに交わらない 2 つの関係パスで到達可能なエンティティで構
成されます。 複数の二重連結コンポーネントに属するエンティティは、専ら 1 つのパーティション
に割り当てられます。
• 分離 — エンティティ パーティションの形成のされ方は Bcc Compact と似ていますが、複数の二重
連結コンポーネントに属するすべてのエンティティは、独立したパーティションに割り当てられま
す。
• カスタム グループ — サークルを形成するエンティティ パーティションをユーザが提供します。 こ
れらのパーティションを指定するためには、そのような追補的なレイアウト データを保有するデー
タ プロバイダをモデルに結合しなければなりません。
• 単一円 — すべてのエンティティが 1 つのサークルに整理されます。
パーティション スタイル
• Cycle — 特定のパーティションからのすべてのエンティティをサークルに置きます。
• Disk — 特定のパーティションからのエンティティで、他のパーティションからのエンティティとの
接続を続けているものはディスク境界に置かれ、それ以外のすべてのエンティティが内部に置かれ
ます。
ユーザ ガイド
517
Relationship Analysis Client
• Organic — パーティションからのエンティティを整理するために使われます。 他のパーティション
からのエンティティに接続するエンティティは、内部とディスク境界のどちらに置いてもかまいま
せん。
レイアウト オプション
円形レイアウトには、一般オプション、パーティション オプション、およびモデル ツリーの形状に関
連するオプションがあります。 [円形レイアウト オプション] リボンの右下隅にある矢印をクリックす
ると、これらの設定にアクセスできます。 設定を変更したら、[適用] をクリックして背景のキャンバ
スに変更内容を直ちに表示するか、別のタブに移動します。 [OK] をクリックして、キャンバスに戻り
ます。 変更を行い、後でデフォルト設定を復元したい場合は、[元に戻す] をクリックします。
一般オプション
• ドロップダウン オプションの詳細については、レイアウト スタイルを参照してください。
• Place children on common radius — 子エンティティに順応半径を適用して詰め込み度のより高い
描画を可能にします。 デフォルトでは、ツリー状の構造でサークルにつながるエンティティは常に、
ルート エンティティからの距離で決まる共通の半径に置かれます。 より詰め込み度の高い描画を実
現するには、共通半径を放棄し、代わりにそれらの子エンティティを実際の子エンティティのサイ
ズおよび周辺エンティティのサイズに順応するような半径に入れます。
パーティション オプション
• ドロップダウン オプションの詳細については、パーティション スタイルを参照してください。
• Automatically set radius/Minimum entity distance — レイアウト内の各サークル/ディスクの半径
を自動的に決定します。
• Manually set radius/Radius — 生成レイアウト内のすべてのサークル/ディスクに適用される固定半
径を決定します。
ツリー形状オプション
• 優先する子ウェッジ — ルート エンティティの子のために予約されるセクタの角度範囲を決定しま
す。 可能な角度範囲は 1 〜 359 です。 この値を小さくすると、エンティティ全体がルート エンティ
ティやモデルの中央から離れたところで動く印象が強まります。 一般的に、値を小さくするとレイ
アウトのコンパクト度が下がります。 値を極端に小さくすると、大量のスペースが消費されます。
• Minimum relationship length — 別の独立したサークルに置かれる 2 つのエンティティをつなぐ関
係の最短距離を決定します。 この値が小さいほど、生成されるレイアウトはコンパクトになります。
• Maximum deviation angle — 関係の最適な方向から角度にどれだけのずれが許容されるかを決定し
ます。 この値が大きいほど、生成されるレイアウトはコンパクトになります。 90 度より小さな角
度を選択すると、ツリー関係は環状に配置されたコンポーネントと交差する可能性があります。
• Compactness — レイアウトによって計算されるツリー関係の長さに影響を及ぼします。 この値が
小さいほど、ツリー関係は短くなり、レイアウト全体がコンパクトになります。 この値を大きくす
ると、コンパクト化がより難しくなり、レイアウトの計算に時間がかかります。
• Minimum entity distance — サークル/ディスク境界で隣接する 2 つのエンティティの間の最短距離
を決定します。 この距離が短いほど、生成レイアウトはコンパクトになります。
• Allow overlaps — 生成レイアウトのコンパクト化をさらに進めます。その結果、エンティティが少
し重複する可能性があります。
518
Spectrum™ Technology Platform 8.0.0
第 22 章 : Data Hub モジュール
階層レイアウト
階層レイアウトでは、有向モデル内の主要な方向やフローが強調されます。 モデルのエンティティは
各レイヤに階層的に配置されるので、モデルの関係の大部分は全体的に同じ方向 (つまり、トップから
ボトム) を向きます。 また、各レイヤ内でのエンティティの順序付けは、交差する関係の数を最小化
するように選ばれます。
階層レイアウトは、ワークフロー、データベース モデリング、プロセス モデリングなどのモデル化に
向いています。
印刷の向き
• 上から下へ (デフォルト) — レイアウトを上から下へ整列します。
• 下から上へ — レイアウトをボトムからトップへ展開します。これはレイアウトを X 軸で反転するこ
とを意味します。
• 左から右へ — レイアウトを左から右へ展開します。これはレイアウトを反時計回りに 90 度回転さ
せることを意味します。
• 右から左へ — レイアウトを右から左へ展開します。これはレイアウトを時計回りに 90 度回転させ
ることを意味します。
スタイル
• 直交 (デフォルト) — 水平と垂直の 90 度のライン セグメントのみ。
• 多角形 — 1 つ以上の 45 度のライン セグメントで構成される実線。
レイアウト オプション
階層レイアウトには、一般オプション、関係オプション、およびレイアウト オプションがあります。
[階層レイアウト オプション] リボンの右下隅にある矢印をクリックすると、これらの設定にアクセス
できます。 設定を変更したら、[適用] をクリックして背景のキャンバスに変更内容を直ちに表示する
か、別のタブに移動します。 [OK] をクリックして、キャンバスに戻ります。 変更を行い、後でデフォ
ルト設定を復元したい場合は、[元に戻す] をクリックします。
一般オプション
ドロップダウン オプションの詳細については、方向を参照してください。
• 最小距離 — 同一レイヤ内の 2 つのエンティティの最小距離、同一レイヤ内のエンティティと非隣接
関係との最小距離、同一レイヤ内の 2 つの関係の最小距離、2 つのレイヤ内の 2 つの関係の最小距
離。
• レイアウト コンポーネントを分離 — 接続されていないサブモデルを垂直に、すなわち積み重ねて
配置します。 それ以外の場合は、水平に配置されます。
• 左右対称 — もっと多くの曲がりがある場合でも、より左右対称なモデルを返します。
関係オプション
• 経路作成スタイル — 次のいずれかのオプションを指定します。
直交 (デフォルト) — 水平と垂直のライン セグメントのみ。
多角形 — 1 つ以上のライン セグメントで構成される実線。
ユーザ ガイド
519
Relationship Analysis Client
• Automatic relationship grouping — モデルの意味論を変えずに、できるだけ多くの関係をグルー
プ化します。 エッジは、共通のソース エンティティか、共通のターゲット エンティティでグルー
プ化されます。
• Backloop routing — ソース エンティティよりも上にあるターゲットに接続する関係をボトムで強
制的に終了させ、そのソースとターゲットのそれぞれのボトムに入ってダイアグラムの全体的な方
向性を高めます。
• ポート制約の最適化 — Relationship Analysis Client は、現在の制約が null の場合、よりよいソース
ポートを探そうとします。 ポート制約は、「どこかの位置で特定の関係が、そのソースまたはター
ゲットのエンティティに接続することを許す」という形式で表現されます。 弱いポート制約は、ポー
トの位置をエンティティの特定の側へ制限します。 強いポート制約は、ポートの位置を現在のポー
ト座標の位置に完全に固定します。
• 最小値 — 最初のセグメント、最後のセグメント、関係自体、または関係の間の距離の最小長。
• Slope (ポリライン ルーティング スタイルの場合のみ) — 垂直レイアウトで関係の中央にあるセグメ
ントの最小傾斜角を決定します。
• ラベル付け — 次のいずれかのスタイルを指定します。
None (デフォルト) — 選択された関係にラベルを表示しません。
Generic — 与えられたモデル内のラベルのラベル位置を見つけて、理想的にはそれらが、互いに重
なり合ったり他のモデル要素と重なったりしないようにします。 これはエンティティや関係を変更
しないで行われます。
Hierarchic (デフォルト) — 関係ラベルの最適な場所を見つけ、相互に重なり合ったり他のモデル要
素と重なったりしないようにします。
• Label model(Labeling の設定が "None" の場合は無効) — 次のいずれかのスタイルを選択します。
As Is (デフォルト) — ラベルを現在のまま、変更されないようにします。
Center — ラベルを関係の中央に配置します。
Side (デフォルト) — ラベルを関係のどちらかの側に配置します。
Free — ラベルの位置を未指定にできるようにします。
レイヤのオプション
• Assignment Policy — モデルのエンティティを独立したレイヤに割り当てます。 次のいずれかのス
タイルを選択します。
Optimal (デフォルト) — レイアウト内のすべての関係のレイヤ距離の合計が最小になるようにレイ
ヤを割り当てます。
Tight Tree Heuristic — Hierarchical-Optimal でレイヤリングを近似します。
BFS Layering (横型探索) (デフォルト) — 生成図形内での関係の広がりが高々 1 レイヤになるよう
にします。 エンティティ間のエッジが同一レイヤに属することを許します。
From Sketch — 入力モデルと似たレイヤリングが探されるようにします。 このレイヤリング戦略
を使用すると、関係で結ばれているエンティティであっても、レイアウト アルゴリズムは同じレイ
520
Spectrum™ Technology Platform 8.0.0
第 22 章 : Data Hub モジュール
ヤに配置することがあります。 これらの内側のレイヤ関係は常に垂直スタイルでルーティングされ
ます。
Topmost — 関係の入力がないすべてのエンティティ (次数 0) をレイアウトの一番上のレイヤに割
り当てます。 独立したレイヤの数を可能な限り少なくします。
• 尺度([スケッチから作成] 割り当てポリシーの場合のみ) — エンティティの周囲の光輪、またはレイ
ヤの重なりを計算するために使用する各差し込みのサイズを設定します。
• 光輪([スケッチから作成] 割り当てポリシーの場合のみ) — エンティティの高さの尺度を設定します。
• 最小サイズ — ([スケッチから作成] 割り当てポリシーの場合のみ) グループ エンティティが最小サイ
ズの標準を満たせば、そのラベルのサイズに順応できるようにします。
• 最大サイズ — ([スケッチから作成] 割り当てポリシーの場合のみ) グループ エンティティが最大サイ
ズの標準を満たせば、そのラベルのサイズに順応できるようにします。
• Alignment within layer — レイヤ内でのエンティティの整列方法を決定します。 次のいずれかのス
タイルを選択します。
エンティティの上端 — レイヤのエンティティを上端に揃えて整列させます。
エンティティの中央 — レイヤのエンティティを中央に揃えて整列させます。
エンティティの下端 (デフォルト) — レイヤのエンティティを下端に揃えて整列させます。
有機レイアウト
有機レイアウトは、フォース志向のレイアウト パラダイムをベースにしています。 レイアウトを計算
するとき、エンティティは、陽子や電子のように相互に反発する力 (フォース) を持つ物理的な実体と
見なされます。 エンティティ間の接続も物理的なアナロジーに従い、エンティティのペアをつなぐス
プリングと見なされます。 これらのスプリングは、長すぎたり、短すぎたりすると、その端点の間に
斥力または引力を生じさせます。 このレイアウト アルゴリズムでは、これらの物理的な力をシミュ
レートし、エンティティおよび関係から発せられる力の合計が (局所) ミニマムになるようにエンティ
ティの位置が再配置されます。 結果的に得られたレイアウトは本来的な意味での対称クラスタ構造モ
デルの形を呈すことが多く、エンティティはほどよく分散し、関係が交差することも多くありません。
オーガニック レイアウトは、企業ネットワーキング、システム管理、WWW 可視化などを使用するモ
デルに向いています。
出力
出力は、レイアウトが特定の形に、また指定されたアスペクト比で、フィットするかどうかを判断し
ます。
• 制約なし — レイアウトは、出力の特定の図形やアスペクト比に制約されません。
• アスペクト比 — レイアウトは、アスペクト比の制約を受けます。
• 楕円形 — レイアウトを楕円形で出力します。
• 長方形 — レイアウトを長方形で出力します。
ユーザ ガイド
521
Relationship Analysis Client
レイアウト オプション
オーガニック レイアウトには、一般オプションと制約オプションがあります。 [オーガニック レイア
ウト オプション] リボンの右下隅にある矢印をクリックすると、これらの設定にアクセスできます。
設定を変更したら、[適用] をクリックして背景のキャンバスに変更内容を直ちに表示するか、別のタ
ブに移動します。 [OK] をクリックして、キャンバスに戻ります。 変更を行い、後でデフォルト設定
を復元したい場合は、[元に戻す] をクリックします。
一般オプション
• Layout is deterministic — 入力モデルが同じで設定が同じとき、同じ結果を生成します。
• エンティティと関連性の重なり合いを許可 — 非常に高密度のモデルでも、エンティティと関係の重
複が生じないことを保証します。
• Allow entity overlaps — 非常に高密度のモデルでもエンティティの重複が生じないことを保証しま
す。
• Minimum entity distance— エンティティ (ラベル) の重複を抑えつつ、エンティティ間の距離を最
小に保ちます。
• Preferred relationship length — すべての関係を、一般的に好まれる長さで指定します。
• Compactness — 目に見えてコンパクトな、あるいは逆に、コンパクトでないレイアウトを生成し
ます。 "Compactness" プロパティの値が小さい場合は、広い図面に比較的余裕をもってエンティ
ティが分散されます。 値が 0.5 より大きいと不自然にコンパクトなレイアウトとなり、値が 1.0 に
近づくとレイアウトにスペースがほとんど無くなります。 コントロール性があるのは、品質設定が
中から高の範囲です。
• 品質/時間の比率 — ここには、巨大なモデル (エンティティ数が毎秒数千のオーダー) のレイアウト
を無難な品質で生成する場合は小さな値を設定し、逆に高品質のレイアウトを時間をかけて (例え
ば、数百のエンティティの処理に数分かけて) 生成する場合は大きな値を設定します。
制約オプション
• Output area — レイアウトが特定の形に、また指定されたアスペクト比で、フィットするかどうか
を判断します。 次のいずれかのスタイルを選択します。
制約なし — レイアウトは、出力の特定の図形やアスペクト比に制約されません。
Aspect ratio — レイアウトは、アスペクト比の制約を受けます。
Elliptical — レイアウトを楕円形で出力します。
Rectangular — レイアウトを長方形で出力します。
• Bounds — (出力エリアが楕円または長方形の場合のみ) 楕円または長方形の幅と高さの他に、X お
よび Y の範囲を設定できます。
• Aspect ratio — (出力エリアのアスペクト比が一定の場合のみ) 出力のアスペクト比を指定できます。
直交レイアウト
直交レイアウトは、無向モデル向けの汎用レイアウト プロバイダです。 重複のないコンパクトな図形
を生成します。交差も曲がりもほとんどありません。
522
Spectrum™ Technology Platform 8.0.0
第 22 章 : Data Hub モジュール
直交レイアウトは、データベース スキーマ、システム管理、ソフトウェア エンジニアリングなどを使
用するモデルに向いています。
直交レイアウトには次のオプションがあります。
• Layout style — 次のいずれかのスタイルを選択します。
Normal (デフォルト) — このレイアウトではノードのサイズは変更されません。 図面内に曲がり (ベ
ンド) が生じることはほとんどありません。
Box — 隣接オブジェクトの数と位置に応じてノードをサイズ変更することで、全体的なベンド (曲
がり) の出現を抑えます。
Fixed Box — "Box" スタイルと似ていますが、エンティティの元のサイズを維持します。
Fixed Mixed — "Mixed" スタイルと似ていますが、エンティティ元のサイズを維持します。
Mixed— "Box" スタイルと似ていますが、すべてのエンティティを同じ大きさにサイズ変更します。
追加的なベンド (曲がり) を導入し、隣接のエンティティと直交しない関係の最後の関係セグメント
を隣接エンティティへルーティングします。
Normal Tree — "Normal" スタイルと似ていますが、大きなサブツリーが特別なツリー レイアウト
アルゴリズムで処理されます。これは直交レイアウトよりもツリー状の構造に向いています。
Uniform — すべてのエンティティを同じサイズにしてからモデルを処理します。
• Reduce relationship crossings — 全般的な関係交差の発生を抑えます。 交差削減のコストは、レ
イアウトの実行時間の増加という形で現れます。
• Length reduction — 全般的な関係の長さを短くします。 この削減のコストは、レイアウト アルゴ
リズムの実行時間増という形で現れます。
• Consider entity labels — エンティティ ラベルがモデル内のエンティティと重複しないことを保証
します。
リボン上の有機レイアウト オプション領域の右隅下にある矢印をクリックすると、以下の設定にアク
セスできます。 設定を変更した後、 [適用] をクリックし、さらに [OK] をクリックすると変更が適用
されます。 変更を取り消したい場合は、[適用] も [OK] もクリックしていなければ、[元に戻す] で元に
戻すことができます。
[一般] タブ
• Layout style — 上の説明を参照。
• Grid spacing — レイアウト アルゴリズムで使われる仮想グリッド スペーシングを定義します。 各
エンティティは、その中央がグリッド ポイントに来るように配置されます。 エッジは、関係の端末
のエンティティがポートの配置を許す限り、そのセグメントがグリッド ラインに沿うような形でルー
ティングされます。 なお、このオプションでは、"Normal" レイアウト スタイルを選択した場合にの
みコントロール性が保証されます。
• Reduce relationship crossings — 上の説明を参照。
• Length reduction — 上の説明を参照。
• Minimize bends — 連鎖エンティティの螺旋配置を回避します。
ユーザ ガイド
523
Relationship Analysis Client
• Use randomization — 全体的な品質向上を高い確率で実現します。 このレイアウトの最適化のコス
トは、実行時間増と、その後のレイアウト実行における非決定論的な結末という形で現れます。
• Use face maximization —
• Use existing layout as a sketch—初期のモデル レイアウトを直交レイアウト生成のための略図と
解釈します。 このアルゴリズムでは、元の図面にあまり変更を加えずに、与えられた略図 (スケッ
チ) の "直交化" が試みられます。
• Consider entity labels — 上の説明を参照。
• Edge labeling — 次のいずれかのスタイルを選択します。 None (デフォルト) — 選択された関係に
ラベルを表示しません。 Generic — 与えられたモデル内のラベルについてラベル位置を調べ、理想
的にはそれらが、互いに重なり合ったり他のモデル要素と重なったりしないようにします。 これは
エンティティや関係を変更しないで行われます。 Integrated (デフォルト) — レイアウト スタイル
"Normal" と共に使います。 エンティティの配置と置き換えの両方のパス生成時に検討されます。 こ
の戦略では、関係ラベルがダイアグラム内の他のオブジェクトと重ならないことが保証されます。
• Edge label mode ("Labeling" の設定が "None" の場合は無効) — 次のいずれかのスタイルを選択し
ます。
As Is (デフォルト) — ラベルを現在のまま、変更されないようにします。
Center — ラベルを関係の中央に配置します。
Side (デフォルト) — ラベルを関係のどちらかの側に配置します。
Free — ラベルの位置を未指定にできるようにします。
スタイル
• Box — 隣接オブジェクトの数と位置に応じてノードをサイズ変更することで、全体的なベンド (曲
がり) の出現を抑えます。
• Fixed Box — "Box" スタイルと似ていますが、エンティティの元のサイズを維持します。
• Mixed— "Box" スタイルと似ていますが、すべてのエンティティを同じ大きさにサイズ変更します。
追加的なベンド (曲がり) を導入し、隣接のエンティティと直交しない関係の最後の関係セグメント
を隣接エンティティへルーティングします。
• Fixed Mixed — "Mixed" スタイルと似ていますが、エンティティ元のサイズを維持します。
• Normal (デフォルト) — このレイアウトではノードのサイズは変更されません。 図面内に曲がり (ベ
ンド) が生じることはほとんどありません。
• Normal Tree — "Normal" スタイルと似ていますが、大きなサブツリーが特別なツリー レイアウト
アルゴリズムで処理されます。これは直交レイアウトよりもツリー状の構造に向いています。
• Uniform — すべてのエンティティを同じサイズにしてからモデルを処理します。
レイアウト オプション
直交レイアウトには、一般オプションがあります。 [直交レイアウト オプション] リボンの右下隅にあ
る矢印をクリックすると、これらの設定にアクセスできます。 設定を変更したら、[適用] をクリック
して背景のキャンバスに変更内容を直ちに表示するか、別のタブに移動します。 [OK] をクリックし
て、キャンバスに戻ります。 変更を行い、後でデフォルト設定を復元したい場合は、[元に戻す] をク
リックします。
524
Spectrum™ Technology Platform 8.0.0
第 22 章 : Data Hub モジュール
• Layout style — 上の説明を参照。
• Grid spacing — レイアウト アルゴリズムで使われる仮想グリッド スペーシングを定義します。 各
エンティティは、その中央がグリッド ポイントに来るように配置されます。 エッジは、関係の端末
のエンティティがポートの配置を許す限り、そのセグメントがグリッド ラインに沿うような形でルー
ティングされます。 なお、このオプションでは、"Normal" レイアウト スタイルを選択した場合にの
みコントロール性が保証されます。
• Reduce relationship crossings — 全般的な関係交差の発生を抑えます。 交差削減のコストは、レ
イアウトの実行時間の増加という形で現れます。
• Length reduction — 全般的な関係の長さを短くします。 この削減のコストは、レイアウト アルゴ
リズムの実行時間増という形で現れます。
• Minimize bends — 連鎖エンティティの螺旋配置を回避します。
• Use randomization — 全体的な品質向上を高い確率で実現します。 このレイアウトの最適化のコス
トは、実行時間増と、その後のレイアウト実行における非決定論的な結末という形で現れます。
• Use face maximization —
• 関連性ラベル — 次のいずれかのスタイルを選択します。
None (デフォルト) — 選択された関係にラベルを表示しません。
Generic — 与えられたモデル内のラベルについてラベル位置を調べ、理想的にはそれらが、互いに
重なり合ったり他のモデル要素と重なったりしないようにします。 これはエンティティや関係を変
更しないで行われます。
Integrated (デフォルト) — レイアウト スタイル "Normal" と共に使います。 エンティティの配置と
置き換えの両方のパス生成時に検討されます。 この戦略では、関係ラベルがダイアグラム内の他の
オブジェクトと重ならないことが保証されます。
• 関連性ラベル モデル([ラベル付け] の設定が [なし] の場合は無効) — 次のいずれかのスタイルを選択
します。
As Is (デフォルト) — ラベルを現在のまま、変更されないようにします。
Center — ラベルを関係の中央に配置します。
Side (デフォルト) — ラベルを関係のどちらかの側に配置します。
Free — ラベルの位置を未指定にできるようにします。
マップ レイアウト
マップ レイアウトは、緯度と経度を使用してモデル内のエンティティの場所を表します。
マップ レイアウトは、関係、アクティビティ、または影響を特定できる地理データを含むモデルに向
いています。
レイアウト オプション
マップ レイアウトのプライマリ ペインには、ビューのフォーカスを変更したり、エンティティにズー
ムインまたはズームアウトするための操作が可能なコントロールがあります。 道路ビューと航空写真
ビューを切り替えることもできます。 航空写真ビューを選択した場合は、マップを見やすくするため
ユーザ ガイド
525
Relationship Analysis Client
にラベルをオフにできます。 マップをコントロールなしで表示したい場合は、二重矢印をクリックし
てコントロールを非表示にしてください。
注: マップ レイアウトを選択した場合、概要ペインは表示されません。
マップ レイアウトには、[マップ レイアウト オプション] リボンから利用できる一般オプションがあり
ます。
• 緯度 — モデルから緯度情報を含むフィールドを選択できます。
• 経度 — モデルから経度情報を含むフィールドを選択できます。
• 無効なエンティティのフィルタリング — 緯度情報または経度情報を含まないエンティティをフィル
タリングします。
モデル データの分析
Relationship Analysis Client の [データ] セクションには、モデル内のデータを分析できるツールがあり
ます。
• Discovery の使用
• Centrality の使用
• Groups の使用
• モデルの編集
Discovery の使用
Discovery 機能を使用すると、クエリで指定した条件に基づいて、最小数の要素をロードできます。
分析タスクに最も重要な追加の要素をロードすることもできます。 例えば、テロ対策データを含むモ
デルを使用して、特定の容疑者すなわちエンティティに結び付けられたアクティビティのみを見たい
場合があります。 このデータを表示してから、この容疑者と結び付いている他のエンティティを調べ
ることにしたとします。 Discovery を使用すると、この容器者と結び付いているすべての要素をロー
ドしたり、この容疑者の後続の要素のみをロードしたりできます。 .
追加要素を含めるためにモデルを再ロードしてから、これらの要素の一部を削除したい場合がありま
す。 前述の例では、その容疑者には関係者として若い息子や娘がいるかもしれません。 その年齢か
ら、彼らを容疑者とは見なしません。 Unload 機能を使用すると、"Son" または "Daughter" という関
係を持つエンティティを取得できます。
Discovery オプションを使用して、Discovery 機能の実行後に追加の関係を復元するかどうかを決定で
きます。 Discovery で取得する最大エンティティ数も設定できます。
要素を返す
[データ] タブで[クエリ] 機能を用いて特定のモデルを開く場合は、Discovery 機能でモデルにクエリ
を実行して、現在選択されているエンティティと何らかの関係性があるエンティティを取得できます。
次のタイプのエンティティを取得して部分モデルに返すことができます。
• 選択したエンティティに接続されているすべてのエンティティ
526
Spectrum™ Technology Platform 8.0.0
第 22 章 : Data Hub モジュール
• 選択したエンティティに先行するエンティティ
• 選択したエンティティに後続するエンティティ
これらの結果を絞り込むこともできます。具体的には、 [関係ラベル] を選択し、[接続状態]、[前に続
くもの]、または [後ろに続くもの] を選択します。 例えば、テロリストに関する部分モデルを確認し
ているとき、あといくつかエンティティを選択してから、[移動したもの] 関係ラベルを選択し、[接続
状態] をクリックします。 これにより、元のエンティティに加えて、元のエンティティとコネクショ
ンがあって、そこから辿れるすべてのエンティティもモデルにロードされます。
Discovery を使用するには
1. [開く] タブの [クエリ] 機能を使用して部分モデルを開きます。
2. 直接的なコネクションを特定したいエンティティを選択します。
注: 複数のエンティティを選択した場合、Discovery は最後に選択されたエンティティに対しての
み結果を返します。
3. コネクションを絞り込みたければ、[関係ラベル] を選択します。
4. [接続状態]、[前に続くもの]、または[後ろに続くもの] をクリックします。 モデルが再ロードされ、
元のエンティティとコネクションのある追加的なエンティティがあれば、予め設定した方法でそれ
が示されます。 すべてのエンティティを含めて、グラフが完全にロードされると、Discovery は無
効になります。
要素のアンロード
Discovery を使用して追加のエンティティと関係をモデルに読み込んでから、読み込まれたデータの一
部を Unload 機能を使用してアンロードできます。 上の例と同じ例では、既存のエンティティから辿
れるエンティティを読み込んでから、"wife" という関連性ラベルを持つエンティティをアンロードで
きます。なぜなら、男性の容疑者のみを探しているからです。
注: 以下では、ステップ 1 で選択したエンティティ以外にコネクションを持たないエンティティのみ
をアンロードできます。
1. Discovery を使用してモデルに追加されたエンティティをクリックするか、Discovery を使用して
モデルに追加されたエンティティとコネクションを持つエンティティをクリックします。
2. コネクションを絞り込みたければ、[関連性ラベル] を選択します (今回の例では、"Wife" を選択し
ます)。
3. [葉エンティティのアンロード] ドロップダウンから [接続]、[先行]、または [後続] を選択します。
このステップおよびステップ 2 で指定した条件を満たすエンティティがアンロードされて、モデル
が再ロードされます。
注: このオプションを使用できるかどうかは、モデルのコンテンツによって異なります。 [先行]
または [後続] のみ選択できる場合もあります。
要素を手動で選択し、 [選択範囲のアンロード] をクリックして、要素をアンロードすることもできま
す。
ユーザ ガイド
527
Relationship Analysis Client
Options
[Discovery オプション] ボックスで [関連性を塗りつぶす] をオンにすると、Discovery で見つかった追
加の関係を取得できます。 見つかったエンティティがキャンバス上に既にある追加エンティティ
(Discovery を使用する前に選択したエンティティを除く) に接続されていた場合、これらの関係も取得
されます。
取得するエンティティまたは関係の最大数も決定できます。 デフォルトは 100 です。
Centrality の使用
Centrality は、個々のエンティティおよび関係の重要性と重要度を測定する手段の 1 つです。 中心性
アルゴリズムを実行する場合、値が高くなればなるほど要素は重要になります。
1. [データ] タブの [中心性] リボンから、モデルに適用する中心性尺度の種類を選択します。
• 媒介値 (Betweenness) — エンティティとその他のエンティティの間の最短パスの個数を反映し
ます。
• 距離 (Closeness) — エンティティとその他のエンティティの間の測地距離の長さを反映します。
• 次数 (Degree) — エンティティの関係の個数を反映します
• 影響性 (Influence) — 高得点エンティティとの接続に基づくエンティティの重要性を反映しま
す。
2. アルゴリズムに適用したい方向を選択します。
• 入方向 (Incoming)— エンティティに入る関係によって結果が生じます。
• 出方向 (Outcoming) — エンティティから出る関係によって結果が生じます。
• 双方向 (Both) — エンティティに出入りする双方向の関係によって結果が生じます。
3. 近接性アルゴリズムを使用する場合は、結果を返す方法に適したボタンをクリックします。
• [標準] — エンティティの連結 (すなわち、関係) の数と、各エンティティへの最短パスの合計の
逆数に基づいて結果が生じます。
• [Dangalchev] — 別のエンティティにリンクされたエンティティの数だけでなく、リンクされた
各エンティティの関係の数も結果に影響します。
• [Opsah]— 各エンティティへの最短パスの逆数の合計に基づいて結果が生じます。
4. 影響性アルゴリズムを使用する場合は、[精度] スケールを動かして結果の精度を決定します。 精
度が低ければより正確な結果が返されますが、アルゴリズムの実行速度は遅くなります。
5. 関係の不利度を測りたい場合は、[重みとして関係プロパティを使用] をクリックし、使いたい関係
プロパティを [プロパティ] ドロップダウンから選択します。 この場合は、値が大きいほど、否定
的な関係性が高まります。
6. 関係プロパティを重みとして使用し、そのプロパティで低い値が高い値よりも良いと見なされてい
る場合は、[値が低いほど有意性が高い] ボックスをクリックします。 例えば、そのプロパティが
ある種のランク付けシステムの場合、通常は 1 または第 1 位が最も良い値です。 もう 1 つの例は、
528
Spectrum™ Technology Platform 8.0.0
第 22 章 : Data Hub モジュール
そのプロパティが距離で、最短経路を決定しようとしている場合で、 5 マイルは 10 マイルより良
いと見なされます。
7. 出力プロパティ名を選択したアルゴリズム以外の名前にしたい場合は、[デフォルトの出力プロパ
ティ名のオーバーライド] をクリックします。 次に、新しい名前を [プロパティ] フィールドに入力
します。
8. [OK] をクリックします。
Groups の使用
Groups 機能を使うと、二重連結要素を選択できます。二重連結要素とはモデル内で連結して分離でき
ず、たまたま何かエンティティが削除されたとき、モデルそのものを連結状態に陥らせるものです。
これは、2 つのエンティティの双方から相手の位置に到達できるパスが少なくとも 2 つあることを示
します。
モデルに二重結合がないか調べるには、[ツール] リボンの [モデルの詳細] ボタンをクリックし、[が二
重接続される] フィールドが "True" かどうかを確認します。
ここでは、関係の媒介性に関わるクラスタリング オプションも設定できます。 [データ] タブの [グルー
プ] リボンの [媒介性クラスタリング] ボタンをクリックします。 このダイアログ ボックスでは、グ
ループ数の最大値と最小値を設定し、この加重をどの関係プロパティで使うかを指定します。 [OK] を
クリックすると、設定した要件を満たすモデル内の要素が、異なる色で表示されます。 これらの要素
をハイライト表示することで、データに含まれる潜在的な関係を特定できます。
モデルの編集
この機能を使用すると、モデルからエンティティまたは関係を手動で追加または削除できます。 プロ
パティを手動で追加、編集、または削除したり、エンティティおよび関係に関連付けられたプロパティ
の値を変更することもできます。 この機能の例としては、モデルが米国のデータを使用して、州のエ
ンティティのプロパティの 1 つが人口である場合に、何らかの理由でモデルの作成後に人口が変化し
たら、その値を変更できます。
ここで行った設定は選択したエンティティと関係にだけ適用されます。
エンティティと関係の追加
ここでは、既存のモデルに手動でエンティティと関係を追加できます。 これは、モデルを作り直した
くはないが、モデルに追加したいエンティティの形式のデータやエンティティ間の新しい関係がある
場合に便利です。
1. 既存のモデルを開いた状態で、[データ] タブの [編集中] リボンの [モデルの編集] ボタンをクリッ
クします。
2. モデル内の任意の場所をクリックします。 [エンティティを追加] ダイアログ ボックスが表示され
ます。
3. ラベルと新しいエンティティのタイプを入力し、 [OK] をクリックします。 既存のタイプを選択す
るか、新しいタイプを入力できます。 エンティティの表示
ユーザ ガイド
529
Relationship Analysis Client
4. 新しいエンティティをクリックし、それとの関係を持つエンティティのところまでドラッグしま
す。 [関係を追加] ダイアログ ボックスが表示されます。
5. 関係のラベルを入力します。 これらの 2 つのエンティティの間で複数の関係をこの同じラベルに
より共有する必要がある場合は、関係の一意識別子を入力します。 これらの 2 つのエンティティ
の間で複数の関係を異なるラベルにより共有する必要がある場合は、一意識別子は必要ありませ
ん。
6. エンティティと関係に必要なプロパティを追加します。具体的には、エンティティまたは関係をク
リックし、編集リボンのEntities または Relationships をクリックします。
7. モデルを保存します。
エンティティと関係の削除
ここでは、既存のモデルのエンティティと関係を手動で削除できます。 これは、モデルを作り直した
くはないが、モデルから削除したいエンティティや関係がある場合に便利です。
1. 既存のモデルを開いた状態で、[編集中]リボンの [モデルの編集] ボタンをクリックします。
2. 削除したいエンティティまたは関係をクリックし、[削除] を押します。 モデルの随時更新
3. モデルを保存します。 これらの変更の後、 Centrality アルゴリズムを実行してモデルの変化を確認
してください。
注: エンティティを削除すると、それに接続された関係も削除されます。 しかし、関係を削除しても
それが接続していたエンティティは 削除されません。
プロパティの追加
既存のモデルを開き、少なくとも 1 つのエンティティまたは関係を選択した状態で、[データ] タブの
[編集中] リボンの [エンティティ] ボタン、[関連性] ボタン、または [すべて] ボタンをクリックしま
す。 [プロパティの編集] ダイアログ ボックスが表示されます。
1. 新しいプロパティの名前を [名前] フィールドに入力します。
2. 新しいプロパティのタイプを [タイプ] ドロップダウンで選択します。 次のデータ タイプがサポー
トされています。
データ タイプ
説明
Boolean
true と false の 2 つの 値を持つ論理タイプ。
Double
-1074
正と負の倍精度数を含む数値データ タイプ。値の範囲は、2
-52
(2-2
〜
1023
)×2
。 指数表記すると、値の範囲は、4.9E-324 〜
1.7976931348623157E308 となります。 指数表記については、次のサ
イトを参照してください。
http://en.wikipedia.org/wiki/Scientific_notation#E_notation
530
Spectrum™ Technology Platform 8.0.0
第 22 章 : Data Hub モジュール
データ タイプ
Float
説明
-149
正と負の単精度数を含む数値データ タイプ。値の範囲は、2
23
〜
127
(2-2 )×2
。 指数表記すると、値の範囲は、1.4E-45 〜 3.4028235E38
となります。 指数表記については、次のサイトを参照してください。
http://en.wikipedia.org/wiki/Scientific_notation#E_notation
Integer
31
正と負の整数を含む数値データ タイプ。値の範囲は、-2 (-2,147,483,648)
31
〜 2 -1 (2,147,483,647)。
Long
63
正と負の自然数を含む数値データ タイプ。値の範囲は、-2
63
(-9,223,372,036,854,775,808) 〜 2 -1 (9,223,372,036,854,775,807)。
String
文字シーケンス。
3. 新しいプロパティの値を [値] フィールドに追加します。
4. [追加] をクリックします。
5. [OK] をクリックします。
プロパティの変更
1. 既存のモデルを開き、少なくとも 1 つのエンティティまたは関係を選択した状態で、[データ] タブ
の [編集中] リボンの [エンティティ] ボタン、[関連性] ボタン、または [すべて] ボタンをクリック
します。 [プロパティの編集] ダイアログ ボックスが表示されます。
2. [名前] フィールドから値を変更したいプロパティを選択します。
3. 新しい情報を [値] フィールドに入力し、[変更] をクリックします。
4. [OK] をクリックします。
5. モデルを保存します。
プロパティの削除
この機能によって、エンティティおよび関係に関連付けられたプロパティを手動で削除できます。
1. 既存のモデルを開き、少なくとも 1 つのエンティティまたは関係を選択した状態で、[データ] タブ
の [編集中] リボンの [エンティティ] ボタン、[関連性] ボタン、または [すべて] ボタンをクリック
します。 [プロパティの編集] ダイアログ ボックスが表示されます。
2. [名前] フィールドから削除したいプロパティを選択し、[削除] をクリックします。
3. [OK] をクリックします。
4. モデルを保存します。
ユーザ ガイド
531
Data Normalization モジュー
ル
このセクションの構成
• Data Normalization モジュールとは . . . . . . . . . . . . . . . . .534
• Advanced Transformer . . . . . . . . . . . . . . . . . . . . . . . . . . .539
• Open Parser . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .544
• Table Lookup . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .610
• テーブル管理 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .613
• Transliterator . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .619
23
Data Normalization モジュールとは
Data Normalization モジュールとは
Spectrum™ Technology Platform では、レコード内の用語を調べて、その用語が好ましい形式である
かどうかを確認できます。
• Advanced Transformer — このコンポーネントは、一連のデータをスキャンして分割し、抽出デー
タと非抽出データを既存のフィールドまたは新しいフィールドに配置します。 詳細については、
Advanced Transformer(539ページ)を参照してください。
• Open Parser — このコンポーネントは、世界のさまざまなカルチャーからの入力データを、シンプ
ルかつ強力なパーシング グラマーでパースします。 このグラマーを使用すると、ドメイン パター
ンを表す一連の式を入力データのパース用に定義できます。 また、Open Parser は、統計データを
収集してパーシング マッチにスコアを付けるため、パーシング グラマーの効果を調べるのも容易で
す。 詳細については、Open Parser(544ページ)を参照してください。
• Table Lookup — このコンポーネントは、語を評価し、その語とその語の妥当性確認済みの形式と
を比較します。 語が適切な形式でない場合は、その語を標準バージョンに置き換えます。 Table
Lookup には、単語のフルスペルを省略形に変更する、単語の省略形をフルスペルに変更する、ニッ
クネームを正しい名前に変更する、ミススペルを訂正する機能等があります。 詳細については、
Table Lookup(610ページ)を参照してください。
• Transliterator — Transliterator は、ラテン文字など、異なるスクリプト (用字系) の間で文字列を変
換します。 詳細については、Transliterator(619ページ)を参照してください。
Data Normalization モジュールのテーブル
Advanced Transformer のテーブル
Advanced Transformer は、次のテーブルを使用して語を識別します。 新しいテーブルの作成、または
既存のテーブルの変更には、テーブル管理を使用してください。 詳細については、テーブル管理
(613ページ)を参照してください。
• 航空略語
• すべての頭字語と頭文字語
• 企業名の略語
• カナダの準州の略号
• コンピューティング/IT 略語
• 区切り記号
• ドイツ企業
• Fortune 1000
• 地理的方向指示の略号
• Global Sentry のノイズ語
• Global Sentry の認可国
• 政府機関の略語
• IATA 航空会社コード
534
Spectrum™ Technology Platform 8.0.0
第 23 章 : Data Normalization モジュール
• IATA 航空会社コード (国)
• 法律略語
• 医学略語
• 医療機関の頭字語
• 軍事略語
• ニックネーム
• セカンダリ ユニットの略号
• セカンダリ ユニットの逆順序
• シンガポールの略語
• スペイン語の略語
• スペイン語の方向指示の略号
• スペイン語の通り接尾語の略号
• 州名の略号
• 州名の逆順序
• 通り接尾語の略号
• 通り接尾語の逆順序
• 子会社と親会社
• 米国 陸軍の頭字語
• 米国 海軍の頭字語
Open Parser のテーブル
Open Parser は、次のテーブルを使用して語を識別します。 新しいテーブルの作成、または既存のテー
ブルの変更には、テーブル管理を使用してください。 詳細については、テーブル管理(613ページ)を
参照してください。
基本テーブル
基本テーブルは、Data Normalization モジュールのインストール パッケージに同梱されています。
• アカウント説明
• 企業
• 企業接頭語
• 企業接尾語
• 企業名称
• 接続詞
• 姓の前に付ける敬称
• 姓
• 一般接尾語
• ドイツ企業
• 名
ユーザ ガイド
535
Data Normalization モジュールとは
• 世代接尾語
• スペイン語の名
• スペイン語の姓
• 敬称
Core Names
Core Names のテーブルを使用するには、ライセンスが別途必要です。 詳細については、アカウント
エグゼクティブに問い合わせてください。
Core Names のテーブルは、Data Normalization モジュールのデータベース ロード ユーティリティを
使用してロードしなければなりません。 詳細については、 Spectrum™ Technology Platform インス
トール ガイドを参照してください。.
• 拡張姓
• 拡張名
Arabic Plus Pack
Arabic Plus Pack のテーブルを使用するには、ライセンスが別途必要です。 詳細については、アカウ
ント エグゼクティブに問い合わせてください。
Arabic Plus Pack のテーブルは、Data Normalization モジュールのデータベース ロード ユーティリティ
を使用してロードしなければなりません。 詳細については、 Spectrum™ Technology Platform インス
トール ガイドを参照してください。.
• アラビア語の姓 (アラビア文字)
• アラビア語の姓 (ローマ字)
• アラビア語の名 (アラビア文字)
• アラビア語の名 (ローマ字)
Asian Plus Pack
Asian Plus Pack のテーブルを使用するには、ライセンスが別途必要です。 詳細については、アカウ
ント エグゼクティブに問い合わせてください。
Asian Plus Pack のテーブルは、Data Normalization モジュールのデータベース ロード ユーティリティ
を使用してロードしなければなりません。 詳細については、 Spectrum™ Technology Platform インス
トール ガイドを参照してください。.
• 中国語の姓 (ネイティブ)
• 中国語の姓 (ローマ字)
• 中国語の名 (ネイティブ)
• 中国語の名 (ローマ字)
• 韓国語の姓 (ネイティブ)
• 韓国語の姓 (ローマ字)
• 韓国語の名 (ネイティブ)
536
Spectrum™ Technology Platform 8.0.0
第 23 章 : Data Normalization モジュール
• 韓国語の名 (ローマ字)
• 日本語の姓 (かな)
• 日本語の姓 (漢字)
• 日本語の姓 (ローマ字)
• 日本語の名 (かな)
• 日本語の名 (漢字)
• 日本語の名 (ローマ字)
Table Lookup のテーブル
Table Lookup は、次のテーブルを使用して語を識別します。 新しいテーブルの作成、または既存の
テーブルの変更には、テーブル管理を使用してください。 詳細については、テーブル管理(613ペー
ジ)を参照してください。
基本テーブル
基本テーブルは、Data Normalization モジュールのインストール パッケージに同梱されています。
• 航空略語
• すべての頭字語と頭文字語
• 企業名の略語
• カナダの準州の略号
• コンピューティング/IT 略語
• EU の頭字語
• Fortune 1000
• フランスの略語
• フランスの Arrondissement (郡) と Department (県) 番号の対応
• フランスの Commune (コミューン) と郵便番号の対応
• フランスの Department (県) と Region (地域圏) の対応
• フランスの Department (県) 番号と Department の対応
• 性別コード
• 地理的方向指示の略号
• ドイツの頭字語
• ドイツの都市と州コードの対応
• ドイツの市外局番と都市の対応
• ドイツの都市と州コードの対応
• ドイツの州の略語
• Global Sentry の認可国
• 政府機関の略語
• IATA 航空会社コード
• IATA 航空会社コード (国)
ユーザ ガイド
537
Data Normalization モジュールとは
• 法律略語
• 医学略語
• 医療機関の頭字語
• 軍事略語
• ニックネーム
• セカンダリ ユニットの略号
• セカンダリ ユニットの逆順序
• シンガポールの略語
• スペイン語の略語
• スペイン語の方向指示の略号
• スペイン語の通り接尾語の略号
• 州名の略号
• 州名の逆順序
• 通り接尾語の略号
• 通り接尾語の逆順序
• 子会社と親会社
• 英国の都市と郵便番号エリアの対応
• 英国の市外局番のプレフィックス
• 英国の市外局番と都市の対応
• 英国の郵便番号エリアと都市の対応
• 米国 陸軍の頭字語
• 米国 海軍の頭字語
• ZREPLACE (フランスの住所検証用の SAP モジュールで使用)
Core Names
Core Names のテーブルを使用するには、ライセンスが別途必要です。 詳細については、アカウント
エグゼクティブに問い合わせてください。
Core Names のテーブルは、Data Normalization モジュールのデータベース ロード ユーティリティを
使用してロードしなければなりません。 詳細については、 Spectrum™ Technology Platform インス
トール ガイドを参照してください。.
• 拡張姓エスニシティ
• 拡張性別コード
• 拡張名エスニシティ
Arabic Plus Pack
Arabic Plus Pack のテーブルを使用するには、ライセンスが別途必要です。 詳細については、アカウ
ント エグゼクティブに問い合わせてください。
538
Spectrum™ Technology Platform 8.0.0
第 23 章 : Data Normalization モジュール
Arabic Plus Pack のテーブルは、Data Normalization モジュールのデータベース ロード ユーティリティ
を使用してロードしなければなりません。 詳細については、 Spectrum™ Technology Platform インス
トール ガイドを参照してください。.
• アラビア語の姓エスニシティ (アラビア文字)
• アラビア語の姓エスニシティ (ローマ字)
• アラビア語の性別コード (アラビア語)
• アラビア語の性別コード (ローマ字)
• アラビア語の名エスニシティ (アラビア文字)
• アラビア語の名エスニシティ (ローマ字)
Asian Plus Pack
Asian Plus Pack のテーブルを使用するには、ライセンスが別途必要です。 詳細については、アカウ
ント エグゼクティブに問い合わせてください。
Asian Plus Pack のテーブルは、Data Normalization モジュールのデータベース ロード ユーティリティ
を使用してロードしなければなりません。 詳細については、 Spectrum™ Technology Platform インス
トール ガイドを参照してください。.
• CJK の姓エスニシティ (ネイティブ)
• CJK の姓エスニシティ (ローマ字)
• CJK の名エスニシティ (ネイティブ)
• CJK の名エスニシティ (ローマ字)
• 日本語の性別コード (かな)
• 日本語の性別コード (漢字)
• 日本語の性別コード (ローマ字)
Advanced Transformer
Advanced Transformer コンポーネントは、テーブルまたは正規表現を使用して、一連のデータ列をス
キャンして複数のフィールドに分割します。 このコンポーネントは、特定の語、あるいは語の右側ま
たは左側から指定した数だけ単語を抽出します。 抽出データと非抽出データを既存のフィールドまた
は新しいフィールドに配置できます。
例えば、次の住所フィールドから一組の情報を抽出し、その情報を別のフィールドに配置するとしま
す。
2300 BIRCH RD STE 100
これを行うには、語 STE と語 STE の右側にあるすべての単語を抽出して、フィールドを次のように
残す Advanced Transformer を作成します。
2300 BIRCH RD
ユーザ ガイド
539
Advanced Transformer
入力
Advanced Transformer は、データ フロー内の定義済みの入力フィールドを使用します。
オプション
Advanced Transformer のオプションを指定するには、ルールを作成します。 複数のルールを作成し
て、ルールを適用する順序を指定することができます。 ルールを作成するには、次の手順に従いま
す。
1. キャンバスで、Advanced Transformer のインスタンスをダブルクリックします。 [Advanced
Transformer オプション] ダイアログが表示されます。
2. 実行時インスタンスの番号を選択します。 実行時インスタンス オプションを使用して、コンポー
ネントの複数同時インスタンスを実行し、パフォーマンスを向上できるよう、データフローを設定
します。
3. [追加] ボタンをクリックします。 [Advanced Transformer ルール オプション] ダイアログが表示さ
れます。
注: 複数の Transformer ルールを追加する場合は、[上へ移動] ボタンと [下へ移動] ボタンを使用
して、ルールの適用順序を変更することができます。
4. 実行するトランスフォーム アクションのタイプを選択します。 選択肢を表 84 : Advanced
Transformer オプション (540ページ)に示します。
5. [OK] をクリックします。
表 84 : Advanced Transformer オプション
フィールド名
説明/有効値
ソース
スキャンおよび分割を評価するためのソース入力フィールドを指定し
ます。
次を使用して抽出
[テーブル データ] または [正規表現] を選択します。
<Drive>:\Program Files\Pitney
Bowes\Spectrum\server\modules\advancedtransformer\data にあ
る XML テーブルを使用してスキャンおよび分割を行う場合は、[テー
ブル データ] を選択します。 各オプションの詳細については、後述の
テーブル データ オプションを参照してください。
正規表現を使用してスキャンおよび分割を行う場合は、[正規表現] を
選択します。 正規表現には、データを分割するための追加オプション
が多数あります。 あらかじめパッケージ化された正規表現のいずれか
540
Spectrum™ Technology Platform 8.0.0
第 23 章 : Data Normalization モジュール
フィールド名
説明/有効値
をリストから選択して使用するか、Regex 構文を使用して独自の正規
表現を作成することができます。
例えば、最初の数値が見つかったときにデータを分割することができ
ます。"John Smith 123 Main St." では、"John Smith" が 1 つのフィー
ルドに格納され、"123 Main St." は別のフィールドに格納されます。
各オプションの詳細については、後述の正規表現オプションを参照し
てください。
テーブル データ オプション
非抽出データ
変換したデータを格納する出力フィールドを指定します。 元の値を置
換する場合は、[ソース] ドロップダウン ボックスで指定したものと同
じフィールドを [デスティネーション] フィールドで指定します。
[デスティネーション] フィールドに新しいフィールド名を入力するこ
ともできます。 新しいフィールド名を入力した場合、そのフィールド
名は、Advanced Transformer の下流にあるデータフローのコンポーネ
ントに表示されるようになります。
抽出データ
抽出したデータを格納する出力フィールドを指定します。
[抽出データ] フィールドに新しいフィールド名を入力することができ
ます。 新しいフィールド名を入力した場合、そのフィールド名は、
Advanced Transformer の下流にあるデータフローのコンポーネントに
表示されるようになります。
トークン化する文字
トークン化する特殊文字を指定します。 トークン化は、語を分離する
処理です。 例えば、"Smith, John" というデータの入ったフィールド
がある場合に、カンマをトークン化するものとします。 このデータ
は、次の語に分離されます。
• Smith
• ,
• John
語が分離されたら、スキャンしてカンマを抽出することによってデー
タを分割し、正規化するデータとして "Smith" と "John" を明確に識別
することができます。
テーブル
ユーザ ガイド
フィールドの分割の基礎となる語を含むテーブルを指定します。 テー
ブルの一覧は、Advanced Transformer のテーブル(534ページ)を参
541
Advanced Transformer
フィールド名
説明/有効値
照してください。 テーブルの作成または変更については、テーブル管
理(613ページ)を参照してください。
複数の単語からなる語を検索 指定された文字列内で複数の単語からなる語を検索できるようにする
には、このチェック ボックスを選択します。 例えば、
入力文字列 = "Cedar Rapids 52401"、ビジネス ルール = Cedar Rapids
= US というエントリを含むテーブルに基づいて文字列内の "Cedar
Rapids" を識別する、出力 = "Cedar Rapids" の存在を識別し、City な
どの新しいフィールドに語を格納するものとします。
複数の単語からなる語の検索では、最初にマッチが出現した時点で検
索は停止します。
注: このオプションを選択すると、パフォーマンスに悪影響が生じる
場合があります。
抽出
実行する抽出のタイプを指定します。 次のいずれかを選択します。
語を抽出
選択したテーブルによって識別される語を抽出しま
す。
語の右側の N
語
語の右側の N 語を抽出します。 抽出する語数を指
定します。 例えば、識別された語の右側の 2 語を
抽出する場合、2 を指定します。
語の左側の N
語
語の左側の N 語を抽出します。 抽出する語数を指
定します。 例えば、識別された語の左側の 2 語を
抽出する場合、2 を指定します。
語の右側または左側の語を抽出する場合、デスティネーション データ
または抽出データにその語自体を含めるかどうかを指定できます。 例
えば、
2300 BIRCH RD STE 100
というフィールドがあり、"STE 100" を抽出して、抽出データで指定
したフィールドに格納する場合、抽出データ フィールドにこの語を含
めることにします。すると、"STE" という略語と "100" という語が格
納されます。
デスティネーション データも抽出データも選択しない場合、その語は
格納されず、破棄されます。
正規表現オプション
542
Spectrum™ Technology Platform 8.0.0
第 23 章 : Data Normalization モジュール
フィールド名
説明/有効値
正規表現
あらかじめパッケージ化された正規表現をリストから選択するか、テ
キスト ボックスに独自の正規表現を作成します。 Advanced
Transformer は、標準の Regex 構文をサポートしています。
Java 2 プラットフォームには java.util.regex というパッケージが含ま
れており、正規表現を使用することができます。 詳細については、
java.sun.com/docs/books/tutorial/essential/regex/index.html にア
クセスしてください。
省略記号ボタン
新しい正規表現を追加または削除するには、このボタンをクリックし
ます。
グループに追加
定義済みの Regex 式を選択するか、新しい Regex 式を入力したら、
[グループに追加] をクリックして Regex グループを抽出し、検出され
たすべての Regex グループと共に、式全体を [グループ] リストに配
置します。
グループ
この列には、選択した正規表現グループの正規表現が表示されます。
例えば、Date Regex 式を選択した場合、テキスト ボックスに次の式
が表示されます。 (1[012]{1,2}|0?[1-9])[-/.]([12][0-9]|3[01]{1,2}|0?[1-9])[/.](([0-9]{4})) この Regex 式には 3 つの部分があり、式全体と各部分を
異なる出力フィールドに送ることができます。 式全体がソース フィー
ルドで検索され、ソース フィールドでマッチが見つかった場合は、関
連する部分が割り当てられた出力フィールドに移されます。 ソース
フィールドが "On 06/12/14" で、Date 式を適用する場合、データ全体
(つまり "06/12/14") を DATE フィールドに、"12" を MONTH フィール
ドに、"14" を DAY フィールドに、"2006" を YEAR フィールドに格納
するよう割り当てます。 日付が検索され、見つかった場合は、適切な
情報が該当する出力フィールドに移されます。
ソース フィールド: "On 06/12/14" DATE: "06/12/14" MONTH: "12" DAY:
"14" YEAR: "2006"
出力フィールド
出力フィールドを選択するためのプルダウン メニュー。
出力
Advanced Transformer は、新しい出力フィールドを作成しません。 定義したフィールドが出力に書き
出されるだけです。
ユーザ ガイド
543
Open Parser
Open Parser
Open Parser とは
Open Parser は、世界のさまざまなカルチャーからの入力データを、シンプルかつ強力なパーシング
グラマーでパースします。 このグラマーを使用すると、ドメイン パターンを表す一連の式を入力デー
タのパース用に定義できます。 また、Open Parser は、統計データを収集してパーシング マッチにス
コアを付けるため、パーシング グラマーの効果を調べるのも容易です。
Open Parser を使用して、次のことができます。
• ドメインエディタで定義したドメイン固有およびカルチャー固有のパーシング グラマーを使用して、
入力データをパースします。
• ドメインエディタで使用できるものと同じ、シンプルかつ強力なパーシング グラマーを使用して
Open Parser で定義した、ドメインに依存しないパーシング グラマーを使用して、入力データをパー
スします。
• ターゲット入力データファイルを使用してジョブを実行する前に、パーシング グラマーをプレビュー
して、サンプル入力データがどのようにパースされるかをテストします。
• パーシング グラマー結果をトレースして、定義した式にトークンがどれくらいマッチしたか、また
はマッチしなかったかを確認し、マッチング処理に関する理解を深めます。
パーシング グラマーの作成をすぐに開始したい場合は、このワークフロー ダイアグラムを使用して、
必要な情報に直接アクセスしてください。
次のセクションでは、Open Parser の概念について説明します。
544
Spectrum™ Technology Platform 8.0.0
第 23 章 : Data Normalization モジュール
• パーシングとは(545ページ)
• トークンとは(545ページ)
• パーシング グラマーとは(545ページ)
• ドメイン パターンとは(548ページ)
• カルチャー階層とは(548ページ)
• CultureCode とは(549ページ)
• スコアリングとは(550ページ)
パーシングとは
パーシングは、連続した入力文字またはトークンを解析し、正しい出力コンポーネントに格納する処
理です。
Open Parser プロセスは、一連のレコード内の指定された入力フィールドにある連続した文字を解析
し、定義済みのグラマーを使用して連続したトークンに分類し、マッチング トークンを割り当てた
フィールドに出力します。 定義済みのパーシング グラマーに準拠するレコードは、フラグが立てら
れ、パースされます。 定義済みのパーシング グラマーに準拠しないレコードは、フラグが立てられま
すが、パースされません。 パーシング プロセスの詳細については、カルチャー固有のパーシング グ
ラマーの使用(551ページ)およびドメインに依存しないパーシング グラマーの定義(551ページ)を参
照してください。
トークンとは
トークンとは、分類化されたテキストのかたまりです。 トークン化するとは、入力文字列のセクショ
ンをスペースやハイフン、その他の区切り文字列でそれぞれのトークンに区切り、分類することです。
トークンは、定義済みのグラマーに基づいて、出力フィールドに処理されます。
トークンの詳細については、Tokenize コマンド(560ページ)およびToken コマンド(566ページ)を
参照してください。
パーシング グラマーとは
パーシング グラマーとは、人間が読むことのできるシンプルかつ強力なパーシング言語で作成された
式のセットです。 パーシング グラマーは、連続した文字列をドメイン パターンとも呼ばれる一連の
名前付き要素にマップします。 定義したドメイン パターンは、入力データの検索、ドメイン パター
ンのマッチング、そしてマッチしたデータを定義した出力フィールドに返すことに使用できます。
パーシング グラマーは、ドメインエディタでカルチャーとドメインに関連付けることができます。
Open Parser で、ドメイン情報に依存せずに定義することもできます。
カルチャー固有のパーシング グラマー
ドメインエディタで作成したカルチャー固有のパーシング グラマーは、カルチャーとドメインに関連
付けられた、検証済みのパーシング グラマーです。 カルチャー固有のパーシング グラマーは、親か
らプロパティを継承できます。 カルチャー固有のパーシング グラマーは、CultureCode に対して入力
データを評価し、パーシング グラマーに含まれるカルチャー設定に従って、データを処理します。 カ
ユーザ ガイド
545
Open Parser
ルチャー固有のパーシング グラマーの詳細については、ドメインエディタ(601ページ)を参照してく
ださい。
ドメインに依存しないパーシング グラマー
Open Parser で作成したカルチャーに依存しないパーシング グラマーは、カルチャーとドメインに関
連付けられていない、検証済みのパーシング グラマーです。 ドメインに依存しないパーシング グラ
マーは、親からプロパティを継承せず、入力データの CultureCode 情報を無視します。 ドメインに依
存しないパーシング グラマーの詳細については、ドメインに依存しないパーシング グラマーの定義
(551ページ)を参照してください。
パーシング グラマーの構文の概要
有効なパーシング グラマーは、次のものを含みます。
• 連続したトークン、またはドメイン パターンをルール変数として定義するルート変数 (必須)。
• 有効な文字セット、およびその文字セットの出現によってドメイン パターンの一部と認識されるシー
ケンスを定義するルール変数。 詳細については、Rule セクションのコマンド(563ページ)を参照
してください。
• パーシングする入力データのトークン化に使用される文字 (オプション)。 トークン化文字は、トー
クンの開始と終了を決定する、スペースやハイフンなどの文字です。 トークン化文字は、連続する
文字を一連のトークンに分解する主要な方法です。 トークン化コマンドを NONE に設定して、フィー
ルドをトークン化しないこともできます。 トークン化を None に設定する場合、グラマー ルールの
ルール定義内にスペースを含めなければなりません。
• 入力データのトークンに対する大文字と小文字の区別オプション (オプション)。
• パースする入力フィールド (必須)。 入力フィールドは、パースするソース データ レコード内のフィー
ルドを指定します。
• パースされた結果データ用の出力フィールド (必須)。 出力フィールドは、パースされた各結果トー
クンをどこに格納するかを定義します。
• マッチング トークンを区切るための結合文字 (オプション)。
有効なパーシング グラマーには、次の目的で、その他のオプション コマンドも含まれます。
• テーブル内のトークンのマッチング
• テーブル内の複合トークンのマッチング
• Regex タグの定義
• 引用符で囲まれたリテラル文字列
• 式の数量詞 (オプション)。 式の数量詞の詳細については、Rule セクションのコマンド(563ページ)
および式の数量詞: Greedy、Reluctant、および Possessive な動作(574ページ)を参照してくだ
さい。
• グループ化、コメント化、および割り当てのためのその他のインジケータ (オプション)。 グループ
化した式の詳細については、グループ化演算子 ( )(570ページ)を参照してください。
パーシング グラマーのルール変数は、ドメイン パターン内に連続する文字またはトークンの階層化ツ
リー構造を形成します。 例えば、<FirstName>、<MiddleName>、および <LastName> というトー
546
Spectrum™ Technology Platform 8.0.0
第 23 章 : Data Normalization モジュール
クンを含む名前入力データに基づいてドメイン パターンを定義するパーシング グラマーを作成できま
す。
次の入力データを使用します。
Joseph Arnold Cowers
ドメイン パターン内の 3 つのトークンとして、このデータ文字列を表すことができます。
<root> = <FirstName><MiddleName><LastName>;
このドメイン パターンのルール変数は次のようになります。
<FirstName> = <given>;
<MiddleName> = <given>;
<LastName> = @Table("Family Names");
<given> = @RegEx("[A-Za-z]+");
この簡単なサンプル グラマーに基づいて、Open Parser はスペースでトークン化を行い、トークン
Joseph を名として解釈します。最初のトークン内の文字は、[A-Za- z]+ という定義にマッチし、トー
クンが定義済みのシーケンス内にあるからです。 必要に応じて、式に別の式を続けることができま
す。
例
<variable> = "some leading string" <variable2>;
<variable2> = @Table ("given") @RegEx("[0-9]+");
グラマー ルールとは、変数が 1 つまたは複数の式に等しい文法的な文です。 各グラマー ルールは次
の形式になります。
<rule> = expression [| expression...];
グラマー ルールは次のルールに従わなければなりません。
• <root> は特殊な変数名で、ドメイン パターンを定義しているため、グラマーの中で最初に実行さ
れるルールです。 <root> は、グラマー内の他のルールから参照できません。
• <rule> 変数は、自分自身を直接的または間接的に参照できません。 ルール A がルール B を参照
し、ルール B がルール C を参照し、ルール C がルール A を参照する場合、循環参照が作成されま
す。 循環参照は許可されていません。
• <rule> 変数は、1 つまたは複数の式と同等です。
ユーザ ガイド
547
Open Parser
• 各式は、OR で分離されます。OR は、パイプ文字 (|) で表されます。
• 式は一度に 1 つずつ調べられます。 最初にマッチする式が選択されます。 それ以降の式は調べられ
ません。
• 変数名は、英字、数字、アンダースコア (_)、およびハイフン (-) で構成することができます。 変数
の名前は、任意の有効な文字で開始することができます。 指定した出力フィールド名がこの形式に
準拠していない場合、エイリアス機能を使用して、変数名を出力フィールドにマップしてください。
式は次のいずれかのタイプになります。
• <another_variable>
• 文字列。 単一引用符または二重引用符で囲まれた 1 つ以上の文字です。
例
"McDonald" 'McDonald' "O'Hara" 'O\'Hara' 'D"har' "D\"har"
ドメイン パターンとは
ドメイン パターンとは、名前、住所または顧客番号のように理解可能または変更されたデータ構造と
して表したい入力データの中の、連続した一つまたは複数のトークンです。 ドメイン パターンは、入
力データからパース可能な任意の数のトークンで構成できます。 ドメイン パターンは、<root> 式とし
てパーシング グラマーに表現されます。 入力データには、そのようなトークンが使用しにくいフォー
マット、または混在フォーマットで含まれることがしばしばあります。 例を次に示します。
• 入力データには名と姓に分離したい名前が単一のフィールドに含まれている。
• 入力データには複数のカルチャーの住所が含まれており、特定のカルチャーの住所データのみを抽
出したい。
• 入力データには電子メール アドレスが埋め込まれた自由形式テキストが含まれており、電子メール
アドレスを抽出して個人データとマッチングし、データベースに格納したい。
ドメイン パターンの詳細については、ドメインエディタ(601ページ)を参照してください。
カルチャー階層とは
カルチャー階層は、パーシング グラマーを構成するための主要な概念です。 カルチャー階層を使用す
ると、グローバルおよび特定のカルチャー属性 (CultureCode) に従って、パーシング グラマー ルール
を定義および割り当てることができます。 Open Parser のドメインエディタは、入力データに含まれ
る CultureCode を使用し、カルチャー固有のパーシング グラマーに基づいてデータをパースします。
例を次に示します。
• 言語、カルチャー、または地域に固有のパーシング グラマー ルールを定義する。
• 特定の言語またはカルチャー/地域にグローバル グラマー ルールを割り当てる。
• カルチャーの継承を使用して、カルチャー コードが割り当てられているが、そのカルチャー コード
用のグラマー ルールが定義されていないレコードをパースする。
カルチャーは次の階層になっています。
• グローバル カルチャー
548
Spectrum™ Technology Platform 8.0.0
第 23 章 : Data Normalization モジュール
• 言語
• カルチャー/地域
カルチャー階層において、カルチャー/地域の親は言語であり、言語の親はグローバル カルチャーで
す。
• グローバル カルチャーはカルチャーに依存せず、言語にとらわれません。 すべてのカルチャーおよ
び言語にわたるパーシング グラマーを作成するには、グローバル カルチャーを使用してください。
• 言語は、特定のカルチャー/地域ではなく、言語に関連付けられています。
• カルチャー/地域は、言語と国または地域に関連付けられています。
カルチャー/地域は、親の言語のプロパティを継承します。 言語は、グローバル カルチャーのプロパ
ティを継承します。 したがって、ある言語を共有する複数の国々で使用するため、その言語でパーシ
ング グラマーを定義することができます。 その後、基本となる言語カルチャーと同じ言語を共有して
いるが、固有の住所指定、名前指定、あるいは他の国または地域的な違いを持つ特定の国または地域
用に特殊化されたパーシング グラマーで、その言語のグラマー ルールをオーバーライドすることがで
きます。
カルチャーの継承を使用して、カルチャー コードが割り当てられているが、そのカルチャー コード用
のグラマー ルールが定義されていない入力レコードをパースすることもできます。 この場合、Open
Parser は、グラマー ルールが割り当てられている言語コードを検索します。 そのような言語コード
が存在しない場合、Open Parser はグローバル カルチャー内で割り当て済みグラマー ルールを検索し
ます。
ドメインエディタは、言語コードとカルチャー コードを組み合わせて使用し、言語とカルチャー/地域
をそれぞれ表します。
カルチャーの詳細については、ドメインエディタ(601ページ)を参照してください。
CultureCode とは
CultureCode とは、入力で定義されたコードで、カルチャー固有のパーシングに使用するパーシング
グラマーを決定します。
CultureCode は、カルチャーごとに一意な名前を使用します。 名前は、言語に関連付けられた小文字
2 文字のカルチャー コードと、国または地域に関連付けられた大文字 2 文字のサブカルチャー コード
の組み合わせで、日本語 (日本) は "ja-JP"、英語 (米国) は "en-US" となります。 2 文字の言語コード
が存在しない場合は、3 文字のコードが使用されます。例えば、ウズベク語 (ウズベキスタン、キリル
文字) は "uz-Cyrl-UZ" となります。
言語は、2 桁の小文字の言語コードによってのみ指定されます。 例えば、"fr" はフランス語の中立的カ
ルチャーを指定し、"de" はドイツ語の中立的カルチャーを指定します。
注: このルールと相反するカルチャー名が 2 つあります。 カルチャー "zh-Hans" (簡体字中国語) と
"zh-Hant" (繁体字中国語) は、中立的カルチャーです。 カルチャー名は現在の標準を表すものな
ので、古い名前である "zh-CHS" および "zh-CHT" を使用する理由がないのであれば、こちらを使
用してください。
ユーザ ガイド
549
Open Parser
スコアリングとは
ルール変数の中の各式には、オプションでスコア重みを含めることができます。 スコア重み
は、:Score(Weight) を式の末尾、かつ OR 演算子 (|) や変数の末尾を表す文字 (;) の前に付加するこ
とによって指定します。ここで、Weight は 0 〜 100 の整数です。
式に明示的なスコアリング コマンドがない場合、重み値は 100 と仮定されます。 この場合、パーシ
ング スコアは 0 または 100 になります。
ルール変数が他のルール変数を含む場合、スコア値は下位のルールと平均されます。 例えば、次の
ルール変数があるとします。
<root> = <a> <b> <c>;
<a> = 'a':Score (100);
<b> = 'b':Score (50);
<c> = 'c':Score (100);
<root> のスコアは 83 と計算されます [(100+50+100)/3]。 平均を計算する際、スコアは最も近い整
数に四捨五入されます。
合計平均スコアが ParserScore フィールドの出力になります。 ParserScore の値は、パーシング グラ
マーでの定義に従って、0 〜 100 の間になります。 マッチが返されない場合は、0 が返されます。
親の式のスコア重みは、子の式のスコア重みに影響を与えることがあります。 例えば、ルール <C> が
ルール <A> および <B> に次のように参照されるものとします。
<A> = <C>;
<B> = <C>:Score(50);
<C> = @Table("something"):Score(50);
<A> がマッチする場合、スコアは <C> の値の 100% (デフォルト スコア) で、スコア重みは 50 になり
ます。 しかし、<B> がマッチする場合、その値は <C> の 50% で、スコア重みは 25 になります。
スコアリングの使用方法については、Score コマンド(567ページ)を参照してください。
入力
Open Parser は、パーサー グラマーで定義した入力フィールドを受け入れます。 詳細については、
InputField コマンド(561ページ)を参照してください。
入力データのカルチャー識別子に基づいてパーシングを実行する場合、Open Parser ではそのフィー
ルド名が CultureCode である必要があります。 入力データに格納されているカルチャー識別子デー
タがこのフィールド名を使用していない場合は、任意の Open Parser ステージへの入力を含むチャネ
ルで、フィールド名を CultureCode に変更してください。
フィールドの名前変更の詳細については、「ツール」の章の「フィールドの名前変更」を参照してく
ださい。 サポートされている CultureCode の詳細については、Open Parser のカルチャー コード
(586ページ)を参照してください。
550
Spectrum™ Technology Platform 8.0.0
第 23 章 : Data Normalization モジュール
オプション
カルチャー固有のパーシング グラマーの使用
カルチャー固有のパーシング グラマーは、ドメインエディタで作成します。 カルチャー固有のパーシ
ング グラマーを作成したら、それを Open Parser で使用して、入力データをパースできます。
カルチャー固有のドメイン グラマーを使用するには、次の手順に従います。
1. [ルール] タブの [カルチャー固有のドメイン グラマーを使用] をクリックします。
2. [ドメイン] リストからドメインを選択します。 ドメインエディタでドメイン パターンを定義でき
ます。 ドメインの定義の詳細については、ドメインエディタ(601ページ)を参照してください。
3. [追加] をクリックして、[カルチャー] ドロップダウン リストからカルチャーを選択します。 この
ステップを繰り返して、必要な数のカルチャーを追加します。すべてのカルチャーをルールに追加
するには、[すべて追加] チェック ボックスをクリックします。
ドメインエディタでカルチャー プロパティを定義できます。 カルチャーの詳細については、ドメ
インエディタ(601ページ)を参照してください。
4. [上へ移動] ボタンと [下へ移動] ボタンを使用して、パーサーを実行する順序を設定します。
5. 入力を正しくパースしたカルチャーごとに Open Parser がレコードを返すようにするには、[複数
のパース済みレコードを返す] をクリックします。 このボックスをチェックしない場合、Open
Parser は、カルチャーにかかわらず、パーサー スコア 100 を達成した最初のレコードの結果を返
します。 パーサー スコア 100 のレコードにヒットすることなく、すべてのカルチャーが実行され
た場合、Open Parser は 100 に最も近いスコアのレコードを返します。 複数のカルチャーが、100
未満の同じ高スコアのレコードを返す場合、ステップ 4 で設定した順序によって、どのカルチャー
のレコードを返すかが決定されます。
6. [プレビュー] タブをクリックして、パーシング グラマーをテストします。 詳細については、を参
照してください。 パーシング グラマーのプレビュー(553ページ)
7. 必要な操作が終了したら、[OK] をクリックします。
ドメインに依存しないパーシング グラマーについては、ここをクリックして説明を参照してくださ
い。
パーシング グラマーのプレビューについては、ここをクリックして説明を参照してください。
ドメインに依存しないパーシング グラマーの定義
ドメインに依存しないパーシング グラマーを定義するには、次の手順に従います。
1. [ルール] タブの [ドメインに依存しないグラマーを定義] をクリックします。
ユーザ ガイド
551
Open Parser
2. グラマーエディタを使用して、グラマー ルールを作成します。 コマンドと変数をテキスト ボック
スに入力するか、[コマンド] タブに表示されるコマンドを使用することができます。 詳細につい
ては、パーシング グラマーのリファレンス(558ページ)を参照してください。
3. パーシング グラマーのテキスト文字列の切り取り、コピー、貼り付け、検索、および置換を行う
には、グラマーエディタ内で右クリックして、該当するコマンドを選択します。
4. グラマー ルールのテキストを使用可能なテキスト ボックス幅で表示する場合は、[右端での折り返
しを有効にする] をクリックします。
5. [グラマー] テキスト ボックスの内容を削除するには、[クリア] をクリックします。
6. 作成したパーシング グラマーをチェックするには、[検証] をクリックします。
検証機能により、エラーが発生した行と列、エラーの説明、エラーの原因となったコマンド名また
は値など、グラマー構文のエラーが表示されます。
552
Spectrum™ Technology Platform 8.0.0
第 23 章 : Data Normalization モジュール
7. [プレビュー] タブをクリックして、パーシング グラマーをテストします。 詳細については、パー
シング グラマーのプレビュー(553ページ)を参照してください。
8. パーシング グラマーの作成を終了したら、[OK] をクリックします。
パーシング グラマーのプレビュー
パーシング グラマーをプレビューするには、次の手順に従います。
1. [プレビュー] タブをクリックします。
実用的なパーシング グラマーは、繰り返し作業によって作成されます。 プレビューは、入力に対
してさまざまなテストを行い、パーシング グラマーによって期待した結果が得られることを確認
するのに役立ちます。
2. 入力フィールドにテスト値を入力して、[プレビュー] をクリックします。
ユーザ ガイド
553
Open Parser
パースされた出力フィールドが [結果] グリッドに表示されます。 出力フィールドについては、出
力(558ページ)を参照してください。 トレースについては、パーシング グラマーのトレース
(554ページ)を参照してください。
3. [入力データ] の値と [結果] グリッドをリセットするには、[すべてクリア] をクリックします。
4. 期待した結果が得られない場合は、[ルール] タブをクリックし、期待した結果が得られるまでパー
シング グラマーの編集と入力データのテストを続行します。
5. 必要な操作が終了したら、[OK] をクリックします。
パーシング グラマーのトレース
パーシング グラマーをプレビューしたら、トレース詳細を使用して、[結果] グリッドで選択された行
に関して、入力フィールドが出力フィールドの値にどのようにパースされたかを 1 トークンずつ視覚
的に表示します。 トレースにより、マッチ結果、非マッチ結果、および中間結果が表示されます。
デフォルトでは、トレース詳細により、最終的なパーシング結果が表示されます。または、パーシン
グ イベントをステップ スルーして、マッチング プロセッサが 1 トークンずつマッチと非マッチをど
のように決定するかを確認することができます。
トレース詳細の要素
パーシング グラマーのツリー ビューには、選択したオプションに応じて、次の要素が 1 つまたは複数
表示されます。
• <root> 変数。 ツリーの最上位ノードは、<root> 変数です。
• <root> 変数で定義された式。 第 2 レベルのノードは、<root> 変数で定義された式です。 <root> 式
は、出力フィールドの名前も定義します。
554
Spectrum™ Technology Platform 8.0.0
第 23 章 : Data Normalization モジュール
• 第 2 レベル ノードの変数定義。 第 3 レベル ノードとその下の各レベルは、各 <root> 式の定義で
す。 他の変数、エイリアス、またはルール定義を式の定義にすることができます。
• 出力となる値とトークン。 ツリーの最下位ノードには、パーシング グラマーで連続した各 トーク
ンに割り当てられた値が表示されます。
• パーシング グラマーの関連要素のパーサー スコア。 パーサー スコアは、ルート式の下位から上位
に決定されます。 例えば、ある式パターンの重みが 80 で、上位のルールの重みが 75 の場合、上位
の式の最終的なスコアは、子のスコアと上位のスコアから作成されます。この例では、60% になり
ます。
• 見やすくなるよう、改行なしの空白文字 (上向きの括弧) として [入力データ] テキスト ボックスに表
示される空白文字。 トークンとして使用されない区切り文字は、灰色で表示されます。
トレース詳細での色分け
マッチと非マッチは、トレース詳細で次のように色分けされます。
• 緑色のボックスは、最終的な成功結果の一部であるマッチを示します。
• 赤色のボックスは、非マッチを示します。
• 黄色のボックスは、イベントのステップ スルー時に最終的にはロールバックされる中間マッチを示
します。 中間マッチは、[パーシング イベントのステップ スルー] にのみ表示されます。
• 灰色のボックスは、そのトークンを別の式用に解放するためロールバックされた中間マッチを示し
ます。 中間マッチは、[パーシング イベントのステップ スルー] にのみ表示されます。
最終パース結果のトレース
最終パース結果には、パーシング グラマー ツリーと結果出力が表示されます。 マッチング処理の結
果のみを確認したい場合は、このビューを使用してください。 これはデフォルトのビューです。
最終パース結果をトレースするには、次の手順に従います。
1. プレビューを使用して、代表的な入力データをテストします。
2. [トレース] 列で、トレース詳細を表示するためのリンクをクリックします。
[トレース詳細] ウィンドウが表示されます。
ユーザ ガイド
555
Open Parser
デフォルトでは、[情報] リストに最終パース結果が表示されます。 パーシング イベントをステッ
プ スルーするには、パーシング イベントのステップ スルーのトレース(557ページ)を参照してく
ださい。
3. [詳細レベル] リストで、いずれかのオプションを選択します。
•
マッチしない式を非表示。 マッチまたは非マッチ結果となるブランチを表示します。 マッチに
ならないルート式のブランチは、省略記号ボタンとして表示されます。 マッチにならないブラ
ンチを見たい場合は、省略記号ボタンをダブルクリックしてください。
•
マッチしないルート式を非表示。 マッチまたは非マッチ結果を含むルート式のすべてのブラン
チを表示します。 その他のルート式は表示されません。
•
すべてのルートを表示。 すべてのルート式を表示します。 ルートにマッチ結果がない場合、そ
のルート式の表示は省略記号ボタンを使用して折りたたまれます。
•
すべての式を表示。 ルート式とすべてのブランチを表示します。 ルート式は省略記号ボタンと
して表示されなくなります。代わりに、ブランチ内の各式のルールが表示されます。
マッチしない式を非表示にする詳細レベル ビューを選択し、現在表示されていないルート式を選
択した場合、トレース詳細によって、詳細レベルの選択がルート式の最小数を示すリスト項目に変
更されますが、ルート式は引き続き表示されます。
4. 結果にパーサー スコアを含めるには、[スコアを表示] をクリックします。
5. ツリー ビューのサイズを調整するには、ズーム コントロールを使用します。
6. ルート式のリストで、いずれかのオプションを選択して、ルート式ツリーのそのブランチを表示し
ます。
556
Spectrum™ Technology Platform 8.0.0
第 23 章 : Data Normalization モジュール
7. 必要な操作が終了したら、[OK] をクリックします。 [OK] をクリックすると、詳細レベル、スコ
ア表示、およびズーム コントロールの設定が保存されます。
パーシング イベントのステップ スルーのトレース
パーシング イベントのステップ スルーには、マッチング処理における 1 イベントごとのステップを表
示するためのメディア コントロールがあります。 マッチング処理のトラブルシューティングを行って
いて、各トークンがどのように評価されるか、パーシング グラマーのトークン化、および 1 トークン
ごとのマッチング結果を確認したい場合は、このビューを使用してください。
マッチング処理をステップ スルーするには、次の手順に従います。
1. プレビューを使用して、代表的な入力データをテストします。
2. [トレース] 列で、トレース詳細を表示するための [ここをクリック...] リンクをクリックします。
[トレース詳細] ウィンドウが表示されます。
3. [情報] リストで [パーシング イベントのステップ スルー] を選択します。
4. 最終パース結果のトレース(555ページ)の説明に従って、その他の選択を行います。
デフォルトでは、[選択されたノードまで自動的にステップ] チェック ボックスが選択されます。
このチェック ボックスが選択されている状態で [再生] ボタンをクリックすると、イベントが最初
から実行され、選択したノードまたはそのいずれかの子で発生した最初のイベントで停止します。
停止せずにすべてのイベントを再生するには、[再生] ボタンをクリックする前にこのチェック ボッ
クスをクリアします。
ユーザ ガイド
557
Open Parser
5. [再生] ボタンをクリックして、パーシング イベントの実行を開始します。
6. 必要な操作が終了したら、[OK] をクリックします。
出力
表 85 : Open Parser の出力
フィールド名
説明/有効値
<入力フィールド>
パーシング グラマーで定義された元の入力フィールド。
<出力フィールド...>
パーシング グラマーで定義された出力フィールド。
CultureCode
入力データに含まれるカルチャー コード。 サポートされている全カ
ルチャー コードの一覧は、Open Parser のカルチャー コード(586ペー
ジ)を参照してください。
CultureUsedtoParse
各出力レコードのパースに使用されるカルチャー コードの値。 この
値は、カルチャー固有のパーシング グラマーとのマッチに基づいてい
ます。
IsParsed
出力レコードがパースされたかどうかを示します。 値は Yes または
No です。
ParserScore
合計平均スコアを示します。 ParserScore の値は、パーシング グラ
マーでの定義に従って、0 〜 100 の間になります。 マッチが返されな
い場合は、0 が返されます。
詳細については、スコアリングとは(550ページ)およびScore コマン
ド(567ページ)を参照してください。
Trace
[結果] グリッドで選択された行に関して、パーシング グラマー内の各
トークンが出力フィールドにどのようにパースされたかを視覚的に表
示するには、このコントロールをクリックします。
パーシング グラマーのリファレンス
このセクションには、パーシング グラマーのリファレンスがすべ記載されています。
• コマンドのメタ文字(559ページ)
• Header セクションのコマンド(560ページ)
558
Spectrum™ Technology Platform 8.0.0
第 23 章 : Data Normalization モジュール
• Tokenize コマンド(560ページ)
• Tokenize (None)(561ページ)
• InputField コマンド(561ページ)
• OutputFields コマンド(562ページ)
• IgnoreCase コマンド(562ページ)
• Join コマンド(563ページ)
• Rule セクションのコマンド(563ページ)
• RegEx コマンド(564ページ)
• Table コマンド(565ページ)
• CompoundTable コマンド(565ページ)
• Token コマンド(566ページ)
• Score コマンド(567ページ)
• <root> 変数(569ページ)
• rule|rule コマンド(569ページ)
• グループ化演算子 ( )(570ページ)
• Min/Max 回数演算子 {min,max}(570ページ)
• Exact 回数演算子 {exact}(571ページ)
• 代入演算子 (=)(571ページ)
• OR 演算子 (|)(572ページ)
• End-of-Rule 演算子 (;)(572ページ)
• コメント演算子 (!)(572ページ)
• 0 または 1 回の出現を表す数量詞 (?)(573ページ)
• 0 回以上の出現を表す数量詞 (*)(573ページ)
• 1 回以上の出現を表す数量詞 (+)(573ページ)
• 式の数量詞: Greedy、Reluctant、および Possessive な動作(574ページ)
コマンドのメタ文字
Open Parser は、%Tokenize コマンドおよび @RegEx コマンドで、Java Regex 文字クラスのメタ文
字の標準セットをサポートしています。 メタ文字とは、パターン マッチングにおいて特殊な意味を持
つ文字です。 サポートされているメタ文字には次のものがあります。
([{\^-$|]})?*+
これらの文字がメタ文字として扱われない状況もあります。 パーシング グラマーを作成すると、その
ような状況について理解が深まります。 上記の一覧を使用して、特殊文字がメタ文字と見なされるか
どうかを確認してください。 例えば、数量詞メタ文字は、文字セットの内部では意味を持ちません。
文字セットは常に正確に 1 文字を定義するため、'?'、'+'、および '*' の前に '\' を付けてはならないから
です。
メタ文字を通常の文字として強制的に扱うには、次の 2 つの方法があります。
ユーザ ガイド
559
Open Parser
• メタ文字の前にバックスラッシュを付ける
• \Q (引用符の開始) と \E (引用符の終了) で囲む
%Tokenize は、Java 正規表現全体ではなく、Java 正規表現の文字クラスのルールに従います。
一般的に、文字セットでは次の文字が予約されています。
• '[' および ']' は、別のセットを示します。
• '-' は、他の 2 つの文字間にある場合、1 つのメタ文字です。
• '^' は、セット内の最初の文字である場合、1 つのメタ文字です。
• '&&' は、他の 2 つの文字間にある場合、複数のメタ文字です。
• '\' は、続く文字がリテラルであることを意味します。
ある文字をメタ文字として扱うかどうかに疑問がある場合や、文字をリテラルとして扱いたい場合は、
バックスラッシュを使用してその文字をエスケープします。
Header セクションのコマンド
ここでは、Header セクションのコマンドについて説明します。 一部のコマンドはオプションです。
オプションのコマンドについては、デフォルトの値または動作を明記します。
• Tokenize コマンド(560ページ) (オプション)
• Tokenize (None)(561ページ)
• InputField コマンド(561ページ) (必須)
• OutputFields コマンド(562ページ) (必須)
• IgnoreCase コマンド(562ページ) (オプション)
• Join コマンド(563ページ) (オプション)
Tokenize コマンド
%Tokenize([token set],[preserved set]);
これはオプションのコマンドです。 省略した場合は、デフォルトの [\s] が使用されます。これは、
スペース文字を表す正規表現のデフォルトです。
フィールドをトークン化するために使う文字を定義し、保持する文字を設定します。
[token set] は、フィールドを自動的にトークン化するために使われる一連の文字です。 トークン
化とは、スペース文字を使ってフィールドを区切ることを意味します。
例
%Tokenize([-\s],[-];
この例では、スペース文字とダッシュを使ってトークン化を行い、ダッシュをトークンとして保持し
ます。
注: %Tokenize は、Java の RegEx 構文ルールに従います。 バックスラッシュ文字 "\" を使うと、
ハイフンやその他のメタ文字を通常の文字として扱うように Open Parser に強制できます。 例え
ば、ハイフン文字 (-) は、リテラル文字のハイフンとして使用するか、文字の範囲指定に使用で
560
Spectrum™ Technology Platform 8.0.0
第 23 章 : Data Normalization モジュール
きます。 %Tokenize の値を [(-)] に設定すると、Open Parser は、左カッコ "(" の文字と右
カッコ ")" の文字に囲まれた範囲の文字を意味すると解釈します。 予約語の全一覧については、
コマンドのメタ文字(559ページ)を参照してください。
[preserved set] は、token set に含まれるトークンのうち、トークンとして残されてトークン一覧
に表示されるものの文字セットの正規表現定義です。 例えば、token set が空白とハイフンで、preserved
set がハイフンである場合、"before-after this" は、 'before'、'-'、'after'、'this という 4 つのトークンに
分割されます。
このコマンドを使用するには、次の手順に従います。
1. コマンドを挿入する場所にカーソルを置きます。
2. [コマンド] リストの [%Tokenize] をダブルクリックします。
3. [トークン セット] 矢印をクリックして RegEx 値を選択するか、[トークン セット] テキスト ボッ
クスに値を入力します。
トークン セットの定義に使用できる、定義済み RegEx タグがいくつか用意されています。 詳細に
ついては、ドメインエディタ(601ページ)を参照してください。
4. 必要に応じて、[保存する文字] チェック ボックスを選択します。
5. [保存するトークン セット文字] 矢印をクリックして値を選択するか、テキスト ボックスに値を入
力します。
6. [OK] をクリックします。
Tokenize (None)
このコマンドはオプションです。
Tokenize を None に設定することにより、フィールドのトークン化を停止できます。 Tokenize を
None に設定する場合、パーシング グラマー ルールは、ルール定義内に空白などのトークン区切り文
字を含む必要があります。
このコマンドを使用するには、次の手順に従います。
1. コマンドを挿入する場所にカーソルを置きます。
2. [コマンド] リストの [%Tokenize(None)] をダブルクリックします。
InputField コマンド
%InputField("name");
このコマンドは必須です。 指定しない場合、エラーが発生します。
ターゲットの入力フィールドの名前を指定します。
例
%InputField("PhoneNumber");
このコマンドを使用するには、次の手順に従います。
ユーザ ガイド
561
Open Parser
1. コマンドを挿入する場所にカーソルを置きます。
2. [コマンド] リストの [%InputField] をダブルクリックします。
3. 入力フィールド名を入力します。
4. [OK] をクリックします。
OutputFields コマンド
%OutputFields("name"->"alias", "name..."->"alias...");
このコマンドは必須です。 指定しない場合、エラーが発生します。
name (または、指定されている場合は alias) は、Rule セクションで使用されている <variable>
の名前に対応している必要があります。
例
%OutputFields("FirstName","LastName");
FirstName と LastName は、ステージから出力されるフィールドです。 それぞれの値は、FirstName
と LastName の各グラマー ルールによって得られます。
alias を使用することにより、1 つの名前のルールで、異なる名前のフィールドに結果を出力すること
ができます。
例
%OutputFields("FN1"->"FirstName","FN2"->"FirstName", "LastName");
FirstName と LastName は、ステージから出力されるフィールドです。 FirstName の値は FN1 ま
たは FN2 のグラマー ルール (最後に評価される方) によって得られ、LastName の値は LastName グ
ラマー ルールによって得られます。
このコマンドを使用するには、次の手順に従います。
1. コマンドを挿入する場所にカーソルを置きます。
2. [コマンド] リストの [%OutputFields] をダブルクリックします。
3. ルール名を入力するか、[ルール] リストから選択します。
各ルールの名前は、Rule セクションで使用されている <variable> に対応している必要があります。
ここで選択したルールが、上述のように新しいフィールドとして出力されます。
1. 必要に応じて、エイリアス名を入力するか、[エイリアス] リストから選択します。
2. 各ルールに対して、この操作を繰り返します。
3. ルールを削除するには、行を選択して [削除] をクリックします。
4. [OK] をクリックします。
IgnoreCase コマンド
%IgnoreCase;
562
Spectrum™ Technology Platform 8.0.0
第 23 章 : Data Normalization モジュール
このコマンドはオプションです。 指定しない場合、すべての @RegEx コマンドで大文字と小文字が区
別されます。 大文字と小文字を区別するかどうかは、変数レベルで設定することも可能です。 詳細に
ついては、RegEx コマンド(564ページ)を参照してください。
すべての @RegEx コマンドにおいて大文字と小文字を区別しないように、グローバル デフォルトを設
定します。
1. コマンドを挿入する場所にカーソルを位置付けます。
2. [コマンド] リストの [%IgnoreCase] をダブルクリックします。
Join コマンド
%Join("Separator");
このコマンドはオプションです。
指定しない場合、Tokenize に None 以外の値が設定されている場合はシングル スペースが使用され
ます。 Tokenize に None が設定されている場合は (文字を 1 つも含まない) 空の文字列が使用されま
す。
例
%Join("-");
入力フィールドに社会保障番号が格納されている場合、社会保障番号はハイフンで結ばれて出力され
ます。
このコマンドを使用するには、次の手順に従います。
1. コマンドを挿入する場所にカーソルを位置付けます。
2. [コマンド] リストの [%Join] をダブルクリックします。
3. テキスト ボックスに単一の文字を入力します。
4. [OK] をクリックします。
Rule セクションのコマンド
Rule セクションのコマンドには次のものがあります。
• RegEx コマンド(564ページ)
• Table コマンド(565ページ)
• CompoundTable コマンド(565ページ)
• Token コマンド(566ページ)
• Score コマンド(567ページ)
• Rule ID コマンド(567ページ)
• <root> 変数(569ページ)
• rule|rule コマンド(569ページ)
• グループ化演算子 ( )(570ページ)
• Min/Max 回数演算子 {min,max}(570ページ)
ユーザ ガイド
563
Open Parser
• Exact 回数演算子 {exact}(571ページ)
• 代入演算子 (=)(571ページ)
• OR 演算子 (|)(572ページ)
• End-of-Rule 演算子 (;)(572ページ)
• コメント演算子 (!)(572ページ)
• 0 または 1 回の出現を表す数量詞 (?)(573ページ)
• 0 回以上の出現を表す数量詞 (*)(573ページ)
• 1 回以上の出現を表す数量詞 (+)(573ページ)
• 式の数量詞: Greedy、Reluctant、および Possessive な動作(574ページ)
RegEx コマンド
@RegEx ("expression"[,IgnoreCase|NoIgnoreCase])
このコマンドはオプションです。
トークンを正規表現にマッチングし、大文字小文字区別のオプションを設定します。 パーシング グラ
マーにはグローバルな大文字小文字区別のオプション (%IgnoreCase) を使用してください。 大文字と
小文字の区別については、IgnoreCase コマンド(562ページ)を参照してください。
例
<GivenName> = @RegEx("[A-Z]+",IgnoreCase)
このルールが真になるには、トークンが A-Z の文字を 1 回以上含まなければなりません。それらの文
字の大文字と小文字の区別は無視されます。
正規表現は、文字列セット内の各文字列が共有する共通パターンに基づいて、文字列セットを記述し
ます。 Open Parser では、正規表現を使用して入力データを検索し、OutputFields として指定した形
式でデータを出力します。 正規表現の複雑さはさまざまです。 『Spectrum™ Technology Platform テ
ンプレート ガイド』に記載されている Open Parser のテンプレートが、基礎を理解するのに役立ちま
す。 正規表現の作成方法の基礎を理解したら、正規表現を作成できるようになります。 サポートされ
ている正規表現の構文は、Java のドキュメントで定義されている構文と次の点で異なります。
• Java で定義されている捕捉グループと後方参照はサポートされていません。
• POSIX スタイルの文字セット クラスは、ドメインエディタの Regex タグを使用して定義されてい
る場合にサポートされます。
• 正規表現は、空の文字列にマッチしてはいけません。 例えば、@RegEx("[A-Z]?") または
@RegEx("[A-Z]?") は、空の文字列が無効になるため許可されません。
? または * の使用は制限されていませんが、これらの数量詞を使用できるのは、正規表現が空の文字
列にマッチしない場合のみです。 例えば、@RegEx("[A-Z]+\.?") は、正規表現の一部のみがオプ
ションなので有効です。
* または ? を使用して、@RegEx コマンド自体が出現する頻度を制御することができます。 この制限
は、@RegEx コマンド内部の正規表現のみを対象としています。
このコマンドを使用するには、次の手順に従います。
564
Spectrum™ Technology Platform 8.0.0
第 23 章 : Data Normalization モジュール
1. コマンドを挿入する場所にカーソルを位置付けます。
2. [コマンド] リストの [@RegEx] をダブルクリックします。
3. リストから式名を選択するか、正規表現を入力します。
4. 大文字と小文字の区別オプションを選択します。
• [グローバル オプションの使用] は、Regex タグがグラマー ルールで定義された大文字と小文字
の区別の設定を使用することを意味します。 グラマー ルールで %IgnoreCase が定義されてい
る場合、RegEx コマンドは大文字と小文字を区別します。 グラマー ルールで %IgnoreCase が
定義されていない場合、RegEx コマンドは大文字と小文字を区別しません。
• [大文字と小文字を区別しない] は、Regex タグが英字をマッチングする際に大文字と小文字の違
いを無視することを意味します。
• [大文字と小文字を区別] は、Regex タグが英字をマッチングする際に大文字と小文字の違いを評
価することを意味します。
5. [OK] をクリックします。
Table コマンド
@Table ("table-name")
このコマンドはオプションです。
指定された名前のテーブルから、トークンと一致するエントリを検索します。 多くの場合、パーサー
が使用するこのテーブルの定義は、アクティブなカルチャーによって異なります。 テーブル検索で
は、大文字と小文字を区別しません。 例えば、"BROWN" というトークンは、テーブルの中の "Brown"
というエントリにマッチします。
例
@Table("Given Names")
このコマンドは、トークンがテーブル管理の Givens Names テーブルにマッチするかどうかをチェッ
クします。
このコマンドを使用するには、次の手順に従います。
1. コマンドを挿入する場所にカーソルを位置付けます。
2. [コマンド] リストの [@Table] をダブルクリックします。
3. テーブル名を選択します。
必要なテーブルが表示されない場合は、テーブル管理でテーブルを作成する必要があります。 詳
細については、テーブル管理(613ページ)を参照してください。
4. [OK] をクリックします。
CompoundTable コマンド
@CompoundTable("name", min, max)
このコマンドはオプションです。
ユーザ ガイド
565
Open Parser
Open Parser のテーブルは、複合語 (such as "Mary Jo"、"Jo Beth"、"National Security Administration"
など) を認識するように処理されます。 どの Open Parser テーブルにもこの機能があるため、すべて
の Open Parser テーブルで複合語とそれ以外の語をサポートできます。
例
@CompoundTable("GivenNames",1,3)
このコマンドは、トークンがテーブル管理の Givens Names テーブルにマッチするかどうかをチェッ
クし、マッチする語が 1 語から 3 語である場合に、トークンをマッチしたとみなします。 マッチする
語がないか、4 語以上マッチする場合は、マッチしないとみなします。
このコマンドの引数は、次のように指定します。
• name は、テーブル名です。
• min は、テーブルにマッチする語の最小数を表す値です。
• max は、テーブルにマッチする語の最大数を表す値です。
• min と max は、整数でなければなりません。
このコマンドを使用するには、次の手順に従います。
1. コマンドを挿入する場所にカーソルを置きます。
2. [コマンド] リストの [@CompoundTable] をダブルクリックします。 最小または最大マッチ数が必
要ない場合は、該当するフィールドを空白にしておきます。
3. テーブル名を選択します。
必要なテーブルが表示されない場合は、テーブル管理でテーブルを作成する必要があります。 詳
細については、テーブル管理(613ページ)を参照してください。
4. 最小マッチ数の値を [最小値] フィールドに入力します。
5. 最大マッチ数の値を [最大値] フィールドに入力します。
6. [OK] をクリックします。
Token コマンド
@Token
このコマンドはオプションです。
このコマンドを使用して、式の値を任意のマッチング トークンに設定します。 %Tokenize(NONE)
とした場合、任意の単一の文字にマッチします。
例
<root> = <a><b>;
<a> = @RegEx("[A-Za-z]+");
<b> = @Token
入力が John Smith-Jones である場合、John は最初のトークンにマッチし、Smith-Jones は 2 つめの
トークンにマッチします。2 つめのトークンの式において、入力データの文字の種類が制限されてい
ないためです。
566
Spectrum™ Technology Platform 8.0.0
第 23 章 : Data Normalization モジュール
このコマンドを使用するには、次の手順に従います。
1. コマンドを挿入する場所にカーソルを置きます。
2. [コマンド] リストの [@Token] をダブルクリックします。
Score コマンド
:Score(Weight)
このコマンドはオプションです。
ルール変数の中の各式には、オプションでスコア重みを含めることができます。 スコア重み
は、:Score(Weight) を式の末尾に付加することによって指定します。ここで Weight は、0 〜 100
の整数です。 Score コマンドは、OR 演算子 (|) や変数の末尾を表す文字 (;) の前に配置することがで
きます。
例
<GivenName> = @RegEx("[A-Z-a-z]+"):Score(50);
GivenName ルールの式は、50% で重み付けされます。 したがってこのルールが真である場合、Given
Name のスコア値は 50 になります。
合計平均スコアが ParserScore フィールドの出力になります。 ParserScore の値は、パーシング グラ
マーでの定義に従って、0 〜 100 の間になります。 マッチが返されない場合は、0 が返されます。
スコアリングの詳細については、スコアリングとは(550ページ)を参照してください。
このコマンドを使用するには、次の手順に従います。
1. コマンドを挿入する場所にカーソルを置きます。
2. [コマンド] リストの [:Score] をダブルクリックします。
3. テキスト ボックスに 0 〜 100 の範囲の値を入力します。
4. [OK] をクリックします。
Rule ID コマンド
:RuleID("ID")
このコマンドはオプションです。
ルールを作成するときに、このコマンドを使用してそのルールに ID を割り当てることができます。
ID は、:RuleID("ID") を付加することによって指定します。ここで "ID" は、ルールに付与する英数
字の識別子です。 ルールに識別子を割り当てない場合は、Spectrum™ Technology Platform が数値 ID
をそのルール用に生成します。 複数のルールが存在する場合は、実行順序に基づいて連続する番号が
割り当てられます ("1"、"2"、"3" など)。
例を次に示します。
%IgnoreCase;
%InputField("Name");
%OutputFields("FirstName", "LastName", "FirstName2", "LastName");
<root>=<FirstName><LastName> :RuleID("Name") |
ユーザ ガイド
567
Open Parser
<FirstName> '&' <FirstName2> <LastName> :RuleID("CompoundName");
<FirstName>=@Table("Given Names");
<FirstName2>=@Table("Given Names");
<LastName>=@Table("Family Names");
上の例では、ルート ルールに 2 つのルールが含まれています。 RuleID "Name" が付与された最初の
ルールである <FirstName><LastName> :RuleID("Name") は、FirstName と LastName をマッ
チングします。
RuleID "CompoundName" が付与された 2 つめのルールである <FirstName> '&' <FirstName2>
<LastName> :RuleID("CompoundName") は、FirstName2 も含めて FirstName と LastName を
マッチングします。
これらのルールの出力は、以下のようになります。
次に、ユーザ定義 RuleID を持たないグラマーの例を示します。
%IgnoreCase;
%InputField("Name");
%OutputFields("FirstName", "LastName", "FirstName2", "LastName");
<root>=<FirstName><LastName> |
<FirstName> '&' <FirstName2> <LastName> ;
<FirstName>=@Table("Given Names");
<FirstName2>=@Table("Given Names");
<LastName>=@Table("Family Names");
これらのルールの出力は、以下のようになります。
568
Spectrum™ Technology Platform 8.0.0
第 23 章 : Data Normalization モジュール
このコマンドを使用するには、次の手順に従います。
1. コマンドを挿入する場所にカーソルを置きます。
2. [コマンド] リストの [:RuleID] をダブルクリックします。
3. テキスト ボックスに英数字の値を入力します。
4. [OK] をクリックします。
<root> 変数
このコマンドは必須です。 指定しない場合、エラーが発生します。
ルート変数を表します。 ルート変数は、トークンの順序、つまりドメイン パターンをルール変数とし
て定義します。 ルール変数は、有効な文字セットとその順序を定義します。それらの文字がその順序
で出現する場合に、ドメイン パターンの一部であるとみなされます。
例
<root> = <Title><GivenName><FamilyName>;
このコマンドは、肩書を含む個人名のドメイン パターンを定義します。 肩書を含む個人名のみが、こ
のドメイン パターンにマッチします。
このコマンドを使用するには、次の手順に従います。
1. コマンドを挿入する場所にカーソルを置きます。
2. [コマンド] リストの [<root>] をダブルクリックします。
3. ルート タグに対するルート式を入力します。 <root> とルート式の間に必ず等号 (=) を入れます。
rule|rule コマンド
このコマンドは必須です。
このコントロールは、使用可能なルール (出力フィールド ルール、カルチャーから継承したグラマー
ルール、および現在のグラマーで定義された任意のグラマー ルール) の一覧を表示し、ダイアログ ボッ
クスで選択された順序でルールをグラマーに挿入します。
ユーザ ガイド
569
Open Parser
このコマンドを使用するには、次の手順に従います。
1. コマンドを挿入する場所にカーソルを置きます。
2. [コマンド] リストの [(<rule>[<rule>...])] をダブルクリックします。
3. 1つまたは複数のルールを選択します。
4. [OK] をクリックします。
選択したルールのパーシング グラマーが、グラマーエディタに追加されます。
グループ化演算子 ( )
このコマンドはオプションです。
これはグループ化演算子です。 選択したテキストを括弧で囲んで、式をグループ化することを示しま
す。 式の数量詞によって、複数部分からなる式を全体として扱う場合に使用します。
例
<first> = (<given> <initial>)+;
グループ化した式では OR (|) もサポートされています。
例
<first> = (<given>|<initial>)+;
グループ化した式には、他のグループ化した式を含めることもできます。
例
<first> = (<foreign given> | (<given> | <initial>)+)?;
このコマンドを使用するには、次の手順に従います。
1. コマンドを挿入する場所にカーソルを位置付けます。
2. [コマンド] リストの [()] をダブルクリックします。
Min/Max 回数演算子 {min,max}
このコマンドはオプションです。
式が出現しなければならない最小および最大回数を示します。量化する式のすぐ後ろに続ける必要が
あります。
例
<FamilyName> = @RegEx("[A-Za-z]+"){1,2};
このコマンドは、A-Z および a-z の文字の最小 1 回、最大 2 回の出現に一致します。
このコマンドは、次の形式になります。
• expression{min,} は、式が最小 min 回出現しなければならないことを意味します。 min の値は整数
で、後ろにカンマを続ける必要があります。
570
Spectrum™ Technology Platform 8.0.0
第 23 章 : Data Normalization モジュール
• expression{,max} は、式が最大 max 回出現しなければならないことを意味します。 max の値は整
数で、カンマの後ろに続ける必要があります。
• expression{min,max} は、式が最小 min 回、最大 max 回出現しなければならないことを意味します。
min および max の値は整数でなければなりません。
• Min/Max 演算子は、量化している式またはグループ化した式のすぐ後ろに続ける必要があります。
このコマンドを使用するには、次の手順に従います。
1. コマンドを挿入する場所にカーソルを位置付けます。
2. [コマンド] リストの [{min,max}] をダブルクリックします。 最小または最大出現回数が必要ない
場合は、該当するフィールドを空白にしておきます。
3. Min の値を入力します。
4. Max の値を入力します。
5. [OK] をクリックします。
Exact 回数演算子 {exact}
このコマンドはオプションです。
式が出現しなければならない正確な回数を示します。量化する式のすぐ後ろに続ける必要があります。
例
<FamilyName> = @RegEx("[A-Za-z]+"){3};
このコマンドは、A-Z および a-z の文字のちょうど 3 回の出現に一致します。
このコマンドは、次の形式になります。
• expression{exact} は、式が exact 回出現しなければならないことを意味します。 exact の値は整数
でなければなりません。
• Exact 演算子は、量化している式またはグループ化した式のすぐ後ろに続ける必要があります。
このコマンドを使用するには、次の手順に従います。
1. コマンドを挿入する場所にカーソルを位置付けます。
2. [コマンド] リストの [{exact}] をダブルクリックします。
3. Exact の値を入力します。
4. [OK] をクリックします。
代入演算子 (=)
<root> コマンドおよびルール変数に必須です。
代入演算子を示します。
例
<root> = <GivenName><FamilyName>;
<GivenName>= @Table("Given Names");
ユーザ ガイド
571
Open Parser
<FamilyName>= @Table("Family Names");
このコマンドを使用するには、次の手順に従います。
1. コマンドを挿入する場所にカーソルを位置付けます。
2. [コマンド] リストの [=] をダブルクリックします。
OR 演算子 (|)
このコマンドはオプションです。
1 つ以上のトークンに対する条件選択を表します。
例
<root> = <GivenName><FamilyName> |
<FamilyName>;
<GivenName>= @Table("Given Names") | @RegEx("[A-Za-z]+");
<FamilyName>= @Table("Family Names");
注: 垂直バー | は、ISO Latin 1 0x7C であり、OR を表す文字として一般的に使用されます。 しかし、
一部の国のキーボード上には、これに似た文字 (A|) が存在します。こちらは、ISO Latin 1 (0xA6)
です。 この文字は、垂直バーと混同されることが多いため、グラマー構文では両方の文字を OR
を表す文字として処理します。
このコマンドを使用するには、次の手順に従います。
1. コマンドを挿入する場所にカーソルを置きます。
2. [コマンド] リストの [|] をダブルクリックします。
End-of-Rule 演算子 (;)
このコマンドは、各式の末尾に必須です。
式の末尾を表します。
例
<root> = <GivenName><FamilyName>;
<GivenName>= @Table("Given Names");
<FamilyName>= @Table("Family Names");
このコマンドを使用するには、次の手順に従います。
1. コマンドを挿入する場所にカーソルを置きます。
2. [コマンド] リストの [;] をダブルクリックします。
コメント演算子 (!)
このコマンドはオプションです。
572
Spectrum™ Technology Platform 8.0.0
第 23 章 : Data Normalization モジュール
文字 ! は、コメントを表すために使用します。 文字 ! に続く同一行の文字はすべて、コメントである
と解釈されます。 コメントは、パーシング グラマーの説明が必要な場合にグラマー ルールに注釈を
加えるために使用します。 Open Parser は、コメントを解釈しません。
例
! This rule checks to see if a token matches the Given
! Names table.
<GivenName>= @Table("Given Names");
このコマンドを使用するには、次の手順に従います。
1. コマンドを挿入する場所にカーソルを置きます。
2. [コマンド] リストの [!] をダブルクリックします。
3. 文字 ! に続けて、コメントを同一行に入力します。
0 または 1 回の出現を表す数量詞 (?)
このコマンドはオプションです。
式が 1 回も出現しないか、または 1 回だけ出現してよいことを表します。 {Min,Max} を併用すること
もできます。 デフォルトでは、式の数量詞は Greedy な動作を行います。 この動作の変更について
は、式の数量詞: Greedy、Reluctant、および Possessive な動作(574ページ)を参照してください。
このコマンドを使用するには、次の手順に従います。
1. コマンドを挿入する場所にカーソルを置きます。
2. [コマンド] リストの [?] をダブルクリックします。
0 回以上の出現を表す数量詞 (*)
このコマンドはオプションです。
式が 0 回以上出現してよいことを表します。 デフォルトでは、式の数量詞は Greedy な動作を行いま
す。 この動作の変更については、式の数量詞: Greedy、Reluctant、および Possessive な動作(574ペー
ジ)を参照してください。
このコマンドを使用するには、次の手順に従います。
1. コマンドを挿入する場所にカーソルを置きます。
2. [コマンド] リストの [*] をダブルクリックします。
1 回以上の出現を表す数量詞 (+)
このコマンドはオプションです。
式が 1 回以上出現してよいことを表します。 {Min,Max} を併用することもできます。 デフォルトで
は、式の数量詞は Greedy な動作を行います。 この動作の変更については、式の数量詞: Greedy、
Reluctant、および Possessive な動作(574ページ)を参照してください。
ユーザ ガイド
573
Open Parser
このコマンドを使用するには、次の手順に従います。
1. コマンドを挿入する場所にカーソルを置きます。
2. [コマンド] リストの [+] をダブルクリックします。
式の数量詞: Greedy、Reluctant、および Possessive な動作
デフォルトでは、数量詞は Greedy な動作を行います。 Greedy な動作とは、式が、マッチを成立させ
つつ、できる限り多くのトークンを消費しようとすることを意味します。 この動作は、'?' を付加する
ことによって Reluctant なマッチングに、'+' を付加することによって Possessive なマッチングに変更
することができます。
Reluctant なマッチングとは、式が、マッチを成立させつつ、できる限り少なくトークンを消費しよう
とすることを意味します。
Possessive なマッチングとは、マッチの成立が妨げられる場合であっても、できる限り多くのトーク
ンを消費しようとすることを意味します。
式の数量詞の動作を示す例については、以下を参照してください。
• Rule セクションのコマンド(563ページ)
• Rule セクションのコマンド(563ページ)
• Rule セクションのコマンド(563ページ)
• Rule セクションのコマンド(563ページ)
• 1 つ以上の式の数量詞の例
Greedy
1. <Field1> の Greedy な動作は、ルールにマッチする最大数のトークンを受け入れつつ、残りの
ルールにマッチするために必要な場合にのみトークンを放棄します。
2. <Field2> は、<Field1> によって放棄が強制される最小数のトークンのみを受け入れます。
3. <Field3> は、<Field1> によって放棄が強制される単一のトークンのみを受け入れます。
574
Spectrum™ Technology Platform 8.0.0
第 23 章 : Data Normalization モジュール
Reluctant
1. <Field1> の Reluctant な動作は、ルールにマッチする最小数のトークンを受け入れつつ、残りの
ルールにマッチするために必要な場合にのみトークンを放棄します。
2. <Field2> は Greedy であり、<Field1> によって放棄された最大数のトークンを受け入れつつ、残
りのルールにマッチするために必要な場合にのみトークンを放棄します。
3. <Field3> は、<Field2> によって放棄が強制される単一のトークンのみを受け入れます。
ユーザ ガイド
575
Open Parser
Possessive
1. <Field1> の Possessive な動作は、ルールにマッチする最大数のトークンを受け入れつつ、残り
のルールにマッチするトークンはいっさい放棄しません。
2. <Field1> は Possessive なので、<Field2> で使用できるトークンはありません。 3. <Field1> は
Possessive なので、<Field3> で使用できるトークンはありません。
3. 入力はパースされません。
576
Spectrum™ Technology Platform 8.0.0
第 23 章 : Data Normalization モジュール
0 以上の数量詞の例
Greedy
1. <Field1> の Greedy な動作は、ルールにマッチするいっさいのトークンまたは最大数のトークン
を受け入れず、残りのルールにマッチするために必要な場合にのみトークンを放棄します。
2. <Field1> は Greedy なので、<Field2> は <Field1> によって放棄が強制される最小数のトークン
のみを受け入れます。 <Field2> の最小数は 0 なので、0 のトークンはこのルールにマッチしま
す。
ユーザ ガイド
577
Open Parser
3. <Field1> は Greedy なので、<Field3> は <Field1> によって放棄が強制される単一のトークンの
みを受け入れます。
Reluctant
1. <Field1> の Reluctant な動作は、ルールにマッチするいっさいのトークンまたは最小数のトーク
ンを受け入れず、残りのルールにマッチするために必要な場合にのみトークンを放棄します。
2. <Field2> は Greedy であり、<Field1> によって放棄された最大数のトークンを受け入れつつ、残
りのルールにマッチするために必要な場合にのみトークンを放棄します。
3. <Field3> は、<Field2> によって放棄が強制される単一のトークンのみを受け入れます。
578
Spectrum™ Technology Platform 8.0.0
第 23 章 : Data Normalization モジュール
Possessive
1. 1. <Field1> の Possessive な動作は、ルールにマッチするいっさいのトークンまたは最大数の
トークンを受け入れず、残りのルールにマッチするトークンを放棄しません。
2. <Field1> は Possessive なので、<Field2> で使用できるトークンはありません。
3. <Field1> は Possessive なので、<Field3> で使用できるトークンはありません。 入力はパース
されません。
ユーザ ガイド
579
Open Parser
0 または 1 つの数量詞の例
Greedy
1. <Field1> の Greedy な動作は、ルールにマッチするいっさいのトークンまたは最大数のトークン
を受け入れず、残りのルールにマッチするために必要な場合にのみトークンを放棄します。
2. <Field2> は、<Field1> によって放棄が強制される最小数のトークンのみを受け入れます。
3. <Field3> は、<Field1> によって放棄が強制される単一のトークンのみを受け入れます。
580
Spectrum™ Technology Platform 8.0.0
第 23 章 : Data Normalization モジュール
Reluctant
1. <Field1> の Reluctant な動作は、ルールにマッチする最小数のトークンを受け入れつつ、残りの
ルールにマッチするために必要な場合にのみトークンを放棄します。
2. <Field2> は Greedy であり、<Field1> によって放棄された最大数のトークンを受け入れつつ、残
りのルールにマッチするために必要な場合にのみトークンを放棄します。
3. <Field3> は、<Field2> によって放棄が強制される単一のトークンのみを受け入れます。
ユーザ ガイド
581
Open Parser
Possessive
1. <Field1> の Possessive な動作は、ルールにマッチするいっさいのトークンまたは最大数のトー
クンを受け入れず、残りのルールにマッチするトークンを放棄しません。
2. <Field1> は Possessive なので、<Field2> で使用できるトークンは 1 つだけです。
3. <Field1> は Possessive なので、<Field3> で使用できるトークンはありません。 入力はパース
されません。
582
Spectrum™ Technology Platform 8.0.0
第 23 章 : Data Normalization モジュール
• 最小/最大数量詞の例
Greedy
1. <Field1> ルールの Reluctant な動作は、ルールにマッチする最小数のトークンを受け入れつつ、
残りのルールにマッチするために必要な場合にのみトークンを放棄します。
2. <Field2> は、<Field1> によって放棄が強制される最小数のトークンのみを受け入れます。
3. <Field3> は、<Field1> によって放棄が強制される単一のトークンのみを受け入れます。
ユーザ ガイド
583
Open Parser
Reluctant
1. <Field1> の Reluctant な動作は、ルールにマッチする最小数のトークンを受け入れつつ、残りの
ルールにマッチするために必要な場合にのみトークンを放棄します。
2. <Field2> は Greedy であり、<Field1> によって放棄された最大数のトークンを受け入れつつ、残
りのルールにマッチするために必要な場合にのみトークンを放棄します。
3. <Field3> は、<Field2> によって放棄が強制される単一のトークンのみを受け入れます。
584
Spectrum™ Technology Platform 8.0.0
第 23 章 : Data Normalization モジュール
Possessive
1. <Field1> の Possessive な動作は、ルールにマッチする最大数のトークンを受け入れつつ、残り
のルールにマッチするトークンはいっさい放棄しません。
2. <Field1> は Possessive なので、<Field2> で使用できるトークンは 2 つあります。
3. <Field3> は、<Field2> によって放棄が強制される単一のトークンのみを受け入れます。
ユーザ ガイド
585
Open Parser
Open Parser のカルチャー コード
表 86 : Open Parser のカルチャー コード(586ページ) に、ドメインエディタでサポートされている
カルチャー コードを示します。 ドメインエディタでは、言語およびカルチャー/地域コードを使用し
て、これらの属性をカルチャー階層に表わします。 カルチャー コード列のコードは、言語ノードおよ
びカルチャー/地域ノードを表します。 例えば、af はアフリカーンス語の言語コードで、af-ZA はアフ
リカーンス語/南アフリカのカルチャー/地域コードです。
表 86 : Open Parser のカルチャー コード
586
言語 (カルチャー/地域)
カルチャー コード
グローバル カルチャー
グローバル カルチャー
アフリカーンス語
af
アフリカーンス語 (南アフリカ)
af-ZA
アルバニア語
sq
アルバニア語 (アルバニア)
sq-AL
アラビア語
ar
Spectrum™ Technology Platform 8.0.0
第 23 章 : Data Normalization モジュール
言語 (カルチャー/地域)
カルチャー コード
アラビア語 (アルジェリア)
ar-DZ
アラビア語 (バーレーン)
ar-BH
アラビア語 (エジプト)
ar-EG
アラビア語 (イラク)
ar-IQ
アラビア語 (ヨルダン)
ar-JO
アラビア語 (クウェート)
ar-KW
アラビア語 (レバノン)
ar-LB
アラビア語 (リビア)
ar-LY
アラビア語 (モロッコ)
ar-MA
アラビア語 (オマーン)
ar-OM
アラビア語 (カタール)
ar-QA
アラビア語 (サウジアラビア)
ar-SA
アラビア語 (シリア)
ar-SY
アラビア語 (チュニジア)
ar-TN
アラビア語 (U.A.E.)
ar-AE
アラビア語 (イエメン)
ar-YE
アルメニア語
hy
アルメニア語 (アルメニア)
hy-AM
アゼルバイジャン語
az
アゼルバイジャン語 (アゼルバイジャン、キリル文字)
az-Cyrl-AZ
ユーザ ガイド
587
Open Parser
588
言語 (カルチャー/地域)
カルチャー コード
アゼルバイジャン語 (アゼルバイジャン、ラテン文字)
az-Latn-AZ
バスク語
eu
バスク語 (バスク)
eu-ES
ベラルーシ語
be
ベラルーシ語 (ベラルーシ)
be-BY
ブルガリア語
bg
ブルガリア語 (ブルガリア)
bg-BG
カタロニア語
ca
カタロニア語 (カタロニア)
ca-ES
中国語
zh
中国語(香港特別行政区、中国)
zh-HK
中国語 (マカオ特別行政区)
zh-MO
中国語 (中国)
zh-CN
中国語 (簡体字)
zh-Hans
中国語(シンガポール)
zh-SG
中国語(台湾)
zh-TW
中国語 (繁体字)
zh-Hant
クロアチア語
hr
クロアチア語 (クロアチア)
hr-HR
チェコ語
cs
Spectrum™ Technology Platform 8.0.0
第 23 章 : Data Normalization モジュール
言語 (カルチャー/地域)
カルチャー コード
チェコ語 (チェコ共和国)
cs-CZ
デンマーク語
da
デンマーク語 (デンマーク)
da-DK
ディベヒ語
dv
ディベヒ語 (モルディブ)
dv-MV
オランダ語
nl
オランダ語(ベルギー)
nl-BE
オランダ語 (オランダ)
nl-NL
英語
en
英語(オーストラリア)
en-AU
英語 (ベリーズ)
en-BZ
英語(カナダ)
en-CA
英語(カリブ諸国)
en-029
英語(アイルランド)
en-IE
英語(ジャマイカ)
en-JM
英語(ニュージーランド)
en-NZ
英語 (フィリピン)
en-PH
英語(南アフリカ)
en-ZA
英語 (トリニダード・トバゴ)
en-TT
英語 (英国)
en-GB
ユーザ ガイド
589
Open Parser
590
言語 (カルチャー/地域)
カルチャー コード
英語(米国)
en-US
英語 (ジンバブエ)
en-ZW
エストニア語
et
エストニア語 (エストニア)
et-EE
フェロー語
fo
フェロー語 (フェロー諸島)
fo-FO
ペルシア語
fa
ペルシア語 (イラン)
fa-IR
フィンランド語
fi
フィンランド語 (フィンランド)
fi-FI
フランス語
fr
フランス語(ベルギー)
fr-BE
フランス語(カナダ)
fr-CA
フランス語 (フランス)
fr-FR
フランス語(ルクセンブルク)
fr-LU
フランス語 (モナコ)
fr-MC
フランス語(スイス)
fr-CH
ガリシア語
gl
ガリシア語 (スペイン)
gl-ES
グルジア語
ka
Spectrum™ Technology Platform 8.0.0
第 23 章 : Data Normalization モジュール
言語 (カルチャー/地域)
カルチャー コード
グルジア語 (グルジア)
ka-GE
ドイツ語
de
ドイツ語(オーストリア)
de-AT
ドイツ語 (ドイツ)
de-DE
ドイツ語(リヒテンシュタイン)
de-LI
ドイツ語(ルクセンブルク)
de-LU
ドイツ語(スイス)
de-CH
ギリシア語
el
ギリシア語 (ギリシア)
el-GR
グジャラート語
gu
グジャラート語 (インド)
gu-IN
ヘブライ語
he
ヘブライ語 (イスラエル)
he-IL
ヒンディー語
hi
ヒンディー語 (インド)
hi-IN
ハンガリー語
hu
ハンガリー語 (ハンガリー)
hu-HU
アイスランド語
is
アイスランド語 (アイスランド)
is-IS
インドネシア語
id
ユーザ ガイド
591
Open Parser
592
言語 (カルチャー/地域)
カルチャー コード
インドネシア語 (インドネシア)
id-ID
イタリア語
it
イタリア語 (イタリア)
it-IT
イタリア語(スイス)
it-CH
日本語
ja
日本語 (日本)
ja-JP
カンナダ語
kn
カンナダ語 (インド)
kn-IN
カザフ語
kk
カザフ語 (カザフスタン)
kk-KZ
コンカニ語
kok
コンカニ語 (インド)
kok-IN
韓国語
ko
韓国語 (韓国)
ko-KR
キルギス語
ky
キルギス語 (キルギスタン)
ky-KG
ラトビア語
lv
ラトビア語 (ラトビア)
lv-LV
リトアニア語
lt
リトアニア語 (リトアニア)
lt-LT
Spectrum™ Technology Platform 8.0.0
第 23 章 : Data Normalization モジュール
言語 (カルチャー/地域)
カルチャー コード
マケドニア語
mk
マケドニア語 (マケドニア旧ユーゴスラビア共和国)
mk-MK
マレー語
ms
マレー語 (ブルネイ・ダルサラーム)
ms-BN
マレー語 (マレーシア)
ms-MY
マラーティー語
mr
マラーティー語 (インド)
mr-IN
モンゴル語
mn
モンゴル語 (モンゴル)
mn-MN
ノルウェー語
no
ノルウェー語 (ブークモール、ノルウェー)
nb-NO
ノルウェー語 (ニーノシュク、ノルウェー)
nn-NO
ポーランド語
pl
ポーランド語 (ポーランド)
pl-PL
ポルトガル語
pt
ポルトガル語 (ブラジル)
pt-BR
ポルトガル語 (ポルトガル)
pt-PT
パンジャブ語
pa
パンジャブ語 (インド)
pa-IN
ルーマニア語
ro
ユーザ ガイド
593
Open Parser
594
言語 (カルチャー/地域)
カルチャー コード
ルーマニア語 (ルーマニア)
ro-RO
ロシア語
ru
ロシア語 (ロシア)
ru-RU
サンスクリット語
sa
サンスクリット語 (インド)
sa-IN
セルビア語
sr
セルビア語 (セルビア、キリル文字)
sr-Cyrl-CS
セルビア語 (セルビア、ラテン文字)
sr-Latn-CS
スロバキア語
sk
スロバキア語 (スロバキア)
sk-SK
スロベニア語
sl
スロベニア語 (スロベニア)
sl-SI
スペイン語
es
スペイン語(アルゼンチン)
es-AR
スペイン語(ボリビア)
es-BO
スペイン語(チリ)
es-CL
スペイン語(コロンビア)
es-CO
スペイン語(コスタリカ)
es-CR
スペイン語 (ドミニカ共和国)
es-DO
スペイン語(エクアドル)
es-EC
Spectrum™ Technology Platform 8.0.0
第 23 章 : Data Normalization モジュール
言語 (カルチャー/地域)
カルチャー コード
スペイン語 (エルサルバドル)
es-SV
スペイン語(グアテマラ)
es-GT
スペイン語 (ホンジュラス)
es-HN
スペイン語 (メキシコ)
es-MX
スペイン語 (ニカラグア)
es-NI
スペイン語 (パナマ)
es-PA
スペイン語(パラグアイ)
es-PY
スペイン語(ペルー)
es-PE
スペイン語 (プエルトリコ)
es-PR
スペイン語 (スペイン)
es-ES
スペイン語 (スペイン、トラディショナル ソート)
es-ES_tradnl
スペイン語(ウルグアイ)
es-UY
スペイン語(ベネズエラ)
es-VE
スワヒリ語
sw
スワヒリ語 (ケニア)
sw-KE
スウェーデン語
sv
スウェーデン語 (フィンランド)
sv-FI
スウェーデン語 (スウェーデン)
sv-SE
シリア語
syr
シリア語 (シリア)
syr-SY
ユーザ ガイド
595
Open Parser
596
言語 (カルチャー/地域)
カルチャー コード
タミル語
ta
タミル語 (インド)
ta-IN
タタール語
tt
タタール語 (ロシア)
tt-RU
テルグ語
te
テルグ語 (インド)
te-IN
タイ語
th
タイ語 (タイ)
th-TH
トルコ語
tr
トルコ語 (トルコ)
tr-TR
ウクライナ語
uk
ウクライナ語 (ウクライナ)
uk-UA
ウルドゥー語
ur
ウルドゥー語 (パキスタン)
ur-PK
ウズベク語
uz
ウズベク語 (ウズベキスタン、キリル文字)
uz-Cyrl-UZ
ウズベク語 (ウズベキスタン、ラテン文字)
uz-Latn-UZ
ベトナム語
vi
ベトナム語 (ベトナム)
vi-VN
Spectrum™ Technology Platform 8.0.0
第 23 章 : Data Normalization モジュール
個人名および企業名のグラマー
Open Parser は、個人名および企業名のグラマーを 3 つ提供しています。 これらのパーシング グラ
マーをそのまま使用したり、コピーして独自のパーシング グラマーを作成することができます。 個人
名および企業名のパーシング グラマーには次のものがあります。
• 英語 (en)(597ページ)
• ドイツ語 (de)(599ページ)
• スペイン語 (es)(600ページ)
英語 (en)
英語パーシング グラマーは、英語カルチャーの個人名および企業名を処理します。 英語パーシング
グラマーは複合名を考慮し、既知の逆順の名前パターン (姓、名、ミドルネーム) もチェックします。
簡単な例は次のようになります。
入力: MARY-SUE BARTLETT JONES
FirstName: MARY-SUE
MiddleName: BARTLETT
LastName: JONES
FirstName、MiddleName、LastName は、まずそれぞれのテーブル内の既知の名前と照合されます。
FirstName および LastName トークン内ではハイフンで結ばれた名前、FirstName および MiddleName
トークン内では頭文字との照合も行われます。 名前が所定のテーブルに存在しない場合、パーシング
グラマーはそのトークンを正規表現として扱います。 LastName のマッチングでは、姓の前に付ける
敬称テーブルを使用して、姓の前に付ける敬称も考慮されます。 TitlesOfRespect (Mr、Mrs、Dr など)
や、MaturitySuffixes (I、II、III、Sen、Jun など) もパースされます。
英語パーシング グラマーの FirmName は、企業名称テーブルを使用して、企業テーブル内の既知の名
前と未知の名前に基づいてパースされます。
ユーザ ガイド
597
Open Parser
598
Spectrum™ Technology Platform 8.0.0
第 23 章 : Data Normalization モジュール
ドイツ語 (de)
ドイツ語パーシング グラマーは、ドイツ語カルチャーの個人名および企業名を処理します。 ドイツ語
パーシング グラマーは、英語パーシング グラマーに似ています。 主な相違点は、複合 FirstName に
対するグラマー ルールがないことと、多くのドイツ語名は 3 つ以上の名前で構成されているため、大
部分が MiddleName にパースされることです。 簡単な例は次のようになります。
入力: ASTRID ELSA MAR KAEMMERER
FirstName: ASTRID
MiddleName: ELSA MAR
LastName: KAEMMERER
通常、姓の前に付ける敬称がない限り、姓は単一のトークンです。 Barin、Graf などの肩書きが姓の
前に付ける敬称の前にある場合、肩書きも姓に含まれます。
入力: BERHARDINE BARONIN VON HAMMERSTEIN
FirstName: BERHARDINE
MiddleName: 該当なし
LastName: BARONIN VON HAMMERSTEIN
TitlesOfRespect (Herr および Frau) や、MaturitySuffixes (I、II、III、Sen、Jun など) も処理されます。
ドイツ語パーシング グラマーの FirmName は、英語パーシング グラマーの FirmName と同様に動作
します。 主な相違点は、FirmSuffix (企業接尾語テーブルとのマッチ) が見つかった場合、マッチのス
コアが 100 になることです。 FirmSuffix が見つからなかった場合、FirmName のマッチは企業テーブ
ルとの 1 つのマッチ、または企業名称テーブルとの 1 つ以上のマッチに依存します。
ユーザ ガイド
599
Open Parser
スペイン語 (es)
スペイン語パーシング グラマーは、スペイン語カルチャーの個人名および企業名を処理します。 スペ
イン語パーシング グラマーは、英語パーシング グラマーに似ています。 主な相違点は、父の姓と母
の姓を示すために、姓が 2 セットのトークンを "y" で結合したものになっていて、それぞれの姓の前
に "de" または "del" という冠詞が付く場合が多いということです。 スペイン語パーシング グラマー
は、このようなパターンを処理します。 スペイン語の名前は 3 つ以上の名で構成されており、ミドル
ネームがないため、名は FirstName にパースされます。 簡単な例は次のようになります。
入力: Jose Maria Alvarez del Manzano y Lopez del Hierro
FirstName: Jose Maria
MiddleName: 該当なし
PaternalLastName: Alvarez del Manzano
MaternalLastName: y Lopez del Hierro
スペイン語パーシング グラマーの FirmName は、英語パーシング グラマーの FirmName と同様に動
作します。 主な相違点は、FirmSuffix (企業接尾語テーブルとのマッチ) が見つかった場合、マッチの
スコアが 100 になることです。 FirmSuffix が見つからなかった場合、FirmName のマッチは企業テー
ブルとの 1 つのマッチ、または企業名称テーブルとの 1 つ以上のマッチに依存します。
600
Spectrum™ Technology Platform 8.0.0
第 23 章 : Data Normalization モジュール
ドメインエディタ
Open Parser ドメインエディタを使用して、カルチャー固有のパーシング グラマーを作成します。
パーシング グラマーを作成したら、Open Parser コンポーネントをデータフローで使用してパーシン
グ アクティビティを実行します。
ユーザ ガイド
601
Open Parser
ドメインエディタを使用する前に
このセクションでは、カルチャー固有のパーシング グラマーを作成および使用するためのワークフ
ロー プロセスについて説明します。 リンクを使用して、必要な情報を参照してください。 ワークフ
ロー プロセスは次のとおりです。
1. 名前、住所、電話データなどのドメインを作成します。 ドメイン名は、1 つまたは複数のグラマー
におけるドメイン パターンを表します。 [ドメイン] タブを使用して、グラマー エディタでのドメ
イン パターンの作成に使用するドメイン名を定義します。 ドメイン パターンは、入力データ内の
連続する 1 つ以上のトークンを表し、一般的にはパースに必要で、1 つ以上のカルチャーに関連付
けられます。 詳細については、ドメインの追加(603ページ)を参照してください。 ドメイン エ
ディタでドメインをインポートおよびエクスポートすることもできます。 詳細については、ドメ
インのインポートとエクスポートを参照してください。
2. サポートされているカルチャー用のグラマー ルールと Regex タグを定義します。 詳細について
は、カルチャー Regex タグの追加または変更(606ページ)を参照してください。 ドメイン エディ
タでカルチャーをインポートおよびエクスポートすることもできます。 詳細については、カル
チャーのインポートとエクスポートを参照してください。
3. ドメインとオプションのカルチャー プロパティを定義したら、1 つまたは複数のカルチャーを 1
つのドメインに関連付け、パーシング グラマーを定義します。 パーシング グラマーは、パーシン
グ グラマー コマンド、およびワークフロー プロセスの初期に作成したカルチャー プロパティ内で
定義済みのグラマー ルールと Regex タグを使用して定義します。 詳細については、カルチャー固
有のパーシング グラマーの作成(608ページ)を参照してください。
4. Open Parser をデータフローのキャンバスにドラッグして、入力と出力を接続します。
5. Open Parser のオプションで、ドメインエディタで作成したドメインとカルチャーを選択します。
詳細については、カルチャー固有のパーシング グラマーの使用(551ページ)を参照してください。
602
Spectrum™ Technology Platform 8.0.0
第 23 章 : Data Normalization モジュール
注: ドメインに依存しないパーシング グラマーを作成する場合は、ドメインに依存しないパーシ
ング グラマーの定義(551ページ)を参照してください。 ドメインに依存しないパーシング
グラマーの作成では、ドメインエディタは使用しません。
注: Open Parser を使用する前に詳細を理解したい場合は、Open Parser(544ページ)を参照し
てください。
ドメインの追加
1. [ドメイン] タブをクリックします。 [ドメイン] タブが表示されます。
2. [追加] をクリックします。[ドメインの追加] ダイアログ ボックスが表示されます。
3. [名前] テキスト ボックスにドメイン名を入力します。 既に存在する名前を入力した場合は、警告
アイコンが点滅します。 これで次のことができます。
•
別の名前を入力する
•
既存のドメインを削除する。 詳細については、ドメインの削除(604ページ)を参照してくださ
い。
4. [説明] テキスト ボックスにドメイン名の説明を入力します。
5. 新しい空のドメインを作成する場合は、[OK] をクリックします。 別のドメインを基に新しいドメ
インを作成する場合は、この作業を続行します。
6. 別のドメインを基に新しいドメインを作成する場合は、[他のドメインをテンプレートとして使用]
を選択します。
7. リストからドメインを選択します。 次のステップで [OK] をクリックすると、新しいドメインが作
成されます。 新しいドメインには、選択したドメイン テンプレートで定義済みのカルチャー固有
のパーシング グラマーがすべて含まれます。
8. [OK] をクリックします。
ドメインの変更
1. [ドメイン] タブをクリックします。 [ドメイン] タブが表示されます。
2. リストでドメインを選択し、[変更] をクリックします。 [ドメインの変更] ダイアログ ボックスが
表示されます。
3. 説明情報を変更します。
4. ドメインの説明のみを変更する場合は、[OK] をクリックします。 テンプレート ドメインを更新
し、その変更内容を変更中のドメインに追加する場合は、次の作業を続行します。
5. [他のドメインをテンプレートとして使用] を選択して、ドメイン テンプレートに対して行われた
変更を継承します。
6. リストからドメイン パターン テンプレートを選択します。 次のステップで [OK] をクリックする
と、ドメイン パターンが変更されます。 変更されたドメイン パターンには、選択したドメイン パ
ターン テンプレートで定義済みのカルチャー固有のパーシング グラマーがすべて含まれます。 選
択したドメイン パターン内のパーシング グラマーが、ドメイン パターン テンプレートのパーシン
グ グラマーで上書きされます。
ユーザ ガイド
603
Open Parser
7. [OK] をクリックします。
作業の結果を確認するには、次の手順に従います。
1. NameParsing というドメイン パターンを作成し、グローバル カルチャー、
en、および en-US 用のパーシング グラマーを定義します。
2. NameParsing2 というドメイン パターンを作成し、NameParsing をドメイ
ン パターン テンプレートとして使用します。 NameParsing2 は正確なコピー
として作成され、グローバル カルチャー、en、および en-US 用のパーシング
グラマーを含みます。
3. グローバル カルチャー グラマーのグラマー ルールの一部を変更することに
よって、NameParsing のカルチャー固有のパーシング グラマーを変更し、
en-CA を新しいカルチャーとして追加します。
4. [ドメイン] タブで NameParsing2 を選択して [変更] をクリックし、
NameParsing をドメイン パターン テンプレートとして再度使用します。
結果は次のとおりです。
• グローバル カルチャー パーシング グラマーが更新されます (変更を加えていた
場合は、その変更が上書きされます)。
• en および en-US は変更しません (ただし、これらがターゲット ドメインで変
更されている場合は、en および en-US は Name Parsing のバージョンに戻り
ます)。
• en-CA 用のカルチャー固有のグラマーが追加されます。
ドメインの削除
1. リストでドメインを選択します。
2. [削除] をクリックします。 ドメインが 1 つ以上のカルチャー固有のパーシング グラマーと関連付
けられている場合、次のようなメッセージが表示されます。
このドメインにカルチャー固有のパーシング グラマーが関連付けられていない場合、選択したド
メインの削除を確認するメッセージが表示されます。
3. [はい] をクリックします。 ドメインと、このドメインに関連付けられているカルチャー固有のパー
シング グラマーが削除されます。
604
Spectrum™ Technology Platform 8.0.0
第 23 章 : Data Normalization モジュール
ドメインのインポートとエクスポート
In addition to creating domains, you can also import domains you've created elsewhere and export domains
you create in the Domain Editor.
ドメインのインポート
1. [ドメイン] タブをクリックします。 [ドメイン] タブが表示されます。
2. [インポート] をクリックします。 [ドメインのインポート] ダイアログ ボックスが表示されます。
3. ドメイン名に移動して選択します。 [開く] をクリックします。 インポートしたドメインがドメイ
ン エディタに表示されます。
ドメインのエクスポート
1. [ドメイン] タブをクリックします。 [ドメイン] タブが表示されます。
2. [エクスポート] をクリックします。 [ドメインのエクスポート] ダイアログ ボックスが表示されま
す。
3. エクスポートしたドメインを保存したい場所に移動して選択します。 [保存] をクリックします。
エクスポートしたドメインが保存され、ドメイン エディタに戻ります。
カルチャー プロパティの定義
カルチャー階層は、グラマー ルールと Regex タグを構成するための主要な概念です。 カルチャー階
層を使用すると、グローバルおよび特定カルチャーの属性に従って、グラマー ルールと Regex タグを
追加および定義することができます。 子が親のグラマー ルールまたは Regex タグと同じ名前を使用
してグラマー ルールまたは Regex タグを定義した場合、カルチャー階層を使用して、子のグラマー
ルールおよび Regex タグのプロパティをオーバーライドすることもできます。 作成したオーバーライ
ドをキャンセルしたい場合は、オーバーライド プロパティを元の設定に戻すことができます。
注: カルチャー プロパティの定義はオプションで、カルチャー固有のパーシングに必須ではありませ
ん。
ドメインエディタにはいくつかの Regex タグが定義済みで、これを使用してカルチャー プロパティを
定義できます。 詳細については、カルチャー Regex タグの追加または変更(606ページ)を参照して
ください。 カルチャー階層の詳細については、カルチャー階層とは(548ページ)を参照してくださ
い。
カルチャーへのグラマー ルールの追加
カルチャー階層は、グラマー ルールと Regex タグを構成するための主要な概念です。 カルチャー階
層を使用すると、グローバルおよび特定のカルチャー属性に従って、グラマー ルールと Regex タグを
追加および定義することができます。 子が親のグラマー ルールまたは Regex タグと同じ名前を使用
してグラマー ルールまたは Regex タグを定義した場合、カルチャー階層を使用して、子のグラマー
ルールおよび Regex タグのプロパティをオーバーライドすることもできます。 作成したオーバーライ
ドをキャンセルしたい場合は、オーバーライド プロパティを元の設定に戻すことができます。
ユーザ ガイド
605
Open Parser
注: カルチャー プロパティの定義はオプションで、カルチャー固有のパーシングに必須ではありませ
ん。
ドメインエディタにはいくつかの Regex タグが定義済みで、これを使用してカルチャー プロパティを
定義できます。詳細については、を参照してください。カルチャーへのグラマールールの追加(605ペー
ジ)
カルチャー階層の詳細については、カルチャー階層とは(548ページ)を参照してください。
1. [カルチャー] タブをクリックします。 サポートされているカルチャーの一覧が [カルチャー] タブ
に表示されます。 サポートされている全カルチャーの一覧は、Open Parser のカルチャー コード
(586ページ)を参照してください。
2. リストからカルチャーを選択し、[プロパティ] をクリックします。 [カルチャー プロパティ] ダイ
アログ ボックスが表示されます。
3. [グラマー ルール] タブをクリックします。 [グラマー ルール] タブが表示されます。 表示される情
報には、選択したカルチャーおよび関連付けられたソース カルチャー用に定義されたグラマー ルー
ル名、定義済みのグラマー ルールの値、説明などがあります。
4. [追加] をクリックして、新しいグラマー ルールを追加します。 [グラマー ルールの追加] ダイアロ
グ ボックスが表示されます。
5. [名前] テキスト ボックスにグラマー ルールの名前を入力します。 選択したカルチャーに既に存在
する名前を入力した場合は、警告アイコンが点滅します。 別の名前を入力するか、このダイアロ
グ ボックスを閉じて、既存のグラマー ルールを削除してから、[追加] を再度クリックしてくださ
い。
6. [説明] テキスト ボックスにグラマー ルールの説明を入力します。
7. [値] テキスト ボックスにグラマー ルールの値を入力します。
値は任意の有効な変数、文字列、コマンド、またはグループ化した式です。 詳細については、パー
シング グラマーのリファレンス(558ページ)を参照してください。
8. テキスト ボックスの値をスクロールせずに表示するには、[右端での折り返しを有効にする] を選
択します。
9. [OK] をクリックすると、入力したグラマー ルールの値が検証されます。 値にグラマー構文のエ
ラーが含まれる場合は、発生したエラーの説明、エラーが発生した行と列、エラーが発生したコマ
ンド、グラマー ルール、または Regex タグに関するメッセージが表示されます。
カルチャー Regex タグの追加または変更
1. [カルチャー] タブをクリックします。 サポートされているカルチャーのリストが [カルチャー] タ
ブに表示されます。 サポートされている全カルチャーの一覧は、Open Parser のカルチャー コー
ド(586ページ)を参照してください。
2. リストからカルチャーを選択し、[プロパティ] をクリックします。 [カルチャー プロパティ] ダイ
アログ ボックスが表示されます。
3. [Regex タグ] タブをクリックします。 [Regex タグ] タブが表示されます。 表示される情報には、
選択したカルチャーおよび関連付けられたソース カルチャー用に定義された Regex タグ名や、
Regex タグの値、説明などがあります。 定義済みの Regex タグについては、カルチャー Regex
タグの追加または変更(606ページ)を参照してください。
606
Spectrum™ Technology Platform 8.0.0
第 23 章 : Data Normalization モジュール
4. [追加] または [変更] をクリックします。
5. [名前] テキスト ボックスに Regex タグの名前を入力します。
選択したカルチャーに既に存在する名前を入力した場合は、警告アイコンが点滅します。 別の名
前を入力するか、このダイアログ ボックスを閉じて、既存の Regex タグを削除してから、[追加]
を再度クリックしてください。
6. [説明] テキスト ボックスに Regex タグの説明を入力します。
7. [値] テキスト ボックスに Regex タグの値を入力します。
値は任意の有効な正規表現です。 詳細については、パーシング グラマーのリファレンス(558ペー
ジ)を参照してください。 Regex の値は検証されません。
ドメインエディタにはいくつかの Regex タグが定義済みで、これを使用してカルチャー プロパ
ティを定義できます。 パーシング グラマーのトークン化文字の定義にも、これらの Regex タグを
使用できます。
定義済みの Regex タグを変更するか、それをコピーして独自の Regex タグを作成することができ
ます。 オーバーライド プロパティを使用して、特定の言語用に特殊な Regex タグを作成すること
もできます。
• 文字: 任意の言語の任意の文字。 この Regex タグには、キリル文字のスクリプト、アジア言語
のスクリプト、タイ語のスクリプトなど、使用するスクリプトの違いによって、複数の言語用の
オーバーライドが含まれます。
• 小文字: 対応する大文字がある小文字。
• 番号: 任意のスクリプトの任意の数字。
• 句読文字: 任意の句読文字。
• 大文字: 対応する小文字がある大文字。
• 空白: 任意の空白または非表示の区切り文字。
8. [OK] をクリックします。
カルチャーのインポートとエクスポート
In addition to creating cultures, you can also import cultures you've created elsewhere and export cultures you
create in the Domain Editor.
カルチャーのインポート
1. [カルチャー] タブをクリックします。 [カルチャー] タブが表示されます。
2. [インポート] をクリックします。 [カルチャーのインポート] ダイアログ ボックスが表示されます。
3. カルチャーに移動して選択します。 [開く] をクリックします。 インポートしたカルチャーがドメ
イン エディタに表示されます。
カルチャーのエクスポート
1. [カルチャー] タブをクリックします。 [カルチャー] タブが表示されます。
2. [エクスポート] をクリックします。 [カルチャーのエクスポート] ダイアログ ボックスが表示され
ます。
ユーザ ガイド
607
Open Parser
3. エクスポートしたカルチャーを保存したい場所に移動して選択します。 [保存] をクリックします。
エクスポートしたカルチャーが保存され、ドメイン エディタに戻ります。
カルチャー固有のパーシング グラマーの作成
[グラマー] タブを使用して、カルチャー固有のパーシング グラマー用のグラマー ルールを定義しま
す。 パーシング グラマーの詳細については、パーシング グラマーとは(545ページ)を参照してくだ
さい。
カルチャー固有のパーシング グラマーを作成するには、次の手順に従います。
1. [ドメイン] ドロップダウン矢印をクリックして、ドメイン パターンを選択します。 パーシング グ
ラマーに関連付けるドメインを作成してからでなければ、カルチャー固有のパーシング グラマー
は作成できません。
2. [追加] をクリックします。[カルチャーの追加] ダイアログ ボックスが表示されます。
3. リストからカルチャーを選択し、[OK] をクリックします。 サポートされている全カルチャーの一
覧は、Open Parser のカルチャー コード(586ページ)を参照してください。 [グラマーの編集] ダ
イアログ ボックスが表示されます。
4. グラマーエディタを使用して、グラマー ルールを作成します。 テキスト ボックスにテキスト コマ
ンドと変数を入力するか、[コマンド]、[グラマー ルール] 、および [Regex タグ] タブを使用して、
定義済みのパーシング グラマー要素を挿入することができます。
•
コマンドについては、パーシング グラマーのリファレンス(558ページ)を参照してください。
•
グラマー ルールの式については、カルチャー固有のパーシング グラマーの使用(551ページ)
を参照してください。
•
正規表現については、を参照してください。 カルチャー固有のパーシング グラマーの使用
(551ページ)
5. グラマー ルールのテキストを使用可能なテキスト ボックス幅で表示する場合は、[右端での折り返
しを有効にする] をクリックします。
6. カルチャー プロパティを編集するには、[カルチャー プロパティ] ボタンをクリックします。 ボタ
ンのラベルは、現在編集中のカルチャーに合わせて変化します。
7. [グラマー] テキスト ボックスの内容を削除するには、[クリア] をクリックします。
8. 作成した グラマー構文をチェックするには、[検証] をクリックします。 パーシング グラマーの検
証機能により、グラマー構文のエラーが表示されます。表示には、発生したエラー、エラーが発生
した行と列、エラーが発生したコマンド、グラマー ルール、または Regex タグが含まれます。
608
Spectrum™ Technology Platform 8.0.0
第 23 章 : Data Normalization モジュール
9. [プレビュー] タブをクリックします。 実用的なパーシング グラマーは、繰り返し作業によって作
成されます。 プレビューは、入力データに対してさまざまなテストを行い、パーシング グラマー
によって期待した結果が得られることを確認するのに役立ちます。
10. 入力フィールドにテスト値を入力し、[プレビュー] をクリックします。
ユーザ ガイド
609
Table Lookup
パースされた出力フィールドが [結果] グリッドに表示されます。 出力フィールドについては、出
力(558ページ)を参照してください。 トレースについては、パーシング グラマーのトレース
(554ページ)を参照してください。
11. [入力データ] の値と [結果] グリッドをリセットするには、[すべてクリア] をクリックします。
12. 期待した結果が得られない場合は、[グラマー] タブをクリックし、期待した結果が得られるまで
パーシング グラマーの編集と代表的な入力データのテストを続行します。
13. 必要な操作が終了したら、[OK] をクリックします。
14. [グラマー ルール] タブに [カルチャー プロパティ] ダイアログ ボックスで作成したグラマー ルール
が表示されます。 グラマー ルールの作成の詳細については、カルチャーへのグラマー ルールの追
加(605ページ)を参照してください。 定義済みのグラマー ルールをパーシング グラマーに追加す
るには、次の手順に従います。
a) [グラマー] テキスト ボックス内の式を挿入する位置にカーソルを位置付けます。
b) [グラマー ルール] タブをクリックします。 [グラマー ルール] タブが表示されます。
c) リストのグラマー ルールをダブルクリックします。 グラマー ルールが [グラマー] テキスト
ボックスに追加されます。
15. [Regex タグ] タブに [カルチャー プロパティ] ダイアログ ボックスで作成した Regex タグが表示さ
れます。 Regex タグの作成の詳細については、カルチャー Regex タグの追加または変更(606ペー
ジ)を参照してください。 Regex タグをパーシング グラマーに追加するには、次の手順に従いま
す。
a) [グラマー] テキスト ボックス内の Regex タグを挿入する位置にカーソルを位置付けます。
b) [Regex タグ] タブをクリックします。 [Regex タグ] タブが表示されます。
c) リストの Regex タグをダブルクリックします。 Regex タグが [グラマー] テキスト ボックスに
追加されます。
ドメインエディタにはいくつかの Regex タグが定義済みで、これを使用することができます。 詳
細については、カルチャー Regex タグの追加または変更(606ページ)を参照してください。
Table Lookup
Table Lookup コンポーネントは、語とその語の妥当性確認済みの形式とを照合して正規化し、標準
バージョンを適用します。 この評価は、正規化する語をテーブルから検索して実行されます。
次に例を示します。
名
姓
ソース入力:
Bill
Smith
正規化された出力:
William
Smith
アクションには、 正規化、特定、および分類の 3 種類があります。
610
Spectrum™ Technology Platform 8.0.0
第 23 章 : Data Normalization モジュール
正規化アクションの実行時に語が見つかると、Table Lookup は、フィールド全体またはそのフィール
ド内の個々の語を正規化語に置き換えます。この置き換えは、フィールドに複数の単語が含まれてい
る場合も行われます。 Table Lookup には、単語のフルスペルを省略形に変更する、単語の省略形をフ
ルスペルに変更する、ニックネームを正しい名前に変更する、ミススペルを訂正する機能等がありま
す。
特定アクションの実行時に語が見つかると、Table Lookup は、そのレコードに対して、正規化可能な
語を含むレコードとしてのフラグを設定しますが、アクションは実行しません。
分類アクションの実行時に語が見つかると、Table Lookup は、ソースの値をキーとして使用して、対
応する値をテーブル エントリから、選択されたフィールドにコピーします。 どのソース語もマッチし
ない場合は、指定のデフォルト値が使用されます。
入力
表 87 : Table Lookup 入力フィールド
フィールド名
説明/有効値
Source
スキャンおよび分割を評価するためのソース入力フィールドを指定し
ます。
StandardizationTable
Table Lookup のテーブル(537ページ)に一覧表示されているテーブ
ルの 1 つ。
オプション
Table Lookup のオプションを指定するには、ルールを作成します。 複数のルールを作成して、ルール
を適用する順序を指定することができます。 ルールを作成するには、次の手順に従います。
1. キャンバスで、Table Lookup のインスタンスをダブルクリックします。 [Table Lookup オプショ
ン] ダイアログが表示されます。
2. 実行時インスタンスの番号を選択します。
実行時インスタンス オプションを使用して、コンポーネントの複数同時インスタンスを実行し、
パフォーマンスを向上できるように、データフローを設定します。
3. [追加] をクリックします。[Table Lookup ルール オプション] ダイアログが表示されます。
注: 複数の Table Lookup ルールを追加する場合は、[上へ移動] ボタンと [下へ移動] ボタンを使用
して、ルールの適用順序を変更することができます。
4. フィールド全体またはそのフィールド内の個々の語に対して実行するアクションを選択します。
次のオプションがあります。
ユーザ ガイド
611
Table Lookup
• 正規化 — フィールド全体またはそのフィールド内の個々の語を正規化語に置き換えます。この
置き換えは、フィールドに複数の単語が含まれている場合も行われます。 [フィールド全体] を
選択した場合、Table Lookup はフィールド全体を 1 つの文字列として扱い、文字列全体を使用
してフィールドを正規化します。 例えば、"International Business Machines" は "IBM" に変更さ
れます。 [フィールド内の個々の語] を選択した場合、Table Lookup はフィールドをパースし、
そのフィールド内の個々の語を正規化します。 例えば、"Bill Mike Smith" は "William Michael
Smith" に変更されます。
• 特定 — そのレコードに対して、正規化可能な語を含むレコードとしてのフラグを設定しますが、
アクションは実行しません。 フィールドを正規化できる場合は値 Yes を、正規化できない場合
は値 No を持つ出力フィールド StandardizedTermIdentified がレコードに追加されます。 [フィー
ルド全体] を選択した場合、Table Lookup はフィールド全体を 1 つの文字列として扱い、文字列
全体を正規化できる場合はレコードにフラグを設定します。 [フィールド内の個々の語] を選択
した場合、Table Lookup はフィールドをパースし、そのフィールド内の一語でも正規化できる
場合はレコードにフラグを設定します。
• 分類 — ソースの値をキーとして使用して、対応する値をテーブル エントリから [デスティネー
ション] リストで選択したフィールドにコピーします。 [フィールド全体] を選択した場合、Table
Lookup はフィールド全体を 1 つの文字列として扱い、文字列全体を分類できる場合はレコード
にフラグを設定します。
[フィールド内の個々の語] を選択した場合、Table Lookup は各語を処理し、マッチング テーブル
の値を結果にコピーします。 正規化 と異なり、テーブル マッチがない場合、分類はソース語をコ
ピーしません。 どのソース語もマッチしない場合は、指定のデフォルト値が使用されます。
[フィールド内の個々の語] を選択した場合、Table Lookup は最初にマッチする複数の単語からな
る語まで処理します (正規化と同様)。 正規化と異なり、分類はそのテーブル値のみを返し、[ソー
ス] からは何も返しません。 どのソース語もマッチしない場合は、指定のデフォルト値が使用され
ます。
5. [ソース] リストで、検索する入力フィールドを選択します。
6. [デスティネーション] リストで、選択したアクションの実行時に語をコピーするデスティネーショ
ン フィールドを選択します。
値を置き換える場合は、[ソース] リストで指定したものと同じフィールドを [デスティネーション]
リストで指定します。 作成したいフィールドの名前を入力して、新しいフィールドを作成するこ
ともできます。
[特定] を選択した場合、[デスティネーション] リストは使用できません。
7. [テーブル] リストで、検索語を含むテーブルを選択します。
編集可能なテーブルの一覧は、Table Lookup のテーブル(537ページ)を参照してください。 テー
ブルの作成または変更については、テーブル管理(613ページ)を参照してください。
8. 指定された文字列内の複数の単語からなる語の検索を有効にするには、[複数の単語からなる語を
検索] チェック ボックスを選択します。
注: このオプションを選択すると、パフォーマンスに悪影響が生じる場合があります。
612
Spectrum™ Technology Platform 8.0.0
第 23 章 : Data Normalization モジュール
例えば、
入力文字列 = "Major General John Smith"、ビジネス ルール: エントリを含むテーブルに基づいて
文字列内の "Major General" を識別する、出力 = "Major General" を "Maj. Gen." で置き換えるもの
とします。
複数の単語からなる語の検索では、最初にマッチが出現した時点で検索は停止します。
[対象] が [フィールド全体] に設定されている場合、このオプションは無効になります。
9. ステップ 4 で [分類] アクションを選択した場合は、テーブル エントリが見つからなかった場合に
使用するデフォルト値オプションを選択します。 [ソース] のキー値を使用するか、[その他] テキ
スト ボックスに値を入力することができます。 [その他] テキスト ボックスでは、空の文字列は有
効な値です。
10. [OK] をクリックします。
出力
表 88 : Table Lookup の出力
フィールド名
説明/有効値
StandardizedTermIdentified
正規化可能な語がフィールドに含まれているかどうかを示します。
[フィールド全体] オプションまたは [フィールド内の個々の語] オプ
ションを選択した場合にのみ出力されます。
Yes
レコードは正規化可能な語を含みます。
No
レコードは正規化可能な語を含みません。
テーブル管理
テーブル管理は、Enterprise Designer ツールの 1 つです。このツールは、Advanced Transformer、
Open Parser、および Table Lookup テーブルの検索テーブルの内容を変更するときに使用します。 検
索テーブルは、キー/値のペアで構成されるテーブルです。Spectrum™ Technology Platform のコンポー
ネントはデータを正規化するとき、このテーブルを使用してトークンの置き換えを行います。 テーブ
ル管理では、基本テーブルとユーザ テーブルの 2 種類の検索テーブルを使用します。
基本テーブルは、製品のインストールの一部として展開される検索テーブルです。 基本テーブルは、
読み取り専用で、変更できませんが、ユーザ テーブルと組み合わせて使用すると、テーブルの変更が
表示されます。
ユーザ ガイド
613
テーブル管理
ユーザ テーブルは、ユーザの変更を含む検索テーブルです。 ユーザ テーブルは、基本テーブルに基
づくことがあります。この場合、ユーザ テーブルには、ユーザが基本テーブルに加えた変更が含まれ
ます。 また、ユーザ テーブルは、スタンドアロンで使用することもできます。この場合、ユーザ テー
ブルは、ユーザによって作成され、展開されている基本テーブルには基づきません。
テーブル管理のオープン
テーブル管理を開くと、デフォルトでは Table Lookup テーブルが表示されます。 他のテーブル タイ
プを表示するには、Advanced Transformer または Open Parser を選択します。 変更する 1 語または
テーブル内の語の範囲を素早く検索したり、検索語のサブセットを選択することによって、大きなテー
ブル内の関連語の表示に要する時間を短縮するには、[コンテンツ] コントロールを使用します。
テーブル管理を開くには、次の手順に従います。
1. [ツール] メニューで [テーブル管理] を選択します。
2. [タイプ] リストからテーブル タイプを選択します。 選択肢は Advanced Transformer、Open Parser、
および Table Lookup です。 Advanced Transformer または Open Parser を選択した場合、テーブ
ル管理には検索語の一覧が表示されます。 Table Lookup を選択した場合、テーブル管理には、 検
索語の一覧と、関連付けられた正規化語の 2 列が表示されます。
3. [名前] リストからテーブルを選択します。 テーブルのコンテンツが [コンテンツ] セクションに表
示されます。[タイプ] リストで [Advanced Transformer] または [Open Parser] を選択した場合
は、ステップ 5 に進んでください。
4. [タイプ] リストで [Table Lookup] を選択した場合は、[正規化語 (グループ化)] を選択して、Table
Lookup テーブルのコンテンツをグループごとに表示することができます。
5. テーブルに表示される検索語のサブセットを表示するには、[コンテンツ] コントロールを使用しま
す。 [次の順で表示] リストが表示されるのは、[タイプ] リストで [Table Lookup] を選択した場合
だけです。
6. [次で開始] テキスト ボックスに表示したい検索語の先頭の数文字を入力します。
7. ページあたりの表示項目数を入力します。 デフォルト値は 100 です。
614
Spectrum™ Technology Platform 8.0.0
第 23 章 : Data Normalization モジュール
8. [更新] をクリックします。
進捗バーが表示されます。 リストのコンテンツが更新され、[次で開始] の範囲に含まれる検索語が
表示されます。
9. 表示された検索語のサブセットの各ページを表示するには、ページ コントロールを使用します。
テーブル間を移動したり、テーブル管理を閉じたりすると、現在のテーブルのコンテンツ コント
ロール設定が保存されます。
テーブル項目の追加
管理対象テーブルに項目を追加することができます。 ユーザ定義項目はユーザの検索テーブルに個々
に保存されているため、製品のアップグレードによって、ユーザ定義の変更を上書きすることなく、
基本テーブルを置き換えることができます。
テーブル項目を追加するには、次の手順に従います。
1. [追加] をクリックします。[項目の追加] ダイアログ ボックスが表示されます。 [項目の追加] ダイ
アログ ボックスは、変更するテーブル タイプによって異なります。
図 3 : Table Lookup テーブル
図 4 : Advanced Transformer テーブルまたは Open Parser テーブル
テーブル コンテンツが値の順で表示され、いずれかのグループがハイライト表示されている場合、
ハイライト表示されている値が [項目の追加] ダイアログ ボックスに設定されます。
2. 既に語が表示されている場合は、[検索語] テキスト ボックスに語を入力します。
3. Table Lookup テーブルの場合は、[正規化語] テキスト ボックスに値を入力します。
4. この語が既に Table Lookup テーブルに存在し、ステップ 3 で入力した値で置き換えたい場合は、
[既存の語を上書き] チェック ボックスを選択します。
5. [追加] をクリックします。
テーブル項目またはテーブル グループの変更
Table Lookup テーブルの項目またはグループを変更することができます。 ユーザ定義項目はユーザの
検索テーブルに個々に保存されているため、製品のアップグレードによって、ユーザ定義の変更を上
書きすることなく、基本テーブルを置き換えることができます。
ユーザ ガイド
615
テーブル管理
テーブル項目を変更するには、次の手順に従います。
1. キーを選択し、[変更] をクリックします。 [項目の変更] ダイアログ ボックスが表示されます。
2. [正規化語] テキスト ボックスに新しい値を入力します。
3. [OK] をクリックします。
4. テーブル グループを変更するには、次の手順に従います。
a) [正規化語 (グループ化)] をクリックします。
b) グループを選択し、[変更] をクリックします。 [グループの変更] ダイアログ ボックスが表示さ
れます。
c) [正規化語] テキスト ボックスに新しい値を入力します。
テーブル項目またはテーブル グループの削除
インストール済みの基本テーブルからテーブル項目またはグループを物理的に削除することはできま
せん。 テーブル項目またはテーブル グループを削除すると、そのテーブル項目またはグループが非表
示になります。 このため、基本テーブルの元の状態がそのまま保持されます。
テーブル項目を削除するには、次の手順に従います。
1. テーブル項目またはグループを選択し、[削除] をクリックします。 [削除の確認] ダイアログ ボッ
クスが表示されます。
2. [はい] をクリックして、テーブル項目またはグループを削除します。
ユーザ テーブルの追加
基本テーブルを基にしないユーザ テーブルを追加できます。
ユーザ テーブルを追加するには、次の手順に従います。
1. [タイプ] リストからテーブル タイプを選択します。
2. [新規] をクリックします。 [テーブルの追加] ダイアログ ボックスが表示されます。
3. 新規テーブルの名前を入力します。
4. 選択したタイプの新しい空のテーブルが必要な場合は、[コピー元] は None に設定したままにして
ください。 既存の追加済みテーブルを基に新しいテーブルを作成する場合は、[コピー元] リスト
からテーブル名を選択します。
5. [OK] をクリックします。
注: その名前のテーブルが既に存在する場合は、警告メッセージが表示されます。
テーブル タイプに基づいて、テーブル コンテンツ領域が更新されます。 Table Lookup テーブル
を作成した場合は、2 つの列が表示されます。 Advanced Transformer テーブルまたは Open Parser
テーブルを作成した場合は、グループ ビューがなく、1 つの列が表示されます。
新規テーブルへのテーブル項目の追加については、テーブル項目の追加(615ページ)を参照してくだ
さい。
616
Spectrum™ Technology Platform 8.0.0
第 23 章 : Data Normalization モジュール
テーブルのカスタマイズを元に戻す
標準テーブルでテーブル項目またはグループを追加、削除、または変更する以前の元の状態に、カス
タマイズしたテーブルを戻すことができます。
テーブルのカスタマイズを元に戻すには、次の手順に従います。
1. テーブルを選択します。 詳細については、テーブル管理のオープン(614ページ)を参照してくだ
さい。
2. [元に戻す] をクリックします。 [元に戻す] ダイアログ ボックスが表示されます。 [元に戻す] ダイ
アログ ボックスに、追加、削除、および変更されたすべてのテーブル エントリが表示されます。
3. 元に戻したい各テーブル エントリの [元に戻す] チェック ボックスを選択します。 [すべて選択] ま
たは [すべて非選択] をクリックして、すべての [元に戻す] チェック ボックスを選択またはクリア
することもできます。
4. 選択が終了したら、[OK] をクリックします。 選択されたすべてのテーブル エントリが、元の状態
に戻ります。
ユーザ定義テーブルのインポート
ユーザ定義テーブルを既存のテーブルにインポートするには、次の手順に従います。
1. テーブルを選択します。 詳細については、テーブル管理のオープン(614ページ)を参照してくだ
さい。
2. [インポート] をクリックします。 [インポート] ダイアログ ボックスが表示されます。
3. [参照] をクリックして、インポートするファイルを選択します。 ファイル要件は次のとおりです。
• 区切り記号付きの UTF-8 エンコード ファイルであること。
• サポートされている区切り文字がカンマ (,)、セミコロン (;)、パイプ (|)、タブ (\t) であること。
ユーザ ガイド
617
テーブル管理
• 区切り記号が埋め込まれたフィールドが二重引用符で開始および終了していること
("1,a"、"2,b"、"3,c" など)。
• 二重引用符で開始および終了しているフィールド内のリテラル引用符が 2 つの引用符を持つこと
("2"" feet" など)。
4. [開く] をクリックします。 ファイルのプレビューに、インポートされたファイル内のデータのプ
レビューが表示されます。 ファイルの読み込み中に問題が発生した場合は、エラー メッセージが
表示されます。
5. ユーザ定義テーブルから列を選択して、既存テーブルの列にマップすることができます。 例えば、
インポートするユーザ定義テーブルに 2 つの列があるものとします。 column1 と column2 です。
列のリストには column1 と column2 が表示されます。 column2 を選択して検索語にマップし、
column1 を選択して正規化語にマップすることができます。
6. [新しい語のみインポート] を選択してユーザ定義テーブルから新規レコードのみをインポートする
か、[既存の語を上書き] を選択して選択した列のすべてのレコードをインポートします。
7. [OK] をクリックします。
高度なインポートの使用
高度なインポートを使用すると、次のことが可能です。
• 区切り記号付きのユーザ定義ファイルで選択した列から、語を抽出する。
• 区切り記号付きのユーザ定義ファイルで選択した列から、1 語からなる単語 (トークン) を抽出する。
トークンを抽出すると、ファイル内の指定の列にその語が出現する回数を識別し、関連語のグルー
プを作成して、テーブルに追加することができます。
高度なインポートでは、次のテーブル タイプがサポートされています。
• Advanced Transformer
• Table Lookup
• Open Parser
1. テーブルを選択します。 詳細については、テーブル管理のオープン(614ページ)を参照してくだ
さい。
2. [高度な インポート] をクリックします。 [高度なインポート] ダイアログ ボックスが表示されま
す。
3. [参照] をクリックして、インポートするファイルを選択します。
Open Parser テーブルおよび Table Lookup テーブルは、次の要件を満たさなければなりません。
• 区切り記号付きの UTF-8 エンコード ファイルであること。
• 区切り文字がカンマ (,)、セミコロン (;)、パイプ (|)、またはタブ (\t) であること。
• 区切り記号が埋め込まれたフィールドが二重引用符で開始および終了していること
("1,a"、"2,b"、"3,c" など)。
• 二重引用符で開始および終了しているフィールド内のリテラル引用符が 2 つの引用符を持つこと
("2"" feet" など)。
4. [開く] をクリックします。
618
Spectrum™ Technology Platform 8.0.0
第 23 章 : Data Normalization モジュール
5. [列] リストからテーブル列を選択します。 サンプル データによって、ユーザ定義テーブルに表示
される各語の出現頻度が示されます。 頻度は、既存のテーブルにまだ存在しない語に関してのみ
表示されます。
6. 語を 1 語からなる単語として表示するには、[1 語からなる単語に分割] を選択します。
7. Transformer テーブルおよび Open Parser テーブルの場合
a) 左側のリストから語を選択します。
b) 右側のリストに語を追加するには、右矢印をクリックします。 選択した語をテーブル リストか
ら削除するには、左矢印をクリックします。
c) [OK] をクリックして、変更をテーブルに保存します。
8. Table Lookup テーブルの場合
a)
をクリックして、テーブル グループを追加します。
b) [新規] をクリックします。
c) 新しい語を入力して、[追加] をクリックします。語の追加を最後まで続行し、[閉じる] をクリッ
クします。
d) リストから語を選択して、[追加] をクリックします。語の追加を最後まで続行し、[閉じる] を
クリックします。 新しい語が右側の語のリストに追加されます。
e) 選択したグループに語を追加するには、左側で語を選択し、右矢印をクリックします。 語をい
ずれかのグループから削除するには、左矢印をクリックします。
f) 語を変更するには、右側のリストから語を選択して、
をクリックします。
g) 語を削除するには、右側のリストから語を選択して、
をクリックします。
h) [OK] をクリックして、変更をテーブルに保存します。
Transliterator
Transliterator は、ラテン文字など、異なるスクリプト (用字系) の間で文字列を変換します。 例:
ソース
書き直し
kyanpasu
biologichyeskom
書き直しは翻訳でないことを心に留めておくことが重要です。 書き直しは、基盤となる語句を翻訳せ
ずに、異なる用字系の間で文字を変換することを意味します。
注: 標準の書き直し方法は、多くの場合、変換先の用字系における特定言語の発音ルールに従いませ
ん。
ユーザ ガイド
619
Transliterator
Transliterator ステージでは、以下の用字系がサポートされています。 一般に、Transliterator ステージ
は、UNGEGN のラテン文字化方式に関する作業部会 (Working Group on Romanization Systems) のガ
イドラインに従います。 詳細については、www.eki.ee/wgrs を参照してください。
アラブ系
アラビア語、イラン語、ウルドゥー語など、複数のアジアおよびアフリカの言語で
使われる用字系。
Cyrillic
ロシア語などのスラブ系の言語を含む、東ヨーロッパおよびアジアの言語で使われ
る用字系。 基本キリル文字セットに関しては、Transliterator ステージは一般に ISO
9 に従います。
ギリシャ系
ギリシャ語で使われる用字系。
半角/全角
Transliterator ステージは、幅の狭い半角用字系と幅の広い全角用字系の間の変換を
行えます。 例えば、これは半角です。
。 これは全角です。
。
Hangul
韓国語で使われる用字系です。 Transliterator ステージは、韓国文化観光部の書き直
し規則に従います。 詳細については、The National Institute of the Korean
Language (韓国国立国語院) の Web サイトを参照してください。
漢字
日本語を書くために使うことができる複数の用字系の 1 つ。
片仮名
日本語を書くために使うことができる複数の用字系の 1 つ。 Transliterator ステー
ジでは、ヘボン式と少しだけ異なる用字系が使われます。 ヘボン式では、ZI ( ) と
DI ( ) は、どちらも "ji" で表現され、ZU ( ) と DU ( ) はどちらも "zu" で表現され
ます。 DI の代わりに "dji"、DU の代わりに "dzu" を使えば、書き直しの可逆性が少
し改善されます。 片仮名書き直しは可逆です。
Latin
英語など、ヨーロッパの多くの言語で使われる用字系。
Transliterator は、Data Normalization モジュールのコンポーネントです。 他のコンポーネントの一覧
については、Data Normalization モジュールとは(534ページ)を参照してください。
書き直しの概念
用字系の書き直しには、一般に望ましいとされる品質要件がいくつか存在します。 適切な書き直しに
求められる要件は次のとおりです。
• 完備性
• 予見性
• 発音可能性
• 明白性
これらの品質要件が同時に満たされることはまれなので、Transliterator ステージは、これらの要件の
バランスを取ろうとします。
620
Spectrum™ Technology Platform 8.0.0
第 23 章 : Data Normalization モジュール
完備性
変換元用字系における正しい形式の文字シーケンスが、変換先用字系の文字シーケンスにすべて書き
直される、という要件です。
予見性
文字そのものが与えられれば (その用字系で記述される言語に関する知識がなくても)、比較的少数の
ルールに基づいて書き直しが可能である、という要件です。 これで書き直しを機械的に実行できるよ
うになります。
発音可能性
書き直しは、その発音に気を配らずにただ文字をマッピングするだけなら、ほとんど意味がありませ
ん。 例えば、
を "abcdefgh..." にマッピングするだけだと、完備性と明白性は満たされるか
もしれませんが、発音できません。
標準の書き直し方法は、多くの場合、変換先の用字系における特定言語の発音ルールに従いません。
例えば、日本語のヘボン式では (フランス語、ドイツ語、またはスペイン語とは対照的に) 英語の音価
を持つ "j" が使われますが、使われる母音は標準的な英語の音声を持ちません。 書き直し方法の中に
は、場合によって適切な発音を得るために特別な知識が必要とされるものもあります。 例えば、日本
語の訓令式では "tu" が "tsu" と発音されます。 これは同じ用字系内に異なる言語が存在するような状
況と似ています。 例えば、単語 Gewalt がドイツ語由来の単語であるという知識があれば、"w" は "v"
と発音されるでしょう。
場合によって、書き直しは慣習による影響を大きく受けます。 例えば、現代ギリシャ語の文字 "ベー
タ" ( ) の音声は "v" に似ていますが、変換によっては、(biology のように) そのまま b が使われること
があります。 この場合、ユーザは書き直し後の単語内の "b" が "ベータ" ( ) に対応し、現代ギリシャ
語では "v" と発音されることを知っている必要があります。 発音の予見性を高めるために文脈によっ
て文字が異なる書き直しを受けることもあります。 例えば、ギリシャ語の文字シーケンス "ガンマ ガ
ンマ" ( ) は "ng" と発音され、最初の "ガンマ" は "n" と文字化できます。
注: 一般に、ラテン語の用字系を他の用字系に書き直すとき予見性の高い結果を得るために、英語の
テキストで音声は生成されません。 英語の発音は単語内の文字から簡単に予見できないからで
す。 例えば、単語の grove、move、love はいずれも "ove" で終わっていますが、発音は大きく異
なります。
明白性
変換先用字系の書き直し結果から変換元用字系のテキストを常に復元できる、という要件です。 例え
ば、Ellada を変換前の
に復元できなければなりません。 ただし、複数文字の書き直しでは曖昧
性が生じることがあります。 例えば、ギリシャ語の文字 "プサイ" ( ) は ps にマッピングされますが、
ps は文字シーケンス "パイ シグマ" (
) から生成される場合もあります。"パイ" ( ) は p にマッピン
グされ、"シグマ" ( ) は s にマッピングされるからです。
この曖昧性の問題に対処するために、Transliterator はアポストロフィ (') を用いて文字シーケンスの曖
昧性を解消しています。 この手順に従うと、ギリシャ文字の "パイ シグマ" (
) は p's にマッピング
ユーザ ガイド
621
Transliterator
されます。 日本語では、変換先用字系で曖昧な文字シーケンスが単一の文字から生成されない限り、
変換の曖昧性解消のためにアポストロフィ (') が用いられます。 例えば、man'ichi と manichi を区別す
るためにこの手順が用いられます。
注: 変換先用字系の文字の中には、限られた文脈以外であまり目にすることがないものがあります。
例えば、日本語の "kya" (
) などに現れる小文字の "ya" (ャ) は、通常、単独では使われません。
このような文字を扱うために、Transliterator はチルダ (~) を使います。 例えば、入力が "~ya" な
ら単独の小文字 "ya" (ャ) が生成されます。 ギリシャ文字への書き直しで、入力が "a~s" なら単語
末尾でもギリシャ語のファイナルでない "シグマ" (
) が生成されます。 同様に、入力が "~sa"
なら単語末尾でなくてもファイナルな "シグマ" ( ) が生成されます。
一般的な用字系の変換では、可逆性を得るための共通の技法として、通常なら区別できないような文
字の間に特別なアクセント記号を用いることが行われています。 例えば、以下は完全に可逆なラテン
文字にマッピングされるギリシャ語テキストです。
入力
フィールド名
説明
任意の文字列フィールド
Transliterator ステージでは、任意の文字列フィー
ルドを書き直すことができます。 Transliterator ス
テージのオプションで、どのフィールドを書き直
すかを指定できます。
TransliteratorID
Transliterator ステージのオプションで指定された
デフォルトの書き直しをオーバーライドします。
このフィールドは、レコードごとに異なる書き直
しを指定したいときに使用してください。
次のいずれかです。
622
Arabic-Latin
アラビア文字からラテン文字。
Cyrillic-Latin
キリル文字からラテン文字。
Greek-Latin
ギリシャ文字からラテン文字。
Hangul-Latin
ハングル文字からラテン文字。
KatakanaLatin
片仮名からラテン文字。
Latin-Arabic
ラテン文字からアラビア文字。
Latin-Cyrillic
ラテン文字からキリル文字。
Latin-Greek
ラテン文字からギリシャ文字。
Spectrum™ Technology Platform 8.0.0
第 23 章 : Data Normalization モジュール
フィールド名
説明
Latin-Hangul
ラテン文字からハングル文字。
LatinKatakana
ラテン文字から片仮名。
Fullwidth-Halfwidth 全角から半角。
Halfwidth-Fullwidth 半角から全角。
オプション
表 89 : Transliterator のオプション
オプション
説明/有効値
変換元
書き直したいフィールドで使われている用字系。 サポートされている用字
系については、Transliterator(619ページ)を参照してください。
注: Transliterator ステージは、すべての用字系の間の書き直しをサポート
しているわけではありません。 [変換元] フィールドと [変換先] フィー
ルドは、選択内容に応じて自動的に妥当な値を反映するようになって
います。
変換先
フィールドの変換先の用字系。 サポートされている用字系については、
Transliterator(619ページ)を参照してください。
注: Transliterator ステージは、すべての用字系の間の書き直しをサポート
しているわけではありません。 [変換元] フィールドと [変換先] フィー
ルドは、選択内容に応じて自動的に妥当な値を反映するようになって
います。
スワップ ボタン
スワップ ボタンをクリックすると、 [変換元] フィールドと [変換先] フィー
ルドの間で言語が交換されます。
書き直し対象フィールド 書き直したいフィールドを指定します。
ユーザ ガイド
623
Transliterator
出力
指定したフィールドが Transliterator ステージにより書き直されます。 それ以外の出力は生成されませ
ん。
624
Spectrum™ Technology Platform 8.0.0
Enterprise Geocoding モ
ジュール
このセクションの構成
• Enterprise Geocoding モジュールとは . . . . . . . . . . . . . .626
• Geocode Address Global の概要 . . . . . . . . . . . . . . . . . . .637
• Geocode Address World . . . . . . . . . . . . . . . . . . . . . . . . .720
• GNAF PID Location Search . . . . . . . . . . . . . . . . . . . . . . .743
• Reverse Geocode Address Global の概要 . . . . . . . . . . .756
• 国際ジオコーディングの結果コード . . . . . . . . . . . . . . . . .769
• 国際ジオコーディング用のカスタム データベース . . . . . .774
24
Enterprise Geocoding モジュールとは
Enterprise Geocoding モジュールとは
Enterprise Geocoding モジュールは、住所の正規化、住所ジオコーディング、および郵便番号セント
ロイド ジオコーディングを実行します。 住所を入力して出力を取得できます。例えば、出力として取
得する地図上のポイント(緯度と経度)は、詳細な空間分析やデモグラフィックスによる分類に使用
できます。 また、ジオコード (緯度と経度で表現される地図上のポイント) を入力し、そのジオコード
に関する住所情報を取得することもできます。
Enterprise Geocoding コンポーネント
Enterprise Geocoding モジュールは、次のコンポーネントから構成されます。 取得したライセンスに
よっては一部のコンポーネントが含まれないことがあります。
• Geocode Address AUS — オーストラリアの住所を受け取り、それに対応する緯度/経度座標などの
情報を返します。 詳細については、Geocode Address AUSを参照してください。
• Geocode Address GBR — 英国の住所を受け取り、それに対応する緯度/経度座標などの情報を返
します。 詳細については、Geocode Address GBRを参照してください。
• Geocode Address Global — サポートされている任意の国の住所を受け取り、それに対応する緯度/
経度座標などの情報を返します。 このコンポーネントは、ライセンスを取得した国のジオコード住
所のみを提供します。 オーストラリアと英国はサポート対象外です。 詳細については、Geocode
Address Global の概要(637ページ)を参照してください。 サポートされている国のリストについ
ては、各国の ISO コードとモジュール サポート(1086ページ)を参照してください。
• Geocode US Address — 住所を受け取り、それに対応する緯度/経度座標などの情報を返します。
詳細については、Geocode US Addressを参照してください。
• GNAF PID Location Search — Geocoded National Address File Persistent Identifier (G-NAF PID)
の住所および緯度/経度座標を特定します。 詳細については、GNAF PID Location Search(743ペー
ジ)を参照してください。
• Reverse APN Lookup — Assessor's Parcel Number (APN)、FIPS (連邦情報処理標準) 郡コード、
FIPS 州コードを受け取り、小区画の住所を返します。 詳細については、Reverse APN Lookupを
参照してください。
• Reverse Geocode US Location — ジオコード (緯度/経度座標) を受け取り、その場所に対応する住
所を返します。 詳細については、Reverse Geocode US Locationを参照してください。
Enterprise Geocoding データベース
次の表に、Enterprise Geocoding モジュールのデータベースを示します。 これらのデータベースは
Spectrum™ Technology Platform サーバーにインストールされます。 一部のデータベースは、Pitney
Bowes Software が提供するサブスクリプションによって利用可能で、月に 1 回、または年に 4 回更新
®
されます。 それ以外のデータベースは、USPS からライセンスされます。
626
Spectrum™ Technology Platform 8.0.0
第 24 章 : Enterprise Geocoding モジュール
表 90 : Enterprise Geocoding モジュール データベース
データベース名 & 説明
必須またはオプ
ション
提供元
米国 Geocoding データベース
米国ジオコーディ
ングに必須
Pitney Bowes
Software サブスク
リプション (月 1 回
更新)
これらのデータベースには、住所の正規化とジオコーディ
ングに必要な空間データが格納されています。 これらのデー
タベースを最低 1 つインストールする必要があります。 マッ
チングに使用するデータベースを処理オプションを使って
設定します。 Enterprise Geocoding は、指定したデータベー
スにマッチングを探します。 目的のデータベースがマッチ
ングに使われていることを確認するには、[StreetDataType]
出力フィールドに返される値を確認します。
これらのデータベースでは、GSD ファイルと呼ばれる独自
形式のファイルが使われます。 ZIP Code セントロイド マッ
チングの場合、すべての州のセントロイド情報が us.Z9 ファ
イルに格納され、ファイル拡張子には、通常、z9 が使われ
ます。
• Centrus Enhanced Geocoding — このデータベースは、
米国 地質調査所から提供された TIGER データと米国 郵
政公社から提供された住所データから構成されます。
• GDT Geocoding — このデータベースは、Centrus
Enhanced Geocoding データベースに未収録の最新データ
を格納しています。 使用するには、ライセンスが別途必
要です。 郵政公社から提供されます。
• NAVTEQ Geocoding — このデータベースは、Centrus
Enhanced Geocoding データベースに未収録の最新データ
を格納しています。 使用するには、ライセンスが別途必
要です。 NAVTEQ データは、サードパーティの空間デー
タ プロバイダである NAVTEQ, から提供されます。 これ
らのデータベースの詳細については、営業担当者にお問い
合わせください
• ZIP + 4 Centroid — このデータベースは、住所の正規化
と ZIP + 4 セントロイド マッチングのみを提供します。
通りレベル マッチングは提供しません。
各ジオコーディング データベースには、オプションの
Statewide Intersections Index があります。 Statewide
Intersection Index は、州単位で交差点を迅速に識別するた
めに設計されています。 例えば、Statewide Intersection
ユーザ ガイド
627
Enterprise Geocoding モジュールとは
データベース名 & 説明
必須またはオプ
ション
提供元
ライセンスされた
すべての国に必須
Pitney Bowes
Software サブスク
リプション (年 4 回
更新)
オプション
Pitney Bowes
Software サブスク
リプション (年 4 回
更新)
Index を使って、"1st and Main St, CO" をデータベース検索
すると、ジオコーディング データベース全体から交差点の
各インスタンスを検索する場合よりも迅速にコロラド州内
の候補リストが返されます。
Enterprise Geocoding データベース
International Geocoding データベースには、米国外の場所に
ついて住所の正規化とジオコーディングを実行するのに必
要な空間データが格納されています。 各国には専用のデー
タベースがあり、一部の国にはジオコーディングを強化す
るためのオプションのデータベースが提供されています。
Australia Geocoded National Address File (G-NAF)
このデータベースを使って、オーストラリアの住所ジオコー
ディングを改善できます。 これは、オーストラリア全土の
地方、通り、および番号を表す唯一の公式インデックスで
あり、検証済みの地理的座標も含まれます。 公式に認めら
れた地方/都市部の住所と非公式の住所 (エイリアス) が格納
されています。 郵便住所と私書箱番号は含まれません。 た
だし、適切な地方住所情報が存在しない地方があるため、
G-NAF データセットには郵便箱 (RMB) 番号、ロット番号、
ブロック番号、およびセクション番号が含まれます。
このデータベースをインストールすると、次の 2 つのサブ
フォルダが作成されます。
• GNAF123 — ポイントレベル辞書が格納されます。 これ
は、最高精度のジオコーディング (信頼レベル 1、2、また
は 3) です。
• GNAF456 — 最高精度のジオコーディング条件を満たさ
ない残りの G-NAF 住所 (信頼レベル 4、5、または 6) が
格納されます。
これらはデータベース リソースとして Management Console
で個別に指定する必要があります。
住所の有無の確認には両方のデータベースを使用し、小区
画レベルのジオコーディングには GANF123 のみを使用す
ることを推奨します。 小区画レベルのジオコードが不要な
場合は、ジオコーディングに GANF456 データベースを使
用することができます。
628
Spectrum™ Technology Platform 8.0.0
第 24 章 : Enterprise Geocoding モジュール
データベース名 & 説明
必須またはオプ
ション
提供元
United Kingdom Address-Point データベース
オプション
Pitney Bowes
Software
オプション
Pitney Bowes
Software
®
この住所ポイントデータベースには、陸地測量 に由来する
通り住所が格納されています。 通常、候補の場所は、建物/
小区画配達ポイントから 0.1m の精度で位置付けられます。
このデータベースは、このような高い精度が要求されるア
プリケーション (ルーティング アプリケーションなど) に適
しています。
Address-Point データベースは、CodePoint データベースで
は得られない高い精度のジオコーディングを提供します。
この高いレベルの精度は、結果コード S8 および S7 で示さ
れます。
Ordnance Survey Address-Point データ ソースの詳細につい
ては、
www.ordnancesurvey.co.uk/oswebsite/products/addresspoint/ を参照してください。
Ordnance Survey データ ソースには北アイルランドの住所
は含まれないので、Pitney Bowes Software が提供する
®
Address-Point データセットには Royal Mail の北アイルラ
ンドの郵便番号住所データが補足されています。 この北ア
イルランド データは、郵便番号セントロイド (結果コード
S3) の精度のみを備えています。
United Kingdom CodePoint データベース
CodePoint Postal Address File (PAF) データベースは、郵便
番号セントロイド ジオコーディングを提供します。 この
CodePoint データベースは、住所のマッチング、妥当性の確
認など、ほとんどのアプリケーションに適しています。
Royal Mail に由来するこの CodePoint データベースは、英
国 (グレート ブリテンおよび北アイルランド) の通り住所を
網羅します。 この CodePoint データベースのライセンス
は、地域単位ではなくデータセット全体を対象とします。
Royal Mail データ ソースの詳細については、
www.royalmail.com を参照してください。
CodePoint データベースから提供される郵便番号セントロイ
ド精度は、結果コード S3 として示されます。
ユーザ ガイド
629
Enterprise Geocoding モジュールとは
データベース名 & 説明
必須またはオプ
ション
提供元
オプションのデー
タベースですが、
このデータベースには、緯度/経度の場所を住所に変換する
Reverse Geocode
ために必要なデータが含まれています。
US Location を使う
場合はこのデータ
ベースを使う必要
があります。 使用
するには、ライセ
ンスが別途必要に
なります。
Pitney Bowes
Software サブスク
リプション (月 1 回
更新)
New Zealand Point データベース
オプション
Pitney Bowes
Software
オプションのデー
タベースですが、
Reverse APN
Lookup を使う場合
は Centrus
Enhanced Points
または Centrus
Premium Points が
必要です。 使用す
るには、ライセン
スが別途必要にな
ります。
Pitney Bowes
Software サブスク
リプション (月 1 回
更新)
Reverse Geocoding データベース (米国 のみ)
New Zealand Point データベース は、通り住所を建物レベ
ルの精度で特定する郵便ポイント データに基づきます。 こ
のデータベースから候補として返されるロケーション X お
よび Y は、建物レベルの精度を備えています。
このデータは、政府機関である Land Information New
Zealand によって管理されます。 データベースの内容は、
各地区の下部組織からの情報に基づいて月に 1 回更新され
ます。
U.S. Points データベース
Points データベースには、小区画の中心を特定できるデー
タが含まれています。 これらのデータベースは、インター
ネットのマップ データ、損害保険、通信、ユーティリティ
などの分野で高度なジオコーディング精度を提供します。
• Centrus Points — このデータベースには、小区画または
建物の中心を特定するために必要なデータが格納されてい
ます。 査定官が割り当てた区画番号 (APN) または標高
データは含まれません。
• Centrus Elevation — このデータベースは、Centrus Points
のデータに標高データが追加されたものです。
• Centrus Enhanced Points — このデータベースは、
Centrus Points のデータに APN データを追加したもので
す。
630
Spectrum™ Technology Platform 8.0.0
第 24 章 : Enterprise Geocoding モジュール
データベース名 & 説明
必須またはオプ
ション
提供元
オプション
ユーザ定義
• Centrus Premium Points — このデータベースは、Centrus
Points のデータに APN データと標高データが追加された
ものです。
• Centrus TomTom Points データベース — このデータベー
ス内のデータはサードパーティの空間データ プロバイダ
である TomTom により提供されます。
補助ファイル
補助ファイルには、ユーザ定義レコードが含まれます。 補
助ファイルを使って、住所マッチングとジオコード マッチ
ングに使うカスタム データを提供できます。 詳細について
は、補助ファイルの概要を参照してください。
®
オプションのデー Pitney Bowes
タベースですが、 Software サブスク
Delivery Point Validation データベースは、米国の郵送先住
™
CASS Certified 処 リプション (月 1 回
所 (1 億4,500 万件以上) の妥当性をチェックするために使用
理を行うには必要 更新)
できます。 DPV データベースは、オプション機能として配
です。 使用するに
布されており、ジオコーディング データベースの郵送先住
は、ライセンスが
所検証機能を強化するためにインストールできます。 ジオ
別途必要になりま
コーディング データベースの新版がリリースされるたびに、
す。
それに対応するオプション DPV データベースの新版もリ
リースされます。 DPV データベースの日付がジオコーディ
ング データベースの日付に一致しなければ、DPV の処理は
機能しません。 DPV 検索は、DPV データベースの有効期限
を過ぎると実行されなくなります。
DPV データベース (米国 のみ)
DPV の詳細については、Delivery Point Validation (DPV)
(636ページ)を参照してください。
注: CASS 処理を行うには、DPV オプションが必要です。
また、DPV オプションは、ZIP + 4 および ZIP + 4 関連
出力 (DPBC、USPS レコード タイプなど) を決定する
場合も必要です。
Postal Service ライセンスでは、DPV を住所または住所録
の生成に使うことが禁じられています。また、DPV データ
ベースを米国から輸出することも禁止されています。
ユーザ ガイド
631
Enterprise Geocoding モジュールとは
データベース名 & 説明
必須またはオプ
ション
提供元
EWS データベース (米国 のみ)
オプション
USPS Web サイト
Early Warning System (EWS) データベースには、郵便デー
タが米国 郵便データベースにすぐに反映されないことから
誤った郵便番号が使用されるのを防ぐためのデータが格納
されています。 詳細については、Early Warning System
(EWS)(637ページ)を参照してください。
®
から無償でダウン
ロードできます。
®
USPS は、EWS ファイルを週 1 回のペースで最新の情報
Link
に更新しています。 DPV または LACS
データベースと
は異なり、EWS データベースはジオコーディング データ
ベースと同じ日付である必要はありません。 EWS ファイル
®
は USPS RIBBS Web サイトの CASS セクション
からダウンロードできます (ribbs.usps.gov) 。
EWS データベースをダウンロードすると、ファイルは "OUT"
という名前で保存されます。 "OUT" ファイルを "EWS.txt"
という名前に変更してから使用してください。
Link
オプションのデー Pitney Bowes
タベースですが、 Software サブスク
Link
LACS
データベースを使って、地方配送路の住所を通り
™
CASS Certified 処 リプション (月 1 回
に沿った住所への変更、私書箱の再割り当て、および変更
理を行うには必要 更新)
があった通りに従って住所を訂正できます。 詳細について
です。
は、Locatable Address Conversion System (LACS)
(636ページ)を参照してください。
LACS
Link
LACS
データベース (米国 のみ)
データベースの日付がジオコーディング データ
Link
ベースの日付に一致しなければ、LACS
の処理は機能し
ません。
注: Enterprise Geocoding モジュールは、ZIP + 4 または
ZIP + 4 関連出力 (配達先バーコード、USPS レコード
Link
タイプなど) を受け取るために LACS
オプションを
CASS モードで使用する必要があります。
Link
USPS ライセンスでは、LACS
を住所または住所録の生
Link
成に使うことは禁じられています。また、LACS
データ
ベースを米国から輸出することも禁止されています。
632
Spectrum™ Technology Platform 8.0.0
第 24 章 : Enterprise Geocoding モジュール
ジオコーディングの概念
ジオコーディングは、住所の緯度/経度座標を決定するプロセスです。 住所のジオコーディングを行う
方法は複数あります。 以下に、精度の高い方法から順に説明します。
ポイント レベル マッチング
ポイントレベル マッチングは、実際の建物の敷地または小区画の中心地点を特定します。 最も精度の
高いジオコーディング方法であり、インターネットのマップ データ、保険、通信、ユーティリティな
どの分野で利用されます。
中央線マッチングは、ポイント レベルのジオコードを親の通りセグメントにリンクするためにポイン
トレベル マッチングと併用されます。 これにより、ポイントレベル マッチング単独では取得できな
い親の通りセグメントに関する情報が手に入ります。 この情報には、ポイント データ ジオコードか
ら中央線マッチングまでの方位も含まれます。
通りマッチング
通りマッチングは、通りセグメント上の近似の住所位置を特定します。 通りマッチングでは、住所の
通りにある家番号の範囲に基づいて特定の家番号の近似の位置を計算することで、場所を決定します。
例えば、家番号 50 〜 99 の範囲がある通りセグメント上に住所がある場合、家番号 75 がこの通りセ
グメントの真ん中に位置すると見なします。 この方法では、住所が通りセグメント上に均等な間隔で
並んでいることを前提とします。 実際には住所が通りセグメントに均等に配置されていないこともあ
るので、この方法の精度はポイント マッチングに劣ります。
例えば、建物が均等に並んでいないセグメントでの通りレベル マッチングの結果は、以下の図のよう
になります。 最初の 3 棟の建物は均等な間隔で立地するので、この部分についてはかなり正確なジオ
コーディングが得られます。 しかし、4 番目の建物は、この通りに面する他の建物と比べて、やや広
い敷地に建っています。 通りレベルのマッチングは、建物が等間隔で並んでいることを前提とするた
め、4 番目、5 番目、6 番目の住居の精度は、最初の 3 棟の建物よりも劣る結果になります。 ポイン
トレベルのジオコーディングを使っていれば、結果は正確なものとなります。
セントロイドのマッチング
ZIP Code セントロイドのマッチングは、ZIP Code または ZIP + 4 で定義されたエリアの中心点を取
得するマッチングであり、最も精度の低いタイプのジオコードです。 ZIP セントロイドは ZIP Code
ユーザ ガイド
633
Enterprise Geocoding モジュールとは
の中心点であり、ZIP + 4 セントロイドは ZIP + 4 の中心点です。 ZIP + 4 は ZIP Code より小さいエ
リアを表すため、ZIP + 4 セントロイドは ZIP Code セントロイドより正確です。
次の図は、セントロイド マッチングを表したものです。 この例では、6 軒の家がすべて同じ ZIP + 4
コード内にあるため、同じジオコードになります。
米国以外の ロケーションでのジオコーディング マッチ戦略
Enterprise Geocoding モジュールには、ジオコーディングの精度とマッチ率を制御するための各種オ
プションがあります。 以下の情報は、さまざまなオプションを持つ米国のジオコーダ (Geocode US
Address) 以外のあらゆる国のジオコーダに適用できる、マッチングのためのさまざまなアプローチに
ついて説明したものです。
マッチ率の最大化
マッチ率をできる限り高めるには、各国のジオコーダの タブにある [近似検索条件] 設定で ExactMatch
オプションを使用して家番号、通り、都市/地方を指定しないようにします。
マッチ率を最大化するもう 1 つの方法は、 [ジオコーディング] タブで代替レベルを [郵便番号セント
ロイド] に設定することです。 これは、通りレベルの近似一致が見つからなかった場合に、ジオコー
ダが 4 桁の郵便番号セントロイドで代替するということを意味します。 このシナリオは誤検出を生む
こともありますが、大規模データベースにジオコーディングを行う場合は最適なマッチング ソリュー
ションです。
誤検出の割合が分析に影響を与えるかどうかを評価する必要があります。 ヒット率を低下させずに誤
検出数を減らすには、ジオコーディング セッション後に結果コードを分析し、それに応じて設定を調
整してください。
634
Spectrum™ Technology Platform 8.0.0
第 24 章 : Enterprise Geocoding モジュール
精度の最大化
高精度でジオコード化された住所が分析に必要な場合は、ジオコーダが高精度のジオコードを返す割
合を最大化し、不明確なマッチ (誤検出) を返す数を最小化する戦略を選択します。 そのためには、
[マッチング] タブの [近似検索条件] 設定を使用し、すべての住所要素に対して近似検索でマッチング
を行います。 また、代替レベルなし ([ジオコーディング] タブで [郵便番号セントロイド] または [地理
的セントロイド] を選択しない) を設定します。
この手法によって、マッチ率が低下することがありますが、最高の精度を得ることができます。
マッチ率と精度のバランスをとる
マッチ率と地理的精度のバランスをとる戦略を使用したいことがあります。 つまり、できる限り多く
のレコードに自動的にジオコーディングを行いたいが、同時に、不正確なマッチ (誤検出) の数は最小
化したいという場合です。 ジオコーダが次のものを検出した場合、誤検出が発生する可能性がありま
す。
• 入力された通りと読みが似ている通り
• 別の都市にある同じ通り (郵便番号が緩和されている場合)
• 異なる家番号ある通り (家番号が緩和されている場合)
マッチ率と精度のバランスを適切に保つには、次の設定を使用してください。
• 近似一致のみ — このオプションを選択します。
• 近似検索条件 — [家番号] と [通り] のみを選択します。
• 郵便番号セントロイド — この代替レベルを指定しないでください。
郵便番号の概念
次のセクションでは、Enterprise Geocoding モジュールが使用する郵便番号の概念について説明しま
す。
二重住所
Geocode US Address は、同一住所行に同一レコードの 2 つの住所を含む入力を処理することができ
ます。 例えば、Geocode US Address は、次の入力住所を処理できます。
3138 HWY 371
PO BOX 120
PRESCOTT AR 71857
Geocode US Address は、2 つの住所がどちらも通り住所である二重住所を認識しません。 例えば、
Geocode US Address は、135 Main St 4750 Walnut St Ste 200 を認識しません。 Geocode US Address
は、2 つの住所が同じ住所タイプであるが、通り住所ではない二重住所を認識します。 例えば、Geocode
US Address は、PO BOX 12 PO BOX 2000 を認識します。
ユーザ ガイド
635
Enterprise Geocoding モジュールとは
Geocode US Address は、二重住所をパースしてから、マッチを検索します。 Geocode US Address
は、処理モードに基づいて、マッチに対する優先設定を持つ住所を判断します。 CASS モードでは、
Geocode US Address は、[PO Box を優先] オプションと [通りの住所を優先] オプションを無視し、
PO Box、通り、地方配送路、局留め郵便の順序に基づいてマッチを検索します。 緩和モードでは、
Geocode US Address は、[住所の優先設定] (AddressPreference) 入力オプションを認識します。
注: Geocode US Address は、完全一致モードと近似モードでは、二重住所処理を実行しません。
Geocode US Address は、複数行の住所に対して二重住所処理を実行しません。
Locatable Address Conversion System (LACS)
USPS® Locatable Address Conversion System (LACS) は、地方配送路の住所を通りに沿った住所への
Link
変更、私書箱の再割り当て、および変更があった通りに従って住所を訂正します。 次に、LACS
変
換の例を示します。
• 地方配送路の住所を通り名に沿った住所への変更: 旧住所: 231 RR 3 Box 45 新住所: 1292 North
Ridgeland Drive
• 通り名または通り番号の変更: 旧住所: 23 Main Street 新住所: 45 West First Avenue
• 私書箱の再割り当て: 旧住所: PO Box 453 新住所: PO Box 10435
Link
CASS 処理を行うには、LACS
が必要です。
Delivery Point Validation (DPV)
Delivery Point Validation (DPV®) は、住所情報の正確さを個々の郵便アドレスまで照合する米国郵政公
社® (USPS®) のテクノロジーです。 この DPV® を使用して住所の照合をすることによって、住所不完
全のため不達(UAA)という事態を減少させ、郵便コストや不正な住所情報に関連する他のビジネス
コストを削減することができます。
DPV® なしでの個々の住所検証では、その通り上にある複数の有効な住所までしか照合できません。
例えば、USPS データは Maple Lane 上の住所が 500 から 1000 まであることを示しています。 610
Maple Ln という住所を DPV® なしで検証しようとすると、この住所は 500 〜 1000 の範囲にあるため
有効と見なされます。 しかし、実際には 610 Maple Ln という住所は存在しません。 この通りの当該
区画にある家番号は、608、609、613、および 616 です。 DPV® 処理を使うと、610 Maple Ln が存在
しないことが警告され、住所を訂正する措置をとることができます。
DPV® は、ターゲットを絞り込んだ郵便リストの作成に役立つ独特の住所属性も備えています。 例え
ば、DPV® は郵送先が空き家かどうかを確認したり、それが郵便受取代行業 (CMRA) や私設私書箱の
住所であることを識別できます。
DPV® は既存の住所の正確性を検証できますが、DPV® を使って住所録を作成することはできません。
例えば、123 Elm Street Apartment 6 という住所が存在することは確認できますが、同じ通りに
Apartment 7 があるかどうかを調べることはできません。 住所録の生成を阻止するために、DPV® デー
タベースには誤検出レコードが含まれています。 誤検出レコードは、誤検出テーブルに存在する人為
的に作られた住所です。 DPV® クエリで負の応答が発生すると、誤検出テーブルに対してクエリが発
行されます。 このテーブルのレコードとマッチする場合、DPV® の処理は停止します。
636
Spectrum™ Technology Platform 8.0.0
第 24 章 : Enterprise Geocoding モジュール
Early Warning System (EWS)
Early Warning System (EWS) は、月に 1 回更新される USPS データベースにまだ反映されていない、
新規の住所や変更された住所に関する最新住所情報を提供します。 EWS は USPS® データベースの郵
便データの更新遅れによる、住所レコードの誤った情報提供を防ぐことができます。
米国 郵便データベースが古いほど、住所が誤って変換される可能性は高くなります。 米国郵便データ
ベースにあるマッチングする住所が不正確な場合、有効な住所が誤った住所に変換され、 壊れた住所
が生成されます。
EWS データは、ZIP Code™、通り名、前置/後置方位記号、および接尾語に限定される、部分住所情報
から構成されます。 住所レコードを EWS 対応のデータとするには、その住所が月 1 回更新される米
国 郵便データベースの最新版に掲載されていないことが必要です。
USPS® は、EWS ファイルを週に 1 回更新します。 EWS ファイルは、USPS® Web サイト
(https://ribbs.usps.gov/cassmass/documents/tech_guides/) からダウンロードできます。
Geocode Address Global の概要
Geocode Address Global は、通りレベルでのジオコーディングを多数の国に提供します。 また、都市
や地方のセントロイドと郵便番号のセントロイドにも対応しています。 Geocode Address Global は、
通りの住所をネイティブの言語とフォーマットで扱います。 例えば、フランスの標準的な書式で表記
された住所は、通り名が "Rue des Remparts" のようになります。 ドイツの標準的な書式で表記され
た住所では、通り名は "Bahnhofstrasse" のようになります。
注: Geocode Address Global は、米国および英国の住所に対応しません。 米国の住所のジオコーディ
ングには、Geocode US Address を使用してください。 英国の住所のジオコーディングには、
Geocode Address GBR を使用してください。
どの国の住所を扱えるかは、インストールした国データベースによって決まります。 例えば、カナ
ダ、イタリア、オーストラリアのデータベースがインストールされている場合は、Geocode Address
Global はこれらの国々の住所ジオコーディングを 1 回の処理で実行できます。 Geocode Address
Global を操作する前に、1 つ以上の国データベースが存在するグローバル データベース リソースを定
義する必要があります。 データベース リソースを作成すると、Geocode Address Global は Management
Console、Enterprise Designer、および Interactive Driver で使用可能になります。 Geocode Address
Global データベース リソースの作成については、Enterprise Geocoding モジュール グローバル デー
タベース リソースの追加(230ページ)を参照してください。
Geocode Address Global は、Enterprise Geocoding モジュールのオプションのコンポーネントです。
Enterprise Geocoding モジュールの詳細については、Enterprise Geocoding モジュールとは(626ペー
ジ)を参照してください。
入力
Geocode Address Global は、住所または交差点を入力として受け取ります。 最大のパフォーマンスと
最良のマッチ結果を得るには、入力住所リストが可能な限り完全で、綴りの誤りや不完全な住所がな
ユーザ ガイド
637
Geocode Address Global の概要
く、できる限りに郵便当局の規格に従っている必要があります。 多くの郵便当局が、その国の住所規
格に関する情報を掲載した Web サイトを提供しています。
入力フィールド
Geocode Address は、住所または交差点を入力として受け取ります。 の場合、Geocode Address
Global は、住所または交差点を入力として受け取ります。 最大のパフォーマンスと最良のマッチ結果
を得るには、入力住所リストが可能な限り完全で、綴りの誤りや不完全な住所がなく、できる限りに
郵便当局の規格に従っている必要があります。 多くの郵便当局が、その国の住所規格に関する情報を
掲載した Web サイトを提供しています。
ジオコーディングに使用する入力フィールドの一覧を以下の表に示します。
注: API を使用しているときはDataTable クラスを使って入力を指定します。 以下で説明するフィー
ルドは、DataTable クラスにおける有効な列名です。DataTable クラスの詳細については、API
ユーザ ガイドの「API の基礎」のセクションを Spectrum™ Technology Platform API ガイド.
表 91 : の入力フィールド
フィールド名
説明/有効値
AddressLine1
次のいずれかです。
• 通り名と建物番号が含まれる住所行。日本国内の住所の場合は、地
番と支号です。イギリス国内の住所の場合は、建物名が含まれるこ
とがあります。次に例を示します。
Datun Rd
1000 Beijing
Calle Palamos 321
1000
Muldenweg 2
71665 Vaihingen an der Enz
Odra 18
10132
9, rue Paul Lafargue
93217 ST DENIS CEDEX
2 Akti Miaouli
19003
GRC は、キリル文字セットもサポートしています。
638
Spectrum™ Technology Platform 8.0.0
第 24 章 : Enterprise Geocoding モジュール
フィールド名
説明/有効値
8 Hong Cheung Street
J1 Pecenongan
Gambir
Gunjur Road
Bangalore South 560017
Unijas iela 11A
LV-1039
Riga
Nemencines pl 39
LV-10001
8 Travessa Nova
calle naranjo 7
89600 Altamira TAMPS
Pleasant Drive Caloocan City
Myakininskaya 5-ya ulitsa
Recka 182
Bangalore South 560017
Potocnikova ulica 12
1000
• 完全な住所。 詳細については、を参照してください。 単一行入力
(680ページ)
• (アルゼンチン、イギリス、および日本を除くすべての国の) 交差
点。 交差点を指定するには、2 つのアンパサンド (&&) で通り名を
区切ります。 詳細については、交差点の入力(683ページ)を参照
してください。
フランスの入力通り住所では、番号が範囲で指定されることがありま
す。 例えば、"104-106 rue de Charenton" といった住所を入力したと
します。 返される住所候補には 2 つの住所範囲が含まれ、104 が
100-106 範囲からの近似一致とされます。 英数字の範囲で指定され
ユーザ ガイド
639
Geocode Address Global の概要
フィールド名
説明/有効値
る住所も同様に処理されます。例えば、"2A-4B" のような英数字の範
囲の住所を入力できます。 ジオコーディング データベース内に入力
家番号の英字値がある場合、その家番号は (英字であってもなくても)
データベース内のデータのまま返されます。 入力家番号の英字値を
確認できなければ、家番号が一致する限り、入力された英字値が返さ
れます。
AddressLine2
2 行からなる住所の 2 行目の住所行。 例:
26 WELLINGTON ST E
SUITE 500
TORONTO ON M5E 1S2
このフィールドはアルゼンチン、オーストラリア、オーストリア、ベ
ルギーまたはルクセンブルク、ブラジル、チリ、チェコ共和国、デン
マーク、エストニア、フィンランド、フランス、ドイツ、ハンガリー、
インド、インドネシア、アイルランド、イタリア、日本、ラトビア、
リトアニア、マレーシア、メキシコ、オランダ、ノルウェー、ポーラ
ンド、ポルトガル、シンガポール、スロベニア、南アフリカ、スペイ
ン、スウェーデン、スイス (リヒテンシュタインも含む)、タイ、およ
びトルコでは使われません。
この国ではこのフィールドは使用されません。
City
都市または町の名前。 入力住所には、正式な都市名またはエイリア
スを使用してください。アルゼンチン、オーストリア、チェコ共和
国、インドネシア、イタリア、メキシコ、ポルトガル、スペイン、ス
ロベニア、およびスイスでは、町名のエイリアスを使用できます。例
えば、Lubiana、Liubliana、および Laibach は Ljubljana のエイリア
スです。
注: アルゼンチンでは、"Buenos Aires Federal District" は Buenos
Aires 州にありません。 入力住所に "Buenos Aires" のみを指定
した場合、Spectrum™ Technology Platform は、候補として
Federal District の住所と Buenos Aires 州の住所の両方を返しま
す。
アルゼンチンの州都を意味する住所であれば、実際の都市名のほかに
"Capital" という語を使用できます。 例えば、"Capital, MZA" という
入力は "Mendoza, MZA" に相当します。
フランスの一部の地域は、実際には行政上の市ではなくても慣例とし
て市と同じに扱われます。 このような地域は、人工都市エリアや仮
640
Spectrum™ Technology Platform 8.0.0
第 24 章 : Enterprise Geocoding モジュール
フィールド名
説明/有効値
想都市と呼ばれます。 サポートされる仮想都市のリストについては、
フランスの住所ガイドライン(658ページ)を参照してください。
インドネシアの住所では、このフィールドに従属する地区が格納され
ます。 例えば、Jakarta は Jakarta Utara のエイリアスです。
タイの住所では、このフィールドに従属する地区 (タムボン) が格納
されます。
日本の住所では、このフィールドに地方自治体の従属する地区 (大字)
が格納されます。
リトアニアの住所では、都市と郡を入力時に交換できます。 つまり、
都市が [都市] 入力フィールドと [郡] 入力フィールドのどちらに現れ
ても、ジオコーダは正しい候補を返します。 同様に、地方を [地方]
入力フィールドと [都市] 入力フィールドのどちらに入力してもかま
いません。
County
郡 (County) の意味は国によって異なります。
• ARG (アルゼンチン) — 郡 (Department)
• AUS (オーストラリア) — 地方自治体 (Local Government Authority:
LGA)
• AUT (オーストリア) — 使用せず
• BEL (ベルギー) — 州 (Province)
• BRA (ブラジル) — 使用せず
• CAN (カナダ) — 使用せず
• CHE (スイス) — 州 (Province)
• CHL (チリ) — 地区 (District)
• CHN (中国) — 使用せず
• CZE (チェコ共和国) — 地区名またはエイリアス
• DEU (ドイツ) — 郡 (Kreis)
• DNK (デンマーク) — 州 (Province)
• ESP (スペイン) — 州 (Province)
• EST (エストニア) — 地区 (District)
• FIN (フィンランド) — 使用せず
• FRA (フランス) — 県 (Department)
• GBR (イギリス) — 使用せず
• GRC (ギリシャ) — 地区 (Discrict)
• HKG (香港) — 使用せず
• HUN (ハンガリー) — 地区 (District)
ユーザ ガイド
641
Geocode Address Global の概要
フィールド名
説明/有効値
• IDN (インドネシア) — 摂政管区/都市 (Regency/City)
• IND (インド) — 地区 (District)
• IRL (アイルランド) — 州 (Province)
• ITA (イタリア) — 州 (Province)
• JPN (日本) — 市区町村
• LTU (リトアニア) — 郡 (County)
• LVA (ラトビア) — 地区 (District)
• MAC (マカオ) — 使用せず
• MEX (メキシコ) — 州 (Province)
• MYS (マレーシア) — 使用せず
• NLD (オランダ) — 州 (Province)
• NOR (ノルウェー) — 地区 (District) (fylke/counties)
• NZL (ニュージーランド) — 地方行政区画 (Region)
• PHL (フィリピン) — 地区 (District)
• POL (ポーランド) — 地区 (District) (poviat)
• PRT (ポルトガル) — 使用せず
• RUS (ロシア) — 地区 (Discrict)
• SGP (シンガポール) — 使用せず
• SVK (スロバキア) — 町 (Town)
• SVN (スロベニア) — 地方行政区画 (Region)
• SWE (スウェーデン) — コミューン (Kommun)
• THA (タイ) — 地区 (District) (amphoe)
• TUR (トルコ) — 地区 (District)
• ZAF (南アフリカ) — 地区 (District)
この国ではこのフィールドは使用されません。
郡の名前。
注: アンドラ郡コード (AND) を含む住所を入力した場合、アンドラ
国内の住所のみが返されます。この住所には AND コードが含ま
れます。 スペイン郡コード (ESP) を含むアンドラの住所を入力
した場合、アンドラの住所が候補として返されますが、郡コー
ドはスペインのものが含まれます。
地域名またはエイリアス。 例えば、Osrednjeslovenska/Ljubljana。
地区 (district) の名前。
摂政管区/都市 (regency/city) の名前。
地区 (district) の名前。
642
Spectrum™ Technology Platform 8.0.0
第 24 章 : Enterprise Geocoding モジュール
フィールド名
説明/有効値
FirmName
会社または場所の名前。 次に例を示します。
Pitney Bowes
4360 Dukes Rd
Kalgoorlie WA 6430
場所の名前。建物名や会社名など。
Aravali Vihar Police Station
Alwar 301030
この国ではこのフィールドは使用されません。
HouseNumber
建物番号。 国によっては、AddressLine1 ではなく、このフィールド
に家番号を入力すると、よりよいパーシング結果が得られることがあ
ります。 最適な結果を得るために、次の国で複数行入力を用いると
きは [HouseNumber] 入力フィールドを使用してください: インド、
シンガポール、マレーシア、タイ、トルコ。
注: [HouseNumber] フィールドで指定した家番号は、[AddressLine1]
フィールドで指定した家番号よりも優先されます。
LastLine
住所の最後の行。
4360 DUKES RD
KALGOORLIE WA 6430
9, rue Paul Lafargue
93217 ST DENIS CEDEX
Markopoulo Mesogaias
Hong Kong Tsuen Wan District
Macau
Krasnogorsk 143420
Locality
地方 (locality) の意味は国によって異なります。
• ARG (アルゼンチン) — 区域 (Neighborhood または barrio)
• AUS (オーストラリア) — 使用せず
• AUT (オーストリア) — 使用せず
• BEL (ベルギー) — 使用せず
• BRA (ブラジル) — 地方 (Locality)
ユーザ ガイド
643
Geocode Address Global の概要
フィールド名
説明/有効値
• CAN (カナダ) — 散布エリア (Dissemination Area: DA) および列挙
エリア (Enumeration Area: EA)
• CHE (スイス) — 使用せず
• CHL (チリ) — 地方 (Locality)
• CHN (中国) — 地方 (Locality)
• CZE (チェコ共和国) — 地方 (Locality)
• DEU (ドイツ) — 使用せず
• DNK (デンマーク) — 使用せず
• ESP (スペイン) — 地方 (Locality)
• EST (エストニア) — 地方 (Locality)
• FIN (フィンランド) — 使用せず
• FRA (フランス) — 使用せず
• GBR (英国) — 地方 (Locality)
• GRC (ギリシャ) — 地方 (Locality)
• HKG (香港) — 地方 (Locality)
• HUN (ハンガリー) — 地方 (Locality)
• IDN (インドネシア) — 村 (Village)
• IND (インド) — 地方 (Locality)
• IRL (アイルランド) — 使用せず
• ITA (イタリア) — 地方 (Locality)
• JPN (日本) — 市内の地域 (丁目)
• LTU (リトアニア) — 地方 (Locality)
• LVA (ラトビア) — 地方 (Locality)
• MAC (マカオ) — 地方 (Locality)
• MEX (メキシコ) — 地方 (Locality)
• MYS (マレーシア) — 使用せず
• NLD (オランダ) — 使用せず
• NOR (ノルウェー) — 使用せず
• NZL (ニュージーランド) — 郊外 (Suburb)
• PHL (フィリピン) — 地方 (Locality)
• POL (ポーランド) — 使用せず
• PRT (ポルトガル) — 地方 (Locality)
• RUS (ロシア) — 地方 (Locality)
• SGP (シンガポール) — 使用せず
• SVK (スロバキア) — 地方 (Locality)
• SVN (スロベニア) — 地方 (Locality)
• SWE (スウェーデン) — 使用せず
644
Spectrum™ Technology Platform 8.0.0
第 24 章 : Enterprise Geocoding モジュール
フィールド名
説明/有効値
• THA (タイ) — 使用せず
• TUR (トルコ) — 地方 (Locality)
• ZAF (南アフリカ) — 地方 (Locality)
地方 (locality) の名前。
地方 (locality) の名前またはエイリアス。 例えば、Gaberje/Gabrje。
地方 (locality) の名前またはエイリアス。
村 (village)。
Geocode Address Global は、入力に地方が含まれ、都市が含まれな
い住所のジオコーディングを実行できます。たとえば、次の住所は同
じジオコードに変換されます。
calle nicaragua 4705, palermo, capital federal
calle nicaragua 4705, palermo
PostalCode
各国の標準フォーマットで表記された郵便番号。
オーストラリアでは、4 桁の郵便番号が使われます。 一般に、最初
の桁が州または特別地域を意味します。2 番目の桁は州内の地域、
3、4 番目の桁は市を表します。 詳細については、オーストラリアの
住所のガイドライン(651ページ)を参照してください。
オーストリアでは、4 桁の郵便番号が使われます。 最初の 2 桁はセ
クターを表し、残りの 2 桁はセクター内の配達先を表します。
ベルギーとルクセンブルクでは、4 桁の郵便番号が使われます。 最
初の 2 桁は仕分けエリアを示します (通常、最初の桁は地域を表しま
す)。残りの 2 桁は、郵便局と配達局を表します。
ブラジルでは 8 桁の郵便番号が使われ、郵便番号から正確な配達先
がわかります (最も近い候補が 1 つに絞り込まれます)。 ただし、5
桁の郵便番号も使用できます。
スイスでは 4 桁の郵便番号が使用され、1 桁目は 1 〜 9 の範囲の数
字です。 リヒテンシュタインで使われる郵便番号は 9480 〜 9499 の
範囲の数字です。
チリでは 1 〜 9 の範囲の数字で始まる 7 桁の郵便番号が使用されま
す。
カナダでは 6 桁の郵便番号が使われます。 通常、最初の 3 桁と残り
の 3 桁はスペースで区切られます。 最初の 3 桁は FSA で、後半の
3 桁は LDU です。 通りの住所のジオコーディングは FSA のみで行
えますが、郵便番号のジオコーディングは完全な郵便番号 (FSALDU)
ユーザ ガイド
645
Geocode Address Global の概要
フィールド名
説明/有効値
が必要です。 郵便番号の前半 3 桁と後半 3 桁の間にスペースを入れ
るかどうかを選択できます。 この書式で統一すると、ジオコーディ
ングの処理速度を向上できます。
中国には 6 桁の郵便番号制度があります。 最初の 2 桁は州 (province)
を示します。 3 桁目と 4 桁目は地区 (district) と都市/町 (city/town) を
示します 最後の 2 桁は郵便配達区域または有名な場所を表します。
大きな州や都市の場合には、複数の番号ブロックが割り当てられるこ
とがあります。 例えば、Guangdong Province には最初の 2 桁に 51
と 52 が割り当てられています。
注: 中国の場合、郵便番号セントロイドのジオコーディングには、6
桁すべての郵便番号が必要とされます。 ただし、郵便番号を通
りジオコーディング用に住所の一部として提供するときは、4 桁
のみの郵便番号が受け付けられ、また返されます。
チェコ共和国には、5 桁の郵便番号制度があります。 通常、郵便番
号は 3 桁目と 4 桁目をスペースで区切りますが、スペースを省いた
フォーマットも許容されます。
デンマークでは 1 〜 9 の範囲の数字で始まる 4 桁の郵便番号が使用
されます。
スペインの郵便番号は 5 桁で構成されます (アンドラの郵便番号は
AN### というフォーマットです)。 完全な郵便番号を入力する必要が
あります。
エストニアには 5 桁の郵便番号制度があります。
フィンランドでは 5 桁の郵便番号が使われます。 最初の 2 桁は市や
町または地方自治体のエリアを指します。 残りの 3 桁は宛先の郵便
局を表します。
フランスでは 5 桁の郵便番号が使われます。 完全な郵便番号を入力
する必要があります。 通常、最初の 2 桁は郡 (department) を表しま
す。 00 は軍関係の住所を表し、海外領土にも専用の番号がありま
す。 残りの 3 桁は地域の配達エリアを表します。 大都市 (パリ、リ
ヨン、マルセイユ) では、最後の 2 桁が区を表します。 例えば、郵便
番号が 33380 の場合、33 が郡を表し、380 が配達エリアを表しま
す。
ギリシャには 5 桁の郵便番号制度があります。
ハンガリーには 4 桁の郵便番号制度があります。 最初の桁は郵便地
域を表します。
インドネシアには 5 桁の郵便番号制度があります。
646
Spectrum™ Technology Platform 8.0.0
第 24 章 : Enterprise Geocoding モジュール
フィールド名
説明/有効値
インドには 6 桁の郵便番号制度があります。
アイルランドについては、ダブリンの郵便データのみを使用できま
す。 通りレベルのジオコーディングを行うには、Dublin# というフォー
マットで完全な郵便番号を入力します。ここで # は 1 〜 24 の範囲の
数字です (これに加えて "Dublin6W" という地区があります)。 郵便セ
ントロイド ジオコーディング (または郵便セントロイド代替) では、
郵便番号が入力としてのみ使用されます。 例えば、PostalCode には
Dublin3 ではなく 3 と指定します。 郵便セントロイド ジオコーディ
ングまたは郵便セントロイド代替の場合は、郵便番号のみが返されま
す。
イタリアには 5 桁の郵便番号制度があります。 最初の 3 桁は州を表
し、残りの 2 桁は配達ポイントを指します。
日本には、7 桁の数字からなる郵便番号制度があり、次のフォーマッ
トで表記します。 999-99999.
ラトビアでは、4 桁の郵便番号が使われます。 最初の 2 桁は配達エ
リアを示し、最後の 2 桁は郵便局を示します。 郵便番号を 0、2229、35、49、55、または 58-99 で開始することはできません。
リトアニアには 5 桁の郵便番号制度があります。 接頭辞として LT
を使用できますが、必須ではありません。
マレーシアには 5 桁の郵便番号制度があります。
オランダの郵便番号は 4 桁の数字と 2 つの文字で構成されます。 最
初の 2 桁の数字は市と地域を指します。 最後の 2 桁の数字と 2 文字
は家番号の範囲を指定します。 2 文字は配達コードです。 4 桁の番
号のみでジオコーディングを行えますが、2 文字の配達コードを含め
てもかまいません。
ノルウェーでは 4 桁の郵便番号が使われます。 最初の 2 桁は地図上
のエリアを指定します。
ニュージーランドでは 4 桁の郵便番号が使われます。 最初の桁は地
図上の地域を表します。 2 桁目と 3 桁目は郵便仕分けエリアを表し
ます。 最後の桁は特定の市内エリア、地方配送、または私書箱室を
表します。
ポーランドでは 99-999 形式の 5 桁の郵便番号が使われます。 最初
の桁は郵便配達区域を表します。 2 桁目はその区域をさらに分割し
た小区域を表します。 ダッシュの後にある 3 つの番号は配達局を表
します。 広大な自治体の場合、最後の 3 桁が特定の通り、通りの 1
区画、または一部のケースで特定の住所を表すことがあります。
ユーザ ガイド
647
Geocode Address Global の概要
フィールド名
説明/有効値
ポルトガルでは 1 〜 9 の範囲の数字で始まる 4 桁の郵便番号が使用
されます。 また、新しく制定された 7 桁の郵便番号では、4 桁の数
字と 3 桁の数字をダッシュで区切るフォーマットが使われます。 ジ
オコーディングの際は、末尾の 3 桁が無視され、4 桁の郵便番号が返
されます。
シンガポールには 6 桁の郵便番号制度があります。 最初の 2 桁は配
達地区を表し、残りの 4 桁は地区内の配達ポイントを指します。 シ
ンガポールの建物には固有の郵便番号が割り当てられています。
スロバキアには 5 桁の郵便番号制度があります。
スロベニアでは、4 桁の郵便番号が使われます。
スウェーデンでは 1 〜 9 の範囲の数字で始まる 5 桁の郵便番号が使
用されます。 通常は、最初の 3 桁 (郵便番号の外部ソート部分) と最
後の 2 桁 (内部ソート部分) の間にスペースがあります。
タイには 5 桁の郵便番号制度があります。
トルコには 5 桁の郵便番号制度があります。 通常、郵便番号は 3 桁
目と 4 桁目をスペースで区切りますが、スペースを省いたフォーマッ
トもジオコーダで扱うことができます。
英国では、各住所が最大 7 文字の英数字コードに関連付けられます。
郵便番号ごとに平均で 15 個の住所が含まれます。 企業などの顧客が
相当量の郵便物を受け取る場合、郵便番号は 1 つの住所のみに関連
付けられます (大口ユーザ郵便番号)。
この国ではこのフィールドは使用されません。
StateProvince
StateProvince の意味は国によって異なります。
• ARG (アルゼンチン) — 地域 (Region) または州 (Province)
• AUS (オーストラリア) — 州 (State)
• AUT (オーストリア) — 地域 (Region)
• BEL (ベルギー) — 使用せず
• BRA (ブラジル) — 州 (State)
• CAN (カナダ) — 州 (Province)
• CHE (スイス) — 使用せず
• CHL (チリ) — 州 (State)
• CHN (中国) — 州 (Province)
• CZE (チェコ共和国) — 地域 (Region) 名またはエイリアス 例えば、
地域 HLAVNI MESTO PRAHA のエイリアスを Prag とすることが
できます。
648
Spectrum™ Technology Platform 8.0.0
第 24 章 : Enterprise Geocoding モジュール
フィールド名
説明/有効値
• DEU (ドイツ) — 連邦州 (Bundesland)
• DNK (デンマーク) — 使用せず
• ESP (スペイン) — 地域 (Region)
• EST (エストニア) — 使用せず
• FIN (フィンランド) — 地域 (Region) (lan)
• FRA (フランス) — 地域 (Region)
• GBR (イギリス) — 地域 (Region)
• GRC (ギリシャ) — 地域 (Region)
• HKG (香港) — 特別行政区 (Province)
• HUN (ハンガリー) — 郡 (County)
• IDN (インドネシア) — 州 (Province)
• IND (インド) — 州 (State)
• IRL (アイルランド) — 使用せず
• ITA (イタリア) — 地域 (Region)
• JPN (日本) — 県
• LTU (リトアニア) — 使用せず
• LVA (ラトビア) — 州 (State)
• MAC (マカオ) — 特別行政区 (State)
• MEX (メキシコ) — 州 (Province)
• MYS (マレーシア) — 州 (State) (negeri)
• NLD (オランダ) — 使用せず
• NOR (ノルウェー) — 使用せず
• NZL (ニュージーランド) — 地方行政区画 (Region)
• PHL (フィリピン) — 州 (State)
• POL (ポーランド) — 県 (Province) (voivodship)
• PRT (ポルトガル) — 地域 (Region)
• RUS (ロシア) — 地域 (Region)
• SGP (シンガポール) — 使用せず
• SVK (スロバキア) — 使用せず
• SVN (スロベニア) — 使用せず
• SWE (スウェーデン) — 地域 (Region) (lan)
• THA (タイ) — 県 (Province) (changwat)
• TUR (トルコ) — 県 (Province)
• ZAF (南アフリカ) — 州 (State)
州の名前。
州 (province) の名前。
ユーザ ガイド
649
Geocode Address Global の概要
フィールド名
説明/有効値
地方行政区画 (region) の名前。
この国ではこのフィールドは使用されません。
住所入力のガイドライン
通り名の入力データを最適なジオコーディングが可能な最善のフォーマットにするために、次の推奨
事項に従ってください。
アルゼンチンの住所のガイドライン
通り名の入力データを最適なジオコーディングが可能な最善のフォーマットにするために、次の推奨
事項に従ってください。
• 大通りタイプ — 入力住所に含まれる大通りタイプとその一般的な略語は認識され、完全に対応済み
です。 代表的な大通りタイプの例を次に示します。
Avendia
Avendia
Av
Calle
C
Clle
Lateral Ruta
Lat Ruta
LR
Ruta Provincia
RP
RP
Ave
Avda
LR
• 数字、数字に相当する文字、および序数 — 番号が付けられた通りは、名前に読み替えた通り名に変
換されます。 例えば、Calle 5 と Calle cinco のどちらを入力しても、返される候補は同じです。 入
力住所に含まれる序数も認識されます。 次の数字と数字に相当する文字は、入力される通り名の一
部として認識されます。
1、UNO、PRIMERO、PRIMER、PRIMERA
5、CINCO、QUINTO、QUINTA
例えば、通り名として "25 de Mayo" を入力した場合、この名前は "Veinticinco de Mayo" として認識
され、これと同じように扱われます。
• 通り名と都市名に含まれる固有名詞と日付 — アルゼンチンの住所には固有名詞と日付がよく使われ
ます。これらは MapMarker Argentina によって処理されます。 例えば、通り名として "Juan F. Ibarra"
を入力した場合、この名前は "Juan Felipe Ibarra" として認識され、これと同じように扱われます。
• 住所に含まれる方角 — 入力住所に含まれる次の方角が認識されます。 Norte、Oriente、Este、Sur、
Oueste、Occidente、Poniente、N、E、S、O、NE、NO、SE、SO、Noreste、Sudeste、Noroeste、
および Sudoeste。
• 住所に含まれる略語 — 入力住所には一般的な略語を使用できます。 Geocode AddressARG は、略
語を認識し、ジオコーディングを正しく行います。 以下に、対応済みの略語の一部を示します。 こ
れ以外にも多数の住所略語が認識されます。
650
Spectrum™ Technology Platform 8.0.0
第 24 章 : Enterprise Geocoding モジュール
Bario
BAR
Ciudad
CD
CD.
Colonia
COL
COL.
Doctor
DR
Francisco
FCO
Manza
MZA
オーストラリアの住所のガイドライン
Geocode Address Global によるジオコーディングが正しく実行されるように、次の推奨事項に従って
入力を作成してください。 オーストラリアの住所の詳細については、Australia Post Web サイト (
www.auspost.com.au) を参照してください。
• 必須のフィールド — 住所には必ず都市名か郵便番号を指定する必要があります。
• 家番号およびアパート — 家番号とアパート文字の間にスペースを入れないでください。 123 A Main
Street のジオコードは正しく行われません。ジオコーダが、通り名が A であると解釈するためです。
この問題を回避する方法は 2 通りあります。
• アパート文字を含めない。
• 家番号とアパート文字の間にあるスペースを削除する。 123A Main Street を入力すると、ジオコー
ダは A を無視するので正しくジオコーディングが行われます。
• 家番号およびユニット情報 — 家番号は住所の場所をピンポイントで指します。 ユニットの入力は、
2 つのフォーマットのどちらかで指定できます。以下に例を示します。
• Flat 2, 17 Jones St.
• Apt 19, 123 Main St. − この例では Apt はユニット タイプで、99 はユニット番号です。 このフォー
マットを使う際は、有効なユニット タイプを指定する必要があります。ユニット タイプが無効な
場合、住所のジオコーディングは正しく行われません。 有効なユニット タイプのリストについて
は、www.auspost.com.au を参照してください。
• 99-123 Main St. − G-NAF データベースから取得された住所の場合、この住所は一意の家番号であ
り、範囲ではなく単一の配達ポイントとしてジオコーディングされます。
• 方位接尾語 — 使用可能な位置では、方位を示す接尾語を使ってください。 これは、番号の割り振
られた通りで主に構成される町や都市でとくに推奨されます。 このような通りは、方位接尾語や通
りタイプでしか区別できません。 また、直線ではない通り上の住所を区別するのにもこの情報が役
立ちます。 例えば、 123 Queen St W および 123 Queen St E は、座標がかなり異なります。
• 通りタイプ — 同じ名前の通りを区別するのに使用されます。 例えば、Main Avenue と Main Street
はまったく異なる通りです。 タイプの使用は必須ではありませんが、データの精度を高めるには有
効です。 通りタイプのリストについては、www.auspost.com.au を参照してください。
• 都市/郊外の名前 — 都市/郊外の名前は [City] フィールドに入力します。 入力住所には必ず都市名か
郵便番号を指定する必要があります。 指定された郊外の通りに近似一致が検出されない場合、範囲
ユーザ ガイド
651
Geocode Address Global の概要
を地方自治体 (LGA) に広げて近似一致が検索されます。 地方自治体 (LGA) は、オーストラリア全土
をカバーしません。 例えば、ノーザン テリトリーと呼ばれるオーストラリア南部の北半分や、首都
特別地域は LGA に含まれません。 LGA に多数の公式な郊外が含まれる場合があります。 ジオコー
ディングを正しく行うには郊外名を使うのが最善ですが、ジオコーディング結果で LGA からマッチ
ングを得る (または LGA 情報を返す) ことは可能です。
• 郵便番号 — 郵便番号は 4 桁の情報です。 例外はありますが、一般に郵便番号は次のフォーマット
で表記します。
注: これは一般的なガイドラインであり、ここに示す郵便番号の範囲に含まれない例外も存在しま
す。
• 1 桁目は州または特別地域を表し、書式は次の規則に従います。
2
NSW
2600 および 2900
ACT
3
VIC
4
QLD
5
SA
6
WA
7
TAS
0
NT
• 2 桁目は州内の地域を表します。 通常、州または特別地域の州都は 2 桁目が 0 または 1 とされま
す。
• 3 桁目と 4 桁目は都市を表します。 通常、主要な都市の 4 桁目は 0 です (3 桁目も 0 の場合があ
ります)。
オーストリアの住所のガイドライン
Geocode Address Global によるジオコーディングが正しく実行されるように、次の推奨事項に従って
入力を作成してください。 オーストリアの住所の詳細については、Austria Post Web サイト (
www.post.at) を参照してください。
• 必須のフィールド — 住所には必ず都市名または郵便番号を含める必要があります。
• 州の略語 — 州の略語がサポートされています。 オーストリアの州とその略語の一覧を以下の表に
示します。
652
Spectrum™ Technology Platform 8.0.0
第 24 章 : Enterprise Geocoding モジュール
Burgenland
Bgl
Karnten
Ktn
Niederosterreich
NO
Oberosterreich
OO
Salzburg
Sbg
Steiermark
Stm
Tirol
Tirol
Vorarlberg
Vbg
Wien
Wien
• 大通りタイプ — 入出力におけるオーストリアの大通りタイプとその一般的な略語は認識され、完全
に対応済みです。
• 数字、数字に相当する文字、および序数 — 番号が付けられた通りは、名前に読み替えた通り名に変
換されます。 入力住所に含まれる序数も認識されます。
• 一般的な語と略語 — 住所で使用される一般的な語、方角、家番号を指す記号、および略語が認識さ
れています。
ベルギーの住所のガイドライン
ベルギーのジオコーダは、ベルギーおよびルクセンブルグ国内のロケーションをサポートしています。
Geocode Address Global によるジオコーディングが正しく実行されるように、次の推奨事項に従って
入力を作成してください。 ベルギーおよびルクセンブルグの住所の詳細については、Belgium Post
Web サイト ( www.bpost.be) を参照してください。
• 必須のフィールド — 住所には必ず都市名または郵便番号を含める必要があります。
• サポートされている言語 — オランダ語、フランス語、およびドイツ語のエイリアスと住所フォー
マットがサポートされています。
• 大通りタイプ — 入出力におけるベルギーの大通りタイプとその一般的な略語は認識され、完全に対
応済みです。 ドイツ、フランス、およびドイツの大通りタイプもサポートされています。
• 数字、数字に相当する文字、および序数 — 番号が付けられた通りは、名前に読み替えた通り名に変
換されます。 入力住所に含まれる序数も認識されます。
• 一般的な語と略語 — 住所で使用される一般的な語、方角、家番号を指す記号、および略語がサポー
トされています。
ユーザ ガイド
653
Geocode Address Global の概要
ブラジルの住所のガイドライン
• 必須のフィールド — 住所には必ず都市名または郵便番号を含める必要があります。
• 大通りタイプ — 入出力における大通りタイプ (前置/後置大通りタイプ) とその一般的な略語は認識
され、完全に対応済みです。 認識されている大通りタイプの一部を次の表に示します。
ALAMEDA=AL、ALAMEDA、ALUA LALA
ACESSO=AC、ACESSO
ARCO=ARCO
AUTO-ESTRADA=AUTO-EST、AUTO-ESTRADA
AVENIDA=AV、AVDA、AVE、AVENIDA
AZINHAGA=AZINHAGA
BAIRRO=BAI、BAIRRO
BALUARTE=BALUARTE
BECO=BECO
これ以外にも多数の大通りタイプが認識されます。
• 数字、数字に相当する文字、および序数 — 番号が付けられた通りは、名前に読み替えた通り名に変
換されます。 入力住所に含まれる序数も認識されます。 例えば、入力住所に含まれる次の文字はす
べて認識されます。
um、first、one、1st、primera、primeiras、primeiro
dois、second、two、2nd、segunda、segundos
これ以外にも多数の数字表示が認識されます。
• 住所に含まれる方角 — 入力住所に含まれる次の方角が認識されます。 norte、do norte、setentrional、
sul、do sul、meridional、leste、este、do leste、do este、oriental、oeste、do oeste、ocidental
• 一般的な語と略語 — 住所で使用される一般的な語、方角、家番号を指す記号、および略語がサポー
トされています。 認識されている一般的な語と略語の一部を次の表に示します。 これ以外にも多数
の一般的な語に対応済みです。
654
冠詞
dos、das、do、da、de、d、dom、uma、e、o、n、sn、sa、ie a、
os、as、ao、em、no、na、nos、nas、ao、andar、andares、
ander、apart、apartment、flat、apartmento、apto、apt、ap、ato、
casa、cs、cob、unit (およびこれ以外の多数の一般的な冠詞)
一般的な語
os、nova、novas、na、no、nas、nos、um
一般的な略語
aeroporto=aerop
internacio=intern、int
internacional=int
international=int
conselheiro=cnso
desembargador=des
regente=reg
Spectrum™ Technology Platform 8.0.0
第 24 章 : Enterprise Geocoding モジュール
limitado=ltda、ltdo、ltd
(およびこれ以外の多数の略語)
カナダの住所のガイドライン
通り名の入力データを最適なジオコーディングが可能な最善のフォーマットにするために、次の推奨
事項に従ってください。
• 私書箱番号 — 私書箱および地方配送路住所はジオコード不可能です。 Geocode Address CAN はこ
のユーザ入力に従って私書箱と地方配送路の情報を出力しますが、ジオコーディング目的には使用
できません。
• 高速道路住所 — 高速道路住所 (Hwy 401 など) はジオコードに変換されます。
• 家番号およびアパート文字 — 家番号とアパート文字の間にスペースを入れないでください。 123 A
Main Street のジオコードは正しく行われません。ジオコーダが、通り名が A であると解釈するため
です。この問題を回避する方法は 2 通りあります。
• アパート文字を含めない。
• 家番号とアパート文字の間にあるスペースを削除する。 123A Main Street を入力すると、ジオコー
ダは A を無視するので正しくジオコーディングが行われます。
• 家番号およびユニット情報 — 家番号は住所のロケーションをピンポイントで指します。 ユニット
の入力は、2 つのフォーマットのどちらかで指定できます。以下に例を示します。
• 99-123 Main St - この例では 99 はユニット番号です。 このフォーマットを使う際は、ユニット タ
イプを指定しないでください。 番号 99 は、スィート、アパート、ユニット、フロア、または任意
の有効なユニット タイプです。
• 123 Main St. Apt 99 − この例では Apt はユニット タイプで、99 はユニット番号です。 このフォー
マットを使う際は、有効なユニット タイプ (Apt または Suite など) を指定する必要があります。ユ
ニット タイプが無効な場合、住所のジオコーディングは正しく行われません。
• 方位接尾語 — 使用可能な位置では、方位を示す接尾語を使ってください。 これは、番号の割り振
られた通りで主に構成される町や都市 (Calgary など) で特に推奨されます。 このような通りは、方
位接尾語や通りタイプでしか区別できません。 また、直線ではない通り上の住所を区別するのにも
この情報が役立ちます。 例えば、 123 Queen St W および 123 Main St E は、座標がかなり異なり
ます。
• 通りタイプ — 同じ名前の通りを区別するのに使用されます。 例えば、Main Avenue と Main Street
はまったく異なる通りです。 タイプの使用は必須ではありませんが、データの精度を高めるには有
効です。 有効な通りタイプの一覧は、http://www.canadapost.ca/ を参照してください。
• 都市の名前 — 都市名は短縮しないでください。 都市が不明の場合は空白にできますが、ジオコー
ドの正確性に影響を与えることがあります。
• 州の名前 — 完全な州の名前 (Ontario など) を使用できますが、入力エラーの可能性を減らすため、
2 文字の略語 (ON) を使用することを推奨します。
ユーザ ガイド
655
Geocode Address Global の概要
チェコ共和国の住所のガイドライン
Geocode Address Global によるジオコーディングが正しく実行されるように、次の推奨事項に従って
入力を作成してください。
• 必須のフィールド — 住所には必ず都市名または郵便番号を含める必要があります。
• 都市、地区、および地域名のエイリアス — 都市、地区、および地域名のエイリアスがサポートされ
ています。
• 大通りタイプ — 入出力における大通りタイプ (前置/後置大通りタイプ) とその一般的な略語は認識
され、完全に対応済みです。
デンマークの住所のガイドライン
Geocode Address Global によるジオコーディングが正しく実行されるように、次の推奨事項に従って
入力を作成してください。 デンマークの郵便制度の詳細については、Post Danmark Web サイト (
www.postdanmark.dk) を参照してください。
• 必須のフィールド — 住所には必ず都市名または郵便番号を含める必要があります。
• サポートされている言語 — 主要な町/地方自治体名に対して、デンマーク語と英語のエイリアスが
サポートされています。 例えば、Copenhagen (英語) は Kobenhavn (デンマーク語) に対応します。
• 大通りタイプ — 入出力における大通りタイプとその一般的な略語は認識され、完全に対応済みで
す。 認識されている大通りタイプの一覧を次の表に示します。 これは完全な一覧ではありません。
その他の大通りタイプも認識できます。
ALLE=alle
ANLAEG=anlaeg
ANLEAG=anleag
BAKKEN=bakken
BANEN=banen
BASTION=bastion
BOUL=boulevard
BOULEVARD=bulevardi
BRO=bro
BROEN=bro
BUEN=buen
BULEVARDI=bulevardi
DAMMEN=dammen
DOSSERING=dossering
GAARD=garrd
GADE=gade
GANGEN=gangen
GARD=gard
GARD=gard
GET=get
HAVE=have
HAVN=havn
HOEJEN=hojen
656
Spectrum™ Technology Platform 8.0.0
第 24 章 : Enterprise Geocoding モジュール
HOJEN=hojen
HoJEN=hojen
HOLMEN=holmen
HUSET=huset
KAER=kaer
KEAR=kear
KRAENTEN=kraeten
KREANTEN=kreanten
LAENGEN=laengen
LEANGEN=leangen
MARKEN=marken
PARK=parken
PARKEN=parken
PASSAGEN=passagen
PLADS=plads
SIDEN=siden
STIEN=stien
STRAEDE=straede
STREADE=streade
SVINGET=svinget
TOFTEN=toften
TORV=torv
VAENGE=vaenge
VANGEN=vangen
VARDEN=varden
VEANGE=veange
VEJ=vej
• 数字、数字に相当する文字、および序数 — 番号が付けられた通りは、名前に読み替えた通り名に変
換されます。 入力住所に含まれる序数も認識されます。
• 一般的な語と略語 — 住所で使用される一般的な語、方角、家番号を指す記号、および略語がサポー
トされています。
フィンランドの住所のガイドライン
Geocode Address Global によるジオコーディングが正しく実行されるように、次の推奨事項に従って
入力を作成してください。 フィンランドの郵便制度の詳細については、Posti kuluttajille Web サイト (
www.posti.fi) を参照してください。 フィンランドの郵便番号は、Itella Corporation が管理していま
す。 詳細については、Itella 郵便番号ページを参照してください。
• 必須のフィールド — 住所には必ず都市名または郵便番号を含める必要があります。
• 大通りタイプ — 入出力におけるフィンランドの大通りタイプとその一般的な略語は認識され、完全
に対応済みです。 スウェーデンの大通りタイプにも対応しています。
• 一般的な語と略語 — 住所で使用される一般的な語、方角、家番号を指す記号、および略語がサポー
トされています。
• 数字、数字に相当する文字、および序数 — 番号が付けられた通りは、名前に読み替えた通り名に変
換されます。 入力住所に含まれる序数も認識されます。
ユーザ ガイド
657
Geocode Address Global の概要
フランスの住所ガイドライン
Geocode Address Global によるジオコーディングを正しく実行するには、次のガイドラインに従う必
要があります。 フランスの郵便制度の詳細については、La Poste Web サイト ( www.laposte.com)
を参照してください。.
• 必須のフィールド — 住所には必ず都市名または郵便番号を含める必要があります。
• 仮想都市名 — 一部の地域は、行政上の都市ではないにもかかわらず、一般に都市として認識されま
す。 このような地域は、人工都市エリアや仮想都市と呼ばれます。 仮想都市名は生活のなかで広く
使われることから、その周囲に位置する都市のいずれかのエイリアスとして扱われます。 返される
候補では、入力の仮想都市名が実際の都市名に訂正されます。
表 92 : フランスの仮想都市
658
仮想都市のエイリアス
周囲に位置する実際の都市
Defense (La)
一部が Nanterre、Puteaux、および Courbevoie
に含まれる
Sophia Antipolis
一部が Valbonne、Mougins、Vallauris、Antibes、
および Biot に含まれる
Cergy-Pontoise
Menucourt、Courdimanche、Puiseux-Pontoise、
Osny、Pontoise、Cergy、Vaureal、Neuville-surOise、Saint-Ouenl'Aumone、Jouy-le-Moutier、
および Eragny
Marne-la-Vallee
Bry-sur-Marne、Villiers-sur-Marne、Noisy-leGrand、Champs-sur-Marne、Emerainville、
Noisiel、Lognes、Croissy-Beaubourg、Torcy,
Collegien、Ferrieres、Bussy- Saint-Georges、
Bussy-Saint-Martin、Saint-Thibault-des-Vignes、
Gouvernes、Conches、Guermantes、Jossigny、
Lagny-sur-Marne、Montevrain、Chanteloup-enBrie、Serris、Chessy、Coupvray、Magny-leHongre、および Bailly- Romainvilliers
Saint-Quentin-en-Yvelines
Elancourt、Verriere (La)、Trappes、Montigny-leBretonneux、Guyancourt、Voisins-leBretonneux、および Magnyle- Hameau
Spectrum™ Technology Platform 8.0.0
第 24 章 : Enterprise Geocoding モジュール
仮想都市のエイリアス
周囲に位置する実際の都市
Senart
Tigery、Combs-la-Ville、Lieusaint、MoissyCramayel、Saint-Pierre-du-Perray、Savigny-leTemple、Reau、Nandy、Cesson、および VertSaint-Denis
Evry
Evry、Bondoufle、Courcouronnes、および Lisses
Etang de Berre
Fos-sur-Mer、Miramas、Vitrolles、および Istres
Isle-d'Abeau
Four、Isle d’Abeau (L’)、Saint-Quentin-Fallavier、
Vaulx-le- Milieu、および Villefontaine
• 一般的な語と略語 — フランスの住所に一般的に使われる略語はジオコーダで適切に処理されます。
フランスの通りタイプを表す公式な略語に加え、ジオコーディングの効率を高めるため、非公式の
通りタイプも数多くサポートされています。 以下に代表的なものを示します。
表 93 : フランスの住所に一般的な略語
通りタイプまたは通り名
略語
Hauts
略語なし。
appartement
APP、APT、APPART
Saint
ST
Sainte
STE
rue
-r
Charles de Gaulle
CDG
Regiment D’Infanterie de Marine
RIMA
Division Blindee
DB
• 住所に含まれる方角 — 略語で示される通りの方角も入力で適切に処理され、返される候補には完全
な方角が明示されます。
ユーザ ガイド
659
Geocode Address Global の概要
表 94 : 通りの方角
N
N.
Nord
S
S.
Sud
E
E.
Est
O
O.
Ouest
NE
N.E.
Nord-Est
SE
S.E.
Sud-Est
NO
N.O.
Nord-Ouest
SO
S.O.
Sud-Ouest
• 序数および番号付きの通り名 — 入力住所には 1er、2e、2nd、2nde、3e などの序数を含めることが
できます。 3 e 以降の序数付き通り名には "e" または "eme" を使用します。 また、通り名に番号を
指定することも、その番号を英字で表記することもできます。 例えば、次の通り名は同じものを意
味し、どちらも入力住所の一部としてジオコーディングが適用されます。
Rue du 4 septembre
Rue du quatre septembre
• 文字を含む家番号 — 家番号には 85B Ave des provinces のように文字を含めることができま
す。
• 私書箱 (BP) 住所 — ジオコーダは、私書箱 (Boite Postale) 住所を適切に処理できます。 以下の住所
を入力すると、結果コード S5HPNTSC-A の近似一致候補が返されます。
AddressLine1: BP 112 2 Avenue CDG
PostalCode: 78150
City: Le Chesnay
この例では、通り名 CDG が Charles de Gaulle として返され、郵便番号が訂正されていること
に注意してください。 BP そのものは返されません。
• CEDEX 住所 — ジオコーディングに CEDEX は使われませんが、CEDEX があってもジオコーディ
ングの妨げにはなりません。 CEDEX は、[AddressLine1]、[City]、または [PostalCode] フィールド
に入力できます。 CEDEX そのものは出力に返されず、代わりに完全な郵便番号が返されます。 以
下の住所を入力すると、結果コード S5HPNTS--A の近似一致候補が返されます。
AddressLine1: 17 Rue Louise Michel
PostalCode: 92301 CEDEX
City: Levallois-Perret
660
Spectrum™ Technology Platform 8.0.0
第 24 章 : Enterprise Geocoding モジュール
郵便番号は返されますが、郵便セントロイドは返されません (リターン コードの 9 番目の位置に Z
はありません)。 CEDEX そのものは返されません。
• Paris の住所フォーマットおよび区 (arrondissement) — 通常、Paris の住所は入力フォーマットが
異なります。 家番号は、通り名の前ではなく後に記述します。 ジオコーダは、この入力フォーマッ
トを適切に処理し、ジオコーディングを正しく実行します。 区 (郵便番号の最後の 2 桁) を入力でき
ます。完全な地方と郵便番号の情報が返されます。次の住所を入力すると、結果コードS5HPNTSCZA
で近似一致候補が返されます。
AddressLine1: 7 Rue Beranger
PostalCode: 75003
City: Paris
返される [Locality] フィールドには、区 (arrondissement) (district) 情報が含まれます。 パリ地区には
20 の区があり、各区は郵便番号の最後の 2 桁で表わされます (最初の 3 桁は 750 です)。 パリの住
所は、最後の 2 桁のみで書くことができます。 次の住所を入力すると、結果コード S5HPNTSC-A
で近似一致候補が返されます。
AddressLine1: 51 Rue Lafitte
PostalCode: 09
City: Paris
完全な郵便番号 (75009) は、入力で 09 (9 番目の区を示す) のみを指定した場合も返されます。
• 軍施設の住所 — 軍施設の住所 (一般的な軍施設住所の略語を含め) は適切に処理されます。 通常、
最初の 2 桁は郡を表します。 この 2 桁が 00 の住所は、軍施設です。
• モナコの住所 — ジオコーダは、モナコの住所を適切に処理します。 [StateProvince] 入力フィール
ドに "Monaco" を指定します。 モナコの郵便番号は常に最初の 2 桁が 98 です。 "Monaco" は、入力
に指定しない場合も、常に住所に返されます。
ドイツの住所のガイドライン
Geocode Address Global によるジオコーディングが正しく実行されるように、次の推奨事項に従って
入力を作成してください。 ドイツの郵便制度の詳細については、Deutsche Post Web サイト (
www.deutschepost.de) を参照してください。
住所には必ず都市名または郵便番号を含める必要があります。
ドイツの住所には、次の住所要素の一部またはすべてを含めることができます。
表 95 : ドイツの住所要素
住所要素
フィールド
例
通りの住所
AddressLine1
Muldenweg 2
Ort
City
Vaihingen an der Enz
ユーザ ガイド
661
Geocode Address Global の概要
住所要素
フィールド
例
郡
County
Ludwigsburg
連邦州
StateProvince
Baden-Wurttemberg
Postcode
PostalCode
71665
ギリシャの住所のガイドライン
Geocode Address Global によるジオコーディングが正しく実行されるように、次の推奨事項に従って
入力を作成してください。 ギリシャの住所の詳細については、Hellenic Post Web サイトを参照してく
ださい。 http://www.elta.gr.
• 必須のフィールド — 住所には必ず都市名または郵便番号を含める必要があります。
• 大通りタイプ — 入出力における大通りタイプとその一般的な略語は認識され、完全に対応済みで
す。
• 一般的な語および略語 — ジオコーダは、住所に含まれる一般的な語、方角、家番号を指す記号、お
よび略語を認識し、このような住所のジオコーディングを正しく実行できます。
香港の住所のガイドライン
Geocode Address Global によるジオコーディングが正しく実行されるように、次の推奨事項に従って
入力を作成してください。 香港の住所の詳細については、香港郵政 Web サイトのガイドラインを参
照してくださいhttp://www.hongkongpost.com/eng/publications/guide/content/6.1.pdf。
• 必須フィールド — 住所には都市が含まれる必要があります。 HKG では、住所に郵便番号が含まれ
ることを前提としません。
• 大通りタイプ — 入力住所に含まれる大通りタイプとその一般的な略語は認識され、完全に対応済み
です。
• 一般的な語と略語 — 住所で使用される一般的な語、方角、家番号を指す記号、および略語がサポー
トされています。
• 数字、数字に相当する文字 — 番号が付けられた通りは、名前に読み替えた通り名に変換されます。
ハンガリーの住所のガイドライン
Geocode Address Global によるジオコーディングが正しく実行されるように、次の推奨事項に従って
入力を作成してください。 ハンガリーの郵便制度の詳細については、Magyar Posta Web サイト (
www.posta.hu) を参照してください。
• 必須のフィールド — 住所には必ず都市名または郵便番号を含める必要があります。
• 大通りタイプ — 入出力における大通りタイプとその一般的な略語は認識され、完全に対応済みで
す。
662
Spectrum™ Technology Platform 8.0.0
第 24 章 : Enterprise Geocoding モジュール
• 家番号、フロア番号、アパートメント番号 — ジオコーダは家番号、フロア、およびアパートの情報
付きの通り住所をサポートしています。 例えば、
AddressLine1: Kavics utca 13 II/3
PostalCode: 1025
City: Budapest
これは、家番号が 13、フロアがローマ数字の 2、アパート番号が 3 に解釈されます。 これは、
Kavics utca 13 II em 3 ajto と入力することもできます。
アイルランドの住所のガイドライン
Geocode Address Global によるジオコーディングが正しく実行されるように、次の推奨事項に従って
入力を作成してください。 アイルランドの郵便制度の詳細については、An Post Web サイト (
www.anpost.ie) を参照してください。
• 必須のフィールド — 住所には必ず都市名または郵便番号を含める必要があります。
• 大通りタイプ — 入出力における大通りタイプ (前置/後置大通りタイプ) とその一般的な略語は認識
され、完全に対応済みです。 認識されている大通りタイプの一部を次の表に示します。 これ以外に
も多数の大通りタイプが認識されます。
表 96 : アイルランドの大通りタイプ
前置大通りタイプ
後置大通りタイプ
Airse
Street (別名: St.、ST、STR)
Ard
Terrace (別名: TCE)
Arda
Third
Ardan
Track (別名: TRK、TCK)
Ascaill
Vale
Barra
Valley
Bealach
View
Bogha
Village
Boithrin
Walk (別名: WK)
Bothar
Way (別名: WY)
ユーザ ガイド
663
Geocode Address Global の概要
前置大通りタイプ
後置大通りタイプ
Bri
Wood(s)
Bruach
Yard (別名: Yd.)
Bulbhard
• 一般的な語と方角 — 住所に含まれる一般的な語と方角が認識され、ジオコーディングが正しく行わ
れます。 以下に、ジオコーダで認識される一般的な語と方角の一部を示します。 これ以外にも多数
の一般的な語に対応済みです。
an、na、a
Cuar、Circular
Cros、Cross
Thoir、East
Tosaigh、Front
Laistigh、Inner
Beag、Little
Lower
Main
Middle
Military
Nua、New
Thuaidh、North
Sean、Old
Lasmuigh、Outer
ear
Dara、Second
Theas、South
Third
Uachtarach、Uacht、Upper
Thiar、West
Iartharach、Western
Saint、St、Naomh
retail、park、business、center、centre、shopping、office、mills、
shop、service、outlet
saint、station
The
Park
House
Building、Blgs
House、Hse、Hses
branch
664
Spectrum™ Technology Platform 8.0.0
第 24 章 : Enterprise Geocoding モジュール
• 方角 — ジオコーダは次の方角を認識します。 North、N、Nth、South、S、Sth、East、E、Est、
West、W、Wst、NE、NW Sea SW Lower、LW、LR、Upper、UP、Upp、Uppe、upr、Thuaidh、
Thoirm、Thiar、Theas
• 一般的な略語 — 住所に含まれる一般的な略語が認識され、ジオコーディングが正しく行われます。
以下に、ジオコーダで認識される略語の一部を示します。 これ以外にも多数の略語に対応済みです。
表 97 : 一般的な略語
語
略語
saint
st.、st
great
gt.、gt
north
n、nth
south
s、sth
east
e、est
west
w、wst
northeast
ne
northwest
nw
southeast
se
southwest
sw
lower
lw、lr
upper
up、upp、uppe
mount
mnt、mt
and
&
football
f
club
c
ユーザ ガイド
665
Geocode Address Global の概要
語
略語
limited
ltd
park
pk
estate
est
gardens
gdns
building
bld
industrial
ind
industries
ind
number
num
center
cnt、centre
centre
cnt、center
country
co
market
mrkt
square
s
o+connell
oconnell
• 数字、数字に相当する文字、および序数 — 番号が付けられた通り名は、名前に読み替えた通り名に
変換されます。 入力住所に含まれる序数も認識されます。 例えば、入力住所に含まれる次の文字は
すべて認識されます。 um、first、one、1st、primera、primeiras、primeiro dois、second、two、
2nd、segunda、および segundos。
イタリアの住所のガイドライン
Geocode Address Global によるジオコーディングが正しく実行されるように、次の推奨事項に従って
入力を作成してください。 イタリアの郵便制度については、Posteitaliane Web サイト ( www.poste.it)
を参照してください。
• 必須のフィールド — 住所には必ず都市名か郵便番号を指定する必要があります。
666
Spectrum™ Technology Platform 8.0.0
第 24 章 : Enterprise Geocoding モジュール
• ドイツ式の住所 — ドイツ式の住所フォーマット (イタリアの South Tyrol 地方で一般的なフォーマッ
ト) のジオコーディングは正しく行われます。 一般的なドイツの大通りタイプと略語に対応済みで
す。 例えば、Marienstrase という通り名は Marienstr と略式に表記できます。どちらを入力に使っ
た場合も、同じ候補が返されます。 strasse と strase のどちらを入力した場合でも、出力候補には
strasse が返されます。
• 州、地方、および県のエイリアス — エイリアスを入力住所に含めることができます。 例えば、
Tuscany は Toscana 州のエイリアスです。 ジオコーディングを行うと、入力と同じ名前が候補に返
されます。 つまり、エイリアスを使った場合はそのエイリアスが返されます。
• 州と県 — 通りのジオコーディングでは、州名 ([StateProvince] フィールドに入力される) は処理に
使われませんが、返される候補には含まれます。 県の略語は 2 文字で表され、[County] フィールド
に返されます。 イタリアには 20 の州と 110 の県があります。
• 私書箱 — 私書箱番号は住所マッチングやジオコーディングに利用されませんが、住所に含まれてい
てもマッチングやジオコーディングの妨げにはなりません。 私書箱情報は、返される候補に含まれ
ません。 次のフォーマットが認識されます。
Casella Postale
CP
• 大通りタイプ — 入出力における大通りタイプ (前置/後置大通りタイプ) とその一般的な略語は認識
され、完全に対応済みです。 大通りタイプにはイタリアとドイツのフォーマットがありますが、両
方に対応しています。
• 一般的な語、略語、および方角 — ジオコーダは、住所に含まれる一般的な語、方角、家番号を指す
記号、および略語を認識し、このような住所のジオコーディングを正しく実行できます。
• 数字、数字に相当する文字、および序数 — 番号が付けられた通りは、名前に読み替えた通り名に変
換されます。 例えば、Via 42 Martiri という通り名を入力すると、QUARANTADUE MARTIRI と
いう名前が返されます。 入力住所に含まれる序数も認識されます。
日本の住所のガイドライン
一般に日本の住所は、次のように表記されます。
この住所を構成する要素について以下の表に説明します。
表 98 : 日本の住所要素
住所要素
Spectrum フィールド名
県
StateProvince
ユーザ ガイド
例
667
Geocode Address Global の概要
住所要素
Spectrum フィールド名
市区町村
County
町・大字
City
丁目
Locality
番地号または地番/支号
AddressLine1
例
番地号または地番/支号の番号
は、最も狭い住所要素です。 日
本の住所には、通常、通り名は
含まれません。
マカオの住所のガイドライン
Geocode Address Global によるジオコーディングが正しく実行されるように、次の推奨事項に従って
入力を作成してください。 マカオの住所の詳細については、Macau Post Web サイトを参照してくだ
さい: http://www.macaupost.gov.mo/.
• 必須フィールド — 住所には都市が含まれる必要があります。 MAC では、住所に郵便番号が含まれ
ることを前提としません。
• 大通りタイプ — 入出力における大通りタイプとその一般的な略語は認識され、完全に対応済みで
す。
• 一般的な語および略語 — ジオコーダは、住所に含まれる一般的な語、方角、家番号を指す記号、お
よび略語を認識し、このような住所のジオコーディングを正しく実行できます。
マレーシアの住所のガイドライン
マレーシアの住所については、Pos Malaysia Web サイト ( www.pos.com.my) を参照してください。
マレーシアでは一部の住所で都市名または郵便番号を省くことができます。 該当する住所を入力する
と、通り名の情報 (住所番号と通り名の組み合わせなど) のみを使ってジオコードが取得されます。都
市名や郵便番号は使われません。
メキシコの住所のガイドライン
通り名の入力データを最適なジオコーディングが可能な最善のフォーマットにするために、次の推奨
事項に従ってください。
• 必須のフィールド — 住所には必ず都市名または郵便番号を含める必要があります。
668
Spectrum™ Technology Platform 8.0.0
第 24 章 : Enterprise Geocoding モジュール
• 都市名のエイリアス — 都市名の代わりにエイリアスを入力できます。その場合も近似一致は取得さ
れます。 例えば、"Coyoacan" や "Miguel Hidalgo" を入力しても、"Mexico City" にマッチします。
表 99 : メキシコの都市名のエイリアス
エイリアス
都市
Mexico City/Ciudad de Mexico
La Magdalena Contreras
Alvaro Obregon
Azcapotzalco
Benito Juarez
Ciudad Madero
Coyoacan
Cuajimalpa de Morelos
Cuauhtemoc
Gustavo A. Madero
Iztacalco
Iztapalapa
Miguel Hidalgo
Milpa Alta
Tlahuac
Tlalpan
Venustiano Carranza
Xochimilco
Ciudad Lopez Mateos
Atizapan de Zaragoza
Las Tortugas
Emiliano Zapata
Naucalpan
Naucalpan de Juarez
San Bernardo
San Bernardo Mixtepec
• 州名のエイリアス — 州名のエイリアスを使用して近似一致を取得できます。 例えば、"YUC" を入
力すると Yucatan にマッチします。
表 100 : メキシコの州名のエイリアス
州
エイリアス
Aguascalientes
AGS/AG/AGU
Baja California
Bassa California/Neder-Californie/BC/BJ/BN/
BAJ/B C
ユーザ ガイド
669
Geocode Address Global の概要
670
州
エイリアス
Baja California Sur
Bassa California del Sud/BCS/BS/BAS/B C S
Campeche
CAM/CP/CM
Chiapas
CHIS/CH/CU/CHP
Chihuahua
CHIH/CI/CL/CHU
Colima
COL/CL/CH
Coahuila de Zaragoza
COAH/CU/CS/COA/CZ/C Z/Coahuila
Distrito Federal
Distretto Federale/DF/MDF/D F
Durango
DGO/DG/DUR
Guanajuato
GTO/GJ/GT/GUA
Guerrero
GRO/GR/GUE
Hidalgo
HGO/HG/HID
Jalisco
JAL/JA
Mexico
Mexico/Mexiko/Meksiko/Messico/MEX/EM/MX
Michoacan de Ocampo
MICH/MH/MC/MIC/MO/M O/Michoacan
Morelos
MOR/MR
Nayarit
NAY/NA
Nuevo Leon
NL/NUE/N L
Oaxaca
OAX/OA
Puebla
PUE/PU/PUB
Queretaro Arteaga
QRO/QA/QE/QDA/Q A/Queretaro
Quintana Roo
QROO/QR/QI/QRO/Q R/Q Roo
Spectrum™ Technology Platform 8.0.0
第 24 章 : Enterprise Geocoding モジュール
州
エイリアス
San Luis Potosi
San Luis Potosi
Sinaloa
SIN/SI
Sonora
SON/SO
Tabasco
TAB/TA/TB
Tamaulipas
TAMPS/TM/TAM
Tlaxcala
TLAX/TL/TLX
Veracruz de Ignacio de la Llave
VER/VZ/VE/VCL/Veracruz
Yucatan
Yucatan/YUC/YC/YU
Zacatecas
ZAC/ZT/ZA
• 数字、数字に相当する文字、および序数 — 番号が付けられた通りは、名前に読み替えた通り名に変
換されます。 例えば、Calle 5 と Calle cinco のどちらを入力しても、返される候補は同じです。 入
力住所に含まれる序数も認識されます。 例えば、入力住所に含まれる次の文字はすべて認識されま
す。 5、CINCO、QUINTO、QUINTA
• 方角 — 入力住所において、次の方角が認識されます。 Norte、Oriente、Este、Sur、Oueste、
Occidente、Poniente、N、E、S、O、NE、NO、SE、SO、Noreste、Sudeste、Noroeste、Sudoeste。
オランダの住所のガイドライン
Geocode Address Global によるジオコーディングが正しく実行されるように、次の推奨事項に従って
入力を作成してください。 オランダの住所の詳細については、TNT Post Web サイト ( www.tntpost.nl)
を参照してください。
• 必須のフィールド — 住所には必ず都市名または郵便番号を含める必要があります。
• 都市名のエイリアス — 入力で、地方、町、県のエイリアスを使用できます。 ジオコーディングを
行うと、よりマッチした入力名 (正式名またはエイリアス) が返される候補に含まれます。
• 私書箱番号 — 私書箱番号は住所マッチングやジオコーディングに利用されませんが、住所に含まれ
ていてもマッチングやジオコーディングの妨げにはなりません。 私書箱情報は、返される候補に含
まれません。 次のフォーマットが認識されます。 Postbus、PostFach。
• 大通りタイプ — 入出力における大通りタイプとその一般的な略語は認識され、完全に対応済みで
す。
• 一般的な語および略語 — ジオコーダは、住所に含まれる一般的な語、方角、家番号を指す記号、お
よび略語を認識し、このような住所のジオコーディングを正しく実行できます。
ユーザ ガイド
671
Geocode Address Global の概要
• 数字、数字に相当する文字、および序数 — 番号が付けられた通りは、名前に読み替えた通り名に変
換されます。 入力住所に含まれる序数も認識されます。
ニュージーランドの住所のガイドライン
Geocode Address Global によるジオコーディングが正しく実行されるように、次の推奨事項に従って
入力を作成してください。 ニュージーランドの住所の詳細については、New Zealand Post Web サイ
ト ( www.nzpost.co.nz) を参照してください。
• 必須のフィールド — 住所には必ず都市名または郵便番号を含める必要があります。
• 郊外のエイリアス — ジオコーダは、正式に認識されている郊外名以外に、ローカルに使用されてい
る郊外名をサポートしています。 例えば、Rosedale は正式な郊外名 Hargest のエイリアスです。
• 大通りタイプ — 入出力における大通りタイプとその一般的な略語は認識され、完全に対応済みで
す。
• 一般的な語および略語 — ジオコーダは、住所に含まれる一般的な語、方角、家番号を指す記号、お
よび略語を認識し、このような住所のジオコーディングを正しく実行できます。
• 数字、数字に相当する文字、および序数 — 番号が付けられた通りは、名前に読み替えた通り名に変
換されます。 入力住所に含まれる序数も認識されます。
ノルウェーの住所のガイドライン
Geocode Address Global によるジオコーディングが正しく実行されるように、次の推奨事項に従って
入力を作成してください。 ノルウェーの住所の詳細については、Posten Norge Web サイト (
www.posten.no) を参照してください。
• 必須のフィールド — 住所には必ず都市名または郵便番号を含める必要があります。
• 一般的な語、略語、および方角 — ジオコーダは、住所に含まれる一般的な語、方角、家番号を指す
記号、および略語を認識し、このような住所のジオコーディングを正しく実行できます。 認識され
ている一般的な語の一覧を次の表に示します。 これ以外の一般的な語と略語も多数認識されます。
一般的な語
av、bak、bakerst、de、dei、den、det e、ei、
ein、eit、en、et for、foran、fra、gammel i、
imellom、Industriebygget、inntil、kort lang、
lille、lita、lite、liten. med、mellom nar、
narmest、nest、ny og、over、overfor、pa sma、
stor、til、under ved、ved siden av
一般的な略語
Sankt=St
方向指示
nord、ost、syd、vest
• 数字、数字に相当する文字、および序数 — 番号が付けられた通りは、名前に読み替えた通り名に変
換されます。 入力住所に含まれる序数も認識されます。
672
Spectrum™ Technology Platform 8.0.0
第 24 章 : Enterprise Geocoding モジュール
フィリピンの住所のガイドライン
Geocode Address Global によるジオコーディングが正しく実行されるように、次の推奨事項に従って
入力を作成してください。 フィリピンの住所の詳細については、Philippine Postal Web サイト
(http://www.philpost.gov.ph/www.philpost.gov.ph/) を参照してください。
• 必須フィールド — 住所には都市が含まれる必要があります。 PHL では、住所に郵便番号が含まれ
ることを前提としません。
• 大通りタイプ — 入力住所に含まれる大通りタイプとその一般的な略語は認識され、完全に対応済み
です。
• 一般的な語と略語 — 住所で使用される一般的な語、方角、家番号を指す記号、および略語がサポー
トされています。
• 数字、数字に相当する文字 — 番号が付けられた通りは、名前に読み替えた通り名に変換されます。
ポーランドの住所のガイドライン
Geocode Address Global によるジオコーディングが正しく実行されるように、次の推奨事項に従って
入力を作成してください。 ポーランドの住所の詳細については、Polish Post Web サイト ( www.pocztapolska.pl) を参照してください。
• 必須のフィールド — 住所には必ず都市名または郵便番号を含める必要があります。
• 大通りタイプ — 入出力における大通りタイプとその一般的な略語は認識され、完全に対応済みで
す。
• 一般的な語および略語 — ジオコーダは、住所に含まれる一般的な語、方角、家番号を指す記号、お
よび略語を認識し、このような住所のジオコーディングを正しく実行できます。
• 数字、数字に相当する文字、および序数 — 番号が付けられた通りは、名前に読み替えた通り名に変
換されます。 入力住所に含まれる序数も認識されます。
ポルトガルの住所のガイドライン
Geocode Address Global によるジオコーディングが正しく実行されるように、次の推奨事項に従って
入力を作成してください。 ポルトガルの住所の詳細については、CTT Portugal Post Web サイト (
www.ctt.pt) を参照してください。
• 必須のフィールド — 住所には必ず都市名または郵便番号を含める必要があります。
• 大通りタイプ — 入出力における大通りタイプとその一般的な略語は認識され、完全に対応済みで
す。
• 一般的な語および略語 — ジオコーダは、住所に含まれる一般的な語、方角、家番号を指す記号、お
よび略語を認識し、このような住所のジオコーディングを正しく実行できます。
• 数字、数字に相当する文字、および序数 — 番号が付けられた通りは、名前に読み替えた通り名に変
換されます。 入力住所に含まれる序数も認識されます。
ユーザ ガイド
673
Geocode Address Global の概要
ロシアの住所のガイドライン
Geocode Address Global によるジオコーディングが正しく実行されるように、次の推奨事項に従って
入力を作成してください。 ロシアの住所の詳細については、Russian Post Web サイトを参照してく
ださい。 http://www.russianpost.ru/
• 必須のフィールド — 住所には必ず都市名または郵便番号を含める必要があります。
• 大通りタイプ — 入出力における大通りタイプとその一般的な略語は認識され、完全に対応済みで
す。
• 一般的な語および略語 — ジオコーダは、住所に含まれる一般的な語、方角、家番号を指す記号、お
よび略語を認識し、このような住所のジオコーディングを正しく実行できます。
シンガポールの住所のガイドライン
Geocode Address Global によるジオコーディングが正しく実行されるように、次の推奨事項に従って
入力を作成してください。 シンガポールの住所の詳細については、Singapore Post Web サイト (
www.singpost.com) を参照してください。
• 必須のフィールド — 住所には必ず都市名または郵便番号を含める必要があります。
• 私書箱の住所 — 郵便局の私書箱番号は、住所マッチングやジオコーディングに利用されませんが、
住所に含まれていてもマッチングやジオコーディングの妨げにはなりません 私書箱情報は、返され
る候補に含まれません。 次のフォーマットは認識されます。 私書箱番号, Locked Bag Service 番号
• 大通りタイプ — 入出力における大通りタイプとその一般的な略語は認識され、完全に対応済みで
す。 認識される大通りタイプの一部を次の表に示します。 その他のタイプも認識されます。
表 101 : 大通りタイプ
前置大通りタイプ
lorong=lorong、lrg、lor、lorang
jalan=jalan、jln、jl
lengkong=lengkong、lkg
kallang=kallang
mount=mount、mt
upper=upper、upp
後置大通りタイプ
track=trk、tck
street=st
road=rd
drive=dr
crescent=cr、cres、crescent、cresent
boulevard=bvd、blvd、bouleyard、boulvard
674
Spectrum™ Technology Platform 8.0.0
第 24 章 : Enterprise Geocoding モジュール
hill=hill
gate=gate
mall=mall
avenue=ave、av、avnue
link=lk
lane=l
walk=wk
green=grn
highway=hwy
quay=quay、qy
parkway=pwy
• 一般的な語および略語 — ジオコーダは、住所に含まれる一般的な語、方角、家番号を指す記号、お
よび略語を認識し、このような住所のジオコーディングを正しく実行できます。 認識されている一
般的な語、略語、および方向指示の一部を次の表に示します。 その他の語も認識されます。
表 102 : 一般的な語
カテゴリ
語
一般的な語
and、ltd、international、industrial、plc、group、
co、front、by、bay
冠詞
the、at、a、an、blk
建物を指す記号
center、centre、building、house、place、court、
galleria、hotel、park、complex、mart、temple、
bank、exchange、station、community、area、
mosque、depertment、department、post office、
shrine、chambers、masjid、apartments、
complex、bureau、resort、lodge、harbour
monastery、convent、restaurant、golf course、
estate、campus、institute、university、facility、
tunnel、libraray、society、mansion、hub、
beach、church、park、kiosk、mission、
condominium、warehouse、hall、laboratories、
hospital、corporation、fire post、terminal、
workshop、headquarters、cemetery
ユーザ ガイド
675
Geocode Address Global の概要
カテゴリ
語
plaza、villa、garden、gardens、tower、station、
hall、lodge、cottages、cottage、village、
gurdwara、place
一般的な略語
AYE=Ayer Rajah Expressway
BKE=Bukit Timah Expressway
CTE=Central Expressway
ECP=East Coast Parkway
KJE=Kranji Expressway
KPE=Kallang-Paya Lebar Expressway
PIE=Pan Island Expressway
SLE=Seletar Expressway
TPE=Tampines Expressway
Ctrl=Central
E=East
S=South
W=West
N=North
JLN=Jalan
CR=Crescent
GR=Grove
L=Lane
WK=Walk
LRG=Lorong
TG.=TANJONG
住所に含まれる方角
676
North、N、Nth、South、S、Sth、East、E、
Est、West、W、Wst、NE、NW、SE、SW、T1、
T2
Spectrum™ Technology Platform 8.0.0
第 24 章 : Enterprise Geocoding モジュール
スペインの住所のガイドライン
Geocode Address Global によるジオコーディングが正しく実行されるように、次の推奨事項に従って
入力を作成してください。 スペインの郵便制度の詳細については、スペイン郵政公社 Web サイト (
www.correos.es) を参照してください。
• 必須のフィールド — 住所には必ず都市名または郵便番号を含める必要があります。
• サポートされている言語 — 通りにスペイン語名とバスク語またはカタロニア語の代替名がある場
合、返される候補に含まれる通り名は入力に一致します。 つまり、バスク語またはカタロニア語の
通り名が入力で使用されている場合、バスク語またはカタロニア語の代替通り名が近似一致候補と
して返されます。 スペイン語の通り名が入力された場合は、スペイン語の通り名が返されます。
• 住所に含まれる略語 — ジオコーダは、スペインの住所で使用される一般的な略語に対応していま
す。 建物タイプ、フロアを指す記号、肩書き、冠詞なども含まれます。 スペインの通りタイプを表
す公式な略語に加え、ジオコーディングの効率を高めるため、非公式の通りタイプも数多くサポー
トされています。 略語で示される通りの方角も入力で適切に処理され、返される候補には完全な方
角が明示されます。 例えば、Arroya Guadalpia N という入力に対して、Arroya Guadalpia Norte と
いう通りが返されます。
N、Norte、Nort
North
S、Sur、Sud
South
E、Este、Est
East
O、Oeste、Oest
West
スウェーデンの住所のガイドライン
Geocode Address Global によるジオコーディングが正しく実行されるように、次の推奨事項に従って
入力を作成してください。 スウェーデンの住所の詳細については、Post Norden Web サイト (
www.posten.se) を参照してください。
• 必須のフィールド — 住所には必ず都市名または郵便番号を含める必要があります。
• 大通りタイプ — 入出力における大通りタイプとその一般的な略語は認識され、完全に対応済みで
す。 認識されている大通りタイプの一覧を次の表に示します。 その他のタイプも認識されます。
ALLE、ALLE、BACKE、BULEVARDI、BULEVARD
DALLEN、ESPLANADI、GATAN、GATTAN、GATA
GATE、GATEN、GRANDEN、GRAND、GRAND
GARD、GARD、KATU、KUJA、LERIG
LIDEN、PARKEN、PARK、PLAN、PORTTI
PROMENADEN、PROMENADER、RACE、RADE、RADE
RINNE、STIGEN、STIG、STRAND、SKOG
TIE、TORG、VAG、VAGEN、VAGEN
VAG、VAGAN、VAGAN
ユーザ ガイド
677
Geocode Address Global の概要
• 一般的な語および略語 — ジオコーダは、住所に含まれる一般的な語、方角、家番号を指す記号、お
よび略語を認識し、このような住所のジオコーディングを正しく実行できます。 認識されている一
般的な語の一覧を次の表に示します。 これ以外の一般的な語と略語も多数認識されます。
andra、at、at、av、bak、bakom、de、del
den、dens、emellan、en、for、for、fore、for
framfor、framfore、framme、fran、fran、gamla、gammal、gammalt
i、in、infor、infore、intill、kort、lang、lang
liten、litens、med、mellan、motliggande、narheten、narheten
narmast、narmast、nord、Norra、ny、nya、och、ost
Ostra、Ostra、over、over、pa、pa、sidan、sma
sma、Sodra、Sodra、stor、syd、till、till、under
vast、vast、Vastra、Vastra、via
• 数字、数字に相当する文字、および序数 — 番号が付けられた通りは、名前に読み替えた通り名に変
換されます。 入力住所に含まれる序数も認識されます。
スイスの住所のガイドライン
スイスのジオコーダは、スイスおよびリヒテンシュタイン国内のロケーションをサポートします。
Geocode Address Global によるジオコーディングが正しく実行されるように、次の推奨事項に従って
入力を作成してください。 スイスの住所の詳細については、Swiss Post Web サイト (
www.swisspost.ch) を参照してください。 リヒテンシュタインの郵便制度の詳細については、
Liechtenstein Post Corp Web サイト ( www.post.li) を参照してください。
• 必須のフィールド — 住所には必ず都市名または郵便番号を含める必要があります。
• 大通りタイプ — 入出力におけるドイツ、フランス、およびイタリアの大通りタイプとその一般的な
略語は認識され、完全に対応済みです。 300 を越える大通りタイプが認識されています。
• 一般的な語および略語 — 一般的に住所に使用されるドイツ語、フランス語、イタリア語の一般的な
語、方角、家番号を指す記号、および略語を使用できます。
• 数字、数字に相当する文字、および序数 — ドイツ語、フランス語、またはイタリア語で番号が付け
られた通りは、名前に読み替えた通り名に変換されます。 入力住所に含まれる序数も認識されます。
タイの住所のガイドライン
Geocode Address Global によるジオコーディングが正しく実行されるように、次の推奨事項に従って
入力を作成してください。 タイの住所の詳細については、Thailand Post Web サイト (
www.thailandpost.com) を参照してください。
• 必須のフィールド — 住所には必ず都市名または郵便番号を含める必要があります。
• 大通りタイプ — 入出力における大通りタイプとその一般的な略語は認識され、完全に対応済みで
す。
• 一般的な語および略語 — ジオコーダは、住所に含まれる一般的な語、方角、家番号を指す記号、お
よび略語を認識し、このような住所のジオコーディングを正しく実行できます。
678
Spectrum™ Technology Platform 8.0.0
第 24 章 : Enterprise Geocoding モジュール
• 数字、数字に相当する文字、および序数 — 番号が付けられた通りは、名前に読み替えた通り名に変
換されます。 入力住所に含まれる序数も認識されます。
トルコの住所のガイドライン
Geocode Address Global によるジオコーディングが正しく実行されるように、次の推奨事項に従って
入力を作成してください。 トルコの住所の詳細については、Turkey PTT Web サイト ( www.ptt.gov.tr)
を参照してください。
• 必須のフィールド — 住所には必ず都市名または郵便番号を含める必要があります。
• 大通りタイプ — 入出力における大通りタイプとその一般的な略語は認識され、完全に対応済みで
す。 典型的な大通りタイプとその略語の例としては、 Bulvar、Bulvari (boulevard) Cadde、Caddesi、
Cd、Cad (avenue、lane) Mahalle、Mahallesi、Mah (neighborhood、quarter) Sokak、Sk、Sokagi
(street) Yolu、Yol (way、road) などがあります。これは完全な一覧ではありません。 その他の大通
りタイプも認識されます。
• 一般的な語および略語 — ジオコーダは、住所に含まれる一般的な語、方角、家番号を指す記号、お
よび略語を認識し、このような住所のジオコーディングを正しく実行できます。 認識されている一
般的な語と略語の一部を次の表に示します。 これ以外にも多数の一般的な語に対応済みです。
表 103 : 一般的な語
カテゴリ
語
冠詞
ve
方角
北、南、西、東、北西、北東、南東、南西を表
す語
建物
bina、binasi、apartman、kurma、yap; ev、
konut、mesken、ev halki、yurt;zemin、taban、
pist、kat
エリア名
semt、semti、ent、sehir、kasaba、sehir halki、
buyuk kasaba
レベルまたは位置
yukarida、asagida、asagi、altta、uzerinde、
altinda、arkasinda、icinde、moda、on、
yanindaki、arasinda、sol、sag
家番号を指す記号
hayir.、rakam、sayi、numara、miktar
一般的な略語
DR (Doctor)、Prof (Professor)、IST (Istanbul)
ユーザ ガイド
679
Geocode Address Global の概要
単一行入力
住所要素を個別のフィールドに入力するのではなく、住所全体を [AddressLine1] 入力フィールドにま
とめて入力できます。
住所は、以下の単一行フォーマットで入力できます。
日本を除くすべての国の住所は、このような 1 行以上の単一行フォーマットで入力できます。
注: すべての国でこれらのすべてのフォーマットが使えるわけではありません。
StreetAddress;PostalCode;City
StreetAddress;City;PostalCode
StreetAddress;PostalCode
StreetAddress;City
StreetAddress,PostalCode,City,StateProvince
StreetAddress,PostalCode,City,County,StateProvince
StreetAddress;City;StateProvince;PostalCode
注: オーストラリアの住所は、次のフォーマットで入力する必要があります。 都市名と州/省または郵
便番号を最後の住所要素として指定する必要があります。
StreetAddress;City;StateProvince+
StreetAddress;City;County;PostalCode
StreetAddress;County;City
StreetAddress;County
StreetAddress,City,PostalCode,StateProvince
PostalCode,City,StateProvince,StreetAddress
PostalCode;City;StreetAddress
PostalCode;StreetAddress
PostalCode;StreetAddress;City
PostalCode;City
City;StreetAddress
City;PostalCode;StreetAddress
City,StateProvince,StreetAddress
City,PostalCode,StateProvince,StreetAddress
City;StreetAddress;Locality
StreetAddress;Locality
680
Spectrum™ Technology Platform 8.0.0
第 24 章 : Enterprise Geocoding モジュール
StreetAddress;Locality;City
StreetAddress;Locality;City;PostalCode
注: 英国の住所は、次のフォーマットで入力する必要があります。 都市名と州/省または郵便番号を最
後の住所要素として指定する必要があります。
StreetAddress;City;Locality
StreetAddress;City;StateProvince;Locality
StreetAddress;City;County;StateProvince;PostalCode
StreetAddress;PostalCode;City;StateProvince;Locality
説明:
• StreetAddress は家番号および通り名であり、順不同です (通りタイプは通り名の直前か直後に記述
します)。
• City は都市です。インドネシアとタイでは、これは従属する地区です。
• Locality は地方の名前です。インドネシアでは、これは村です。
• County は郡の名前です。 チリ、フィリピン、およびタイでは、これは地区です。インドネシアで
は、これは摂政管区/都市です。
• StateProvince は住所で使われる州または省の略語です。
• PostalCode は完全な郵便番号です。 ブラジルの PostalCode は、正確な住所に配達するために完全
な 8 桁の郵便番号である必要があります。ただし、5 桁の郵便番号も使用できます。
単一行の入力によるマッチング精度は、適切なフォーマットの複数行住所の入力に匹敵します。 単一
行の入力住所の処理に要する時間は、適切なフォーマットの複数行住所と比べてやや長くなります。
最適な結果を得るには、住所の各コンポーネントを区切り文字 (カンマ、セミコロン、またはコロン)
で区切ってください。 次に例を示します。
26 Wellington Street East;Toronto;ON;M5E 1S2
Camino Nueva La Rural 3905 9200000 Cerrillos
Yayingshi Rd,5100
schulstrasse 22,Dresden,01328
Pohja Puiestee 23,10111
JL Pecenongan, 10120
Gunjur Road,Marattahalli,560017
Slengiu gatve 19, Klaipeda, 91001
Jatnieku 79;Daugavpils;LV-5410
Urion 30,Col. Tlatilco,02860,Mexico,D.F.
53 Myakininskaya 5-ya ulitsa; 143420; Krasnogorsk
Brezova 6 Sliac 90000
ユーザ ガイド
681
Geocode Address Global の概要
celjskih knezov 9,3000,Celje
Pleasant Drive, Caloocan City
入力住所に区切り文字がない場合、スペースが区切りとして認識され、内部パーシング ルールによっ
て住所コンポーネントが識別されます。 前に示した例では、一部またはすべての区切り文字がない住
所が入力されてもジオコーディングは正しく行われます。
注: 区切り文字がいっさいないか部分的にない単一行の住所のジオコーディングには、区切り文字の
ある単一行の住所と比べて時間がかかり、得られる結果が異なる可能性があります。 通り名や都
市名に複数の語が含まれる住所では、とくにこの傾向があります。 単一行の住所のジオコーディ
ングを最適化するには、住所コンポーネントを区切り文字で区切ってください (とくに通り名と
都市名を区切ります)。
ジオコーディングでは、句点は無視されます。
日本の住所フォーマット
通常、日本の住所は単一行で書かれ、住所フィールドを区切る区切り文字はありません。 標準フォー
マットは次のとおりです。
<prefecture><city><municipality subdivision><city district><block><lot><other>
説明:
• prefecture = 県
• city = 市区町村
• municipality subdivision = 大字
• city district = 丁目
• block = 番地または地番
• lot = 号または支号
• other = 建物名、集合住宅の番号、またはその他の識別名 日本の住所のジオコーディングでは、この
情報は無視されます。
注: 番地号または地番/支号の番号は、日本の住所で最も狭い住所要素です。 一般に日本の住所に通り
名は含まれません。
表 104 : 日本の住所の例
住所
説明
丁目、番、号をハイフンで区切ります。
番と号の数字をハイフンで区切り、丁目には識別
子として "丁目" を明記します。
丁目、番、および号を各自の識別子で区切りま
す。
682
Spectrum™ Technology Platform 8.0.0
第 24 章 : Enterprise Geocoding モジュール
単一行入力のガイドライン
• ドイツ、フランス、およびニュージーランドでは、
• カナダでは、郵便番号と国名を省いた場合でも通り名、都市名、および州名に基づいて住所のジオ
コーディングが行われます。
• 国名は必須ではありません。 ジオコーダは国別にあり、当該国の住所であることを前提として処理
を行います。
• 企業情報 (場所の名前、建物名、または政府機関の建物) は、存在する場合に返されます。
交差点の入力
交差点を入力住所に含めると、交差点の座標がジオコーダによって提供されます。
注: 交差点のジオコーディングは、イギリス (GBR) の住所には行えません。
交差点を入力するには、[AddressLine1] フィールドに 2 つの通り名を 2 個のアンパサンド (&&) で区
切って指定します。 例を次に示します。
AddressLine1: Ocean Ave && New South Head Rd
City: Woollahra
AddressLine1: AVENIDA VINTE E OITO DE MARCO && AVENIDA JOSE ALVES AZEVEDO
PostalCode: 280
AddressLine1: Avenida Los Carrera && Calle Peyronet
City: Quilpue
AddressLine1: Ruyi Rd && Huangge South Rd
PostalCode: 5180
AddressLine1: Telliskivi && Rohu
City: Pohja-Tallinn
AddressLine1: Chemin du Prieure && Rue de la Montcient
City: Seraincourt
AddressLine1: Akti Miaouli && Agias Marinas
City: Markopoulo Mesogaias
GRC はキリル文字セットもサポートしています。
Lai King Hill Road && Wa Lai Path
Kwai Tsing District
AddressLine1: JALAN PUSPO WARNO TENGAH && JALAN PUSPO WARNO SELATAN
PostalCode: 50142
AddressLine1: Arjunlal Road && Tilak Road
City: Ahmadabad City
ユーザ ガイド
683
Geocode Address Global の概要
AddressLine1: Artoju gatve && Bražuoles gatve
City: Vilnius
AddressLine1: SKARNU IELA && KALKU IELA
City: Riga
RUA NORTE && PATIO NOVO
Macau
AddressLine1: G. Tuazon && Calabash B
City: Manila City
AddressLine1: Aleksandra Matrosova ulitsa && Sampsoniyevskiy Bol'shoy
City: Vyborgskaya Storona
RUS はキリル文字セットもサポートしています。
AddressLine1: Opatovska && Mlynska Trencin
AddressLine1: Plešivica pri Žalni && Lobcek
PostalCode: 1290
注: /、_、-、またはその他の区切り文字を使わないでください。 交差点は、必ず 2 個のアンパサンド
(&&) で区切る必要があります。
すべての近似一致条件は、通りレベルのジオコーディングの場合と同様に交差点のジオコーディング
にも適用されます。
オプション
Geocode Address Global を使用して、管理コンソールからデフォルトの処理オプションを設定できま
す。 API または Enterprise Designer 等の クライアント ツールを使用して、Geocode Address
Spectrum™ Technology PlatformGlobal 呼び出しの設定を個別にオーバーライドできます。
ジオコーディングのオプション
以下の表に、特定の場所の座標を決定する方法を制御するためのオプションを示します。
表 105 : のジオコーディング オプション
684
オプション名
説明/有効値
ジオコード レベル
住所のジオコーディングをどのレベルの精度で行うかを指定します。
次のいずれかを選択します。
Spectrum™ Technology Platform 8.0.0
第 24 章 : Enterprise Geocoding モジュール
オプション名
説明/有効値
通りの住所 ジオコーダは、住所を通りの住所にジオコーディングし
ようとします。ただし、郵便番号セントロイド、交差
点、形状パスなどに比べてマッチング場所の精度が劣る
場合があります。
郵便セント ジオコーダは、住所を、確認できる最も高精度の郵便番
ロイド
号にジオコーディングしようとします。郵便番号セント
ロイド マッチングの長所は処理速度です。郵便番号によ
るマッチングの短所は、ジオコーダが [PostalCode]
フィールドしか調べないことです。精度レベルを通りの
住所に指定した場合はジオコーダは通り名のフィールド
と [PostalCode] フィールドの両方を確認し、通りレベル
の座標と、オプションとして郵便番号座標を代替として
返そうとします。郵便番号セントロイドのジオコーディ
ングはこの国では使用できません。
地理的セン ジオコードは、住所を都市または州の地理的セントロイ
トロイド
ドにジオコーディングしようとします。このオプション
は、イギリス( GBR) では使用できません。
住所ポイント補間
住所ポイント補間はこの国では使用できません。
住所ポイント補間を行うかどうかを指定します。 このオプションは
ParcelPrecision などのポイント データベースがインストールされて
いる場合のみに機能します。 このオプションはすべての国で使用でき
ません。
このオプションは、オーストラリア、カナダ、ドイツ、およびスイス
(リヒテンシュタインを含む) のみで使用できます。
住所ポイント補間は、ポイント データを使ってジオコード結果の精度
を高めます。 デフォルトで、ジオコーディング プロセスでは住所の
場所が通りセグメントのどちらかの終点に基づいて推定されます。 例
えば、通りセグメントが 100 Main St. から 200 Main St. までの場合、
150 Main St. を要求するとこのセグメントの中心地点が返されます。
住所ポイント補間を指定すると、180 Main St. のポイントがポイント
データから検出されます。これは通りを 3 分の 2 ほど進んだ地点で
す。 ジオコーダは、この情報を使って、100 および 180 Main St. に基
づいて 150 Main St. の場所を推定できます。この例では、ジオコーダ
はセグメントの中心からやや離れた場所を推定します。
ユーザ ガイド
685
Geocode Address Global の概要
オプション名
説明/有効値
地理的セントロイド
住所レベルのジオコードを決定できない場合に、地理的セントロイド
を決定しようとするかどうかを指定します。 このオプションは英国
(GBR) では使用できません。
郵便セントロイド
住所レベルのジオコードを決定できない場合に郵便番号セントロイド
を決定しようとするかどうかを指定します。このオプションはアルゼ
ンチン、香港、マカオ、フィリピン、および南アフリカでは使用でき
ません。
郵便代替はこの国では使用できません。
通りからのオフセット
通りレベルのジオコーディングに使う通りセグメントからのオフセッ
ト距離を指定します。 距離の単位は [Units] フィールドで指定しま
す。
注: オフセットは英国 (GBR) および日本 (JPN) ではサポートされま
せん。
デフォルト値は国によって異なります。
• 10 メートル — オーストラリア (AUS)、オーストリア (AUT)、ドイ
ツ (DEU)。
• 7 メートル — アルゼンチン (ARG)、ベルギーおよびルクセンブルグ
(BEL)、ブラジル (BRA)、カナダ (CAN)、スイスおよびリヒテンシュ
タイン (CHE)、チェコ共和国 (CZE)、チリ (CHL)、中国 (CHN)、デ
ンマーク (DNK)、スペイン (ESP)、エストニア (EST)、フィンラン
ド (FIN)、フランス (FRA)、英国 (GBR)、ギリシャ (GRC)、香港
(HKG)、ハンガリー (HUN)、インドネシア (IDN)、インド (IND)、ア
イルランド (IRL)、イタリア (ITA)、ラトビア (LVA)、リトアニア
(LTU)、マカオ (MAC)、メキシコ (MEX)、マレーシア (MYS)、オラ
ンダ (NLD)、ノルウェー (NOR)、ニュージーランド (NZL)、フィリ
ピン (PHL)、ポーランド (POL)、ポルトガル (PRT)、ロシア (RUS)、
シンガポール (SGP)、スロバキア (SVK)、スロベニア (SVN)、ス
ウェーデン (SWE)、タイ (THA)、トルコ (TUR)、南アフリカ (ZAF)。
デフォルトは、7 メートルです。
オフセット距離は、ジオコードが通りの中央に位置付けられるのを防
ぐために、通りレベルのジオコーディングで使われます。 通りレベル
のジオコーディングを行うと、住所が位置する通りの中心点の緯度/経
度が返されますが、これを補正するのがオフセットです。 住所が指し
示す建物は通りの真上に建っているわけではないので、路上のポイン
トに相当する住所のジオコードが返されるのは不都合です。 ジオコー
686
Spectrum™ Technology Platform 8.0.0
第 24 章 : Enterprise Geocoding モジュール
オプション名
説明/有効値
ドは、通りに面して建つ建物の場所を表している必要があります。 例
えば、50 フィートのオフセットは、ジオコードが通りの中心から 50
フィート離れた場所を表すことを意味します。 距離は、住所の通りセ
グメントから垂直方向に計算されます。 また、オフセットは、通りを
はさんで向かい合う住所が同じポイントになるのを防ぐ目的にも使わ
れます。 以下に、オフセット ポイントと元のポイントとの比較図を
示します。
通りの座標は 1/10,000 度の精度で決定され、補間ポイントは
1/1,000,000 度の精度で決定されます。
通りの角からのオフセット
通りレベルでのマッチングに使う通りの終端からのオフセットを指定
します。 距離は、 [Units] フィールド に指定した単位で指定されま
す。この値は、通りの角の住所に交差点と同じジオコードが与えられ
るのを防ぐために使われます。
注: オフセットは英国 (GBR) および日本 (JPN) ではサポートされま
せん。
デフォルト値は国よって異なります。
• 12 メートル — オーストラリア (AUS)、オーストリア (AUT)、ドイ
ツ (DEU)。
• 7 メートル — アルゼンチン (ARG)、ベルギーおよびルクセンブルグ
(BEL)、ブラジル (BRA)、カナダ (CAN)、スイスおよびリヒテンシュ
タイン (CHE)、チリ (CHL)、中国 (CHN)、チェコ共和国 (CZE)、デ
ンマーク (DNK)、スペイン (ESP)、エストニア (EST)、フィンラン
ド (FIN)、フランス (FRA)、英国 (GBR)、ギリシャ (GRC)、香港
(HKG)、ハンガリー (HUN)、インドネシア (IDN)、インド (IND)、ア
イルランド (IRL)、イタリア (ITA)、ラトビア (LVA)、リトアニア
(LTU)、マカオ (MAC)、メキシコ (MEX)、マレーシア (MYS)、オラ
ンダ (NLD)、ノルウェー (NOR)、ニュージーランド (NZL)、ポーラ
ンド (POL)、ポルトガル (PRT)、ロシア (RUS)、シンガポール
ユーザ ガイド
687
Geocode Address Global の概要
オプション名
説明/有効値
(SGP)、スロバキア (SVK)、スロベニア (SVN)、スウェーデン
(SWE)、タイ (THA)、トルコ (TUR)、南アフリカ (ZAF)。
デフォルトは、7 メートルです。
以下に、通りの終点とオフセット終点の比較図を示します。
単位
通りオフセットと角オフセットのオプションに使う距離単位を指定し
ます。 次のいずれかを選択します。
注: オフセットは英国 (GBR) および日本 (JPN) ではサポートされま
せん。
• フィート
• マイル
• メートル
• キロメートル
デフォルトは、メートルです。
ポイント タイプ
このオプションはオーストラリアのみで使用できます。
通り住所マッチングで小区画の緯度/経度を返すか、通りの入口の緯度/
経度を返すかを指定します。 このオプションは、G-NAF データベー
スがインストールされ、[データ] タブの [データベース] リストで G-NAF
データベースが選択されている場合のみに使用できます。 このオプ
ションは、G-NAF データベースのデータに一致する住所のみに適用さ
れます。
次のいずれかを選択します。
小区画
688
通り住所マッチングで小区画の正確な場所を返します。
これは標準 G-NAF ポイントであり、G-NAF データベー
スから返される正規のポイントです。 こちらがデフォル
トです。
Spectrum™ Technology Platform 8.0.0
第 24 章 : Enterprise Geocoding モジュール
オプション名
説明/有効値
通りの入
り口
通り住所マッチングで小区画の通りの入口ポイントを返
します。 通りの入口ポイントは、小区画の入口の境界か
ら 12.5 m 離れています。 通りの入口ポイントは、ルー
ティング アプリケーションでの使用に適しています。
郵便物の緯度と経度を表す小 このオプションはオーストラリアのみで使用できます。
数点以下 8 桁の数値を返す
元の緯度/経度を、小数点以下 8 桁までの精度で返すかどうかを指定し
ます。 これは、G-NAF データベースに一致する候補の緯度/経度です。
これらは、桁の切り捨てや四捨五入を行っていない、G-NAF データか
ら直接得られる元の座標です。 このオプションは、G-NAF データベー
スがインストールされ、[データ] タブの [データベース] リストで G-NAF
データベースが選択されている場合のみに使用できます。 このオプ
ションは、G-NAF データベースのデータに一致する住所のみに適用さ
れます。
座標系
座標系は、空間におけるポイントの位置を一意に表すリファレンス シ
ステムです。 カルテシアン (二次元) 座標、測地 (地理) 座標などが、
ユークリッド幾何学に基づくリファレンス システムとして挙げられま
す。Spectrum™ Technology Platform は、European Petroleum Survey
Group (EPSG) に承認されたシステムをサポートしています。
国によって異なる座標系が採用されています。 国によっては、次のオ
プションを 1 つ以上使用できます。
EPSG:4230
EPSG:4283
GDA94 座標系とも呼ばれます。
EPSG:4301
Tokyo 座標系とも呼ばれます。
EPSG:4326
WGS84 座標系とも呼ばれます。
EPSG:27200
NZGD49 座標系とも呼ばれます。
EPSG:27700
British National Grid 系とも呼ばれます。
マッチングのオプション
マッチングのオプションを使って、マッチングの制約、代替、および複数マッチの設定を調整して、
マッチングの精度を必要なレベルに設定することができます。 マッチングの条件を厳格にするには、
家番号、通り名、および郵便番号が正確に一致することを必須とし、郵便番号セントロイドによる代
替を無効に設定します。 ジオコーダは、入力住所の郵便番号に正確に一致する通り住所を検索しま
ユーザ ガイド
689
Geocode Address Global の概要
す。 条件を緩めると、範囲を広げてマッチングする住所を探します。 例えば、郵便番号に関する条件
を緩和すると、ジオコーダは入力住所の郵便番号の範囲外となる同じ市内にも候補を検索します。
マッチング率と精度の兼ね合いに関するガイドラインについては、マッチ率と精度のバランスをとる
(635ページ)を参照してください。
表 106 : のマッチング オプション
オプション名
説明/有効値
複数の一致を保持
住所がデータベース内の複数の候補に一致する場合に結果を返すかど
うかを指定します。 このオプションを選択しない場合、複数の候補に
一致する住所のジオコーディングは失敗します。
このオプションを選択する場合は、返す候補の最大数をチェック ボッ
クスの横で指定します。
返す範囲
住所の範囲情報を返すかどうかを指定します。 このオプションを有効
にすると、出力フィールド Ranges が出力に追加されます。
範囲とは、同じ通りセグメントに沿って並ぶ複数の住所を意味しま
す。 例えば、5400-5499 Main St. は、Main St. の 5400 ブロックにあ
る住所範囲です。範囲は、セグメントの奇数または偶数の番地のみを
表す場合と、奇数と偶数の両方を表す場合があります。 また、範囲は
複数のユニットがあるアパートメントのような単一の建物を表すこと
もあります。
候補あたりの最大範囲数
範囲を返すオプションを選択した場合、このオプションは候補ごとに
返す範囲の最大数を指定します。 ジオコーダはセグメントあたり 1 つ
の候補を返しますが、そのセグメントに複数の範囲が含まれる可能性
があるため、このオプションを使って候補のセグメントにある他の範
囲を確認できます。
範囲あたりの最大単位
範囲を返すオプションを選択した場合、このオプションは範囲ごとに
返すユニット (アパートやスイートの一室など) の最大数を指定しま
す。
例えば、4 部屋のスイートがある 65 Main St. のオフィス ビルをジオ
コードする場合、その建物の範囲で返されるのは最大で 4 つのスイー
ト (65 Suite 1、65 Suite 2、65 Suite 3、および 65 Suite 4) です。 こ
こでユニットの最大数を 2 に指定すると、4 つすべてではなく 2 つの
ユニットだけが返されます。
候補を拡大
690
このオプションはイギリスの住所のみに適用されます。
Spectrum™ Technology Platform 8.0.0
第 24 章 : Enterprise Geocoding モジュール
オプション名
説明/有効値
複数の近似一致を (通り上の配達ポイントごとに 1 つずつ) 返すかどう
かを指定します。 デフォルトで、通りに複数の住所/配達ポイントが
ある場合、Geocode Address GBR は、1 つの近似一致を返します。
このとき、各配達ポイントは範囲として使われます。
近似一致のみ
近似一致候補であるジオコード結果のみを返すかどうかを指定しま
す。 例えば、10 個の候補があり、そのうちの 2 個が近似一致である
場合、このオプションを有効にすると、10 個全部ではなく 2 個の近
似一致のみが候補として返されます。 近似一致と見なす条件を指定す
るには、[近似検索条件] オプションを使います。 住所候補は、これら
の優先設定に入力住所がどの程度近いかによってランク付けされま
す。
マッチ モード
候補が近似一致かどうかを判断する方法を指定します。 次のいずれか
を選択します。
カスタム このオプションを使うと、候補住所のどの部分が入力住
所に一致するときに近似一致と見なすかを指定できます。
[近似検索条件] チェック ボックスを使って、目的の住所
要素を指定できます。これはほとんどの国でデフォルト
値です。
完全一致 候補が近似一致と見なされるためには、候補のすべての
住所要素が一致する必要があります。
閉じる
候補が近似一致と見なされるためには、候補住所の家番
号通り名および都市 のみが一致する必要があります。チ
リ、中国、イギリス、エストニア、インド、インドネシ
ア、ラトビア、リトアニア、スロバキア、スロベニア、
および南アフリカでは、通り名と都市のみが一致する必
要があります。
緩和
すべての候補住所が近似一致と見なされます。 これは日
本ではデフォルト値です。
すべての入力
空白ではないすべての入力フィールドに一致する候補を近似一致と見
なすかどうかを指定します。 例えば、入力住所に都市名と郵便番号が
含まれる場合、この住所の候補が近似一致と見なされるには都市名と
郵便番号が一致する必要があります。
家番号
候補が近似一致と見なされるには家番号が一致する必要があるかどう
かを指定します。
ユーザ ガイド
691
Geocode Address Global の概要
オプション名
説明/有効値
このオプションはこの国では使用されません。
このオプションは中国、インドネシア、インド、および日本では使用
されません。
このオプションを選択する場合は、通り名に正確に一致することも条
件に指定する必要があります。このオプションを選択しても、パフォー
マンスに顕著な影響はありません。 ただし、候補の住所が、範囲を含
まないセグメントに相当する場合、一致のタイプに影響します。 一致
のタイプは、候補の家番号範囲に入力家番号が含まれない場合にも影
響を受けます。
通り
候補が近似一致と見なされるには通り名が一致する必要があるかどう
かを指定します。
このオプションは日本では使用されません。
近似一致が見つかると、ジオコーダは通り名の拡張を試みて、入力住
所と読みが似ている名前やスペルが誤っている名前に一致する候補を
探します。 例えば、"Mueller Strasse" が入力なら "Muller Strasse" を
探します。 この処理はパフォーマンスに影響しますが、マッチ率は向
上します。 ジオコーディング データベースにインデックスが作成さ
れていると、パフォーマンスへの影響は緩和されます。
地方
候補が近似一致と見なされるには地方が一致する必要があるかどうか
を指定します。
地方の一致を必須としない場合、ジオコーダは特定の郵便番号に一致
する通りを検索し、名前は一致しないが郵便番号が一致する他の地方
を候補として検討します。
このオプションはこの国では使用されません。
地方の意味は国によって異なります。
• 使用しない — オーストラリア (AUS)、オーストリア (AUT)、ベル
ギーおよびルクセンブルグ (BEL)、チリ (CHN)、ドイツ (DEU)、デ
ンマーク (DNK)、スペイン (ESP)、エストニア (EST)、フィンラン
ド (FIN)、フランス (FRA)、イタリア (ITA)、リトアニア (LTU)、マ
レーシア (MYS)、オランダ (NLD)、ノルウェー (NOR)、ポルトガル
(PRT)、スロバキア (SVK)、スロベニア (SVN)、スウェーデン
(SWE)、タイ (THA)
• 地方 — ブラジル (BRA)、スイス (CHE)、中国 (CHN)、チェコ共和
国 (CZE)、英国 (GBR)、ギリシャ (GRC)、香港 (HKG)、ハンガリー
(HUN)、インド (IND)、アイルランド (IRL)、ラトビア (LVA)、マカ
692
Spectrum™ Technology Platform 8.0.0
第 24 章 : Enterprise Geocoding モジュール
オプション名
説明/有効値
オ (MAC)、メキシコ (MEX)、シンガポール (SGP)、トルコ (TUR)、
南アフリカ (ZAF)
• 散布エリア (DA) および列挙エリア (EA) — カナダ (CAN)
• 郊外 — ニュージーランド (NZL)
• 小さな町、村、または地方 — インドネシア (IDN)、ポーランド (POL)
• 地区またはバリオ — アルゼンチン (ARG)
• 市内の地区 (丁目) — 日本 (JPN)
このオプションは、 [ジオコーディング] タブで [地理的セントロイド]
を選択した場合には利用できません。
City
候補が近似一致と見なされるには都市が一致する必要があるかどうか
を指定します。 日本では、このフィールドで候補が地方自治体の従属
する地区 (大字) と一致する必要があるかどうかを指定します。都市の
一致を必須としない場合、ジオコーダは特定の郵便番号に一致する通
り住所を検索し、名前は一致しないが郵便番号が一致する他の都市を
候補として検討します。
アルゼンチンでは、都市名は必ずしもソース データで利用できるわけ
ではありません。そのような場合、マッチングには郡 (County フィー
ルド) が使用され、郡が City 出力フィールドに返されます。この方法
でマッチした候補は、近似一致と見なされます。
County
候補が近似一致と見なされるには郡 (county) が一致する必要があるか
どうかを指定します。
候補が近似一致と見なされるには従属する地区 (subdistrict) が一致す
る必要があるかどうかを指定します。
候補が近似一致と見なされるには地区 (district) が一致する必要がある
かどうかを指定します。
このオプションはこの国では使用されません。
候補が近似一致と見なされるには郡 (county) が一致する必要があるか
どうかを指定します。 郡 (County) の意味は国によって異なります。
• ARG (アルゼンチン) — 郡 (Department)
• AUS (オーストラリア) — 地方自治体 (Local Government Authority:
LGA)
• AUT (オーストリア) — 使用せず
• BEL (ベルギー) — 州 (Province)
• BRA (ブラジル) — 使用せず
ユーザ ガイド
693
Geocode Address Global の概要
オプション名
説明/有効値
• CAN (カナダ) — 使用せず
• CHE (スイス) — 州 (Province)
• CHL (チリ) — 使用せず
• CHN (中国) — 使用せず
• CZE (チェコ共和国) — 地区 (Discrict)
• DEU (ドイツ) — 郡 (Kreis)
• DNK (デンマーク) — 使用せず
• ESP (スペイン) — 州 (Province)
• EST (エストニア) — 使用せず
• FIN (フィンランド) — 使用せず
• FRA (フランス) — 県 (Department)
• GBR (イギリス) — 郡 (County)
• GRC (ギリシャ) — 地区 (Discrict)
• HKG (香港) — 確認中
• HUN (ハンガリー) — 使用せず
• IDN (ハンガリー) — 従属する地区 (SubDistrict)
• IND (インド) — 地区 (District)
• IRL (アイルランド) — 州 (Province)
• ITA (イタリア) — 州 (Province)
• JPN (日本) — 市区町村
• LTU (リトアニア) — 使用せず
• LVA (ラトビア) — 郡 (County)
• MAC (マカオ) — 確認中
• MEX (メキシコ) — 使用せず
• MYS (マレーシア) — 使用せず
• NZL (ニュージーランド) — 使用せず
• NLD (オランダ) — 州 (Province)
• NOR (ノルウェー) — 郡 (Fylke)
• PHL (フィリピン) — 地区 (Discrict)
• POL (ポーランド) — 地区 (District) (poviat)
• PRT (ポルトガル) — 使用せず
• RUS (ロシア) — 地区 (Discrict)
• SGP (シンガポール) — 使用せず
• SVK (スロバキア) — 使用せず
• SVN (スロベニア) — 使用せず
• SWE (スウェーデン) — コミューン (Kommun)
694
Spectrum™ Technology Platform 8.0.0
第 24 章 : Enterprise Geocoding モジュール
オプション名
説明/有効値
• THA (タイ) — 使用せず
• TUR (トルコ) — 地区 (District)
• ZAF (南アフリカ) — 地区 (District)
州/省
候補が近似一致と見なされるには州 (state) または省 (province) が一致
する必要があるかどうかを指定します。
候補が近似一致と見なされるには州 (state) が一致する必要があるかど
うかを指定します。
候補が近似一致と見なされるには省 (province) が一致する必要がある
かどうかを指定します。
候補が近似一致と見なされるには地域 (region) が一致する必要がある
かどうかを指定します。
このオプションはこの国では使用されません。
州/省の意味は国によって異なります。
• ARG (アルゼンチン) — 県 (Province) または地域 (Region)
• AUS (オーストラリア) — 州 (State)
• AUT (オーストリア) — 使用せず
• BEL (ベルギー) — 使用せず
• BRA (ブラジル) — 州 (State)
• CAN (カナダ) — 州 (Province)
• CHE (スイス) — 使用せず
• CHL (チリ) — 使用せず
• CHN (中国) — 州 (Province)
• CZE (チェコ共和国) — 地域 (Region)
• DEU (ドイツ) — 連邦州 (Bundesland)
• DNK (デンマーク) — 使用せず
• ESP (スペイン) — 使用せず
• EST (エストニア) — 使用せず
• FIN (フィンランド) — 使用せず
• FRA (フランス) — 地域 (Region)
• GRC (ギリシャ) — 地域 (Region)
• GBR (イギリス) — 地域 (Region)
• HKG (香港) — 特別行政区 (Province)
• HUN (ハンガリー) — 郡 (County)
• IDN (インドネシア) — 使用せず
ユーザ ガイド
695
Geocode Address Global の概要
オプション名
説明/有効値
• IND (インド) — 州 (State)
• IRL (アイルランド) — 使用せず
• ITA (イタリア) — 地域 (Region)
• JPN (日本) — 使用せず
• LTU (リトアニア) — 使用せず
• LVA (ラトビア) — 使用せず
• MAC (マカオ) — 特別行政区 (State)
• MEX (メキシコ) — 州 (Province)
• MYS (マレーシア) — 州 (State) (negeri)
• NLD (オランダ) — 使用せず
• NOR (ノルウェー) — 使用せず
• NZL (ニュージーランド) — 地方行政区画 (Region)
• PHL (フィリピン) — 州 (State)
• POL (ポーランド) — 県 (Province) (voivodship)
• PRT (ポルトガル) — 地域 (Region)
• RUS (ロシア) — 地域 (Region)
• SGP (シンガポール) — 地域 (Region)
• SVK (スロバキア) — 使用せず
• SVN (スロベニア) — 使用せず
• SWE (スウェーデン) — 地域 (Lan)
• THA (タイ) — 県 (Province) (changwat)
• TUR (トルコ) — 県 (Province)
• ZAF (南アフリカ) — 使用せず
郵便番号
候補が近似一致と見なされるには郵便番号が一致する必要があるかど
うかを指定します。 郵便番号の完全一致を必要としない場合、ジオ
コーダはより広いエリアでマッチを検索します。 マッチ候補との比較
の際に完全に一致する必要がないため、結果としてパフォーマンスは
低下しますが、マッチ率は向上します。
このオプションは、アルゼンチン、日本、香港、マカオ、フィリピ
ン、および南アフリカでは使用できません。
[都市名よりも郵便番号を優
先]
696
このオプションは、オーストラリアの住所にのみ適用されます。
郵便番号および通り名は完全一致でも都市名が一致しないときに近似
一致を返すかどうかを指定します。 このオプションをオンにすると、
郵便番号および通り住所が完全一致した場合、[都市] フィールドが無
視されます。 このオプションをオンにしないと、入力の通り住所およ
Spectrum™ Technology Platform 8.0.0
第 24 章 : Enterprise Geocoding モジュール
オプション名
説明/有効値
び郵便番号が完全一致しても都市名が一致しないような状況で、近似
一致が返されません。
例えば、このオプションがオンでないとき、次の入力住所では近似一
致が返されません。
5 East St
GLENROY VIC 3046
このオプションがオンのときは、この同じ入力住所で次の近似一致が
返されます。
5 EAST ST
HADFIELD VIC 3046
LDU を含む候補のみ
このオプションは、カナダの住所のみに適用されます。
候補が近似一致と見なされるには郵便番号全体 (FSA および LDU) が
住所に含まれる必要があるかどうかを指定します。
カナダの郵便番号は、 Forward Sortation Area (FSA) と Local Delivery
Unit (LDU) という 2 つのセクションに分かれています。 例えば、M6H
2P8 という郵便番号は FSA が M6H であり、LDU が 2P8 です。 一部
の候補住所には FSA しか含まれないことがあります。 このオプショ
ンは、このような住所が近似一致に分類されるのを回避するために使
用できます。
郵便区域
このオプションは、英国の住所にのみ適用されます。
候補が近似一致と見なされるには郵便番号の郵便地域部分が一致する
必要があるかどうかを指定します。
英国の郵便番号は、2 つのセクションに分かれています。 スペースを
はさんで左側を外部番号、右側を内部番号と呼びます。 外部番号は、
郵便区域を表します。 例えば、CB3 OHH という郵便番号は郵便区域
が CB3 であり、これは Cambridge に当たります。
ESP 郵便番号の最初の 2 桁
このオプションは、スペインの住所にのみ適用されます。
候補が近似一致と見なされるには郵便番号の最初の 2 桁が一致する必
要があるかどうかを指定します。
[通り一致と共に POI (pointof-interest) 一致を返す]
ユーザ ガイド
このオプションは、インドの住所にのみ適用されます。
入力で通り情報と POI 情報が共に与えられたときに POI (point-ofinterest) 一致と通り一致の両方を返すかどうかを指定します。 このオ
697
Geocode Address Global の概要
オプション名
説明/有効値
プションをオンにすると、通り名の一致する候補と共に POI 情報が返
されます。 このオプションをオンにしないと、通り情報だけが返され
ます。
POI (point-of-interest) 一致を このオプションは、インドの住所にのみ適用されます。
優先
を指定した場合[通り一致と共に POI (point-of-interest) 一致を返す]
オプションをオンにした場合、デフォルトの動作では候補のリストの
先頭に通り名の一致がリストされます (つまり、通りの一致が優先さ
れます)。 しかし、このオプションで POI 候補を最初に返すように設
定できます。 次に、例を挙げて説明します。
FirmName: India Gate
AddressLine1: Lodi Road
City: Delhi
POI が返され、通り名が優先されている場合 (デフォルトの設定)、以
下の候補はここに示す順序で返されます。 ここで、通り名の候補が最
初にリストされ、India Gate POI 候補 (結果コード S8) が最後にリス
トされていることに注意してください。 POI が通り名の候補よりも優
先されていれば、India Gate 候補が最初にリストされます。
StreetName FirmName PostalCode Locality
City
ResultCode
Lodi Road
100003
Lodi
Colony
Delhi
S4-PNTSC-A
Lodi Road
100013
Nizamuddin Delhi
West
S4-PNTSC-A
Lodi road India Gate 100013
India Gate Delhi
S8H---C-A
データ オプション
[データ] タブを使って、ジオコーディングに使うデータベースを指定できます。 データベースには、
指定の住所のジオコードを決定するために必要な住所とジオコード データが格納されています。 デー
タベースには、 標準データベースとカスタム データベースの 2 種類があります。 標準データベース
は、Pitney Bowes Software から提供され、その情報は郵便当局や地理データ サプライヤから取得さ
れた住所とジオコーディング データに基づきます。 カスタム データベースは、特定のニーズを満た
すために標準データベースを強化または増補する目的でユーザが作成したデータベースです。 カスタ
ム データベースの詳細については、カスタム データベースとは(774ページ)を参照してください。
698
Spectrum™ Technology Platform 8.0.0
第 24 章 : Enterprise Geocoding モジュール
オーストラリアのジオコーディングでは、ジオコーディングの空間精度を最適化するために G-NAF
データベースが利用されます。 この方法を使うと、指定の住所の小区画内にポイントを配置する、ポ
イントレベルのジオコーディングが行われます。 G-NAF データベースを利用するには、ライセンスが
別途必要です。 詳細については、販売担当者にお問い合わせください。
以下の表に、使用するデータベースの指定やデータベースの検索順序の指定に使用できるオプション
を示します。
表 107 : のデータ オプション
オプション名
説明/有効値
データベース
ジオコーディングに使うデータベースを指定します。 Management
Console の [データベース リソース] パネルで定義したデータベースの
みを使用できます。
データベースの優先設定
使用するジオコーディング データベースを指定します。 次のいずれ
かを選択します。
カスタム データベー 標準データベースとカスタム データベースの
スを優先
両方を使いますが、候補の選択ではカスタム
データベースを優先します。 このオプション
は、カスタム データベースの品質が標準デー
タベースを上回ると判断した場合に使用してく
ださい。
標準データベースを 標準データベースとカスタム データベースの
優先
両方を使いますが、候補の選択では標準データ
ベースを優先します。
カスタム データベー カスタム データベースのみを使用します。 標
スのみを使用
準データベースは無視されます。
標準データベースの 標準データベースのみを使用します。 カスタ
みを使用
ム データベースは無視されます。
カスタム データベー 標準データベースとカスタム データベースの
スと標準データベー 両方を使用します。 両方から候補が返される
スの両方を使用
場合は、標準データベースが優先されます。
こちらがデフォルトです。
注: 英国 (GBR) のジオコーダはカスタム データベースをサポートし
ないため、このオプションは英国で使用できません。
カスタム データベースから取得された候補は、結果コードの最後に
"U" が付きます。 住所データベースからの候補は、マッチ スコアの最
ユーザ ガイド
699
Geocode Address Global の概要
オプション名
説明/有効値
後に "A" が付きます。 例えば、 S5HPNTSCZA は住所データベースか
ら返された候補のマッチ スコアであり、S5HPNTSCZU はカスタム
データベースから返された候補の結果コードです。 詳細については、
はじめに(769ページ)を参照してください。
デフォルトのデータベース検 データベース リソース ツール ( [モジュール] > [Enterprise Geocoding]
索リストをオーバーライド
> [ツール]) の Management Console で指定したデータベース検索リス
トを使うかどうかを指定します。 デフォルトのデータベース検索リス
トをオーバーライドする場合、[データベース検索リスト] フィールド
でデータベースの検索順序を変更できます。 また、データベースを検
索リストから除外することもできます。
デフォルトのデータベース検索リストをオーバーライドした場合、
データベース リソースへの変更がデータベース検索リストに反映され
ません。これが原因でジオコーディングに失敗することがあります。
ただし、デフォルトのデータベース検索順序をオーバーライドしない
場合は、データベース リソースへの変更はジオコーダによって自動的
に反映されます。 例えば、データベース リソースが別のディレクト
リに移動された後でそのデータベース リソースを適切な手順で ( [モ
ジュール] > [Enterprise Geocoding] > [ツール] ) 更新すると、ジオ
コーダではデータベースの場所が自動的に更新されます。
データベース検索リスト
検索プロセスで使う 1 つ以上のデータベース リソースの名前。
Management Console のデータベース リソース ツールで指定したデー
タベース名を使用します。 詳細については、Enterprise Geocoding
モジュールの国際データベース リソースの追加(232ページ).
複数のデータベース リソースを指定できます。複数のデータベースを
指定するときは、優先度の高いデータベースからリストに追加しま
す。
データベースの順序は、複数のデータベースに近似一致が見つかった
ときに意味を持ちます。 返される近似一致は、検索リストの先頭にあ
るデータベースから取得されます。 それより下位のデータベースに見
つかった近似一致は、非近似一致に格下げされます。
また、目的の国の住所ポイント データベースと通りレベル データベー
スがインストールされている場合、データベースの順序を使って代替
処理を実行することもできます。 住所ポイント データベースを最初
にリストに追加し、通りデータベースを 2 番目に追加してください。
住所のジオコードを住所ポイント レベルで決定できない場合、通りレ
ベルでのジオコーディングが試みられます。
700
Spectrum™ Technology Platform 8.0.0
第 24 章 : Enterprise Geocoding モジュール
出力データ オプション
以下の表に、出力にどのデータを含めるかを指定するオプションを示します。
表 108 : 出力データ オプション
オプション名
説明/有効値
近似する会社名のみを返す
このオプションは、イギリスのみに適用されます。
入力会社名がジオコーディング データベース内の会社内に近似する場
合のみに会社名を返すかどうかを指定します。 例えば、入力の会社名
が "Pitney Bowes Business Insight" なのにジオコーディング データ
ベースから "Pitney Bowes Software, Inc." が返される場合、この 2 つ
の会社名は近似していません。 ほとんどの場合、入力会社名はデータ
ベース内の会社名に正確に一致する必要があります。 ある程度の略語
の相違は、会社名を返してかまわない程度に近似であると見なされま
す。
Y
入力会社名に近似の会社名のみを返します。
N
入力会社名に近似かどうかを問わず、会社名を返します。 こ
ちらがデフォルトです。
出力
ジオコーダは、緯度/経度、正規化された住所、および結果インジケータを返します。 結果インジケー
タは、入力住所がどの程度まで既知の住所に一致したかを表し、さらに割り当てられた場所とマッチ
ング全体のステータスを示します。 API を使用している場合は、 出力は DataTable クラスに返され
ます。DataTable クラスの詳細については、 Spectrum™ Technology Platform API ガイド .
住所出力
住所が入力住所に完全に一致すると判定されるのは、入力住所が正確だった場合、入力住所の正規化
されたバージョンである場合、または複数の候補が見つかったときの候補住所である場合です。
表 109 : の住所の出力
フィールド名
説明
AddressLine1
住所の最初の行。
AddressLine2
住所の 2 番目の行。
ユーザ ガイド
701
Geocode Address Global の概要
フィールド名
説明
ApartmentLabel
ユニット タイプ。アパート、スイート、号など。
ApartmentNumber
ユニット番号。
City
地方自治体名。
日本では、地方自治体の従属する地区 (大字) です。
Country
3 文字の ISO 3166-1 Alpha 3 国コード。
チリの国コードは CHL です。
中国の国コードは CHN です。
エストニアの国コードは EST です。
ギリシャの国コードは GRC です。
香港の国コードは HKG です。
インドネシアの国コードは IDN です。
インドの国コードは IND です。
リトアニアの国コードは LTU です。
ラトビアの国コードは LVA です。
マカオの国コードは MAC です。
ロシアの国コードは RUS です。
スロベニアの国コードは SVN です。
専用のジオコーディング ステージがない国の住所には、国別のジオ
コーダを示す国コードが含まれます。 例えば、バチカン市国の住所で
は、[Country] フィールドに VAT ではなく ITA が設定されます。これ
はバチカン市国の住所のジオコーディングが Geocode Address ITA で
行われるからです。
AND (アンドラ) — アンドラの住所の [Country] フィールドには "ESP"
(スペイン) が設定されます。
GIB (ジブラルタル) — ジブラルタルの住所の [Country] フィールドに
は "ESP" (スペイン) が設定されます。
MCO (モナコ) — モナコの住所の [Country] フィールドには "FRA" (フ
ランス) が設定されます。
SMR (サンマリノ) — サンマリノの住所の [Country] フィールドには
"ITA" (イタリア) が設定されます。
702
Spectrum™ Technology Platform 8.0.0
第 24 章 : Enterprise Geocoding モジュール
フィールド名
説明
VAT (バチカン市国) — バチカン市国の住所の [Country] フィールドに
は "ITA" (イタリア) が設定されます。
County
郡 (County) の意味は国によって異なります。
• ARG (アルゼンチン) — 郡 (Department)
• AUS (オーストラリア) — 地方自治体 (Local Government Authority:
LGA)
• AUT (オーストリア) — 使用せず
• BEL (ベルギー) — 州 (Province)
• BRA (ブラジル) — 使用せず
• CAN (カナダ) — 使用せず
• CHE (スイス) — 州 (Province)
• CHL (チリ) — 地区 (District)
• CHN (中国) — 使用せず
• CZE (チェコ共和国) — 地区名またはエイリアス
• DEU (ドイツ) — 郡 (Kreis)
• DNK (デンマーク) — 州 (Province)
• ESP (スペイン) — 州 (Province)
• EST (エストニア) — 地区 (District)
• FIN (フィンランド) — 使用せず
• FRA (フランス) — 県 (Department)
• GBR (イギリス) — 使用せず
• GRC (ギリシャ) — 地区 (Discrict)
• HKG (香港) — 使用せず
• HUN (ハンガリー) — 地区 (District)
• IDN (インドネシア) — 摂政管区/都市 (Regency/City)
• IND (インド) — 地区 (District)
• IRL (アイルランド) — 州 (Province)
• ITA (イタリア) — 州 (Province)
• JPN (日本) — 市区町村
• LTU (リトアニア) — 郡 (County)
• LVA (ラトビア) — 地区 (District)
• MAC (マカオ) — 使用せず
• MEX (メキシコ) — 州 (Province)
• MYS (マレーシア) — 使用せず
• NLD (オランダ) — 州 (Province)
• NOR (ノルウェー) — 地区 (District) (fylke/counties)
ユーザ ガイド
703
Geocode Address Global の概要
フィールド名
説明
• NZL (ニュージーランド) — 地方行政区画 (Region)
• PHL (フィリピン) — 地区 (District)
• POL (ポーランド) — 地区 (District) (poviat)
• PRT (ポルトガル) — 使用せず
• RUS (ロシア) — 地区 (Discrict)
• SGP (シンガポール) — 使用せず
• SVK (スロバキア) — 町 (Town)
• SVN (スロベニア) — 地方行政区画 (Region)
• SWE (スウェーデン) — コミューン (Kommun)
• THA (タイ) — 地区 (District) (amphoe)
• TUR (トルコ) — 地区 (District)
• ZAF (南アフリカ) — 地区 (District)
この国ではこのフィールドは使用されません。
郡の名前。
注: アンドラ郡コード (AND) を含む住所を入力した場合、アンドラ
国内の住所のみが返されます。この住所には AND コードが含ま
れます。 スペイン郡コード (ESP) を含むアンドラの住所を入力
した場合、アンドラの住所が候補として返されますが、郡コード
はスペインのものが含まれます。
地域名またはエイリアス。 例えば、Osrednjeslovenska/Ljubljana。
地区 (district) の名前。
摂政管区/都市 (regency/city) の名前。
地区 (district) の名前。
FirmName
会社名または場所の名前。
HouseNumber
一致した場所の建物の番号。
日本では、このフィールドに号番号が格納されます。
704
HouseNumberHigh
住所がある範囲の最も大きな家番号。
HouseNumberLow
住所がある範囲の最も小さな家番号。
HouseNumberParity
家番号の範囲に奇数または偶数、またはその両方の番号が含まれるか
どうかを示します。
Spectrum™ Technology Platform 8.0.0
第 24 章 : Enterprise Geocoding モジュール
フィールド名
説明
E
偶数
O
奇数
B
両方
U
不明
LastLine
最後の住所行を完成させます (都市、州/省、および郵便番号)。
LeadingDirectional
通り名の前に付けて通りの方向を表します。 例えば、138 N Main
Street の N がこれに該当します。
Locality
地方 (locality) の意味は国によって異なります。
• ARG (アルゼンチン) — 区域 (Neighborhood または barrio)
• AUS (オーストラリア) — 使用せず
• AUT (オーストリア) — 使用せず
• BEL (ベルギー) — 使用せず
• BRA (ブラジル) — 地方 (Locality)
• CAN (カナダ) — 散布エリア (Dissemination Area: DA) および列挙エ
リア (Enumeration Area: EA)
• CHE (スイス) — 使用せず
• CHL (チリ) — 地方 (Locality)
• CHN (中国) — 地方 (Locality)
• CZE (チェコ共和国) — 地方 (Locality)
• DEU (ドイツ) — 使用せず
• DNK (デンマーク) — 使用せず
• ESP (スペイン) — 地方 (Locality)
• EST (エストニア) — 地方 (Locality)
• FIN (フィンランド) — 使用せず
• FRA (フランス) — 使用せず
• GBR (英国) — 地方 (Locality)
• GRC (ギリシャ) — 地方 (Locality)
• HKG (香港) — 地方 (Locality)
• HUN (ハンガリー) — 地方 (Locality)
• IDN (インドネシア) — 村 (Village)
• IND (インド) — 地方 (Locality)
• IRL (アイルランド) — 使用せず
ユーザ ガイド
705
Geocode Address Global の概要
フィールド名
説明
• ITA (イタリア) — 地方 (Locality)
• JPN (日本) — 市内の地域 (丁目)
• LTU (リトアニア) — 地方 (Locality)
• LVA (ラトビア) — 地方 (Locality)
• MAC (マカオ) — 地方 (Locality)
• MEX (メキシコ) — 地方 (Locality)
• MYS (マレーシア) — 使用せず
• NLD (オランダ) — 使用せず
• NOR (ノルウェー) — 使用せず
• NZL (ニュージーランド) — 郊外 (Suburb)
• PHL (フィリピン) — 地方 (Locality)
• POL (ポーランド) — 使用せず
• PRT (ポルトガル) — 地方 (Locality)
• RUS (ロシア) — 地方 (Locality)
• SGP (シンガポール) — 使用せず
• SVK (スロバキア) — 地方 (Locality)
• SVN (スロベニア) — 地方 (Locality)
• SWE (スウェーデン) — 使用せず
• THA (タイ) — 使用せず
• TUR (トルコ) — 地方 (Locality)
• ZAF (南アフリカ) — 地方 (Locality)
地方 (locality) の名前。
地方 (locality) の名前またはエイリアス。 例えば、Gaberje/Gabrje。
地方 (locality) の名前またはエイリアス。
村 (village)。
Geocode Address Global は、入力に地方が含まれ、都市が含まれない
住所のジオコーディングを実行できます。たとえば、次の住所は同じ
ジオコードに変換されます。
calle nicaragua 4705, palermo, capital federal
calle nicaragua 4705, palermo
NumberOfCandidateRanges 候補がメンバーとして含まれる範囲の数を示します。 候補が建物では
なく通りの場合、候補は複数の範囲の一部である可能性があります。
候補ごとに返す範囲の数を指定するには、[候補あたりの最大範囲] オ
プションを使用します。
706
Spectrum™ Technology Platform 8.0.0
第 24 章 : Enterprise Geocoding モジュール
フィールド名
説明
NumberOfRangeUnits
範囲に含まれるユニットの数を示します。 ユニットとは、建物内にあ
るアパートメントやオフィス スイートなどの住所です。 範囲ごとに
返すユニット数を指定するには、[範囲あたりの最大単位] オプション
を使用します。
PostalCode
住所の郵便番号。 郵便番号のフォーマットは国によって異なります。
PostalCode.Addon
郵便番号の 2 番目の部分。カナダの住所ではこれは LDU です。ほと
んどの国ではこのフィールドを使用しません。
PreAddress
通り名の前に記述されるその他の情報。
PrivateMailbox
現在、このフィールドは使用しません。
レンジ
候補住所がある通りセグメントに存在する住所範囲が格納されたリス
ト フィールドです。
範囲とは、同じ通りセグメントに沿って並ぶ複数の住所を意味しま
す。 例えば、5400-5499 Main St. は、Main St. の 5400 ブロックにあ
る住所範囲です。範囲は、セグメントの奇数または偶数の番地のみを
表す場合と、奇数と偶数の両方を表す場合があります。 また、範囲は
複数のユニットがあるアパートメントのような単一の建物を表すこと
もあります。
Ranges フィールドには、次のサブフィールドが含まれます。
住所
候補の住所と異なる住所要素
(AddressLine1、City など) のサブフィー
ルドを収めたリストです。
AdditionalFields
住所に関連する国固有の情報を収めたリ
ストです。 AdditionalFields に収められ
る情報は、国によって異なります。
HouseNumberHigh
範囲に含まれる住所番号の最大値。
HouseNumberLow
範囲に含まれる住所番号の最小値。
SegmentParity
範囲が通りのどちら側に面しているかを
示します。 次のいずれかです。
0
ユーザ ガイド
範囲が通りのどちら側に面してい
るか不明です。
707
Geocode Address Global の概要
フィールド名
説明
HouseNumberParity
1
範囲は、通りの左側に面していま
す。
2
範囲は、通りの右側に面していま
す。
範囲に含まれる住所番号が奇数か偶数か
を示します。 次のいずれかです。
0
範囲には、奇数と偶数の両方の住
所番号が含まれます。
1
範囲には、奇数の住所番号が含ま
れます。
2
範囲には、偶数の住所番号が含ま
れます。
-1
範囲に含まれる住所番号が奇数か
偶数か不明です。
TotalRangeUnitsReturned 住所について返されるユニット範囲の
数。 ユニットとは、建物内にあるアパー
トメントやスイートなどの住所です。
RangeUnits
建物内にあるユニット範囲のリスト。 ユ
ニットとは、アパートメントやスイート
などを指します。
住所
候補の住所と異なる
住所要素
(AddressLine1、City
など) のサブフィール
ドを収めたリストで
す。
UnitNumberHigh ユニット番号の最大
値。
UnitNumberLow ユニット番号の最小
値。
SegmentCode
708
通りセグメントを識別する一意の ID。日本では、これは住所コードで
す。住所コードは、一意の住所を表すポイント ID です。
Spectrum™ Technology Platform 8.0.0
第 24 章 : Enterprise Geocoding モジュール
フィールド名
説明
SegmentParity
通りのどちら側に奇数番号が振られているかを示します。
StateProvince
L
通りの左側
R
通りの右側
B
通りの両側
U
未確認
StateProvince の意味は国によって異なります。
• ARG (アルゼンチン) — 地域 (Region) または州 (Province)
• AUS (オーストラリア) — 州 (State)
• AUT (オーストリア) — 地域 (Region)
• BEL (ベルギー) — 使用せず
• BRA (ブラジル) — 州 (State)
• CAN (カナダ) — 州 (Province)
• CHE (スイス) — 使用せず
• CHL (チリ) — 州 (State)
• CHN (中国) — 州 (Province)
• CZE (チェコ共和国) — 地域 (Region) 名またはエイリアス 例えば、
地域 HLAVNI MESTO PRAHA のエイリアスを Prag とすることがで
きます。
• DEU (ドイツ) — 連邦州 (Bundesland)
• DNK (デンマーク) — 使用せず
• ESP (スペイン) — 地域 (Region)
• EST (エストニア) — 使用せず
• FIN (フィンランド) — 地域 (Region) (lan)
• FRA (フランス) — 地域 (Region)
• GBR (イギリス) — 地域 (Region)
• GRC (ギリシャ) — 地域 (Region)
• HKG (香港) — 特別行政区 (Province)
• HUN (ハンガリー) — 郡 (County)
• IDN (インドネシア) — 州 (Province)
• IND (インド) — 州 (State)
• IRL (アイルランド) — 使用せず
• ITA (イタリア) — 地域 (Region)
• JPN (日本) — 県
ユーザ ガイド
709
Geocode Address Global の概要
フィールド名
説明
• LTU (リトアニア) — 使用せず
• LVA (ラトビア) — 州 (State)
• MAC (マカオ) — 特別行政区 (State)
• MEX (メキシコ) — 州 (Province)
• MYS (マレーシア) — 州 (State) (negeri)
• NLD (オランダ) — 使用せず
• NOR (ノルウェー) — 使用せず
• NZL (ニュージーランド) — 地方行政区画 (Region)
• PHL (フィリピン) — 州 (State)
• POL (ポーランド) — 県 (Province) (voivodship)
• PRT (ポルトガル) — 地域 (Region)
• RUS (ロシア) — 地域 (Region)
• SGP (シンガポール) — 使用せず
• SVK (スロバキア) — 使用せず
• SVN (スロベニア) — 使用せず
• SWE (スウェーデン) — 地域 (Region) (lan)
• THA (タイ) — 県 (Province) (changwat)
• TUR (トルコ) — 県 (Province)
• ZAF (南アフリカ) — 州 (State)
州の名前。
州 (province) の名前。
地方行政区画 (region) の名前。
この国ではこのフィールドは使用されません。
StreetDataType
住所のジオコーディングに使うデータベースのデフォルトの検索順序
ランク。 値 "1" はそのデータベースがデフォルト検索順序の先頭の
データベースであり、値 "2" はデフォルト検索順序の 2 番目のデータ
ベースであることを意味します。以降も同様です。
デフォルト検索順序は、Management Console でデータベース リソー
ス ツールを使って指定します。
StreetName
通り名。
日本では、このフィールドに番地が設定されます。 通常、日本の住所
では通り名を使いません。
StreetPrefix
710
基本の通り名の前に通りタイプを明記する場合に、その通りタイプ。
Spectrum™ Technology Platform 8.0.0
第 24 章 : Enterprise Geocoding モジュール
フィールド名
説明
例えば、AVENUE:
12 AVENUE B KALGOORLIE WA 6430
StreetSuffix
一致した場所の通りタイプ。 例えば、Avenue の AVE など。
TrailingDirectional
通り名の後に記述する通りの方位記号。例えば、456 3rd St. N におけ
る N。
UnitNumberHigh
ユニットが含まれる範囲における最も大きなユニット番号。
UnitNumberLow
ユニットが含まれる範囲における最も小さなユニット番号。
ジオコード出力
注目: • Geocode Address [国コード] (GBR を除く) は非推奨のコンポーネントであり、今後のリリー
スでサポートが打ち切られる可能性があります。
• ジオコーディングには Geocode Address Global を使ってください。
表 110 : のジオコード出力
フィールド名
説明
CoordinateSystem
緯度/経度座標を決定するために使われる座標系。 地図投影法、座標
単位などを指定する座標系 (例えば、EPSG:4326)。 EPSG は European
Petroleum Survey Group の略語です。
Latitude
小数点以下 4 桁までが計算される 7 桁の度数 (指定したフォーマット
で表記されます)。
Longitude
小数点以下 4 桁までが計算される 7 桁の度数 (指定したフォーマット
で表記されます)。
結果コード
結果コードは、ジオコーディングの成功または失敗に関する情報やジオコードの精度に関する情報を
示します。
ユーザ ガイド
711
Geocode Address Global の概要
表 111 : の結果コード出力
フィールド名
説明
Geocoder.MatchCode
入力住所が候補住所にどの程度近いかを示します。 詳細については、
はじめに(769ページ)を参照してください。詳細については、マッチ
コードを参照してください。
IsCloseMatch
住所が近似一致と見なされるかどうかを示します。 住所は、[マッチ
ング] タブの [近似検索条件] オプションで設定した基準に基づいて近
似かどうかが決定されます。
MultiMatchCount
Y
住所は近似一致です。
N
住所は近似一致ではありません。
通り住所のジオコーディングの場合は、指定された住所に見つかった
マッチングする住所の数。
交差点のジオコーディングの場合は、指定された住所に見つかった
マッチングする交差点の数。
Status
Status.Code
マッチの成功または失敗を報告します。
null
成功
F
失敗
ジオコーダが住所を処理できない場合、このフィールドにその理由が
設定されます。
•
•
•
•
•
•
•
Status.Description
Internal System Error
No Geocode Found
Insufficient Input Data
Multiple Matches Found
Exception occurred
Unable to initialize Geocoder
No Match Found
ジオコーダが住所を処理できない場合、このフィールドに説明が設定
されます。
Problem +
explanation
712
Status.Code = Internal System Error の場合
にこれが返されます。
Spectrum™ Technology Platform 8.0.0
第 24 章 : Enterprise Geocoding モジュール
フィールド名
説明
Geocoding Failed
Status.code = No Geocode Found の場合に
これが返されます。
No location returned Status.code = No Geocode Found の場合に
これが返されます。
No Candidates
Returned
ジオコーダは住所に一致する候補を識別でき
ませんでした。
Multiple Candidates 住所に一致する候補が複数見つかりました。
Returned and Keep
候補の住所を返すために、[複数の一致を保
Multiple Matches not 持] オプションを指定する必要があります。
selected
LocationPrecision
ユーザ ガイド
ジオコードの精度を表すコード。 値は以下のいずれかです。
0
この候補住所の座標情報はありません。
1
補間された通り住所。
2
通りセグメントの中間点。
3
郵便番号 1 セントロイド。
4
部分郵便番号 2 セントロイド。
5
郵便番号 2 セントロイド。
6
交差点。
7
POI (point-of-interest)。
8
州/省セントロイド。
9
郡セントロイド。
10
都市セントロイド。
11
地方セントロイド。
12
未指定のカスタム項目に使う追加のポイント精度。
13
未指定のカスタム項目に使う追加のポイント精度。
14
未指定のカスタム項目に使う追加のポイント精度。
15
未指定のカスタム項目に使う追加のポイント精度。
16
結果は住所ポイント。
713
Geocode Address Global の概要
フィールド名
説明
17
StreetDataType
住所ポイント データを使って候補セグメント データを修
正して生成された結果住所。
住所のジオコーディングに使うデータベースのデフォルトの検索順序
ランク。 値 "1" はそのデータベースがデフォルト検索順序の先頭の
データベースであり、値 "2" はデフォルト検索順序の 2 番目のデータ
ベースであることを意味します。以降も同様です。
デフォルト検索順序は、Management Console でデータベース リソー
ス ツールを使って指定します。
国固有の出力:
以下では、特定の国のみで使われる出力について説明します。
Australian G-NAF データベース出力
®
以下の表に、Australian Geocoded National Address File (G-NAF ) データベース固有の出力フィール
ドを示します。 G-NAF は、全 6 州と 2 つの特別地域に対応したオプションのデータベースです。
G-NAF は、オーストラリア全土の地方、通り、および番号を表す唯一の公式インデックスであり、検
証済みの地理的座標も含まれます。
表 112 : Australia G-NAF 出力
フィールド名
説明
AUS.GNAF_CONFIDENCE
住所が含まれる G-NAF データセットの数を示し
ます。 同じ住所が多くのデータ供給ソースで見つ
かるほど、確信レベルは高くなります。 次のいず
れかです。
<数 住所が含まれることが確認されたデータ
値> セットの総数から 1 を引いた値です。 例
えば、値が 0 のときは、住所が 1 つの供給
元のデータセットに見つかったことを意味
し、値 1 は 2 つの供給元のデータセットに
見つかったことを意味します。値 2 は 3 つ
の供給元のデータセットに見つかったこと
を意味し、以降もこれと同様です。
714
Spectrum™ Technology Platform 8.0.0
第 24 章 : Enterprise Geocoding モジュール
フィールド名
説明
-1
AUS.GNAF_Eight_Decimal_Place_Latitude
住所はどの G-NAF データセットにも見つ
かりませんでした。
小区画の緯度。小数点以下 8 桁までの精度で表さ
れます。 これは、G-NAF データベースのデータ
に一致した候補の緯度です。 これらは G-NAF デー
タから直接取得された元の座標であり、切り捨て
や四捨五入は行われていません。
このフィールドは、 [ジオコーディング] タブで
[郵便物の緯度と経度を表す小数点以下 8 桁の数値
を返す] ボックスをチェックした場合にのみ返さ
れます。
AUS.GNAF_EIGHT_DECIMAL_PLACE_LONGITUDE 小区画の経度。小数点以下 8 桁までの精度で表さ
れます。 これは、G-NAF データベースのデータ
に一致した候補の経度です。 これらは G-NAF デー
タから直接取得された元の座標であり、切り捨て
や四捨五入は行われていません。
このフィールドは、 [ジオコーディング] タブで
[郵便物の緯度と経度を表す小数点以下 8 桁の数値
を返す] ボックスをチェックした場合にのみ返さ
れます。
AUS.GNAF_GEOCODE_LEVEL
住所のジオコードのレベルを示す番号。 G-NAF
データベース内の主要エリアの住所には最低 1 つ
の地方レベルのジオコードがあります。 さらに、
通りレベルやポイント レベルのジオコードがある
場合もあります。
次のいずれかです。
ユーザ ガイド
0
ジオコードはありません。
1
小区画レベルのジオコードのみ (地方レベル
または通りレベルのジオコードはありませ
ん)。
2
通りレベルのジオコードのみ (地方レベルま
たは小区画レベルのジオコードはありませ
ん)。
715
Geocode Address Global の概要
フィールド名
AUS.GNAF_PID
説明
3
通りレベルと小区画レベルのジオコードの
み (地方レベルのジオコードはありません)。
4
地方レベルのジオコードのみ (通りレベルま
たは小区画レベルのジオコードはありませ
ん)。
5
地方レベルと小区画レベルのジオコード (通
りレベルのジオコードはありません)。
6
地方レベルと通りレベルのジオコード (小区
画レベルのジオコードはありません)。
7
地方レベル、通りレベル、および小区画レ
ベルのジオコード。
G-NAF Persistent Identifier (G-NAF PID) は、
G-NAF の住所を一意に定義する 14 文字の英数字
からなる文字列です。 PID は G-NAF Dictionary
の主要な住所フィールドの組み合わせから構成さ
れています。 G-NAF PID は、以下のような形式
です。
GAVIC411711441
AUS.GNAF_RELIABILITY
ジオコードの精度を示す番号。 信頼度は、ジオ
コードを決定するために使われる辞書の品質に左
右されます。 ジオコード信頼レベル 1、2、およ
び 3 のデータは、GNAF123 Dictionary に格納さ
れています。 これはポイント (小区画) レベルの
ジオコード データです。 ジオコード信頼レベル
4、5、および 6 のデータは、GNAF456 Dictionary
に格納されています。 この辞書には、小区画以外
のセントロイド ジオコード データが格納されて
います。
1 ジオコードの精度は、適切な測定基準を満た
しました。 例えば、手動で実行された住所レ
ベルのジオコードは、このレベルになります。
ジオコードの解像度は、GPS を使ってセント
ロイドを住所サイト境界内に配置できるレベ
ルです。
716
Spectrum™ Technology Platform 8.0.0
第 24 章 : Enterprise Geocoding モジュール
フィールド名
説明
2 ジオコードの精度は、セントロイドを住所サ
イト境界内に配置できるレベルです。 例え
ば、対応する地籍上の小区画のセントロイド
として自動的に計算された住所レベルのジオ
コードは、このレベルになります。
3 ジオコードの精度は、セントロイドを住所サ
イト境界の近く (場合によっては内部) に配置
できるレベルです。 例えば、他の境界ジオ
コード住所に基づいて対象の住所が位置する
と思われる道路を計算するという方法で自動
的に計算された住所レベルのジオコードは、
このレベルになります。
4 ジオコードの精度は、住所サイトを道路の固
有の特性に関連付けることができるレベルで
す。 例えば、道路の中央線リファレンス デー
タを使って自動的に計算された通りレベルの
ジオコードは、このレベルになります。
5 ジオコードの精度は、住所サイトを特定の地
方または地区に関連付けることができるレベ
ルです。 例えば、地方のセントロイドとして
自動的に計算された地方レベルのジオコード
は、このレベルになります。
6 ジオコードの精度は、住所サイトを特定の地
域に関連付けることができるレベルです。 例
えば、地形特性から導き出された地方レベル
のジオコードは、このレベルになります。
AUS.LEVEL_NUMBER
多層建築の階またはレベルの番号。 例を次に示し
ます。
Floor 2 , 17 Jones Street
G-NAF データベースには、オーストラリアの一部
の州のレベル情報が含まれています。 レベル情報
がユニット情報に関連付けられている場合もあり
ますが、常にこの関連付けがあるわけではありま
せん。 G-NAF データベースでは、複数のレコー
ドが同じレベルに含まれます。入力住所に個有の
コンテンツ(ユニット番号など)がある場合にの
ユーザ ガイド
717
Geocode Address Global の概要
フィールド名
説明
み、レベル情報が返されます。 G-NAF Dictionary
に住所のレベル情報がある場合は、一致した候補
と共にその情報が返されます。
入力住所にレベル情報がない場合、あるいは入力
のレベル情報が不正確な場合でも、正しいレベル
情報が返されます。 入力住所にレベル情報がある
が、G-NAF データベースにはマッチング住所にレ
ベル情報がない場合、G-NAF データによって検証
されない情報であるとして入力レベル情報が破棄
されます。
AUS.LEVEL_TYPE
多層建築の階に使われるラベル。 例えば、"Level"
または "Floor"。 この例で、レベル タイプは
"Level" です。
Suite 3 Level 7, 17 Jones Street
この例で、Suite 3 はユニットです。
G-NAF データベースには、オーストラリアの一部
の州のレベル情報が含まれています。 レベル情報
がユニット情報に関連付けられている場合もあり
ますが、常にこの関連付けがあるわけではありま
せん。 G-NAF データベースでは、複数のレコー
ドが同じレベルに含まれます。入力住所に個有の
コンテンツ(ユニット番号など)がある場合にの
み、レベル情報が返されます。 G-NAF Dictionary
に住所のレベル情報がある場合は、一致した候補
と共にその情報が返されます。
入力住所にレベル情報がない場合、あるいは入力
のレベル情報が不正確な場合でも、正しいレベル
情報が返されます。 入力住所にレベル情報がある
が、G-NAF データベースにはマッチング住所にレ
ベル情報がない場合、G-NAF データによって検証
されない情報であるとして入力レベル情報が破棄
されます。
AUS.MESH_BLOCK_ID
718
Meshblock は、オーストラリア統計局 (ABS) が統
計データを収集するために作成した最も小さい地
理的な単位です。 通常、Meshblock には最低 20
から 50 の世帯が含まれています。 これは、収集
Spectrum™ Technology Platform 8.0.0
第 24 章 : Enterprise Geocoding モジュール
フィールド名
説明
区 (CD: Collection District) の約 5 分の 1 の大きさ
です。 Meshblock ID を使って、独自のデータに
属性を追加できます。
カナダ固有の出力:
以下の表に、カナダのみで使われる出力フィールドを示します。
表 113 : カナダ固有の出力
フィールド名
説明
CAN.Census_CD
住所がある場所の CD (Census Division)。 詳細に
ついては、Statistics Canada Web サイトの
Census Division の定義に関する説明を参照して
ください。
CAN.Census_CMA
住所がある場所の CMA (Census Metropolitan
Area)。 詳細については、Statistics Canada Web
サイトの Census Metropolitan Area の定義に関
する説明を参照してください。
CAN.Census_CSD
住所がある場所の CSD (Census Subdivision)。 詳
細については、Statistics Canada Web サイトの
Census Subdivision の定義に関する説明を参照
してください。
CAN.Census_CT
住所がある場所の CT (Census Tract)。 詳細につ
いては、Statistics Canada Web サイトの Census
Tract の定義に関する説明を参照してください。
CAN.Census_DA
住所がある場所の DA (Dissemination Area)。 詳
細については、Statistics Canada Web サイトの
Dissemination Area の定義に関する説明を参照
してください。
ニュージーランド固有の出力
以下の表に、ニュージーランドのみで使われる出力フィールドを示します。
ユーザ ガイド
719
Geocode Address World
表 114 : ニュージーランド固有の出力
フィールド名
説明
NZL.NZL_MESHBLOCK_ID
Meshblock は、ニュージーランド統計局が統計
データを収集するために作成した最も小さい地理
的な単位です。 Meshblock のサイズは、街区の一
部から地方の広いエリアまでさまざまです。
NZL.ALIASED_SUBURB
正式に認識されている郊外名の代替名。
Geocode Address World
Geocode Address World コンポーネントは、サポートされている国内の住所を受け取り、都市セント
ロイド (一部の国では郵便番号セントロイド) を返します。 Geocode Address World は、都市セントロ
イド レベル (一部の国では郵便番号セントロイド レベル) でジオコーディングできます。 通り住所レ
ベルではジオコーディングできません。 住所レベルでのジオコーディングが必要な場合は、Geocode
Address Global を使用してください。
Geocode Address World は、通常、Geocode Address Global で得られない国をカバーするための代替
ジオコーダとして使用されます。 例えば、主にオーストラリアの住所のジオコーディングに関心があ
るためにオーストラリア ジオコーダのライセンスを取得したとします。 しかし、手持ちのデータの一
部のレコードにオーストラリア以外のロケーションが含まれています。 このような場合、Geocode
Address World を使えばオーストラリア以外のセントロイド ジオコードを得ることができ、それと共
にオーストラリア ジオコーダでオーストラリアの住所に関するより正確なジオコードを得ることがで
きます。
Geocode Address World コンポーネントは、Enterprise Geocoding モジュールのオプション部分です。
Enterprise Geocoding モジュールの詳細 (これに含まれるその他のコンポーネントなど) については、
Enterprise Geocoding モジュールとは(626ページ)を参照してください。
入力
Geocode Address World は、入力として住所を受け取ります。 最大のパフォーマンスと最良のマッチ
結果を得るには、入力住所リストが可能な限り完全で、綴りの誤りや不完全な住所がなく、できる限
りに郵便当局の規格に従っている必要があります。 多くの郵便当局が、その国の住所規格に関する情
報を掲載した Web サイトを提供しています。
注: 国名または 2 文字か 3 文字の ISO 国コードは省略可能です。 国名を省略すると、Geocode Address
World は、他の入力情報に基づいて最も適切な候補を返します。
720
Spectrum™ Technology Platform 8.0.0
第 24 章 : Enterprise Geocoding モジュール
入力フィールド
以下の表に、Geocode Address World の入力のフォーマットとレイアウトに関する情報を示します。
注: API を使用しているときはDataTable クラスを使って入力を指定します。 以下で説明するフィー
ルドは、DataTable クラスにおける有効な列名です。DataTable クラスの詳細については、
『Spectrum Technology Platform API ガイド』の「API の基礎」のセクションを Spectrum™
Technology Platform API ガイド.
表 115 : Geocode Address World の入力データ
フィールド名
書式
説明/有効値
AddressLine1
文字列
最初の住所行。 次の例では 4360 DUKES RD です。
4360 DUKES RD KALGOORLIE WA 6430
AddressLine2
文字列
2 行からなる住所の 2 行目の住所行。 次の例では Level 6
51 Jacobson St です。
26 WELLINGTON ST E SUITE 500 TORONTO ON M5E 1S2
このフィールドは、オーストラリア、オーストリア、ベル
ギー、ブラジル、デンマーク、フィンランド、フランス、
ドイツ、アイルランド、イタリア、リヒテンシュタイン、
ルクセンブルク、マレーシア、オランダ、ポーランド、ポ
ルトガル、スペイン、スウェーデン、スイス、およびタイ
では使用されません。
City
文字列
都市または町の名前。 入力住所には正式な都市名を使用し
てください。 最適なジオコーディング結果が得られます。
タイの住所では、このフィールドに従属する地区 (タムボン)
が格納されます。
County
文字列
国により、次のいずれかの名前。
• 使用しない — AUT、BRA、CAN、FIN、GBR、MYS、
PRT、SGP
• 郡 (Department) — FRA
• 地区 (District) (amphoe) — THA
• 郡 (District) (fylke/counties) — NOR
• 地区 (District) (poviat) — POL
• コミューン (Kommun) — SWE
• 郡 (Kreis) — DEU
ユーザ ガイド
721
Geocode Address World
フィールド名
書式
説明/有効値
• 地方自治体 (Local Government Authority: LGA) — AUS
• 州 (Province) — BEL、CHE、DNK、ESP、IRL、ITA、
LIE、LUX、NLD
• 地方行政区画 (Region) — NZL
FirmName
文字列
会社名または場所の名前。 次の例では PITNEY BOWES で
す。
PITNEY BOWES 4360 DUKES RD KALGOORLIE WA 6430
LastLine
文字列
住所の最後の行。 次の例では KALGOORLIE WA 6430 で
す。
4360 DUKES RD KALGOORLIE WA 6430
Locality
文字列
国により、次のいずれかの名前。
• 使用しない — AUS、AUT、BEL、CHE、DEU、DNK、
FIN、FRA、IRL、LIE、LUX、MYS、NLD、NOR、POL、
SGP、SWE、THA
• 散布エリア (DA) および列挙エリア (EA) — CAN
• 地方 (Locality) — BRA、GBR、ITA、PRT
• 郊外 (Suburb) — NZL
PostalCode
文字列
各国の標準フォーマットで表記された郵便番号。
StateProvince
文字列
国により、次のいずれかの名前。
• 使用しない — BEL、CHE、DNK、IRL、LIE、LUX、NLD、
NOR、SGP
• 連邦州 (Bundesland) — DEU
• 州 (Province) — CAN
• 県 (Province) (changwat) — THA
• 県 (Province) (voivodship) — POL
• 地域 (Region) — AUT、ESP、FRA、GBR、NZL、PRT
• 地域 (Region) (lan) — FIN
• 地域 (Region) (lan) — SWE
• 州 (State) — AUS、BRA
• 州 (State) (negeri) — MYS
722
Spectrum™ Technology Platform 8.0.0
第 24 章 : Enterprise Geocoding モジュール
フィールド名
書式
説明/有効値
Country
文字列
2 文字または 3 文字の ISO 国コード。 このフォールドはオ
プションです。 国名を省略すると、Geocode Address World
は、他の入力情報に基づいて最も適切な候補を返します。
ISO コードの一覧は、各国の ISO コードとモジュール サ
ポート(1086ページ)を参照してください。
住所入力の推奨事項
入力データを最適なジオコーディングが可能な最善のフォーマットにするために、次の推奨事項に従っ
てください。
• 住所には国コードを含める必要があります。
オプション
Geocode Address World を使用して、Management Console からデフォルトの処理オプションを設定
できます。 API または Enterprise Designer 等の クライアント ツールを使用して、Geocode Address
Spectrum™ Technology PlatformWorld 呼び出しの設定を個別にオーバーライドできます。
ジオコーディング オプション
以下の表に、特定の場所の座標を決定する方法を制御するためのオプションを示します。
表 116 : ジオコーディング オプション
オプション名
説明/有効値
座標系
座標系は、空間におけるポイントの位置を一意に表すリファレンス シ
ステムです。 カルテシアン (二次元) 座標、測地 (地理) 座標などが、
ユークリッド幾何学に基づくリファレンス システムとして挙げられま
す。Spectrum™ Technology Platform は、European Petroleum Survey
Group (EPSG) に承認されたシステムをサポートしています。
次のいずれかを選択します。
ユーザ ガイド
EPSG:4283
GDA94 座標系とも呼ばれます。
EPSG:4326
WGS84 座標系とも呼ばれます。 こちらがデフォ
ルトです。
723
Geocode Address World
マッチング オプション
表 117 : マッチング オプション
オプション名
説明/有効値
複数の一致を保持
住所がデータベース内の複数の候補に一致する場合に結果を返すかど
うかを指定します。 このオプションを選択しない場合、複数の候補に
一致する住所のジオコーディングは失敗します。
このオプションを選択する場合は、チェック ボックスの横にある を
使って、返す候補の最大数を指定してください。
近似一致のみ
近似一致候補であるジオコード結果のみを返すかどうかを指定しま
す。 例えば、10 個の候補があり、そのうちの 2 個が近似一致である
場合、このオプションを有効にすると、10 個全部ではなく 2 個の近
似一致のみが候補として返されます。
データ オプション
[データ] タブを使って、ジオコーディングに使うデータベースを指定できます。 データベースには、
指定の住所のジオコードを決定するために必要な住所とジオコード データが格納されています。 デー
タは、郵便当局や地理データ サプライヤから取得された住所とジオコーディング データに基づきま
す。
表 118 : データ オプション (724ページ) に、使用するデータベースの指定やデータベースの検索順
序の指定に使用できるオプションを示します。
表 118 : データ オプション
オプション名
説明/有効値
デフォルトのデータベース検 データベース リソース ツール ( [モジュール] > [Enterprise Geocoding]
索リストをオーバーライド
> [ツール]) の Management Console で指定したデータベース検索リス
トを使うかどうかを指定します。 デフォルトのデータベース検索リス
トをオーバーライドする場合、[データベース検索リスト] フィールド
でデータベースの検索順序を変更できます。 また、データベースを検
索リストから除外することもできます。
デフォルトのデータベース検索リストをオーバーライドした場合、
データベース リソースへの変更がデータベース検索リストに反映され
ません。これが原因でジオコーディングに失敗することがあります。
ただし、デフォルトのデータベース検索順序をオーバーライドしない
724
Spectrum™ Technology Platform 8.0.0
第 24 章 : Enterprise Geocoding モジュール
オプション名
説明/有効値
場合は、データベース リソースへの変更はジオコーダによって自動的
に反映されます。 例えば、データベース リソースが別のディレクト
リに移動された後でそのデータベース リソースを適切な手順で ( [モ
ジュール] > [Enterprise Geocoding] > [ツール] ) 更新すると、ジオコー
ダではデータベースの場所が自動的に更新されます。
データベース検索リスト
DatabaseSearchOrder
検索プロセスで使う 1 つ以上のデータベース リソースの名前。
Management Console のデータベース リソース ツールで指定したデー
タベース名を使用します。 詳細については、Enterprise Geocoding
モジュールの国際データベース リソースの追加(232ページ).
複数のデータベース リソースを指定できます。 複数のデータベース
を指定する場合は、優先度の高いデータベースからリストに追加しま
す。 データベースの順序は、複数のデータベースに近似一致が見つ
かったときに意味を持ちます。 返される近似一致は、検索リストの先
頭にあるデータベースから取得されます。 それより下位のデータベー
スに見つかった近似一致は、非近似一致に格下げされます。
出力
Geocode Address World は、緯度/経度、都市、郡、および結果インジケータを返します。 結果インジ
ケータは、入力住所がどの程度まで既知のロケーションに一致したかを表し、さらに割り当てられた
緯度/経度とマッチング全体のステータスを示します。API を使用しているときは DataTable クラスで
出力が返されます。 DataTable クラスの詳細については、『Spectrum Technology Platform API ガイ
ド』の「API の基礎」のセクションを Spectrum™ Technology Platform API ガイド.
住所の出力
表 119 : 住所の出力
フィールド名
説明
City
地方自治体名。
Country
3 文字の ISO 3166-1 Alpha 3 国コード。 2 文字のコードも使用できま
す。 地理的ジオコーディングの国とデータ ソースのリストについて
は、各国の地理的データの対象範囲を参照してください。 郵便ジオ
コーディングの国とデータ ソースのリストについては、各国の郵便
データの対象範囲を参照してください。
ユーザ ガイド
725
Geocode Address World
フィールド名
説明
County
このフィールドには、州/省より小さく都市より大きいエリアが含まれ
ます。 特定のエリアは国によって異なります。
• AUS — 地方自治体 (Local Government Authority: LGA)
• AUT — 州 (Province)
• BEL — 州 (Province)
• BRA — 使用せず
• CAN — 使用せず
• CHE — 州 (Province)
• DEU — 郡 (Kreis)
• DNK — 州 (Province)
• FIN — 州 (Province) (kommune)
• FRA — 郡 (Department)
• GBR — 郡 (County)
• ITA — 州 (Province)
• LIE — 州 (Province)
• LUX — 州 (Province)
• MYS — 地区 (District) (daerah)
• NLD — 州 (Province)
• NZL — 使用せず
• POL — 地区 (District) (poviat)
• PRT — 使用せず
• SGP — 地区 (District)
• SWE — 地域 (Region) (kommun)
• THA — 地区 (District) (amphoe)
PostalCode
住所の郵便番号。 郵便番号のフォーマットは国によって異なります。
StateProvince
StateProvince の意味は国によって異なります。
• AUS — 州 (State)
• AUT — 地域 (Region)
• BEL — 使用せず
• BRA — 州 (State)
• CAD — 州 (Province)
• CHE — 州 (State)
• DEU — 連邦州 (Bundesland)
726
Spectrum™ Technology Platform 8.0.0
第 24 章 : Enterprise Geocoding モジュール
フィールド名
説明
• DNK — 使用せず
• ESP — 地域 (Region)
• FIN — 地域 (Region) (lan)
• FRA — 地域 (Region)
• GBR — 地域 (Region)
• IRL — 使用せず
• ITA — 地域 (Region)
• LIE — 州 (State)
• LUX — 使用せず
• MYS — 州 (State) (negeri)
• NLD — 使用せず
• NOR — 使用せず
• NZL — 地域 (Region)
• POL — 県 (Province) (voivodship)
• PRT — 地域 (Region)
• SGP — 使用せず
• SWE — 地域 (Region) (lan)
• THA — 県 (Province) (changwat)
ジオコード出力
表 120 : ジオコード出力
フィールド名
説明
CoordinateSystem
緯度/経度座標を決定するために使われる座標系。 地図投影法、座標
単位などを指定する座標系 (例えば、EPSG:4326)。 EPSG は European
Petroleum Survey Group の略語です。
Latitude
小数点以下 4 桁までが計算される 7 桁の度数 (指定したフォーマット
で表記されます)。
Longitude
小数点以下 4 桁までが計算される 7 桁の度数 (指定したフォーマット
で表記されます)。
ユーザ ガイド
727
Geocode Address World
結果コード
結果コードは、ジオコーディングの成功または失敗に関する情報やジオコードの精度に関する情報を
示します。
表 121 : の結果コード出力
フィールド名
説明
Geocoder.MatchCode
入力住所が候補住所にどの程度近いかを示します。 詳細については、
はじめに(769ページ)を参照してください。詳細については、マッチ
コードを参照してください。
IsCloseMatch
住所が近似一致と見なされるかどうかを示します。 住所は、[マッチ
ング] タブの [近似検索条件] オプションで設定した基準に基づいて近
似かどうかが決定されます。
MultiMatchCount
Y
住所は近似一致です。
N
住所は近似一致ではありません。
通り住所のジオコーディングの場合は、指定された住所に見つかった
マッチングする住所の数。
交差点のジオコーディングの場合は、指定された住所に見つかった
マッチングする交差点の数。
Status
Status.Code
マッチの成功または失敗を報告します。
null
成功
F
失敗
ジオコーダが住所を処理できない場合、このフィールドにその理由が
設定されます。
•
•
•
•
•
•
•
728
Internal System Error
No Geocode Found
Insufficient Input Data
Multiple Matches Found
Exception occurred
Unable to initialize Geocoder
No Match Found
Spectrum™ Technology Platform 8.0.0
第 24 章 : Enterprise Geocoding モジュール
フィールド名
説明
Status.Description
ジオコーダが住所を処理できない場合、このフィールドに説明が設定
されます。
Problem +
explanation
Status.Code = Internal System Error の場合
にこれが返されます。
Geocoding Failed
Status.code = No Geocode Found の場合に
これが返されます。
No location returned Status.code = No Geocode Found の場合に
これが返されます。
No Candidates
Returned
ジオコーダは住所に一致する候補を識別でき
ませんでした。
Multiple Candidates 住所に一致する候補が複数見つかりました。
Returned and Keep
候補の住所を返すために、[複数の一致を保
Multiple Matches not 持] オプションを指定する必要があります。
selected
LocationPrecision
ユーザ ガイド
ジオコードの精度を表すコード。 値は以下のいずれかです。
0
この候補住所の座標情報はありません。
1
補間された通り住所。
2
通りセグメントの中間点。
3
郵便番号 1 セントロイド。
4
部分郵便番号 2 セントロイド。
5
郵便番号 2 セントロイド。
6
交差点。
7
POI (point-of-interest)。
8
州/省セントロイド。
9
郡セントロイド。
10
都市セントロイド。
11
地方セントロイド。
12
未指定のカスタム項目に使う追加のポイント精度。
13
未指定のカスタム項目に使う追加のポイント精度。
14
未指定のカスタム項目に使う追加のポイント精度。
729
Geocode Address World
フィールド名
説明
StreetDataType
15
未指定のカスタム項目に使う追加のポイント精度。
16
結果は住所ポイント。
17
住所ポイント データを使って候補セグメント データを修
正して生成された結果住所。
住所のジオコーディングに使うデータベースのデフォルトの検索順序
ランク。 値 "1" はそのデータベースがデフォルト検索順序の先頭の
データベースであり、値 "2" はデフォルト検索順序の 2 番目のデータ
ベースであることを意味します。以降も同様です。
デフォルト検索順序は、Management Console でデータベース リソー
ス ツールを使って指定します。
ジオコードの精度
Geocode Address World は、入力に含まれるデータに基づいて、最善のジオコーディングを自動的に
提供します。 都市と有効な郵便番号が含まれる場合は、郵便番号セントロイドが返されます。 都市と
無効な郵便番号が含まれる場合、または都市が含まれるが郵便番号が含まれない場合、Geocode Address
World は地理的セントロイドで自動的に代替し、その都市のセントロイドを提供します。 この場合に
返される郵便番号は、都市セントロイドの郵便番号です。
サポートされている国
以下の表に、Geocode Address World でサポートされている国、および各国に対してサポートされて
いるジオコード レベルを示します。
表 122 : Geocode Address World でサポートされている国
730
国名
国コード
都市レベル
郵便番号レベル
アフガニスタン
AFG
はい
アルバニア
ALB
はい
アルジェリア
DZA
はい
はい
アメリカ領サモア
ASM
はい
はい
アンドラ
AND
はい
はい
Spectrum™ Technology Platform 8.0.0
第 24 章 : Enterprise Geocoding モジュール
国名
国コード
都市レベル
アンゴラ
AGO
はい
アンギラ
AIA
はい
南極
ATA
はい
アンティグア・バーブー ATG
ダ
はい
アルゼンチン
ARG
はい
はい
アルメニア
ARM
はい
はい
アルバ
ABW
はい
オーストラリア
AUS
はい
はい
オーストリア
AUT
はい
はい
アゼルバイジャン
AZE
はい
はい
バハマ
BHS
はい
バーレーン
BHR
はい
はい
バングラデシュ
BGD
はい
はい
バルバドス
BRB
はい
ベラルーシ
BLR
はい
はい
ベルギー
BEL
はい
はい
ベリーズ
BLZ
はい
ベナン
BEN
はい
バミューダ
BMU
はい
ユーザ ガイド
郵便番号レベル
はい
731
Geocode Address World
国名
国コード
都市レベル
ブータン
BTN
はい
ボリビア
BOL
はい
ボスニア・ヘルツェゴビ BIH
ナ
732
はい
郵便番号レベル
はい
ボツワナ
BWA
はい
ブラジル
BRA
はい
はい
イギリス領インド洋地域 IOT
はい
はい
ブルネイ・ダルサラーム BRN
はい
はい
ブルガリア
BGR
はい
はい
ブルキナファソ
BFA
はい
ブルンジ
BDI
はい
カンボジア
KHM
はい
カメルーン
CMR
はい
カナダ
CAN
はい
はい
カーボベルデ
CPV
はい
はい
ケイマン諸島
CYM
はい
中央アフリカ共和国
CAF
はい
チャド
TCD
はい
チリ
CHL
はい
はい
中国
CHN
はい
はい
はい
Spectrum™ Technology Platform 8.0.0
第 24 章 : Enterprise Geocoding モジュール
国名
国コード
都市レベル
郵便番号レベル
クリスマス島
CXR
はい
はい
ココス (キーリング) 諸
島
CCK
はい
はい
コロンビア
COL
はい
コモロ
COM
はい
コンゴ
COG
はい
コンゴ民主共和国
COD
はい
クック諸島
COK
はい
コスタリカ
CRI
はい
コートジボワール
CIV
はい
クロアチア
HRV
はい
はい
キューバ
CUB
はい
はい
キプロス
CYP
はい
はい
チェコ共和国
CZE
はい
はい
デンマーク
DNK
はい
はい
ジブチ
DJI
はい
ドミニカ
DMA
はい
ドミニカ共和国
DOM
はい
はい
エクアドル
ECU
はい
はい
エジプト
EGY
はい
はい
ユーザ ガイド
はい
733
Geocode Address World
734
国名
国コード
都市レベル
郵便番号レベル
エルサルバドル
SLV
はい
はい
赤道ギニア
GNQ
はい
エリトリア
ERI
はい
エストニア
EST
はい
はい
エチオピア
ETH
はい
はい
フォークランド諸島 (マ FLK
ルビナス)
はい
はい
フェロー諸島
FRO
はい
はい
フィジー
FJI
はい
フィンランド
FIN
はい
はい
フランス
FRA
はい
はい
フランス領ギアナ
GUF
はい
はい
フランス領ポリネシア
PYF
はい
はい
フランス領南方・南極地 ATF
域
はい
ガボン
GAB
はい
ガンビア
GMB
はい
グルジア
GEO
はい
はい
ドイツ
DEU
はい
はい
ガーナ
GHA
はい
ジブラルタル
GIB
はい
Spectrum™ Technology Platform 8.0.0
第 24 章 : Enterprise Geocoding モジュール
国名
国コード
都市レベル
郵便番号レベル
ギリシャ
GRC
はい
はい
グリーンランド
GRL
はい
はい
グレナダ
GRD
はい
グアドループ
GLP
はい
はい
グアム
GUM
はい
はい
グアテマラ
GTM
はい
はい
ガーンジー
GGY
はい
はい
ギニア
GIN
はい
はい
ギニアビサウ
GNB
はい
はい
ガイアナ
GUY
はい
ハイチ
HTI
はい
はい
ハード島とマクドナルド HMD
諸島
はい
法王聖座 (バチカン市国) VAT
はい
はい
はい
ホンジュラス
HND
はい
香港
HKG
はい
ハンガリー
HUN
はい
はい
アイスランド
ISL
はい
はい
インド
IND
はい
はい
インドネシア
IDN
はい
はい
ユーザ ガイド
735
Geocode Address World
国名
736
国コード
都市レベル
郵便番号レベル
イラン・イスラム共和国 IRN
はい
はい
イラク
IRQ
はい
はい
アイルランド
IRL
はい
はい
マン島
IMN
はい
はい
イスラエル
ISR
はい
はい
イタリア
ITA
はい
はい
ジャマイカ
JAM
はい
はい
日本
JPN
はい
はい
ジャージー
JEY
はい
はい
ヨルダン
JOR
はい
はい
カザフスタン
KAZ
はい
はい
ケニア
KEN
はい
はい
キリバス
KIR
はい
朝鮮民主主義人民共和国 PRK
はい
大韓民国
KOR
はい
はい
クウェート
KWT
はい
はい
キルギス
KGZ
はい
はい
ラオス人民民主共和国
LAO
はい
はい
ラトビア
LVA
はい
はい
レバノン
LBN
はい
はい
Spectrum™ Technology Platform 8.0.0
第 24 章 : Enterprise Geocoding モジュール
国名
国コード
都市レベル
郵便番号レベル
レソト
LSO
はい
はい
リベリア
LBR
はい
はい
大リビア・アラブ社会主 LBY
義人民ジャマーヒリーヤ
国
はい
リヒテンシュタイン
LIE
はい
はい
リトアニア
LTU
はい
はい
ルクセンブルク
LUX
はい
はい
マカオ
MAC
はい
マケドニア旧ユーゴスラ MKD
ビア共和国
はい
はい
マダガスカル
MDG
はい
はい
マラウィ
MWI
はい
マレーシア
MYS
はい
はい
モルディブ
MDV
はい
はい
マリ
MLI
はい
マルタ
MLT
はい
はい
マーシャル諸島
MHL
はい
はい
マルティニーク
MTQ
はい
はい
モーリタニア
MRT
はい
モーリシャス
MUS
はい
ユーザ ガイド
737
Geocode Address World
738
国名
国コード
都市レベル
郵便番号レベル
マヨット
MYT
はい
はい
メキシコ
MEX
はい
はい
ミクロネシア連邦
FSM
はい
はい
モルドバ共和国
MDA
はい
はい
モナコ
MCO
はい
はい
モンゴル
MNG
はい
はい
モントセラト
MSR
はい
モロッコ
MAR
はい
はい
モザンビーク
MOZ
はい
はい
ミャンマー
MMR
はい
はい
ナミビア
NAM
はい
ナウル
NRU
はい
ネパール
NPL
はい
はい
オランダ
NLD
はい
はい
オランダ領アンティル
ANT
はい
ニューカレドニア
NCL
はい
はい
ニュージーランド
NZL
はい
はい
ニカラグア
NIC
はい
はい
ニジェール
NER
はい
はい
ナイジェリア
NGA
はい
はい
Spectrum™ Technology Platform 8.0.0
第 24 章 : Enterprise Geocoding モジュール
国名
国コード
都市レベル
ニウエ
NIU
はい
ノーフォーク島
NFK
はい
はい
北マリアナ諸島
MNP
はい
はい
ノルウェー
NOR
はい
はい
オマーン
OMN
はい
はい
パキスタン
PAK
はい
はい
パラオ
PLW
はい
はい
被占領パレスチナ地域
PSE
はい
パナマ
PAN
はい
パプアニューギニア
PNG
はい
はい
パラグアイ
PRY
はい
はい
ペルー
PER
はい
フィリピン
PHL
はい
はい
ピトケアン
PCN
はい
はい
ポーランド
POL
はい
はい
ポルトガル
PRT
はい
はい
プエルトリコ
PRI
はい
はい
カタール
QAT
はい
レユニオン
REU
はい
はい
ルーマニア
ROU
はい
はい
ユーザ ガイド
郵便番号レベル
739
Geocode Address World
国名
国コード
都市レベル
郵便番号レベル
ロシア連邦
RUS
はい
はい
ルワンダ
RWA
はい
セントヘレナ
SHN
はい
セントクリストファー・ KNA
ネイビス
はい
LCA
はい
サンピエール島とミクロ SPM
ン島
はい
セントビンセントおよび VCT
グレナディーン諸島
はい
セントルシア
740
はい
はい
サモア
WSM
はい
サンマリノ
SMR
はい
サントメ・プリンシペ
STP
はい
サウジアラビア
SAU
はい
はい
セネガル
SEN
はい
はい
セルビア・モンテネグロ SCG
はい
はい
セーシェル
SYC
はい
シエラレオネ
SLE
はい
シンガポール
SGP
はい
はい
スロバキア
SVK
はい
はい
スロベニア
SVN
はい
はい
はい
Spectrum™ Technology Platform 8.0.0
第 24 章 : Enterprise Geocoding モジュール
国名
国コード
都市レベル
ソロモン諸島
SLB
はい
ソマリア
SOM
はい
南アフリカ
ZAF
はい
はい
サウスジョージア・サウ SGS
スサンドウィッチ諸島
はい
はい
スペイン
ESP
はい
はい
スリランカ
LKA
はい
はい
スーダン
SDN
はい
はい
スリナム
SUR
はい
スワジランド
SWZ
はい
はい
スウェーデン
SWE
はい
はい
スイス
CHE
はい
はい
シリア・アラブ共和国
SYR
はい
中国台湾省
TWN
はい
はい
タジキスタン
TJK
はい
はい
タンザニア連合共和国
TZA
はい
タイ
THA
はい
はい
東ティモール
TLS
はい
はい
トーゴ
TGO
はい
トケラウ
TKL
はい
ユーザ ガイド
郵便番号レベル
741
Geocode Address World
742
国名
国コード
都市レベル
郵便番号レベル
トンガ
TON
はい
トリニダード・トバゴ
TTO
はい
チュニジア
TUN
はい
はい
トルコ
TUR
はい
はい
トルクメニスタン
TKM
はい
はい
タークス・カイコス諸島 TCA
はい
はい
ツバル
TUV
はい
ウガンダ
UGA
はい
ウクライナ
UKR
はい
はい
アラブ首長国連邦
ARE
はい
はい
英国
GBR
はい
はい
米国
USA
はい
はい
合衆国領有小離島
UMI
はい
ウルグアイ
URY
はい
はい
ウズベキスタン
UZB
はい
はい
バヌアツ
VUT
はい
ベネズエラ
VEN
はい
はい
ベトナム
VNM
はい
はい
イギリス領ヴァージン諸 VGB
島
はい
Spectrum™ Technology Platform 8.0.0
第 24 章 : Enterprise Geocoding モジュール
国名
国コード
アメリカ領ヴァージン諸 VIR
島
都市レベル
郵便番号レベル
はい
はい
ウェーク島
WAK
はい
ウォリス・フツナ
WLF
はい
はい
西サハラ
ESH
はい
はい
イエメン
YEM
はい
ザンビア
ZMB
はい
ジンバブエ
ZWE
はい
はい
GNAF PID Location Search
GNAF PID Location Search は、Geocoded National Address File Persistent Identifier (G-NAF PID) の
住所および緯度/経度座標を特定します。 G-NAF PID は、G-NAF データベース (オーストラリアの住
所のデータベース) 内の G-NAF の住所を一意に定義する 14 文字の英数字からなる文字列です。 PID
は G-NAF データベースの主要な住所フィールドの組み合わせから構成されています。 G-NAF PID の
例を次に示します。
GAVIC411711441
注: GNAF PID Location Search を使用するには、G-NAF データベースがインストールされている必
要があります。
GNAF PID Location Search は、Enterprise Geocoding モジュールの一部です。 Enterprise Geocoding
モジュールの詳細 (これに含まれるその他のコンポーネントなど) については、Enterprise Geocoding
モジュールとは(626ページ) を参照してください。
入力
GNAF PID Location Search は、入力として G-NAF PID を受け取ります。 以下の表に、入力のフォー
マットとレイアウトに関する情報を示します。
注: API を使用しているときはDataTable クラスを使って入力を指定します。 以下で説明するフィー
ルドは、DataTable クラスにおける有効な列名です。DataTable クラスの詳細については、
ユーザ ガイド
743
GNAF PID Location Search
『Spectrum Technology Platform API ユーザ ガイド』の「API の基礎」のセクションを Spectrum™
Technology Platform API ガイド.
表 123 : GNAF PID Location Search の入力
フィールド名
書式
説明/有効値
GNAFPID
文字列
検索する 14 文字の G-NAF Persistent Identifier。 例えば、
GAVIC411711441
オプション
GNAF PID Location Search を使用して、Management Console からデフォルトの処理オプションを設
定できます。 API または Enterprise Designer 等の クライアント ツールを使用して、GNAF PID
Location Spectrum™ Technology PlatformSearch 呼び出しの設定を個別にオーバーライドできます。
以下のセクションでは、GNAF PID Location Search の処理を制御するオプションについて説明しま
す。
ジオコーディング オプション
表 124 : GNAF PID Location Search のジオコーディング オプション
オプション名
説明/有効値
ポイント タイプ
小区画の緯度/経度を返すか、通りの入口の緯度/経度を返す
かを指定します。 このオプションは、G-NAF データベース
がインストールされている場合にのみ使用できます。 この
オプションは、G-NAF データベースのデータに一致する住
所のみに適用されます。
次のいずれかを選択します。
小区画
通り住所マッチングで小区画の正確な場所を返
します。 これは標準 G-NAF ポイントであり、
G-NAF データベースから返される正規のポイン
トです。 こちらがデフォルトです。
通りの入 通り住所マッチングで小区画の通りの入口ポイ
り口
ントを返します。 通りの入口ポイントは、小区
画の入口の境界から 12.5 m 離れています。 通
りの入口ポイントは、ルーティング アプリケー
ションでの使用に適しています。
744
Spectrum™ Technology Platform 8.0.0
第 24 章 : Enterprise Geocoding モジュール
オプション名
説明/有効値
郵便物の緯度と経度を表す小数点以下
8 桁の数値を返す
元の緯度/経度を、小数点以下 8 桁までの精度で返すかどう
かを指定します。 これは、G-NAF データベースのデータに
一致する候補の緯度/経度です。 これらは G-NAF データか
ら直接取得された元の座標であり、切り捨てや四捨五入は
行われていません。 このオプションは、G-NAF データベー
スがインストールされている場合にのみ使用できます。 こ
のオプションは、G-NAF データベースのデータに一致する
住所のみに適用されます。
Y
元の緯度/経度を、小数点以下 8 桁までの精度で返し
ます。
N
元の緯度/経度を、小数点以下 8 桁までの精度で返し
ません。
データ オプション
表 125 : GNAF PID Location Search のデータ オプション
オプション名
説明/有効値
データベース
小区画の検索に使用するデータベースを指定します。 Management
Console のデータベース リソース ツールで指定したデータベース名
を使用します。 詳細については、Enterprise Geocoding モジュール
の国際データベース リソースの追加(232ページ).
注: この一覧には、G-NAF データベースを含むデータベース リソー
スのみが表示されます。
出力
GNAF PID Location Search は、次のデータ カテゴリを返します。
各カテゴリに含まれる出力フィールドの一覧を以下の表に示します。
注: API を使用する場合は、出力は DataTable クラスで返されます。 DataTable クラスの詳細につい
ては、『Spectrum Technology Platform API ガイド』の「API の基礎」のセクションを Spectrum™
Technology Platform API ガイド.
ユーザ ガイド
745
GNAF PID Location Search
住所の出力
表 126 : 住所の出力
746
フィールド名
説明
AddressLine1
住所の最初の行。
AddressLine2
住所の 2 番目の行。
ApartmentLabel
ユニット タイプ。アパート、スイート、号など。
ApartmentNumber
ユニット番号。
City
地方自治体名。
Country
3 文字の ISO 3166-1 Alpha 3 国コード。
County
地方自治体 (LGA) の名前。
FirmName
会社名または場所の名前。
HouseNumber
一致したロケーションの建物番号。
HouseNumberHigh
住所がある範囲の最も大きな家番号。
HouseNumberLow
住所がある範囲の最も小さな家番号。
HouseNumberParity
家番号の範囲に奇数または偶数、またはその両方の番号が含まれるか
どうかを示します。
E
偶数
O
奇数
B
両方
LastLine
最後の住所行を完成させます (都市、州/省、および郵便番号)。
LeadingDirectional
通り名の前に付けて通りの方向を表します。 例えば、138 N Main
Street の N がこれに該当します。
Locality
この国ではこのフィールドは使用されません。
Spectrum™ Technology Platform 8.0.0
第 24 章 : Enterprise Geocoding モジュール
フィールド名
説明
NumberOfCandidateRanges 住所に家番号があるかどうかを示します。 次のいずれかを選択しま
す。
NumberOfRangeUnits
0
住所に家番号はありません。 家番号がない住所として、私書箱
の住所や局留めの住所などがあります。
1
住所に家番号があります。 家番号が含まれる範囲については、
[HouseNumberHigh]、[HouseNumberLow]、および
[HouseNumberParity] の各フィールドから確認できます。
住所にスイート番号やアパート番号などのユニット番号が含まれるか
どうかを示します。 次のいずれかを選択します。
0
住所にユニット番号が含まれません。
1
住所にユニット番号が含まれます。 ユニット番号が含まれる範
囲については、[UnitNumberHigh] フィールドと
[UnitNumberLow] フィールドから確認できます。
PostalCode
住所の郵便番号。 郵便番号のフォーマットは国によって異なります。
PostalCode.Addon
郵便番号の 2 番目の部分。 例えば、カナダの住所ではこれは LDU で
す。 ほとんどの国ではこのフィールドを使用しません。
PreAddress
通り名の前に記述されるその他の情報。
PrivateMailbox
現在、このフィールドは使用されていません。
SegmentParity
通りのどちら側に奇数番号が振られているかを示します。
L
通りの左側
R
通りの右側
B
通りの両側
U
未確認
StateProvince
州の名前。
StreetDataType
住所のジオコーディングに使うデータベースのデフォルトの検索順序
ランク。 値 "1" はそのデータベースがデフォルト検索順序の先頭の
データベースであり、値 "2" はデフォルト検索順序の 2 番目のデータ
ベースであることを意味します。以降も同様です。
ユーザ ガイド
747
GNAF PID Location Search
フィールド名
説明
デフォルト検索順序は、Management Console でデータベース リソー
ス ツールを使って指定します。
StreetName
通り名。
StreetPrefix
基本の通り名の前に通りタイプを明記する場合に、その通りタイプ。
例えば、以下の場合の AVENUE。
12 AVENUE B KALGOORLIE WA 6430
StreetSuffix
一致した場所の通りタイプ。 例えば、Avenue の AVE など。
TrailingDirectional
通り名の後に記述する通りの方位記号。 例えば、456 Washington N
の N。
UnitNumberHigh
ユニットが含まれる範囲における最も大きなユニット番号。
UnitNumberLow
ユニットが含まれる範囲における最も小さなユニット番号。
ジオコード出力
表 127 : のジオコード出力
フィールド名
説明
CoordinateSystem
緯度/経度座標を決定するために使われる座標系。 地図投影法、座標
単位などを指定する座標系 (例えば、EPSG:4326)。 EPSG は European
Petroleum Survey Group の略語です。
Latitude
小数点以下 4 桁までが計算される 7 桁の度数 (指定したフォーマット
で表記されます)。
Longitude
小数点以下 4 桁までが計算される 7 桁の度数 (指定したフォーマット
で表記されます)。
結果コード
結果コードは、ジオコーディングの成功または失敗に関する情報やジオコードの精度に関する情報を
示します。
748
Spectrum™ Technology Platform 8.0.0
第 24 章 : Enterprise Geocoding モジュール
表 128 : の結果コード出力
フィールド名
説明
Geocoder.MatchCode
入力住所が候補住所にどの程度近いかを示します。 詳細については、
はじめに(769ページ)を参照してください。詳細については、マッチ
コードを参照してください。
IsCloseMatch
住所が近似一致と見なされるかどうかを示します。 住所は、[マッチ
ング] タブの [近似検索条件] オプションで設定した基準に基づいて近
似かどうかが決定されます。
MultiMatchCount
Y
住所は近似一致です。
N
住所は近似一致ではありません。
通り住所のジオコーディングの場合は、指定された住所に見つかった
マッチングする住所の数。
交差点のジオコーディングの場合は、指定された住所に見つかった
マッチングする交差点の数。
Status
Status.Code
マッチの成功または失敗を報告します。
null
成功
F
失敗
ジオコーダが住所を処理できない場合、このフィールドにその理由が
設定されます。
•
•
•
•
•
•
•
Status.Description
Internal System Error
No Geocode Found
Insufficient Input Data
Multiple Matches Found
Exception occurred
Unable to initialize Geocoder
No Match Found
ジオコーダが住所を処理できない場合、このフィールドに説明が設定
されます。
Problem +
explanation
ユーザ ガイド
Status.Code = Internal System Error の場合
にこれが返されます。
749
GNAF PID Location Search
フィールド名
説明
Geocoding Failed
Status.code = No Geocode Found の場合に
これが返されます。
No location returned Status.code = No Geocode Found の場合に
これが返されます。
No Candidates
Returned
ジオコーダは住所に一致する候補を識別でき
ませんでした。
Multiple Candidates 住所に一致する候補が複数見つかりました。
Returned and Keep
候補の住所を返すために、[複数の一致を保
Multiple Matches not 持] オプションを指定する必要があります。
selected
LocationPrecision
750
ジオコードの精度を表すコード。 値は以下のいずれかです。
0
この候補住所の座標情報はありません。
1
補間された通り住所。
2
通りセグメントの中間点。
3
郵便番号 1 セントロイド。
4
部分郵便番号 2 セントロイド。
5
郵便番号 2 セントロイド。
6
交差点。
7
POI (point-of-interest)。
8
州/省セントロイド。
9
郡セントロイド。
10
都市セントロイド。
11
地方セントロイド。
12
未指定のカスタム項目に使う追加のポイント精度。
13
未指定のカスタム項目に使う追加のポイント精度。
14
未指定のカスタム項目に使う追加のポイント精度。
15
未指定のカスタム項目に使う追加のポイント精度。
16
結果は住所ポイント。
Spectrum™ Technology Platform 8.0.0
第 24 章 : Enterprise Geocoding モジュール
フィールド名
説明
17
StreetDataType
住所ポイント データを使って候補セグメント データを修
正して生成された結果住所。
住所のジオコーディングに使うデータベースのデフォルトの検索順序
ランク。 値 "1" はそのデータベースがデフォルト検索順序の先頭の
データベースであり、値 "2" はデフォルト検索順序の 2 番目のデータ
ベースであることを意味します。以降も同様です。
デフォルト検索順序は、Management Console でデータベース リソー
ス ツールを使って指定します。
G-NAF 出力
®
以下の表に、Australian Geocoded National Address File (G-NAF ) データベース固有の出力フィール
ドを示します。 G-NAF は、全 6 州と 2 つの特別地域に対応したオプションのデータベースです。
G-NAF は、オーストラリア全土の地方、通り、および番号を表す唯一の公式インデックスであり、検
証済みの地理的座標も含まれます。
表 129 : Australia G-NAF 出力
フィールド名
説明
AUS.GNAF_CONFIDENCE
住所が含まれる G-NAF データセットの数を示し
ます。 同じ住所が多くのデータ供給ソースで見つ
かるほど、確信レベルは高くなります。 次のいず
れかです。
<数 住所が含まれることが確認されたデータ
値> セットの総数から 1 を引いた値です。 例
えば、値が 0 のときは、住所が 1 つの供給
元のデータセットに見つかったことを意味
し、値 1 は 2 つの供給元のデータセットに
見つかったことを意味します。値 2 は 3 つ
の供給元のデータセットに見つかったこと
を意味し、以降もこれと同様です。
-1
ユーザ ガイド
住所はどの G-NAF データセットにも見つ
かりませんでした。
751
GNAF PID Location Search
フィールド名
説明
AUS.GNAF_Eight_Decimal_Place_Latitude
小区画の緯度。小数点以下 8 桁までの精度で表さ
れます。 これは、G-NAF データベースのデータ
に一致した候補の緯度です。 これらは G-NAF デー
タから直接取得された元の座標であり、切り捨て
や四捨五入は行われていません。
このフィールドは、 [ジオコーディング] タブで
[郵便物の緯度と経度を表す小数点以下 8 桁の数値
を返す] ボックスをチェックした場合にのみ返さ
れます。
AUS.GNAF_EIGHT_DECIMAL_PLACE_LONGITUDE 小区画の経度。小数点以下 8 桁までの精度で表さ
れます。 これは、G-NAF データベースのデータ
に一致した候補の経度です。 これらは G-NAF デー
タから直接取得された元の座標であり、切り捨て
や四捨五入は行われていません。
このフィールドは、 [ジオコーディング] タブで
[郵便物の緯度と経度を表す小数点以下 8 桁の数値
を返す] ボックスをチェックした場合にのみ返さ
れます。
AUS.GNAF_GEOCODE_LEVEL
住所のジオコードのレベルを示す番号。 G-NAF
データベース内の主要エリアの住所には最低 1 つ
の地方レベルのジオコードがあります。 さらに、
通りレベルやポイント レベルのジオコードがある
場合もあります。
次のいずれかです。
752
0
ジオコードはありません。
1
小区画レベルのジオコードのみ (地方レベル
または通りレベルのジオコードはありませ
ん)。
2
通りレベルのジオコードのみ (地方レベルま
たは小区画レベルのジオコードはありませ
ん)。
3
通りレベルと小区画レベルのジオコードの
み (地方レベルのジオコードはありません)。
Spectrum™ Technology Platform 8.0.0
第 24 章 : Enterprise Geocoding モジュール
フィールド名
AUS.GNAF_PID
説明
4
地方レベルのジオコードのみ (通りレベルま
たは小区画レベルのジオコードはありませ
ん)。
5
地方レベルと小区画レベルのジオコード (通
りレベルのジオコードはありません)。
6
地方レベルと通りレベルのジオコード (小区
画レベルのジオコードはありません)。
7
地方レベル、通りレベル、および小区画レ
ベルのジオコード。
G-NAF Persistent Identifier (G-NAF PID) は、
G-NAF の住所を一意に定義する 14 文字の英数字
からなる文字列です。 PID は G-NAF Dictionary
の主要な住所フィールドの組み合わせから構成さ
れています。 G-NAF PID は、以下のような形式
です。
GAVIC411711441
AUS.GNAF_RELIABILITY
ジオコードの精度を示す番号。 信頼度は、ジオ
コードを決定するために使われる辞書の品質に左
右されます。 ジオコード信頼レベル 1、2、およ
び 3 のデータは、GNAF123 Dictionary に格納さ
れています。 これはポイント (小区画) レベルの
ジオコード データです。 ジオコード信頼レベル
4、5、および 6 のデータは、GNAF456 Dictionary
に格納されています。 この辞書には、小区画以外
のセントロイド ジオコード データが格納されて
います。
1 ジオコードの精度は、適切な測定基準を満た
しました。 例えば、手動で実行された住所レ
ベルのジオコードは、このレベルになります。
ジオコードの解像度は、GPS を使ってセント
ロイドを住所サイト境界内に配置できるレベ
ルです。
2 ジオコードの精度は、セントロイドを住所サ
イト境界内に配置できるレベルです。 例え
ば、対応する地籍上の小区画のセントロイド
ユーザ ガイド
753
GNAF PID Location Search
フィールド名
説明
として自動的に計算された住所レベルのジオ
コードは、このレベルになります。
3 ジオコードの精度は、セントロイドを住所サ
イト境界の近く (場合によっては内部) に配置
できるレベルです。 例えば、他の境界ジオ
コード住所に基づいて対象の住所が位置する
と思われる道路を計算するという方法で自動
的に計算された住所レベルのジオコードは、
このレベルになります。
4 ジオコードの精度は、住所サイトを道路の固
有の特性に関連付けることができるレベルで
す。 例えば、道路の中央線リファレンス デー
タを使って自動的に計算された通りレベルの
ジオコードは、このレベルになります。
5 ジオコードの精度は、住所サイトを特定の地
方または地区に関連付けることができるレベ
ルです。 例えば、地方のセントロイドとして
自動的に計算された地方レベルのジオコード
は、このレベルになります。
6 ジオコードの精度は、住所サイトを特定の地
域に関連付けることができるレベルです。 例
えば、地形特性から導き出された地方レベル
のジオコードは、このレベルになります。
AUS.LEVEL_NUMBER
多層建築の階またはレベルの番号。 例を次に示し
ます。
Floor 2 , 17 Jones Street
G-NAF データベースには、オーストラリアの一部
の州のレベル情報が含まれています。 レベル情報
がユニット情報に関連付けられている場合もあり
ますが、常にこの関連付けがあるわけではありま
せん。 G-NAF データベースでは、複数のレコー
ドが同じレベルに含まれます。入力住所に個有の
コンテンツ(ユニット番号など)がある場合にの
み、レベル情報が返されます。 G-NAF Dictionary
に住所のレベル情報がある場合は、一致した候補
と共にその情報が返されます。
754
Spectrum™ Technology Platform 8.0.0
第 24 章 : Enterprise Geocoding モジュール
フィールド名
説明
入力住所にレベル情報がない場合、あるいは入力
のレベル情報が不正確な場合でも、正しいレベル
情報が返されます。 入力住所にレベル情報がある
が、G-NAF データベースにはマッチング住所にレ
ベル情報がない場合、G-NAF データによって検証
されない情報であるとして入力レベル情報が破棄
されます。
AUS.LEVEL_TYPE
多層建築の階に使われるラベル。 例えば、"Level"
または "Floor"。 この例で、レベル タイプは
"Level" です。
Suite 3 Level 7, 17 Jones Street
この例で、Suite 3 はユニットです。
G-NAF データベースには、オーストラリアの一部
の州のレベル情報が含まれています。 レベル情報
がユニット情報に関連付けられている場合もあり
ますが、常にこの関連付けがあるわけではありま
せん。 G-NAF データベースでは、複数のレコー
ドが同じレベルに含まれます。入力住所に個有の
コンテンツ(ユニット番号など)がある場合にの
み、レベル情報が返されます。 G-NAF Dictionary
に住所のレベル情報がある場合は、一致した候補
と共にその情報が返されます。
入力住所にレベル情報がない場合、あるいは入力
のレベル情報が不正確な場合でも、正しいレベル
情報が返されます。 入力住所にレベル情報がある
が、G-NAF データベースにはマッチング住所にレ
ベル情報がない場合、G-NAF データによって検証
されない情報であるとして入力レベル情報が破棄
されます。
AUS.MESH_BLOCK_ID
ユーザ ガイド
Meshblock は、オーストラリア統計局 (ABS) が統
計データを収集するために作成した最も小さい地
理的な単位です。 通常、Meshblock には最低 20
から 50 の世帯が含まれています。 これは、収集
区 (CD: Collection District) の約 5 分の 1 の大きさ
です。 Meshblock ID を使って、独自のデータに
属性を追加できます。
755
Reverse Geocode Address Global の概要
Reverse Geocode Address Global の概要
Reverse Geocode Address Global は、指定された緯度/経度ポイントの住所を決定します。 Reverse
Geocode Address Global は、多くの国の住所を決定することができます。 どの国の住所を扱えるか
は、インストールした国データベースによって決まります。 例えば、カナダ、イタリア、オーストラ
リアのデータベースがインストールされている場合は、Reverse Geocode Address Global はこれらの
国々の住所ジオコーディングを 1 回の処理で実行できます。
注: Reverse Geocode Address Global は、米国の住所に対応しません。 米国の住所のジオコーディ
ングには、Reverse Geocode US Location を使用してください。 また、英国ではリバース ジオ
コーディングを使用できません。
Reverse Geocode Address Global を操作する前に、1 つ以上の国データベースが存在するグローバル
データベース リソースを定義する必要があります。 データベース リソースを作成すると、Reverse
Geocode Address Global は Management Console、Enterprise Designer、および Interactive Driver で
使用可能になります。 データベース リソースの作成については、Enterprise Geocoding モジュール
グローバル データベース リソースの追加(230ページ)を参照してください。
Reverse Geocode Address Global は、Enterprise Geocoding モジュールのオプションのコンポーネン
トです。 Enterprise Geocoding モジュールの詳細については、Enterprise Geocoding モジュールと
は(626ページ)を参照してください。
入力
Reverse Geocode Address Global は、入力として緯度と経度を受け取ります。
注: API を使用しているときはDataTable クラスを使って入力を指定します。 以下で説明するフィー
ルドは、DataTable クラスにおける有効な列名です。DataTable クラスの詳細については、API
ユーザ ガイドの「API の基礎」のセクションを Spectrum™ Technology Platform API ガイド.
表 130 : Reverse Geocode Global の入力
フィールド名
書式
説明/有効値
Latitude
文字列
住所情報が必要なポイントの緯度。
Longitude
文字列
住所情報が必要なポイントの経度。
Country
文字列
次のいずれかを選択します。
• 英語の国名。
• 2 文字の ISO 3116-1 alpha-2 国コード。
• 3 文字の ISO 3116-1 alpha-3 国コード。
756
Spectrum™ Technology Platform 8.0.0
第 24 章 : Enterprise Geocoding モジュール
オプション
ジオコーディング オプション
表 131 : ジオコーディング オプション の
オプション名
説明/有効値
検索距離
住所を検索する入力座標からの半径。 半径内の通りセグメントとポイ
ントが考慮されます。 デフォルトの検索半径は 150 メートル、最大
検索半径は 1600 メートルです。
単位
検索距離を指定する単位。 次のいずれかを選択します。
• フィート
• マイル
• メートル
• キロメートル
通りからのオフセット
通りレベルのジオコーディングに使う通りセグメントからのオフセッ
ト距離を指定します。 距離の単位は [Units] フィールドで指定しま
す。
注: オフセットは英国 (GBR) および日本 (JPN) ではサポートされま
せん。
デフォルト値は国によって異なります。
• 10 メートル — オーストラリア (AUS)、オーストリア (AUT)、ドイ
ツ (DEU)。
• 7 メートル — アルゼンチン (ARG)、ベルギーおよびルクセンブルグ
(BEL)、ブラジル (BRA)、カナダ (CAN)、スイスおよびリヒテンシュ
タイン (CHE)、チェコ共和国 (CZE)、チリ (CHL)、中国 (CHN)、デ
ンマーク (DNK)、スペイン (ESP)、エストニア (EST)、フィンラン
ド (FIN)、フランス (FRA)、英国 (GBR)、ギリシャ (GRC)、香港
(HKG)、ハンガリー (HUN)、インドネシア (IDN)、インド (IND)、ア
イルランド (IRL)、イタリア (ITA)、ラトビア (LVA)、リトアニア
(LTU)、マカオ (MAC)、メキシコ (MEX)、マレーシア (MYS)、オラ
ンダ (NLD)、ノルウェー (NOR)、ニュージーランド (NZL)、フィリ
ピン (PHL)、ポーランド (POL)、ポルトガル (PRT)、ロシア (RUS)、
シンガポール (SGP)、スロバキア (SVK)、スロベニア (SVN)、ス
ウェーデン (SWE)、タイ (THA)、トルコ (TUR)、南アフリカ (ZAF)。
ユーザ ガイド
757
Reverse Geocode Address Global の概要
オプション名
説明/有効値
デフォルトは、7 メートルです。
オフセット距離は、ジオコードが通りの中央に位置付けられるのを防
ぐために、通りレベルのジオコーディングで使われます。 通りレベル
のジオコーディングを行うと、住所が位置する通りの中心点の緯度/経
度が返されますが、これを補正するのがオフセットです。 住所が指し
示す建物は通りの真上に建っているわけではないので、路上のポイン
トに相当する住所のジオコードが返されるのは不都合です。 ジオコー
ドは、通りに面して建つ建物の場所を表している必要があります。 例
えば、50 フィートのオフセットは、ジオコードが通りの中心から 50
フィート離れた場所を表すことを意味します。 距離は、住所の通りセ
グメントから垂直方向に計算されます。 また、オフセットは、通りを
はさんで向かい合う住所が同じポイントになるのを防ぐ目的にも使わ
れます。 以下に、オフセット ポイントと元のポイントとの比較図を
示します。
通りの座標は 1/10,000 度の精度で決定され、補間ポイントは
1/1,000,000 度の精度で決定されます。
通りの角からのオフセット
通りレベルでのマッチングに使う通りの終端からのオフセットを指定
します。 距離は、 [Units] フィールド に指定した単位で指定されま
す。この値は、通りの角の住所に交差点と同じジオコードが与えられ
るのを防ぐために使われます。
注: オフセットは英国 (GBR) および日本 (JPN) ではサポートされま
せん。
デフォルト値は国よって異なります。
• 12 メートル — オーストラリア (AUS)、オーストリア (AUT)、ドイ
ツ (DEU)。
• 7 メートル — アルゼンチン (ARG)、ベルギーおよびルクセンブルグ
(BEL)、ブラジル (BRA)、カナダ (CAN)、スイスおよびリヒテンシュ
758
Spectrum™ Technology Platform 8.0.0
第 24 章 : Enterprise Geocoding モジュール
オプション名
説明/有効値
タイン (CHE)、チリ (CHL)、中国 (CHN)、チェコ共和国 (CZE)、デ
ンマーク (DNK)、スペイン (ESP)、エストニア (EST)、フィンラン
ド (FIN)、フランス (FRA)、英国 (GBR)、ギリシャ (GRC)、香港
(HKG)、ハンガリー (HUN)、インドネシア (IDN)、インド (IND)、ア
イルランド (IRL)、イタリア (ITA)、ラトビア (LVA)、リトアニア
(LTU)、マカオ (MAC)、メキシコ (MEX)、マレーシア (MYS)、オラ
ンダ (NLD)、ノルウェー (NOR)、ニュージーランド (NZL)、ポーラ
ンド (POL)、ポルトガル (PRT)、ロシア (RUS)、シンガポール
(SGP)、スロバキア (SVK)、スロベニア (SVN)、スウェーデン
(SWE)、タイ (THA)、トルコ (TUR)、南アフリカ (ZAF)。
デフォルトは、7 メートルです。
以下に、通りの終点とオフセット終点の比較図を示します。
単位
通りオフセットと角オフセットのオプションに使う距離単位を指定し
ます。 次のいずれかを選択します。
注: オフセットは英国 (GBR) および日本 (JPN) ではサポートされま
せん。
• フィート
• マイル
• メートル
• キロメートル
デフォルトは、メートルです。
座標系
ユーザ ガイド
座標系は、空間におけるポイントの位置を一意に表すリファレンス シ
ステムです。 カルテシアン (二次元) 座標、測地 (地理) 座標などが、
ユークリッド幾何学に基づくリファレンス システムとして挙げられま
す。Spectrum™ Technology Platform は、European Petroleum Survey
Group (EPSG) に承認されたシステムをサポートしています。
759
Reverse Geocode Address Global の概要
オプション名
説明/有効値
国によって異なる座標系が採用されています。 国によっては、次のオ
プションを 1 つ以上使用できます。
EPSG:4230
EPSG:4283
GDA94 座標系とも呼ばれます。
EPSG:4301
Tokyo 座標系とも呼ばれます。
EPSG:4326
WGS84 座標系とも呼ばれます。
EPSG:27200
NZGD49 座標系とも呼ばれます。
EPSG:27700
British National Grid 系とも呼ばれます。
マッチング オプション
表 132 : マッチング オプション の
オプション名
説明/有効値
複数の一致を保持
座標がデータベース内の複数の候補住所に一致する場合に結果を返す
かどうかを指定します。 このオプションを選択しない場合、複数の住
所候補が見つかる座標のジオコーディングは失敗します。
このオプションを選択する場合は、チェック ボックスの横にある を
使って、返す候補の最大数を指定してください。
データ オプション
[データ] タブを使って、リバース ジオコーディングに使うデータベースを指定できます。 データベー
スには、特定のポイントにある住所を確認するために必要な住所とジオコードのデータが格納されて
います。 以下の表に、データベースの検索順序を指定するために使用できるオプションを示します。
表 133 : データ オプション の
オプション名
説明/有効値
デフォルトのデータベース検 データベース リソース ツール ( [モジュール] > [Enterprise Geocoding]
索リストをオーバーライド
> [ツール]) の Management Console で指定したデータベース検索リス
トを使うかどうかを指定します。 デフォルトのデータベース検索リス
トをオーバーライドする場合、[データベース検索リスト] フィールド
760
Spectrum™ Technology Platform 8.0.0
第 24 章 : Enterprise Geocoding モジュール
オプション名
説明/有効値
でデータベースの検索順序を変更できます。 また、データベースを検
索リストから除外することもできます。
デフォルトのデータベース検索リストをオーバーライドした場合、
データベース リソースへの変更がデータベース検索リストに反映され
ません。これが原因でジオコーディングに失敗することがあります。
ただし、デフォルトのデータベース検索順序をオーバーライドしない
場合は、データベース リソースへの変更はジオコーダによって自動的
に反映されます。 例えば、データベース リソースが別のディレクト
リに移動された後でそのデータベース リソースを適切な手順で ( [モ
ジュール] > [Enterprise Geocoding] > [ツール] ) 更新すると、ジオ
コーダではデータベースの場所が自動的に更新されます。
データベース検索リスト
検索プロセスで使う 1 つ以上のデータベース リソースの名前。
Management Console のデータベース リソース ツールで指定したデー
タベース名を使用します。 詳細については、Enterprise Geocoding
モジュールの国際データベース リソースの追加(232ページ).
複数のデータベース リソースを指定できます。複数のデータベースを
指定するときは、優先度の高いデータベースからリストに追加しま
す。
データベースの順序は、複数のデータベースに近似一致が見つかった
ときに意味を持ちます。 返される近似一致は、検索リストの先頭にあ
るデータベースから取得されます。 それより下位のデータベースに見
つかった近似一致は、非近似一致に格下げされます。
また、目的の国の住所ポイント データベースと通りレベル データベー
スがインストールされている場合、データベースの順序を使って代替
処理を実行することもできます。 住所ポイント データベースを最初
にリストに追加し、通りデータベースを 2 番目に追加してください。
住所のジオコードを住所ポイント レベルで決定できない場合、通りレ
ベルでのジオコーディングが試みられます。
出力
注: Spectrum API を使用する場合は、 DataTable クラスに返されます。 DataTable クラスの詳細に
ついては、Spectrum™ Technology Platform API ガイド.
ユーザ ガイド
761
Reverse Geocode Address Global の概要
表 134 : Reverse Geocode Address Global 出力フィールド
フィールド名
説明
AddressLine1
住所の最初の行。
AddressLine2
住所の 2 番目の行。
ApartmentLabel
ユニット タイプ。アパート、スイート、号など。
ApartmentNumber
ユニット番号。
City
地方自治体名。
日本では、地方自治体の従属する地区 (大字) です。
County
郡 (County) の意味は国によって異なります。
• ARG (アルゼンチン) — 郡 (Department)
• AUS (オーストラリア) — 地方自治体 (Local Government Authority:
LGA)
• AUT (オーストリア) — 使用せず
• BEL (ベルギー) — 州 (Province)
• BRA (ブラジル) — 使用せず
• CAN (カナダ) — 使用せず
• CHE (スイス) — 州 (Province)
• CHL (チリ) — 地区 (District)
• CHN (中国) — 使用せず
• CZE (チェコ共和国) — 地区名またはエイリアス
• DEU (ドイツ) — 郡 (Kreis)
• DNK (デンマーク) — 州 (Province)
• ESP (スペイン) — 州 (Province)
• EST (エストニア) — 地区 (District)
• FIN (フィンランド) — 使用せず
• FRA (フランス) — 県 (Department)
• GBR (イギリス) — 使用せず
• GRC (ギリシャ) — 地区 (Discrict)
• HKG (香港) — 使用せず
• HUN (ハンガリー) — 地区 (District)
• IDN (インドネシア) — 摂政管区/都市 (Regency/City)
• IND (インド) — 地区 (District)
762
Spectrum™ Technology Platform 8.0.0
第 24 章 : Enterprise Geocoding モジュール
フィールド名
説明
• IRL (アイルランド) — 州 (Province)
• ITA (イタリア) — 州 (Province)
• JPN (日本) — 市区町村
• LTU (リトアニア) — 郡 (County)
• LVA (ラトビア) — 地区 (District)
• MAC (マカオ) — 使用せず
• MEX (メキシコ) — 州 (Province)
• MYS (マレーシア) — 使用せず
• NLD (オランダ) — 州 (Province)
• NOR (ノルウェー) — 地区 (District) (fylke/counties)
• NZL (ニュージーランド) — 地方行政区画 (Region)
• PHL (フィリピン) — 地区 (District)
• POL (ポーランド) — 地区 (District) (poviat)
• PRT (ポルトガル) — 使用せず
• RUS (ロシア) — 地区 (Discrict)
• SGP (シンガポール) — 使用せず
• SVK (スロバキア) — 町 (Town)
• SVN (スロベニア) — 地方行政区画 (Region)
• SWE (スウェーデン) — コミューン (Kommun)
• THA (タイ) — 地区 (District) (amphoe)
• TUR (トルコ) — 地区 (District)
• ZAF (南アフリカ) — 地区 (District)
この国ではこのフィールドは使用されません。
郡の名前。
注: アンドラ郡コード (AND) を含む住所を入力した場合、アンドラ
国内の住所のみが返されます。この住所には AND コードが含ま
れます。 スペイン郡コード (ESP) を含むアンドラの住所を入力
した場合、アンドラの住所が候補として返されますが、郡コード
はスペインのものが含まれます。
地域名またはエイリアス。 例えば、Osrednjeslovenska/Ljubljana。
地区 (district) の名前。
摂政管区/都市 (regency/city) の名前。
地区 (district) の名前。
ユーザ ガイド
763
Reverse Geocode Address Global の概要
フィールド名
説明
Distance
入力された場所からの距離 (メートル)。 入力座標が住所に正確に一致
する場合、値は 0 です。
FirmName
会社名または場所の名前。
Geocoder.MatchCode
入力座標が候補住所にどの程度一致するかを示します。 詳細について
は、リバース ジオコーディング コード (R カテゴリ)(773ページ)を
参照してください。
HouseNumber
一致した場所の建物の番号。
日本では、このフィールドに号番号が格納されます。
HouseNumberHigh
住所がある範囲の最も大きな家番号。
HouseNumberLow
住所がある範囲の最も小さな家番号。
HouseNumberParity
家番号の範囲に奇数または偶数、またはその両方の番号が含まれるか
どうかを示します。
E
偶数
O
奇数
B
両方
U
不明
LastLine
最後の住所行を完成させます (都市、州/省、および郵便番号)。
LeadingDirectional
通り名の前に付けて通りの方向を表します。 例えば、138 N Main
Street の N がこれに該当します。
Locality
地方 (locality) の意味は国によって異なります。
• ARG (アルゼンチン) — 区域 (Neighborhood または barrio)
• AUS (オーストラリア) — 使用せず
• AUT (オーストリア) — 使用せず
• BEL (ベルギー) — 使用せず
• BRA (ブラジル) — 地方 (Locality)
• CAN (カナダ) — 散布エリア (Dissemination Area: DA) および列挙エ
リア (Enumeration Area: EA)
764
Spectrum™ Technology Platform 8.0.0
第 24 章 : Enterprise Geocoding モジュール
フィールド名
説明
• CHE (スイス) — 使用せず
• CHL (チリ) — 地方 (Locality)
• CHN (中国) — 地方 (Locality)
• CZE (チェコ共和国) — 地方 (Locality)
• DEU (ドイツ) — 使用せず
• DNK (デンマーク) — 使用せず
• ESP (スペイン) — 地方 (Locality)
• EST (エストニア) — 地方 (Locality)
• FIN (フィンランド) — 使用せず
• FRA (フランス) — 使用せず
• GBR (英国) — 地方 (Locality)
• GRC (ギリシャ) — 地方 (Locality)
• HKG (香港) — 地方 (Locality)
• HUN (ハンガリー) — 地方 (Locality)
• IDN (インドネシア) — 村 (Village)
• IND (インド) — 地方 (Locality)
• IRL (アイルランド) — 使用せず
• ITA (イタリア) — 地方 (Locality)
• JPN (日本) — 市内の地域 (丁目)
• LTU (リトアニア) — 地方 (Locality)
• LVA (ラトビア) — 地方 (Locality)
• MAC (マカオ) — 地方 (Locality)
• MEX (メキシコ) — 地方 (Locality)
• MYS (マレーシア) — 使用せず
• NLD (オランダ) — 使用せず
• NOR (ノルウェー) — 使用せず
• NZL (ニュージーランド) — 郊外 (Suburb)
• PHL (フィリピン) — 地方 (Locality)
• POL (ポーランド) — 使用せず
• PRT (ポルトガル) — 地方 (Locality)
• RUS (ロシア) — 地方 (Locality)
• SGP (シンガポール) — 使用せず
• SVK (スロバキア) — 地方 (Locality)
• SVN (スロベニア) — 地方 (Locality)
• SWE (スウェーデン) — 使用せず
• THA (タイ) — 使用せず
ユーザ ガイド
765
Reverse Geocode Address Global の概要
フィールド名
説明
• TUR (トルコ) — 地方 (Locality)
• ZAF (南アフリカ) — 地方 (Locality)
地方 (locality) の名前。
地方 (locality) の名前またはエイリアス。 例えば、Gaberje/Gabrje。
地方 (locality) の名前またはエイリアス。
村 (village)。
Geocode Address Global は、入力に地方が含まれ、都市が含まれない
住所のジオコーディングを実行できます。たとえば、次の住所は同じ
ジオコードに変換されます。
calle nicaragua 4705, palermo, capital federal
calle nicaragua 4705, palermo
NumberOfCandidateRanges 候補がメンバーとして含まれる範囲の数を示します。 候補が建物では
なく通りの場合、候補は複数の範囲の一部である可能性があります。
候補ごとに返す範囲の数を指定するには、[候補あたりの最大範囲] オ
プションを使用します。
NumberOfRangeUnits
範囲に含まれるユニットの数を示します。 ユニットとは、建物内にあ
るアパートメントやオフィス スイートなどの住所です。 範囲ごとに
返すユニット数を指定するには、[範囲あたりの最大単位] オプション
を使用します。
PostalCode
住所の郵便番号。 郵便番号のフォーマットは国によって異なります。
PostalCode.Addon
郵便番号の 2 番目の部分。カナダの住所ではこれは LDU です。ほと
んどの国ではこのフィールドを使用しません。
PreAddress
通り名の前に記述されるその他の情報。
PrivateMailbox
現在、このフィールドは使用しません。
SegmentCode
通りセグメントを識別する一意の ID。日本では、これは住所コードで
す。住所コードは、一意の住所を表すポイント ID です。
SegmentParity
通りのどちら側に奇数番号が振られているかを示します。
L
766
通りの左側
Spectrum™ Technology Platform 8.0.0
第 24 章 : Enterprise Geocoding モジュール
フィールド名
StateProvince
説明
R
通りの右側
B
通りの両側
U
未確認
StateProvince の意味は国によって異なります。
• ARG (アルゼンチン) — 地域 (Region) または州 (Province)
• AUS (オーストラリア) — 州 (State)
• AUT (オーストリア) — 地域 (Region)
• BEL (ベルギー) — 使用せず
• BRA (ブラジル) — 州 (State)
• CAN (カナダ) — 州 (Province)
• CHE (スイス) — 使用せず
• CHL (チリ) — 州 (State)
• CHN (中国) — 州 (Province)
• CZE (チェコ共和国) — 地域 (Region) 名またはエイリアス 例えば、
地域 HLAVNI MESTO PRAHA のエイリアスを Prag とすることがで
きます。
• DEU (ドイツ) — 連邦州 (Bundesland)
• DNK (デンマーク) — 使用せず
• ESP (スペイン) — 地域 (Region)
• EST (エストニア) — 使用せず
• FIN (フィンランド) — 地域 (Region) (lan)
• FRA (フランス) — 地域 (Region)
• GBR (イギリス) — 地域 (Region)
• GRC (ギリシャ) — 地域 (Region)
• HKG (香港) — 特別行政区 (Province)
• HUN (ハンガリー) — 郡 (County)
• IDN (インドネシア) — 州 (Province)
• IND (インド) — 州 (State)
• IRL (アイルランド) — 使用せず
• ITA (イタリア) — 地域 (Region)
• JPN (日本) — 県
• LTU (リトアニア) — 使用せず
• LVA (ラトビア) — 州 (State)
• MAC (マカオ) — 特別行政区 (State)
ユーザ ガイド
767
Reverse Geocode Address Global の概要
フィールド名
説明
• MEX (メキシコ) — 州 (Province)
• MYS (マレーシア) — 州 (State) (negeri)
• NLD (オランダ) — 使用せず
• NOR (ノルウェー) — 使用せず
• NZL (ニュージーランド) — 地方行政区画 (Region)
• PHL (フィリピン) — 州 (State)
• POL (ポーランド) — 県 (Province) (voivodship)
• PRT (ポルトガル) — 地域 (Region)
• RUS (ロシア) — 地域 (Region)
• SGP (シンガポール) — 使用せず
• SVK (スロバキア) — 使用せず
• SVN (スロベニア) — 使用せず
• SWE (スウェーデン) — 地域 (Region) (lan)
• THA (タイ) — 県 (Province) (changwat)
• TUR (トルコ) — 県 (Province)
• ZAF (南アフリカ) — 州 (State)
州の名前。
州 (province) の名前。
地方行政区画 (region) の名前。
この国ではこのフィールドは使用されません。
StreetDataType
住所のジオコーディングに使うデータベースのデフォルトの検索順序
ランク。 値 "1" はそのデータベースがデフォルト検索順序の先頭の
データベースであり、値 "2" はデフォルト検索順序の 2 番目のデータ
ベースであることを意味します。以降も同様です。
デフォルト検索順序は、Management Console でデータベース リソー
ス ツールを使って指定します。
StreetName
通り名。
日本では、このフィールドに番地が設定されます。 通常、日本の住所
では通り名を使いません。
StreetPrefix
基本の通り名の前に通りタイプを明記する場合に、その通りタイプ。
例えば、AVENUE:
12 AVENUE B KALGOORLIE WA 6430
768
Spectrum™ Technology Platform 8.0.0
第 24 章 : Enterprise Geocoding モジュール
フィールド名
説明
StreetSuffix
一致した場所の通りタイプ。 例えば、Avenue の AVE など。
TrailingDirectional
通り名の後に記述する通りの方位記号。例えば、456 3rd St. N におけ
る N。
UnitNumberHigh
ユニットが含まれる範囲における最も大きなユニット番号。
UnitNumberLow
ユニットが含まれる範囲における最も小さなユニット番号。
国際ジオコーディングの結果コード
はじめに
ジオコーダは、レコードのマッチングを試みるたびに結果コードを [Geocoder.MatchCode] 出力フィー
ルドに返します。
単一近似一致 (S カテゴリ)
S カテゴリの一致は、レコードが単一の住所候補に一致したことを意味します。 最初の文字 (S) は、
ジオコーディング サーバーがレコードに一致する通り住所を見つけたことを意味します。 コードの 2
番目の位置は、レコードのジオコーディング結果ポイントの位置的な精度を示します。
一致には次の種類があります。
• S0 — 使用できる座標がない単一近似一致 (めったにないケース)。
• S1 — 郵便番号セントロイドにポイントが位置付けられた単一近似一致。 カナダでは、これは FSA
セントロイドです。 日本では、S1 は候補が県に一致するものの、それより下の住所が一致しないこ
とを示します。
• S3 — 郵便番号セントロイドにポイントが位置付けられた単一近似一致。 カナダでは、これは
FSALDU セントロイドです。 日本では、S3 は候補が県、市区町村、および町・大字に一致したこ
とを意味します。
• S4 — 通りセントロイドにポイントが位置付けられた単一近似一致。 S4 コードの後に、マッチング
の精度を示す文字とダッシュが設定されます。 これらの文字の詳細については、マッチ詳細コード
(770ページ)を参照してください。
• S4G — オーストラリアでは、独自の道路特性に基づく G-NAF 信頼レベル 4 での単一一致を示すた
めに S4G 結果コードを使います。 信頼レベルは、[AUS.GNAF_Reliability] 出力フィールドに返され
ます。 詳細については、Australian G-NAF データベース出力(714ページ)を参照してください。
ユーザ ガイド
769
国際ジオコーディングの結果コード
• S5 — 通り住所の位置にポイントが位置付けられた単一近似一致。 日本では、S5 は候補が番地に一
致するものの、号が一致しないか入力に含まれないことを示します。 S5 コードの後に、マッチング
の精度を示す文字とダッシュが設定されます。 これらの文字の詳細については、マッチ詳細コード
(770ページ)を参照してください。
• S6 — ジオメトリ郵便番号のセントロイドにポイントが位置付けられた単一近似一致 (例えば、固有
の郵便番号を持つ大きなビルなど)。
• S7 — 候補の通りセグメント沿いの補間ポイントに位置付けられた単一一致。 潜在的な候補が住所
ポイント候補ではなく、他の住所ポイント候補には家番号が正確に一致するものがない場合、S7 の
結果コードが住所ポイント補間を使って返されます。 このポイント補間は、セグメントが交差し、
家番号が元の候補の家範囲に含まれる 2 番目に高いか低い住所ポイント候補に従って行われます。
通りセグメント上の既知の住所リファレンス ポイントを使って、S7 ポイントをより正確な位置に調
整できます。 オーストラリアでは、S7G 結果コードは G-NAF 信頼レベル 3 の単一一致を表すため
にも使用されます。 信頼レベルは、[AUS.GNAF_Reliability] 出力フィールドに返されます。 詳細に
ついては、Australian G-NAF データベース出力(714ページ)を参照してください。
• S8 — 住所ポイント候補に関連付けられた単一ポイント、または家番号が同一の住所ポイント候補に
ポイントが位置付けられた単一近似一致。 補間は必要ありません。 オーストラリアでは、S8G 結
果コードは G-NAF 信頼レベル 1 または 2 (最高レベルの G-NAF 信頼度) の単一一致を表すためにも
使用されます。 信頼レベルは、[AUS.GNAF_Reliability] 出力フィールドに返されます。 詳細につい
ては、を参照してください。
• SGG — 地方の中心部、または地形特性から導き出された地方レベルのジオコードにポイントが位置
付けられた単一近似一致。オーストラリアのみで使用します。 SGG 結果コードは、G-NAF 信頼レ
ベル 5 (地方または地区) またはレベル 6 (特定の地域) に関連付けられます。 信頼レベルは、
[AUS.GNAF_Reliability] 出力フィールドに返されます。 詳細については、Australian G-NAF データ
ベース出力(714ページ)を参照してください。
• SP — 郵便 (私書箱) ロケーションへの単一近似一致。オーストラリアのみで使用します。 この一致
は、G-NAF データベースを使わずに、通り範囲住所データベースのみで生成できます。
• SX — 交差点にポイントが位置付けられた単一近似一致。
マッチ詳細コード
S4 および S5 のジオコード結果には、マッチングの精度を示す文字が付加されます。 一般に以下のよ
うな形式で結果コードが返されます。
S5-P--S--A
このコードは、ジオコーダが通り住所への単一一致 (S5) を返すことを示し、さらにその一致が通りの
前置方位記号 (P) と通り接尾語 (S) に正確に一致し、Pitney Bowes Software (A) から提供されたデー
タベースを使って取得されたものであることを示します。 一方、家番号 (H)、通り名 (N)、通りタイプ
(T)、都市名 (C)、および郵便番号 (Z) は一致しないため、これらの位置にダッシュが設定されていま
す。
通りレベルで完全に一致すると、住所のすべてのコンポーネントが一致したことを示す、以下の結果
コードが返されます。
S5HPNTSCZA
770
Spectrum™ Technology Platform 8.0.0
第 24 章 : Enterprise Geocoding モジュール
注: マッチングの精度を高めるには、マッチング条件を厳しくします。
マッチ詳細コードは、以下の表に示す順序で並びます。
表 135 : マッチ詳細コード
文字
説明
H
家番号の正確な一致。
P
通りの前置方位記号の正確な一致。
N
通り名の正確な一致。
T
通りタイプの正確な一致。
S
通り接尾語の正確な一致。
C
都市名の正確な一致。
Z
郵便番号の正確な一致。
A
Pitney Bowes Software が提供する Enterprise
Geocoding モジュール データベースのデータに一
致した住所。
U
ユーザ定義ジオコーディング データベースのデー
タに一致した住所。
-
一致しないフィールドがあれば、その文字がダッ
シュに置き換えられます。
複数の候補からの最良の一致 (M カテゴリ)
M カテゴリの一致は、レコードに複数の近似一致候補があり、Spectrum™ Technology Platform がそ
こから最良の 1 つを選択したことを意味します。 S カテゴリと同様に、M カテゴリでもコードの 2 番
目の位置は、返されるポイント オブジェクトの位置的な精度を意味します。
• M1 — 郵便番号セントロイドにポイントが位置付けられた、複数の近似一致。
• M3 — 地理上のセントロイドにポイントが位置付けられた、複数の近似一致。
• M4 — 形状ポイント パスの中心にポイントが位置付けられた、複数の近似一致 (形状ポイントによっ
て通りの多線形の形状が定義されます)。
• M5 — 通り住所位置にポイントが位置付けられた、複数の近似一致 (最高レベルの精度)。
• M6 — ポイント郵便番号の場所にポイントが位置付けられた、複数の近似一致。
• MX — 交差点にポイントが位置付けられた、複数の近似一致。
• M0 — 座標を使用できない複数の近似一致。
ユーザ ガイド
771
国際ジオコーディングの結果コード
結果コード S および M の意味
S または M カテゴリの結果コードでは、8 文字のコードが追加され、住所がデータベース内の住所に
どの程度一致するかが示されます。 これらの文字は、以下の表に示す順序で並びます。 一致しないコ
ンポーネントはダッシュで表わされます。
例えば、S5--N-SCZA という結果コードは、通り名、後置方位記号、都市名、および郵便番号が一致
する単一近似一致を意味します。 ダッシュは、家番号、前置方位記号、および大通りタイプにマッチ
ングがないことを示します。 一致する候補は、通り範囲住所データベースに見つかりました。 このレ
コードは、見つかった候補の通り住所の位置にジオコーディングされます。
カテゴリ
説明
例
H
家番号
18
P
通りの前置方位記号
North
P は、次の条件が 1 つでも満たされた場合に示さ
れます。
• 候補の前置方位記号が、入力の前置方位記号と
一致する。
• 前置方位記号と後置方位記号を入れ替えると、
候補の後置方位記号と入力の前置方位記号が一
致する。
• 入力に前置方位記号が含まれない。
N
通り名
Merivale
T
通りタイプ
St
S
通りの後置方位記号
W
結果コードの S は、次の条件が 1 つでも満たさ
れた場合に示されます。
• 候補の後置方位記号が、入力の後置方位記号に
一致する。
• 前置方位記号と後置方位記号を入れ替えると、
候補の前置方位記号と入力の後置方位記号が一
致する。
• 入力に後置方位記号が含まれない。
772
Spectrum™ Technology Platform 8.0.0
第 24 章 : Enterprise Geocoding モジュール
カテゴリ
説明
例
C
都市名
South Brisbane
Z
郵便番号
4101
A、G、または U
一致する候補の取得に使われるデータベースのタ A
イプ。
• A — 通り範囲住所データベース。
• G — G-NAF Point Address Dictionary (オースト
ラリアのみ)。
• U — 顧客 (ユーザ定義) データベース。
リバース ジオコーディング コード (R カテゴリ)
R カテゴリの一致は、レコードがリバース (逆順序) のジオコーディングで一致したことを意味します。
R 結果コードの 2 番目の文字は、見つかったマッチングのタイプを示します。 R のジオコード結果に
は、マッチングが見つかった辞書を示す追加の文字が含まれます。
リバース ジオコーディング コードの例を以下に示します。
リバース ジオコーディング
コードの例
説明
RS8A
リバース ジオコーディングのポイント/小区画レベルの精度。 住所辞
書から返された候補です。
RS5A
リバース ジオコーディングの補間後の通り候補。 住所辞書から返さ
れた候補です。
RS4A
リバース ジオコーディングの通りセントロイド候補。 住所辞書から
返された候補です。
郵便番号セントロイド一致 (Z カテゴリ)
Z カテゴリの一致は、通りのマッチングが以下のいずれかの理由で成立しなかったことを意味します。
• 郵便番号セントロイドへのマッチングを指定した。 結果のポイントは、4 段階の精度で郵便番号セ
ントロイドに位置付けられます。
• 近似一致が見つからなかった。なおかつ、郵便番号セントロイドへの代替を指定した。
ユーザ ガイド
773
国際ジオコーディング用のカスタム データベース
Z カテゴリには、次の 4 段階の精度があります。
• Z0 — 使用できる座標がない郵便番号一致 (めったにないケース)。
• Z1 — 郵便番号セントロイド一致。
• Z3 — 完全な郵便番号セントロイド一致。 カナダでは、これは FSALDU セントロイドです。
• Z6 — ポイント ZIP の郵便番号セントロイド一致。
地理的セントロイド一致 (G カテゴリ)
G カテゴリでの一致は、その候補が次のいずれかの精度レベルで地理的セントロイドに存在すること
を示します。 すべての精度レベルがすべての国で使用できるわけではありません。
• G0 — 国セントロイド。 Geocode Address World ではこの精度は返されません。
• G1 — 州/省セントロイド。 日本では、これは県の一致を示します。
• G2 — 郡セントロイド。 日本では、これは市の一致を示します。
• G3 — 都市セントロイド。 日本では、これは地方自治体の従属する地区 (大字) の一致を示します。
オーストラリアでは、Local Government Authority (LGA) 情報は G-NAF データベースを使わずに、
通り範囲住所データベースのみで生成できます。
• G4 — 地方セントロイド。 日本では、これは市内の地区 (丁目) の一致を示します。
一致なしコード
次の結果コードは、マッチングがなかったことを示します。
• N — 近似一致はありません。
• NX — 交差点の近似一致はありません。
• ND — Spectrum™ Technology Platform は、入力された郵便番号または地方自治体/州/省のジオコー
ディング データベースを見つけられませんでした。
国際ジオコーディング用のカスタム データベース
カスタム データベースとは
カスタム データベースとは、ジオコーディング時に、標準の Enterprise Geocoding モジュール デー
タベースの代わりに、またはそれに追加して使用することのできる住所および座標のテーブルです。
標準のデータベースよりも新しいか、または正確なデータが存在し、それによってより正確なジオコー
ド結果を得ることができる場合は、カスタム データベースを使用します。 例えば、顧客サイトに対す
る住所ポイント データが存在する場合、これらのサイトのカスタム データベースを作成できます。
カスタム データベースは、レコードのジオコーディングに単体で使用したり、標準データベースと組
み合わせて使用することができます。
774
Spectrum™ Technology Platform 8.0.0
第 24 章 : Enterprise Geocoding モジュール
注: ユーザ辞書を多く使うほど、ジオコーディングの処理パフォーマンスは低下します。
カスタム データベースの機能を以下に示します。
• 標準の通りジオコーディングでサポートされるすべての列は、カスタム データベースに格納できま
す。
• POI (Points Of Interest) ジオコーディングは、カスタム データベースでサポートされます。 郵便ま
たは地理的セントロイド ジオコーディングは、カスタム データベースでサポートされません。
• 部分的な通り名または POI での住所参照は、カスタム データベースでサポートされます。
• カスタム データベースを作成するには、標準データベースが必要です。 カスタム データベースを
作成する際に標準データベースに含まれている内部構造を利用する必要があるからです。
必要条件
カスタム データベースの必要条件を以下に示します。
• ソース データの必要条件(775ページ)
• 列の必要条件(775ページ)
• ファイル名とフォーマットの必要条件(779ページ)
ソース データの必要条件
カスタム データベースのソース データに通りデータが含まれていること。ただし、場所の名前や交差
点が含まれていてもかまいません。 カスタム データベースのソース データは、次の条件に従う必要
があります。
• ライセンスが供与されたエリアを対象とするカスタム データベースのみを作成できます。 例えば、
Adelaide の通りと住所のカスタム データベースを作成する場合、オーストラリア南部またはオース
トラリア全土のデータベースのライセンスを取得する必要があります。
• ソース レコードには、必須の列を含める必要があります。必須のフィールドは、カスタム データ
ベースの作成プロセス中にマップされます。 特定のレコードの必須列に値がない場合、そのレコー
ドはカスタム データベースにインポートされません。 必須列は、国によって異なります。
• ソース レコードは MapInfo テーブル (TAB ファイル) である必要があります。
• MapInfo テーブル (TAB ファイル) には、特定の列を含める必要があります。 データベース作成ユー
ティリティは、TAB ファイルを使ってテーブルをデータベース形式に変換します。 これらの入力列
については、列の必要条件(775ページ)で説明します。
• 交差点セグメントには、それが交差点であることを Spectrum™ Technology Platform が認識できる
1 つ以上の終端が存在する必要があります。
• ソース レコードとして、ポイント オブジェクトまたはセグメントを使用できます。
• テーブルの各行は、通りセグメントに相当します。
列の必要条件
MapInfo テーブル (TAB ファイル) をカスタム データベースに変換するには、そのテーブル内の列名を
指定する必要があります。 必須列は、TAB ファイル内に存在する必要があります。 それ以外の列は
ユーザ ガイド
775
国際ジオコーディング用のカスタム データベース
オプションですが、使用することを推奨します。 オプション列を省くと、好ましくない結果を招く可
能性があります。 必須列が 1 つでも欠けていると、エラー コードが返されます。
オーストラリア
表 136 : オーストラリアの必須入力列 (776ページ) に必須フィールドを示します。
表 136 : オーストラリアの必須入力列
776
フィールド
説明
列の最大長
必須
Street Name
通りの名前
50
X
Town / Suburb
地方自治体
40
X
Postcode
4 桁の郵便番号
4
X
State
州または特別地域の略語。
3
X
Place Name
場所の名前
40
Local Government
Authority
LGA
50
Unit Number
ユニット番号は、ユニット タイプに関
連付けられています。
Unit Type
ユニット タイプには、アパート、建
物、フラット、スイートなどがありま
す。
Left Starting Address
Number
通りの左側にある住所範囲の開始点。 11
詳細については、カスタム データベー
スの範囲順序(780ページ)を参照して
ください。
Right Starting Address
Number
通りの右側にある住所範囲の開始点。 11
詳細については、カスタム データベー
スの範囲順序(780ページ)を参照して
ください。
Spectrum™ Technology Platform 8.0.0
第 24 章 : Enterprise Geocoding モジュール
フィールド
説明
列の最大長
Left Ending Address
Number
通りの左側にある住所範囲の終了点。 11
詳細については、カスタム データベー
スの範囲順序(780ページ)を参照して
ください。
Right Ending Address
Number
通りの右側にある住所範囲の終了点。 11
詳細については、カスタム データベー
スの範囲順序(780ページ)を参照して
ください。
Left Odd/Even indicator
通りの左側に奇数または偶数の住所範 1
囲があることを示します (O=奇数、E=
偶数、B=両方)。 詳細については、カ
スタム データベースの Odd/Even
Indicator(780ページ)を参照してくだ
さい。
必須
この列を含めることを強くお勧めしま
す。
Right Odd/Even indicator 通りの右側に奇数または偶数の住所範 1
囲があることを示します (O=奇数、E=
偶数、B=両方)。 詳細については、カ
スタム データベースの Odd/Even
Indicator(780ページ)を参照してくだ
さい。
この列を含めることを強くお勧めしま
す。
カナダ
表 137 : オーストラリアの必須入力列 (777ページ) に必須フィールドを示します。
表 137 : オーストラリアの必須入力列
フィールド
説明
Left Start Address
通りの左側にある住所範囲の開始点。 10
X
Right Start Address
通りの右側にある住所範囲の開始点。 10
X
ユーザ ガイド
列の最大長
必須
777
国際ジオコーディング用のカスタム データベース
フィールド
説明
列の最大長
必須
Left End Address
通りの左側にある住所範囲の終了点。 10
X
Right End Address
通りの右側にある住所範囲の終了点。 10
X
Street Name
通りの名前。
50
X
Province Abbreviation
州の略語
2
X
Left FSA (segment)
通りの左側の FSA。
3
X
Right FSA (segment)
通りの右側の FSA。
3
X
Left Odd/Even indicator
通りの左側に奇数または偶数の住所範 1
囲があることを示します (O=奇数、E=
偶数、B=両方)。 詳細については、カ
スタム データベースの Odd/Even
Indicator(780ページ)を参照してくだ
さい。
この列を含めることを強くお勧めしま
す。
Right Odd/Even indicator 通りの右側に奇数または偶数の住所範 1
囲があることを示します (O=奇数、E=
偶数、B=両方)。 詳細については、カ
スタム データベースの Odd/Even
Indicator(780ページ)を参照してくだ
さい。
この列を含めることを強くお勧めしま
す。
778
City
都市名
28
Left LDU
通りの左側の LDU。
3
Right LDU
通りの右側の LDU
3
Spectrum™ Technology Platform 8.0.0
第 24 章 : Enterprise Geocoding モジュール
ファイル名とフォーマットの必要条件
カスタム データベースは、次の条件を満たす必要があります。
• ファイル名は 8 文字以下であること。
• カスタム データベースごとにディレクトリを作成してそこに格納すること。
• カスタム データベースまでのパスの最大長は 1,024 文字です。
• 複数のカスタム データベースまでのパスの最大長は 1,024 文字です。
各カスタム データベースは別々のディレクトリに格納するため、同じ名前のカスタム データベースが
複数あってもかまいません。 ただし、カスタム データベース名の重複を避けるのが一般に賢明です。
一部のデータベース ファイルの名前は、データベース名に基づきます。 その他のファイルは、データ
ベースと関係なく、名前が固定されています。 例えば、"ud1" というデータベースの各ファイルの名
前は次のようになります。
postinfo.jdr
postinfo.jdx
lastline.jdr
post2sac.mmj
geo2sac.mmj
sac2fn_ud.mmj
ud1.jdr
ud1.jdx
ud1.bdx
データに場所の名前が含まれる場合、データベースには次のファイルが含まれます。
ud1.pdx
ud1.pbx
また、次のログ ファイルも含まれます。
ud1.log
ud1.err
カスタム データベースの作成
1. User Dictionary Utility をダウンロードします。 www.pbinsight.com/support/product-downloads
に移動し、[Applications] の下で [MapMarker] をクリックしてから [MapInfo User Dictionary
Utility] をクリックします。
注: このユーティリティでは、カスタム データベースを "ユーザ辞書" と呼びます。 これらは同じ
意味の用語です。
ユーザ ガイド
779
国際ジオコーディング用のカスタム データベース
2. MapInfo TAB ファイル (.tab) を作成します (必要条件(775ページ)の説明に従います).
3. User Dictionary Utility を起動します。
4. 必須の情報を入力し、[次へ] をクリックします。
•
[Country] フィールドで、カスタム データベースの国を選択します。
•
[Address Dictionary File] フィールドで、表示されるデータベースを使用するか、選択した国
の標準データベースを参照して選択します。 [Table Name] フィールドで、カスタム データ
ベースのソース データが格納された TAB ファイルを参照します。
5. 必須列を選択してから [次へ] をクリックします。
注: フィールドのラベルと詳細は国によって異なります。 詳細については、列の必要条件(775ペー
ジ)を参照してください。
6. 必要に応じてオプション列を選択してから [次へ] をクリックします。
7. カスタム データベースの出力ディレクトリとファイル名を入力してから [完了] をクリックします。
空のディレクトリを指定する必要があります。 例えば、C:\data に移動し、"TroyUD" という名前
で空のディレクトリを作成します。 ファイルに名前を付けて、このディレクトリに保存します。
例えば、"TroyUD.jdr" というファイル名を使います。
ログ ファイルには、ここまでの操作と作成されたファイルに関する簡易な情報が記録されます。
エラーがあると、ダイアログ ボックスの [Error File] エリアに表示されます。
8. [終了] をクリックします。
カスタム データベースのディレクトリには、カスタム データベース ファイル
(.mmj、.jdr、.jdx、.sdx、または .bdx ファイル拡張子付きのファイル) が格納されます。 ログ ファ
イルとエラー ファイルも同じディレクトリに格納されます。
9. Management Console を起動し、カスタム データベース用に新しいデータベース リソースを定義
します。 詳細については、 Enterprise Geocoding モジュールの国際データベース リソースの追
加(232ページ). Management Console でデータベース リソースを定義した後で、ジオコーディン
グ コンポーネントの [データ] タブでデータベースを選択します。
カスタム データベースの範囲順序
Enterprise Geocoding モジュールは、開始住所と終了住所を比較して住所範囲を決定します。 比較し
た結果は次のいずれかになります。
• 終了住所が開始住所より大きい場合、範囲は昇順です。
• 開始住所が終了住所より大きい場合、範囲は降順です。
• 開始住所が終了住所に等しい場合、範囲は昇順です。
カスタム データベースの Odd/Even Indicator
[Left Odd/Even Indicator] 列と [Right Odd/Even Indicator] 列は、通りセグメントの右/左側に奇数また
は偶数の住所範囲があるかどうかを指定します。 TAB ファイルに奇数/偶数を示す情報が含まれる場
合、[Odd/Even Indicator] 列を使う必要があります。 これらの列によって、ジオコーディングされる住
780
Spectrum™ Technology Platform 8.0.0
第 24 章 : Enterprise Geocoding モジュール
所は通りの正しい側に位置付けられます。 これらの列を省くと、誤った結果が取得される可能性があ
ります。 [Odd/Even Indicator] 列を含めない場合、次のロジックが使われます。
• [Odd/Even Indicator] が指定されず、[Start Address] と [End Address] の両方に値がある場合、開始
と終了の住所番号が同じである場合を除き、[Odd/Even Indicator] の値は [Both] に設定されます。
その結果、住所番号が奇数であればインジケータの値は [Odd] に設定され、偶数であれば [Even] に
設定されます。I
• [Odd/Even Indicator] が指定されず、[Start Address] と [End Address] の両方に値がある場合、
[Odd/Even Indicator] の値は [Both] (奇数と偶数) に設定されます。
[Odd/Even Indicator] が指定されているが、住所番号が同じではない場合、[Odd/Even Indicator] の値
は [Both] に設定されます。
カスタム データベースの交差点
カスタム データベースを使って交差点のジオコーディングを行う場合、1 つ以上の交差点セグメント
の終端が交差点にないと、Enterprise Geocoding モジュールは交差点を認識できません。 この状況が
起こるのは、カスタム データベースの作成に使ったカスタム通りテーブルに含まれるセグメントが、
終端のない交差点で終わる場合です (例 1)。
例 1: カスタム データベース内の交差点には、セグメントに終端がないことがあります。 Enterprise
Geocoding モジュールは、この交差点のジオコードを識別できません。
例 2: 標準データベース内の交差点には、すべてのセグメントに終端があります。 Enterprise Geocoding
モジュールは、この交差点のジオコードを識別できます。
ユーザ ガイド
781
Enterprise Routing モジュー
ル
このセクションの構成
• Enterprise Routing モジュールとは . . . . . . . . . . . . . . . . .784
• Get Travel Boundary . . . . . . . . . . . . . . . . . . . . . . . . . . . . .784
• Get Travel Cost Matrix . . . . . . . . . . . . . . . . . . . . . . . . . . .793
• Get Travel Directions . . . . . . . . . . . . . . . . . . . . . . . . . . . .802
• ルーティング データベース リソース . . . . . . . . . . . . . . . .812
25
Enterprise Routing モジュールとは
Enterprise Routing モジュールとは
Enterprise Routing モジュールは、自動車または徒歩による移動方向を取得し、運転時間と運転距離を
計算し、出発点から特定の時間または距離で到達できる場所を調べる機能を提供します。
Enterprise Routing コンポーネント
• Get Travel Boundary— 等時線または等距離線計算に基づくポリゴンを取得できます。 等時線と
は、始点から一定時間内に道路を通って到達できるエリアを表すポリゴンまたはポイントの集まり
です。 等距離線とは、始点から一定距離の移動で到達できるエリアを表すポリゴンまたはポイント
の集まりです。 詳細については、Get Travel Boundary(784ページ)を参照してください。
• Get Travel Cost Matrix— 複数の始点および終点の間の移動時間と距離を計算します。 詳細につい
ては、Get Travel Cost Matrix(793ページ)を参照してください。
• Get Travel Directions— ある地点から別の地点、または、ある地点から複数の他の地点へのルート
を取得できます。 詳細については、Get Travel Directions(802ページ)を参照してください。
Get Travel Boundary
Get Travel Boundary は、ロケーションから一定の時間または距離で、車両または徒歩で到達可能なエ
リアの境界を示します。 この機能では、等時線または等距離線の計算に基づくポリゴンを取得しま
す。 等時線とは、始点から一定時間内に道路を通って到達できるエリアを表すポリゴンまたはポイン
トの集まりです。 等距離線とは、始点から一定距離の移動で到達できるエリアを表すポリゴンまたは
ポイントの集まりです。 始点の緯度/経度と終点の緯度/経度を入力として受け取り、ステージの設定
方法によって、最速または最短ルートを返します。
Get Travel Boundary は、Enterprise Routing モジュールに含まれています。 このモジュールの詳細
(これに含まれるその他のコンポーネント等) については、Enterprise Routing コンポーネント(784ペー
ジ) を参照してください。
Get Travel Boundary の動作方法を理解するには、Management Console の [プレビュー] タブを使用し
て、以下の手順を実行してください。
1. Management Console を開きます。
2. [サービス] ノードの下で、[Get Travel Boundary] を選択します。
3. [オプション] タブで、必要なオプションを指定します。 オプションの詳細については、経路オプ
ション(788ページ) を参照してください。
4. [プレビュー] タブをクリックします。
5. [Latitude] セルに緯度情報、[Longitude] セルに経度情報を入力します。 または、この情報をセルに
貼り付けることもできます。複数のセルへの貼り付けも可能です。 タブによって区切られた 2 列
784
Spectrum™ Technology Platform 8.0.0
第 25 章 : Enterprise Routing モジュール
分のデータがある場合は、データをハイライト表示して、最初の [Latitude] セルに貼り付けること
ができます。 データの数に応じて、(緯度と経度の) 複数の行にデータが入力されます。
6. [プレビューを実行] をクリックします。
7. [プレビュー出力] に、"IsoNodeResponse" と "IsoPolygonResponse" が表示されます。
入力
Get Travel Boundary は、コスト、コスト単位、ポイント緯度、およびポイント経度を入力として受け
取ります。 以下の表に、入力のフォーマットとレイアウトに関する情報を示します。
注: Get Travel Boundary サービスを操作する場合は、これが Web サービスとしてのみ利用可能であ
ることに注意してください。 Get Travel Cost Matrix を、Java、C++、C、.NET、または COM
API を介して利用することはできません。
表 138 : Get Travel Boundary 入力データ
フィールド名
書式
説明/有効値
Latitude
String
ポイントの緯度。 [座標フォーマット] オプション
で選択したフォーマットで緯度を指定します。
Longitude
String
ポイントの経度。 [座標フォーマット] オプション
で選択したフォーマットで経度指定します。
TravelBoundaryCost
String
(オプション) [TravelBoundaryCostUnits] フィール
ドまたは [デフォルト コスト単位] オプションで
指定された単位で表わされた距離または時間のコ
スト。 例えば、指定された単位がマイルのときに
このフィールドに 10 を指定すると、コストは 10
マイルになります。
このフィールドを使って、デフォルト経路境界コ
ストをレコード単位で上書きできます。
TravelBoundaryCostUnits
String
(オプション) 経路境界の計算に使用される計測単
位のタイプ。 次のいずれかです。
•
•
•
•
•
•
ユーザ ガイド
Feet
Hours
Kilometers
Meters
Miles
Minutes
785
Get Travel Boundary
フィールド名
書式
説明/有効値
• Seconds
• Yards
このフィールドを使って、デフォルト経路境界コ
スト単位をレコード単位で上書きできます。
Options
Get Travel Boundary では、Management Console グラフィカル ユーザ インターフェイスを使用して、
デフォルトの処理オプションを設定できます。 クライアント API または Enterprise Designer 等の ク
ライアント ツールを使用して、Get Travel Spectrum™ Technology PlatformBoundary 呼び出しの設定
を個別にオーバーライドできます。
Management Console やカスタム インターフェイスを介してシステム レベルのデフォルト値を指定し
ていない場合、呼び出し時に Get Travel Boundary から処理オプションが引き渡されないと、Spectrum™
Technology Platform は、以下のセクションに示すデフォルト オプションを使用します。
以下の表に、Get Travel Boundary の構成オプションを示します。
入力オプション
表 139 : Get Travel Boundary 入力オプション
オプション
説明/有効値
データベース
検索プロセスで使用するデータが格納されたデータベースの名前。Enterprise
Routing モジュールのルーティング データベース リソース ツールで指定さ
れたデータベース名を使用してください。 詳細については、Enterprise
Routing モジュールのデータベース リソースの追加(234ページ).
座標系
入力される座標の座標系。 フォーマットは、European Petroleum Survey
Group (EPSG) コード、SRID コード、または MAPINFO コードでなければ
なりません。 codespace:code という形式で、座標参照系を指定します。
例えば、緯度/経度 (WGS 84) で表されるジオメトリは、EPSG:4326 とな
ります。 デフォルト値は、緯度/経度 (WGS 84) として知られる EPSG:4326
です。 これは、世界規模の座標系であり、ナビゲーションや測量に広く使
用されている NAVSTAR Global Positioning System (GPS: 全地球測位シス
テム) に関連付けられた地球基準座標系です。 この測地系は、地球の中心
("地心") を原点とし、衛星および地上データによって定義されています。
以下の表に、使用頻度の高い EPSG コードを示します。
786
Spectrum™ Technology Platform 8.0.0
第 25 章 : Enterprise Routing モジュール
オプション
座標フォーマット
説明/有効値
座標系
EPSG コード
緯度/経度 (WGS 72)
4322
緯度/経度 (WGS 84)
4326
緯度/経度 (NAD 83)
4269
緯度/経度 (OSGB 36)
4277
British National Grid
27700
入力に使う緯度/経度の座標フォーマットを指定します。
注: このオプションは、緯度/経度座標系を指定した場合のみに使用しま
す。 座標系が緯度/経度座標系ではない場合は、座標フォーマットを
[小数] に設定します。
次のいずれかです。
小数度
(90.000000, 180.000000)
想定小数度
(90000000, 180000000)。 こちらがデフォ
ルトです。
度-分-秒
(90 00 00N, 180 00 00W)
ゼロ補完想定小数度
(090000000N, 180000000W)
ゼロ補完小数度
(090.000000N, 180.000000W)
デフォルト コスト
コスト単位の値。 デフォルトは 10 です。
デフォルト コスト単位
経路境界の計算に使う測定単位。 次のいずれかです。
• フィート
• キロメートル (デフォルト)
• メートル
• マイル
• 分
• 秒
• ヤード
ユーザ ガイド
787
Get Travel Boundary
Output オプション
表 140 : Get Travel Boundary 出力オプション
オプション
説明/有効値
結果タイプ
返す結果のタイプを指定します。 次のいずれかです。
アクセス可能なノード isoChrone 全体を返します。
ジオメトリ
isoChrone 計算に到達しうる、道路沿いのす
べてのポイントを返します。
始点ノード
入力される住所で指定される場所を返しま
す。
簡略化係数
元のポイントをどの割合で返す必要があるか (結果のポリゴンの基に
なるポイントの割合) を指定します。
境界線表示形式
結果に使用する境界線表示形式を指定します。 境界線表示形式は、複
数のコストに基づいて表示できる複数の isoChrone または境界線のタ
イプです。
ドーナツ型
境界は、次に小さな境界をくり抜く方法で確定さ
れます。
包囲型
境界は、他のすべての境界から独立して確定され
ます。
境界内の到達不可能領域を返 境界内の到達不可能領域を返すかどうかを指定します。これは、道順
す
に従って適切な時間または距離で到達できない、より大きな境界内に
存在する領域を指します。
境界外の到達可能領域を返す 境界外の到達可能領域を返すかどうかを指定します。これは、適切な
時間または距離で到達できない、主要境界の外にある小さな領域で
す。
経路オプション
経路オプションでは、道路以外を移動する際の移動速度や、経路境界を計算する際に幹線道路のみを
走行するかどうかなどを指定します。 多くの経路オプションは、一般道走行速度に関連するもので
す。
788
Spectrum™ Technology Platform 8.0.0
第 25 章 : Enterprise Routing モジュール
表 141 : Get Travel Boundary 経路オプション
オプション
説明/有効値
道路外距離の最大値
道路以外を移動する距離の最大値を指定します。 道路以外
とは、私道や進入路などのことです。 例えば、道路外距離
の最大値を 1 マイルと指定すると、道路から 1 マイル以上
離れた地点は、経路境界に含まれません。 道路外距離の最
大値として 0 を指定すると、道路から少しでもそれた地点
は経路境界に含まれません。 道路以外を移動する際の速度
は、一般道走行速度オプションによって指定します。
距離単位
返されるデータの単位を指定します。 次のいずれかです。
• キロメートル (デフォルト)
• メートル
• マイル
幹線道路のみを走行する
計算時に、すべての道路を含めるか、幹線道路のみを含め
るかを指定します。 幹線道路のみを含めるように指定した
場合は、パフォーマンスは向上しますが精度は低くなる場
合があります。
次のマップは、すべての道路を走行する場合の経路境界を
表します。
ユーザ ガイド
789
Get Travel Boundary
オプション
説明/有効値
次のマップは、幹線道路のみを走行する場合の経路境界を
表します。
デフォルト一般道走行速度
経路境界を検索するために使用する、道路以外を移動する
際の速度を指定します。 道路以外とは、私道や進入路など
のことです。
このオプションは、[デフォルト コスト単位] オプション、
または入力フィールド "TravelBoundaryCostUnits" で時間値
を指定した場合のみ有効です。 デフォルト値は 15 です。
速度の単位は、 [一般道走行速度単位] オプションで指定し
ます。
経路境界計算において道路外の移動の処理を制御するには、
道路外を移動する際の速度 (一般道走行速度) を指定する必
要があります。 一般道走行速度は、経路境界を表すポリゴ
ンの大きさや形状に影響を与える可能性があります。 一般
的には、一般道走行速度が速いほど、ポリゴンは大きくな
ります。 例えば、あと 5 分の移動が可能で、一般道走行速
度が 15 マイル/時の場合は、到達可能地点まで 1.25 マイル
の距離があることになります。 一般道走行速度を 10 マイ
ル/時に落とすと、到達可能地点までの距離は 0.83 マイルに
なります。 [道路外距離の最大値] オプションを使用するこ
790
Spectrum™ Technology Platform 8.0.0
第 25 章 : Enterprise Routing モジュール
オプション
説明/有効値
とにより、道路外を移動する距離を制限できることに注意
してください。
注: 歩行者の経路境界を計算する場合は、デフォルト一般
道走行速度を 3 MPH (5 KPH) に変更することを推奨し
ます。
一般道走行速度単位
[デフォルト一般道走行速度] オプションで指定する値に使用
する単位を指定します。デフォルトは、マイル/時です。
一般道走行速度のオーバーライド値
道路の種類ごとに、道路外を移動する際の一般道走行速度
を指定します。 道路の種類に対する一般道走行速度を指定
しない場合は、[デフォルト一般道走行速度] オプションで指
定されたデフォルト一般道走行速度が適用されます。
次のマップは、一般道走行速度のオーバーライド値を指定
しない場合の経路境界の例を示しています。
比較のために、一般道走行速度のオーバーライド値を指定
した場合の、上と同じ経路境界を次のマップに示します。
ユーザ ガイド
791
Get Travel Boundary
オプション
説明/有効値
出力
Get Travel Boundary は、次のフィールドを返します。
表 142 : Get Travel Boundary 出力
オプション
Status
Status.Code
書式
String
String
説明/有効値
マッチの成功または失敗を報告します。
NULL
成功
F
失敗
失敗の原因 (ある場合)。 次のいずれかです。
• InsufficientInputData (緯度/経度の欠落)
• MalformedInputData (誤った入力フォーマット)
• InputOutOfRange (範囲外の入力)
• EngineError (エンジン由来のエラー)
792
Spectrum™ Technology Platform 8.0.0
第 25 章 : Enterprise Routing モジュール
オプション
Status.Description
書式
String
説明/有効値
Status.Code で示される失敗に関する説明。
Get Travel Cost Matrix
Get Travel Cost Matrix は、複数の始点と終点の間の移動時間と距離を計算します。 Get Travel Cost
Matrix を使用して、複数の始点から複数の終点の間の最短または最速ルートを検索し、個々のルート
の合計時間および距離 (ルート コスト) を算出できます。 例えば、4 つの始点 (S1 〜 S4) と 4 つの終
点 (E1 〜 E4) を入力した場合、次の図に示すように合計 16 件のルートが返されます。
マトリクス ルーティングは主に、消防署や警察署といった特定のサービスの応答時間および範囲を特
定するために使用します。 最初の通報から 20 分以内に事故または事件に対応できる人員を 1 人以上
配備するといったサービス レベル アグリーメント (SLA) の、正確な保証範囲を提示するために、この
ような計算が必要になる場合があります。 この計算を分析ツールとして使用することにより、救急
車、警察官、または消防隊員が、合理的な時間以内に不動産/人物まで駆けつけられる確率に基づい
て、保険対象の不動産および人物のリスクを判定できます。
注: Get Travel Cost Matrix をサービスとして利用する場合は、これが Web サービスとしてのみ利用
可能であることに注意してください。 Get Travel Cost Matrix を、Java、C++、C、.NET、または
COM API を介して利用することはできません。
入力
Get Travel Cost Matrix への入力は、緯度/経度の座標で表された一連の始点と終点です。 また、ユー
ザ定義フィールドを含めることもできます。
入力する始点と終点の順番によって、応答の順番が決まります。 例えば、要求で 2 つの始点と 2 つの
終点を指定した場合、応答に含まれる順番は、 S1 から E1、S1 から E2、S2 から E1、S2 から E2 と
なります (S は始点、E は終点を表します)。
Get Travel Cost Matrix をジョブで使うときは、フラット データをリストに変換する必要があります。
そうする必要があるのは、ジョブの入力データが、ファイルまたはデータベースから読み取られるフ
ラット データであるのに対し、Get Travel Cost Matrix は入力をリスト フォーマットとして受け取る
からです。 フラット データをリストに変換するには、Transformer ステージを使ってカスタム トラン
スフォームを作成します。
ユーザ ガイド
793
Get Travel Cost Matrix
表 143 : Get Travel Cost Matrix 入力
フィールド名
説明/有効値
Latitude
始点または終点の緯度。 [座標フォーマット] オプションで選択された
フォーマットを使って緯度を指定します。
Longitude
始点または終点の経度。 [座標フォーマット] オプションで選択された
フォーマットを使って経度を指定します。
ID
ポイントに割り当てる識別子。 ポイントを表す英数字の ID を指定し
ます。 この ID は、出力の [StartPointID] フィールドまたは [EndPointID]
フィールドに対応します。
入力例
以下の入力例は、3 つの始点と 3 つの終点を示します。 始点には A、B、C という ID が付与され、終
点には X、Y、Z という ID が付与されています。ここをクリックして、これらの ID が出力にどのよう
に対応するかを確認してください。
794
Spectrum™ Technology Platform 8.0.0
第 25 章 : Enterprise Routing モジュール
Options
ルーティング オプション
表 144 : ルーティング オプション
オプション
データベース
最適化方法
説明
検索プロセスで使用するデータが格納されたデータベースの名
前。 Enterprise Routing モジュールのルーティング データベース
リソース ツールで指定されたデータベース名を使用してくださ
い。 詳細については、 Enterprise Routing モジュールのデータ
ベース リソースの追加(234ページ).
最短距離または最短時間のどちらを検索するかを指定します。
次のいずれかです。
最速/最短ルートのみを返す
最短時間
移動時間が最短となるように最適化します。
こちらがデフォルトです。
最短距離
移動距離が最短となるように最適化します。
始点/終点の各組み合わせに対し、最適化ルートのみを返すかどう
かを指定します。 最適化ルートとは、 [最適化方法] オプション
の選択によって、最速ルートまたは最短ルートのいずれかになり
ます。
例えば、1 つの始点 (S1) と 2 つの終点 (E1 および E2) があり、
S1 から E2 への移動時間の方が S1 から E1 への移動時間よりも
短く、かつ、最適なルートのみを返すと指定した場合は、S1 か
ら E2 へのルート コスト情報のみが返されます。
ルート コスト マトリクス フォー ルート コスト マトリクスのデータ フォーマットを指定します。
マット
次のいずれかです。
階層
ルート コスト マトリクスは、Management Console、
Enterprise Designer、または Interactive Driver で表示
可能なリストとして返されます。これらのツールでデー
タを表示する場合、または、テーブル形式でデータを
処理する場合は、このオプションを選択します。 こち
らがデフォルトです。
オブ
ルート コスト マトリクスは、直接操作することのでき
ジェク ないデータ オブジェクトとして返されます。 出力を
ト
データフローや Web サービス呼び出しの他のステージ
に直接送信する場合、または、マッピング ソフトウェ
アへの入力など、他のアプリケーションでルートを表
ユーザ ガイド
795
Get Travel Cost Matrix
オプション
説明
示するために使用する場合のみ、このオプションを選
択してください。
座標系
入力される座標の座標系。 フォーマットは、European Petroleum
Survey Group (EPSG) コード、SRID コード、または MAPINFO
コードでなければなりません。 codespace:code という形式
で、座標参照系を指定します。 例えば、緯度/経度 (WGS 84) で
表されるジオメトリは、EPSG:4326 となります。 デフォルト値
は、緯度/経度 (WGS 84) として知られる EPSG:4326 です。 これ
は、世界規模の座標系であり、ナビゲーションや測量に広く使用
されている NAVSTAR Global Positioning System (GPS: 全地球測
位システム) に関連付けられた地球基準座標系です。 この測地系
は、地球の中心 ("地心") を原点とし、衛星および地上データに
よって定義されています。
以下の表に、使用頻度の高い EPSG コードを示します。
座標フォーマット
座標系
EPSG コード
緯度/経度 (WGS 72)
4322
緯度/経度 (WGS 84)
4326
緯度/経度 (NAD 83)
4269
緯度/経度 (OSGB 36)
4277
British National Grid
27700
入力に使う緯度/経度の座標フォーマットを指定します。
注: このオプションは、緯度/経度座標系を指定した場合のみに
使用します。 座標系が緯度/経度座標系ではない場合は、座
標フォーマットを [小数] に設定します。
次のいずれかです。
796
小数度
(90.000000, 180.000000)。 こちらが
デフォルトです。
想定小数度
(90000000, 180000000)。
度-分-秒
(90 00 00N, 180 00 00W)
ゼロ補完想定小数度
(090000000N, 180000000W)
ゼロ補完小数度
(090.000000N, 180.000000W)
Spectrum™ Technology Platform 8.0.0
第 25 章 : Enterprise Routing モジュール
オプション
説明
距離単位
Get Travel Cost Matrix が返す距離の値の単位を指定します。 次
のいずれかです。
時間単位
フィート
距離をフィートで返します。
キロメートル
距離をキロメートルで返します。
メートル
距離をメートルで返します。
マイル
距離をマイルで返します。 こちらがデフォ
ルトです。
ヤード
距離をヤードで返します。
時間の返し方を指定します。 次のいずれかです。
時間
時間を時間数で返します。
分
時間を分数で返します。 こちらがデフォルトで
す。
秒
時間を秒数で返します。
経路オプション
この優先設定セットを使用して、道路タイプごとに望ましさを設定することができます。 例えば、
サーバーがすべての幹線道路タイプを回避するよう要求することができます。
表 145 : 経路の優先設定オプション
オプション
説明/有効値
道路の優先設定
ルート決定時にさまざまな道路に与える優先順位を指定します。
優先順位を設定できるのは次の道路タイプです。
• 進入路
• 脇道
• 接続道路
• フェリー
• 小道
• 出入制限道路 (密集都市部)
• 出入制限道路 (農村部)
• 出入制限道路 (郊外)
ユーザ ガイド
797
Get Travel Cost Matrix
オプション
説明/有効値
• 出入制限道路 (都市部)
• 地方道路 (密集都市部)
• 地方道路 (農村部)
• 地方道路 (郊外)
• 地方道路 (都市部)
• 主要地方道路 (密集都市部)
• 主要地方道路 (農村部)
• 主要地方道路 (郊外)
• 主要地方道路 (都市部)
• 幹線道路 (密集都市部)
• 幹線道路 (農村部)
• 幹線道路 (郊外)
• 幹線道路 (都市部)
• 補助地方道路 (密集都市部)
• 補助地方道路 (農村部)
• 補助地方道路 (郊外)
• 補助地方道路 (都市部)
• 一般道路 (密集都市部)
• 一般道路 (農村部)
• 一般道路 (郊外)
• 一般道路 (都市部)
• 一級高速道路 (密集都市部)
• 一級高速道路 (農村部)
• 一級高速道路 (郊外)
• 一級高速道路 (都市部)
• 出入路 (密集都市部)
• 出入路 (出入制限道路)
• 出入路 (幹線道路)
• 出入路 (一級高速道路)
• 出入路 (農村部)
• 出入路 (二級高速道路)
• 出入路 (郊外)
• 出入路 (都市部)
• 二級高速道路 (密集都市部)
• 二級高速道路 (農村部)
• 二級高速道路 (郊外)
798
Spectrum™ Technology Platform 8.0.0
第 25 章 : Enterprise Routing モジュール
オプション
説明/有効値
• 二級高速道路 (都市部)
道路タイプごとに、次のいずれかを指定できます。
回避
この道路タイプを可能な限りルートで使用しません。
注: 特定の道路タイプを道順から常に除外できるとは限りま
せん。 状況によっては、回避対象の道路タイプの代わり
になるものが非常に貧弱なために回避対象の道路タイプ
を使うルートが選ばれることがあります。 また、始点ま
たは終点がセグメントの横にあって、そのセグメントの
道路タイプが回避されている場合も、そのセグメントが
使われます。
高
この道路タイプを他の道路タイプよりも優先します。
低
他の道路タイプをこの道路タイプよりも優先します。
中
この道路タイプに他の道路タイプと同じ優先設定を与えま
す。 道路タイプに優先設定を指定しないと、デフォルトとし
て "中" が使われます。
出力
Get Travel Cost Matrix からの出力には多数のルート シーケンスが含まれます。各ルート シーケンス
には、マトリクス ルートで使用される候補の始点と終点、および計算された各ルートの時間と距離が
含まれます。 [最適化方法] オプションの設定によって、出力にマトリクスのすべてのルートを含める
ことも、各始点/終点間の最適ルートのみを含めることもできます。
Get Travel Cost Matrix でマトリックスの始点と終点の間にルートが見つからないと、サーバー ログに
エラーが記録されますが、確認できたルートはすべて返されます。 例えば、始点 A と終点 1 および 2
があって、Get Travel Cost Matrix が A から 1 へのルートは見つけられても、A から 2 へのルートを見
つけられない場合、Get Travel Cost Matrix は A から 1 へのルートを返し、A から 2 へのルートは見つ
けられなかったことをログに記録します。
Get Travel Cost Matrix の出力は、[ルート コスト マトリクスを返す] オプションの設定に応じて、リ
スト形式かオブジェクト形式になります。 オブジェクト出力を直接操作することはできません。
ユーザ ガイド
799
Get Travel Cost Matrix
表 146 : Get Travel Cost Matrix の出力
要素名
書式
Distance
String
DistanceUnits
String
EndPointRef
String
EndPointID
String
説明/有効値
始点から終点までの距離。 値の単位は、DistanceUnits 要素に
設定された単位になります。
距離に使用される単位です。 次のいずれかです。
Feet
距離はフィート単位です。
Kilometers
距離はキロメートル単位です。
Meters
距離はメートル単位です。
Miles
距離はマイル単位です。 こちらがデフォルト
です。
Yards
距離はヤード単位です。
入力で終点が指定された順序に対応する参照 ID。 最初に指定
された終点の参照 ID は 1、2 番目に指定された終点の参照 ID
は 2、以降も同様になります。 入力の緯度/経度座標を Get Travel
Cost Matrix が返す参照 ID と関連付ける独自プロセスを作成す
る必要があります。
Input ステージの ID フィールドで、対応する終点に割り当てた
ID。 例えば、最初の終点の EndPointID が N、2 つめの終点の
EndPointID が O (以下同様) となっている場合があります。
注: このフィールドが有効になるのは、[ルート コスト マトリ
クス フォーマット] フィールドが [階層] に設定されている
場合だけです。
800
StartPointRef
String
StartPointID
String
入力で始点が指定された順序に対応する参照 ID。 最初に指定
された始点の参照 ID は 1、2 番目に指定された始点の参照 ID
は 2、以降も同様になります。 入力の緯度/経度座標を Get Travel
Cost Matrix が返す参照 ID と関連付ける独自プロセスを作成す
る必要があります。
Input ステージの ID フィールドにおいて対応する始点に割り当
てた識別子。 例えば、最初の始点の StartPointID が A、2 つめ
の始点の StartPointID が B (以下同様) となっている場合があり
ます。
Spectrum™ Technology Platform 8.0.0
第 25 章 : Enterprise Routing モジュール
要素名
書式
説明/有効値
注: このフィールドが有効になるのは、[ルート コスト マトリ
クス フォーマット] フィールドが [階層] に設定されている
場合だけです。
Time
String
TimeUnits
String
Status
文字列
[1]
始点から終点までの合計時間。 値の単位は、TimeUnits 要素に
設定された単位になります。
時間に使用される単位です。 次のいずれかです。
Hours
単位は時間になります。
Minutes
単位は分になります。 こちらがデフォルト
です。
Seconds
単位は秒になります。
マッチが成功したか失敗したかを表します。
NULL
成功
F
失敗
Status.Code
文字列
[100]
失敗の原因 (ある場合)。
Status.Description
String
Status.Code に示された失敗の説明です。
サンプル出力
以下のサンプル出力は、サンプル入力で割り当てられた StartPointID (入力時にそれぞれ A、B、C と
いう名前が付けられている) が、ポイントのリストの最初の 3 つのエントリ (Spectrum™ Technology
Platform によってそれぞれ 1、2、3 と番号が付けられている) に対応することを示します。 また、最
初の EndPointID (入力時に X という名前が付けられています) が、3 つすべての StartPointID からの最
も効率的なルートであることを示しています。最も効率の良いルートは EndPointID X であるため、他
の 2 つの EndPointID (入力時に Y および Z という名前が付けられています) は以下には示されていま
せん。
ユーザ ガイド
801
Get Travel Directions
Get Travel Directions
Get Travel Directions は、2 つの地点または複数の地点に対するルート情報を返すことができるツール
です。 始点の緯度/経度と終点の緯度/経度を入力として受け取り、ステージの設定方法によって、最
速または最短ルートを返します。
国ごとに、次の形式の名前が付けられた固有のデータベースがあります。 Enterprise Routing モジュー
ル - <国名> 各データベースには、固有の国コードも付与されています。 例えば、オーストリアのデー
タベースの名前は、"Enterprise Routing モジュール - オーストリア" で、オーストリアのバッチ国コー
ドは "A1T" です。 データベースごとに個別のライセンスが必要です。
Get Travel Directions は、Enterprise Routing モジュールに含まれています。 このモジュールの詳細
(これに含まれるその他のコンポーネント等) については、Enterprise Routing コンポーネント(784ペー
ジ) を参照してください。
Get Travel Directions の動作方法を理解するには、Management Console の [プレビュー] タブを使用
して、以下の手順を実行してください。
1. Management Console を開きます。
2. [サービス] ノードの下で、[Get Travel Directions] を選択します。
3. [オプション] タブで、必要なオプションを指定します。 オプションの詳細については、Options
(804ページ) を参照してください。
4. [プレビュー] タブをクリックします。
5. 以下に示すように、[RoutePoints] セルの中をクリックします。
6. [Latitude] セルに緯度情報、[Longitude] セルに経度情報を入力します。 または、この情報をセルに
貼り付けることもできます。複数のセルへの貼り付けも可能です。 タブによって区切られた 2 列
分のデータがある場合は、データをハイライト表示して、最初の [Latitude] セルに貼り付けること
ができます。 データの数に応じて、(緯度と経度の) 複数の行にデータが入力されます。
802
Spectrum™ Technology Platform 8.0.0
第 25 章 : Enterprise Routing モジュール
注: データをインポートしたり、階層構造の表示を水平方向から垂直方向に変更したりすること
はできないため、[データのインポート] と [表示] ボタンはグレイ表示されています。
7. [プレビューを実行] をクリックします。
8. [プレビュー出力] の下で、[+] 記号をクリックすることにより、データを展開します。
道順が表示されます。
入力
Get Travel Directions は、始点と終点の緯度/経度座標を含むルート ポイントを入力として受け取りま
す。 以下の表に、入力のフォーマットとレイアウトに関する情報を示します。
注: GetTravelDirections サービスを操作する場合は、これが Web サービスとしてのみ利用可能であ
ることに注意してください。 Get Travel Directions サービスを、Java、C++、C、.NET、または
COM API を介して利用することはできません。
表 147 : Get Travel Directions の入力データ
フィールド名
書式
説明/有効値
RoutePoints
リスト
緯度と経度の文字列が含まれるスキーマです。
プロセス リストの作成については、を参照してください。
プロセス リスト(44ページ)
Language
String
Get Travel Directions が道順を返す言語を指定します。
次のいずれかです。
ユーザ ガイド
da
デンマーク語で道順を返します。
nl
オランダ語で道順を返します。
en
英語で道順を返します。 デフォルト
en_US
アメリカ英語で道順を返します。
fi
フィンランド語で道順を返します。
fr
フランス語で道順を返します。
803
Get Travel Directions
フィールド名
書式
説明/有効値
de
ドイツ語で道順を返します。
it
イタリア語で道順を返します。
no
ノルウェー語で道順を返します。
pt
ポルトガル語で道順を返します。
es
スペイン語で道順を返します。
sv
スウェーデン語で道順を返します。
注: この入力フィールドに入力した値は、[デフォルト言語]
オプションの値に優先して適用されます。
Options
Get Travel Directions では、Management Console グラフィカル ユーザ インターフェイスを使用し
て、デフォルトの処理オプションを設定できます。 クライアント API や、Enterprise Designer 等の
Spectrum™ Technology Platform クライアント ツールを使用して、呼び出しの設定を個々にオーバー
ライドできます。
Management Console やカスタム インターフェイスを介してシステムレベルのデフォルト値を指定し
ていない場合に、呼び出し時に Get Travel Directions から処理オプションが引き渡しされないと、
Spectrum™ Technology Platform は、次のセクションに示すデフォルト オプションを使用します。
ルーティング
以下の表に、Get Travel Directions の構成オプションを示します。
表 148 : Get Travel Directions の構成オプション
804
オプション
説明/有効値
データベース
検索プロセスで使用するデータが格納されたデータベースの名前。
Management Console のデータベース リソース ツールで指定したデー
タベース名を使用してください。 詳細については、 Location
Intelligence モジュール Centrus データベース リソースの追加
(234ページ) .
最適化方法
Get Travel Directions が最短距離または最短時間のどちらを検索する
かを指定します。
Spectrum™ Technology Platform 8.0.0
第 25 章 : Enterprise Routing モジュール
オプション
説明/有効値
次のいずれかです。
座標系
最短時間
移動時間が最短となるように最適化します。 こち
らがデフォルトです。
最短距離
移動距離が最短となるように最適化します。
入力される座標の座標系。 フォーマットは、European Petroleum
Survey Group (EPSG) コード、SRID コード、または MAPINFO コー
ドでなければなりません。 codespace:code という形式で、座標参
照系を指定します。 例えば、緯度/経度 (WGS 84) で表されるジオメ
トリは、EPSG:4326 となります。 デフォルト値は、緯度/経度 (WGS
84) として知られる EPSG:4326 です。 これは、世界規模の座標系で
あり、ナビゲーションや測量に広く使用されている NAVSTAR Global
Positioning System (GPS: 全地球測位システム) に関連付けられた地球
基準座標系です。 この測地系は、地球の中心 ("地心") を原点とし、衛
星および地上データによって定義されています。
以下の表に、使用頻度の高い EPSG コードを示します。
座標フォーマット
座標系
EPSG コード
緯度/経度 (WGS 72)
4322
緯度/経度 (WGS 84)
4326
緯度/経度 (NAD 83)
4269
緯度/経度 (OSGB 36)
4277
British National Grid
27700
入力に使う緯度/経度の座標フォーマットを指定します。
注: このオプションは、緯度/経度座標系を指定した場合のみに使用し
ます。 座標系が緯度/経度座標系ではない場合は、座標フォーマッ
トを [小数] に設定します。
次のいずれかです。
ユーザ ガイド
小数度
(90.000000, 180.000000)。 こちらがデ
フォルトです。
想定小数度
(90000000, 180000000)。
度-分-秒
(90 00 00N, 180 00 00W)
805
Get Travel Directions
オプション
道順形式
説明/有効値
ゼロ補完想定小数度
(090000000N, 180000000W)
ゼロ補完小数度
(090.000000N, 180.000000W)
道順を返すフォーマットを指定します。
次のいずれかです。
距離単位
標準
標準フォーマットで道順を返します。 こちらがデフォル
トです。
簡易
簡易フォーマットで道順を返します。 簡易フォーマット
の道順は、ワイヤレス機器に適しています。
Get Travel Directions が返す距離の値の単位を指定します。
次のいずれかです。
時間単位
フィート
距離をフィートで返します。
キロメートル
距離をキロメートルで返します。
メートル
距離をメートルで返します。
マイル
距離をマイルで返します。 こちらがデフォル
トです。
ヤード
距離をヤードで返します。
Get Travel Directions が返す時間の値の単位を指定します。
次のいずれかです。
優先項目
806
時間
時間を時間数で返します。
分
時間を分数で返します。 こちらがデフォルトです。
秒
時間を秒数で返します。
ルートの優先項目を指定します。 優先項目が指定されたルートは、
ルートの始点または終点のいずれかに着目した、ルート全体のサブ
セットになります。 始点を優先項目とするルートは、始点から最初の
主要な高速道路まで (その高速道路を含む) のルートを示します。 終
点を優先項目とするルートは、ルートの中の最後の主要な高速道路 (そ
の高速道路を含む) から目的地までのルートを示します。 ルートに主
Spectrum™ Technology Platform 8.0.0
第 25 章 : Enterprise Routing モジュール
オプション
説明/有効値
要な高速道路がない場合、優先項目が指定されたルートは優先項目の
ないルートと同じになります。
次のいずれかです。
通過点を最適化
始点
ルートの最初のみを返します。
終点
ルートの最後のみを返します。
なし
ルート全体を返します。 こちらがデフォルトです。
Get Travel Directions で、ルート計算時に通過点を最適な順序に並べ
替えるかどうかを指定します。
道順
表 149 : Get Travel Directions 道順オプション
オプション
説明/有効値
距離を表示する
ルートの距離を返すかどうかを指定します。
テキスト表示の道順を返す
ルートの道順を進路変更ごとに示すかどうかを指定します。 このオプ
ションは、デフォルトで有効になっています。
セグメント ジオメトリを返す ルート内のセグメントのジオメトリを表す緯度/経度ポイントの集合を
返すかどうかを指定します。 セグメント ジオメトリは、ルート ジオ
メトリを作成するために使用します。 このフィールドの出力は、
RouteDirections 出力フィールド内に表示されます。 ルート ジオメト
リの詳細については、ルート ジオメトリとは(808ページ)を参照して
ください。
ルート ジオメトリを返す
ルート ジオメトリを表す緯度/経度ポイントの集合を返すかどうかを
指定します。 ルート ジオメトリは、ルート マップの作成およびルー
トに関する分析の実行に使用できます。
ルート ジオメトリを返すことを選択した場合は、返すルート ジオメ
トリのタイプを選択します。次のいずれかを選択します。
すべてのルート ポイン ルート ジオメトリのすべてのポイントを返
ト
します。
セグメント終点
ユーザ ガイド
各ルート セグメント ジオメトリの終点のみ
を返します。
807
Get Travel Directions
オプション
説明/有効値
デフォルト言語
Get Travel Directions が道順を返す言語を指定します。
次のいずれかです。
da
デンマーク語で道順を返します。
nl
オランダ語で道順を返します。
en
英語で道順を返します。 デフォルト
en_US
アメリカ英語で道順を返します。
fi
フィンランド語で道順を返します。
fr
フランス語で道順を返します。
de
ドイツ語で道順を返します。
it
イタリア語で道順を返します。
no
ノルウェー語で道順を返します。
pt
ポルトガル語で道順を返します。
es
スペイン語で道順を返します。
sv
スウェーデン語で道順を返します。
時間を表示する
Get Travel Directions がルート内で道順をたどるのに要する時間を返
すかどうかを指定します。
主要名を表示する
Get Travel Directions が道順の中の任意の通りのすべての名前を返す
か、通りの主要名のみを返すかを指定します。
ルート ジオメトリとは
ルート ジオメトリは、ルートを形成する一連の緯度/経度ポイントです。 最も単純なルート ジオメト
リは、単一のポイントです。同じ通りセグメント上で始まって終わるルートなどがこれに該当します。
始点は常に既知の場所なので、このように非常に単純なルート ジオメトリはすなわち終点に等しくな
ります。 したがって、A が始点だとすると、ルート ジオメトリはポイント B の緯度/経度です。
複数のルート セグメントを含む、もっと複雑なルート ジオメトリの場合は、複数のポイントがルート
ジオメトリ内に存在することがあります。 以下に強調して示したようなルートがあると仮定します。
ポイント A に始まり、交差点 X、Y、および B を経由してポイント C が終点となります。
808
Spectrum™ Technology Platform 8.0.0
第 25 章 : Enterprise Routing モジュール
このルートでは、完全なルート ジオメトリはポイント A、X、Y、B、および C の緯度/経度から構成
されます。ただし、どのポイントを実際に返すかは、任意に制御できます。ルート ジオメトリのすべ
てのポイントを含めるのか、各ルート セグメントの終点のみを含めるのか、任意に選択できます。 上
記の例では、終点は B と C です。A から B は 1 つのルート セグメントであり、B から C は別のルー
ト セグメントだからです。
経路オプション
この優先設定セットを使用して、道路タイプごとに望ましさを設定することができます。 例えば、
サーバーがすべての幹線道路タイプを回避するよう要求することができます。
表 150 : 経路の優先設定オプション
オプション
説明/有効値
道路の優先設定
ルート決定時にさまざまな道路に与える優先順位を指定します。
優先順位を設定できるのは次の道路タイプです。
• 進入路
• 脇道
• 接続道路
• フェリー
• 小道
• 出入制限道路 (密集都市部)
• 出入制限道路 (農村部)
• 出入制限道路 (郊外)
• 出入制限道路 (都市部)
• 地方道路 (密集都市部)
• 地方道路 (農村部)
ユーザ ガイド
809
Get Travel Directions
オプション
説明/有効値
• 地方道路 (郊外)
• 地方道路 (都市部)
• 主要地方道路 (密集都市部)
• 主要地方道路 (農村部)
• 主要地方道路 (郊外)
• 主要地方道路 (都市部)
• 幹線道路 (密集都市部)
• 幹線道路 (農村部)
• 幹線道路 (郊外)
• 幹線道路 (都市部)
• 補助地方道路 (密集都市部)
• 補助地方道路 (農村部)
• 補助地方道路 (郊外)
• 補助地方道路 (都市部)
• 一般道路 (密集都市部)
• 一般道路 (農村部)
• 一般道路 (郊外)
• 一般道路 (都市部)
• 一級高速道路 (密集都市部)
• 一級高速道路 (農村部)
• 一級高速道路 (郊外)
• 一級高速道路 (都市部)
• 出入路 (密集都市部)
• 出入路 (出入制限道路)
• 出入路 (幹線道路)
• 出入路 (一級高速道路)
• 出入路 (農村部)
• 出入路 (二級高速道路)
• 出入路 (郊外)
• 出入路 (都市部)
• 二級高速道路 (密集都市部)
• 二級高速道路 (農村部)
• 二級高速道路 (郊外)
• 二級高速道路 (都市部)
道路タイプごとに、次のいずれかを指定できます。
810
Spectrum™ Technology Platform 8.0.0
第 25 章 : Enterprise Routing モジュール
オプション
説明/有効値
回避
この道路タイプを可能な限りルートで使用しません。
注: 特定の道路タイプを道順から常に除外できるとは限りま
せん。 状況によっては、回避対象の道路タイプの代わり
になるものが非常に貧弱なために回避対象の道路タイプ
を使うルートが選ばれることがあります。 また、始点ま
たは終点がセグメントの横にあって、そのセグメントの
道路タイプが回避されている場合も、そのセグメントが
使われます。
高
この道路タイプを他の道路タイプよりも優先します。
低
他の道路タイプをこの道路タイプよりも優先します。
中
この道路タイプに他の道路タイプと同じ優先設定を与えま
す。 道路タイプに優先設定を指定しないと、デフォルトとし
て "中" が使われます。
出力
Get Travel Directions は、次のフィールドを返します。
表 151 : Get Travel Directions の出力
フィールド名
書式
説明/有効値
Distance
String
ルートに含まれる各セグメントの距離。
DistanceUnits
String
距離に使用される単位です。
Format
String
道順の生成に使用されるフォーマットの値です。
Language
String
道順の言語です。
RouteDirections
リスト
ルートの進路変更ごとの道順です。
RouteGeometry
Geometry ルートの各ポイントの座標を含むジオメトリ オブジェクト
オブジェ です。 詳細については、を参照してください。 ルート ジオ
クト
メトリとは(808ページ)
.
ユーザ ガイド
811
ルーティング データベース リソース
フィールド名
書式
説明/有効値
Status
String
マッチの成功または失敗を報告します。
Status.Code
String
NULL
成功
F
失敗
失敗の原因 (ある場合)。 次のいずれかです。
• InsufficientInputData (緯度/経度の欠落)
• MalformedInputData (誤った入力フォーマット)
• InputOutOfRange (範囲外の入力)
• EngineError (エンジン由来のエラー)
Status.Description
String
Status.Code で示される失敗に関する説明。
Time
String
ルートをたどるのに要する合計時間を分数で表します。
TimeUnits
String
時間に使用される単位です。
ルーティング データベース リソース
Enterprise Routing モジュール データベース リソースは、Find Nearest、Get Travel Boundary、Get
Travel Cost Matrix、および Get Travel Directions で使用されます。
ルーティング データベース リソースの追加
1. Management Console を開きます。
2. Management Console で、[モジュール] > [Enterprise Routing] > [ツール] > [Routing Database
Resources] の順に展開します。
3. 新しいデータベースをインストールするには [追加] をクリックし、既存のデータベース リソース
を変更するには [変更] をクリックします。
4. 新しいデータベースをインストールする場合は、[名前] フィールドにデータベース リソースの名
前を入力します。 任意の名前にすることができます。 既存のデータベース リソース名を変更する
ことはできません。 既存のデータベース リソース名を変更すると、そのデータベース リソースを
参照するサービスまたはジョブが失敗します。
5. [パス要素] フィールドにデータベース ファイルを格納するフォルダを指定します。 通常、データ
ベース ファイルは、次の場所に格納されています。 <インストール ディレクトリ>\ERM-<国コー
ド>\<ヴィンテージ>\<タイプ>\<国> に格納されています。<インストール ディレクトリ> はデー
812
Spectrum™ Technology Platform 8.0.0
第 25 章 : Enterprise Routing モジュール
タベース ファイルをインストールするときに指定したディレクトリ、<国コード> は 2 文字の国
コード、<ヴィンテージ> はデータの日付 (例: 2009.1)、<タイプ> はドライブまたは歩行者、<国>
は国の名前です。
6. [OK] をクリックします。
Find Nearest、Get Travel Boundary、Get Travel Cost Matrix、および Get Travel Directions で使用で
きるデータベース リソースの一覧に、このデータベース リソースが表示されるようになります。
ルーティング データベースの削除
1. Management Console を開きます。
2. [モジュール] > [Enterprise Routing] > [ツール] の順に展開してから [Routing Database Resources]
をクリックします。
3. 削除するルーティング データベースをハイライト表示にして、[削除] をクリックします。 データ
ベースを削除するかどうかを尋ねる確認メッセージが表示されます。
4. [OK] をクリックして確認します。
ユーザ ガイド
813
GeoConfidence モジュール
このセクションの構成
• GeoConfidence モジュールとは . . . . . . . . . . . . . . . . . . . .816
• GeoConfidence Surface . . . . . . . . . . . . . . . . . . . . . . . . . .817
26
GeoConfidence モジュールとは
GeoConfidence モジュールとは
GeoConfidence モジュールは、指定された領域に住所または交差点が含まれる可能性を判定するため
に使われます。 このモジュールは住所または交差点の場所 (Geocode US Address で確認された場所)
を受け取り、それをポイント、ライン、またはポリゴン (どれになるかはマッチング精度による) に変
換した後で、その形状を既知の形状のデータベースと照合して、重なり合う形状があるかどうかを調
べ、あった場合は重なる部分の割合を確認します。 例えば、GeoConfidence モジュールを使って洪水
危険地域の格付けを判定できます。この場合、住所の場所と洪水発生地域データの重なり合う面積が
判定基準となります。 過去 100 年間の洪水発生地域と 95% 以上が重なるなら、その住所は洪水危険
地域と判定できます。 逆に、重なる面積が 95% 未満であれば、ビジネス プロセスに従って、その住
所を除外プロセスに引き渡して手動で検証を行うことができます。
住所または交差点は、ポイント、通りセグメント沿いの住所 (通りセグメント ポイントの配列)、ZIP
+ 4 セントロイド、ZIP + 2 セントロイド、または ZIP Code セントロイド (ポリゴン) にジオコードで
きます。 これらの形状 (ポイント、ライン、またはポリゴン) を他の形状と比較して重なり合う部分が
あるかどうかを調べ、その結果を根拠としてリスクや可能性を判定できます。
GeoConfidence result returned by the Enterprise Geocoding モジュールから返される GeoConfidence
結果によって生成されるポリゴンは異なります。 Enterprise Geocoding モジュールから返される
GeoConfidence 情報の詳細については、Enterprise Geocoding モジュールのドキュメントを参照して
ください。
GeoConfidence モジュールは、米国の住所のみに対応します。
注: GeoConfidence では、Enterprise Geocoding モジュールおよび Location Intelligence モジュール
から提供されるサービスが利用されます。
GeoConfidence コンポーネント
GeoConfidence から展開される 3 つのデータフローは、Enterprise Designer を使って変更できます。
各データフローはさまざまなコンポーネントによって構成されますが、それらのコンポーネントは
Enterprise Geocoding モジュールや Location Intelligence モジュールに付属する形でインストール済み
です。
インストール済みのデータフローの各コンポーネントの詳細については、 Spectrum™ Technology
Platform ユーザ ガイド.
以下のデータフローが使用可能です。
• GeoConfidenceSurface − 詳細な分析に利用できる GeoConfidence Surface を作成するデータフ
ローです。 入力は、Enterprise Geocoding モジュールから返された GeoConfidence 情報です。 現
在、Geocode US Address ステージのみがこの情報を返すことができます。
• CreatePointsConvexHull − GeoConfidenceSurface テンプレートで使われるサブフローです。 この
サブフローを変更する必要はありません。
• FloodRiskAnalysis − サンプルのデータフローです。
816
Spectrum™ Technology Platform 8.0.0
第 26 章 : GeoConfidence モジュール
GeoConfidence データベース
GeoConfidence が使うデータベースは、Enterprise Geocoding モジュールおよび Location Intelligence
モジュールと同じです。
Enterprise Geocoding モジュールの U.S. データベースを追加する方法については、Enterprise
Geocoding モジュールの米国 データベース リソース(232ページ)を参照してください。
Location Intelligence モジュールの空間データベース リソースを追加する方法については、Location
Intelligence モジュール データベースの名前付き接続の追加(236ページ)を参照してください。
これらのデータベースのほかに、GeoConfidence モジュールには ZIP Code ポリゴンのデータベース
が含まれます。 これは Geo Confidence Surface で使われます。
GeoConfidence Surface
入力
Geo Confidence Surface の入力フィールドは、Enterprise Geocoding モジュールの GeoConfidence 出
力カテゴリから返された出力フィールドです。 これらのフィールドについて、以下に詳しく説明しま
す。
フィールド名
説明
GeoConfidenceCode
このフィールドに返される値は、どのタイプの
Geoconfidence Surface が返されたかを示します。
有効な値を次に示します。
INTERSECTION 2つの通りが交差する位置のジオコー
ド ポイント。
ユーザ ガイド
ADDRESS
住所が位置付けられた通りセグメン
トを表す、通りセグメント ポイント
の配列。
POINT
ジオコーダがポイント データを使っ
て住所のマッチングに成功した場
合、その住所が位置付けられたポイ
ント ジオメトリ。
POSTAL1
ZIP セントロイドのジオコード ポイ
ント。
817
GeoConfidence Surface
フィールド名
説明
StreetSegmentPoints
POSTAL2
住所が位置付けられた ZIP + 2 に含
まれるすべての通りセグメントのポ
イント配列。
POSTAL3
住所が位置付けられた ZIP + 4 に含
まれる通りセグメントのポイント配
列。
ERROR
エラーが発生しました。
通りセグメント ポイントを表す緯度/経度値の配列。
注: このフィールドに値が設定されるのは、
[GeoConfidenceCode] フィールドに
[ADDRESS]、[POSTAL2]、または [POSTAL3]
が値として返された場合のみです。
GeoConfidenceCentroidLatitude
Geoconfidence ポリゴンのセントロイドの緯度。
GeoConfidenceCentroidLongitude
Geoconfidence ポリゴンのセントロイドの経度。
Output
[Geo Confidence Surface] 出力フィールドには、Geoconfidence ポリゴンが格納されます。
フィールド名
説明
Geometry
返されたジオメトリを表す Geoconfidence ポリゴン。
GeoConfidence モジュールのカスタマイズ
GeoConfidence モジュールから展開される 3 つのデータフロー テンプレートは、Enterprise Designer
を使って変更できます。 各データフローはさまざまなコンポーネントによって構成されますが、それ
らのコンポーネントは Enterprise Geocoding モジュールや Location Intelligence モジュールに付属す
る形でインストール済みです。 データフロー テンプレートの詳細については、『 Spectrum™ Technology
Platform テンプレート ガイド.
次のデータフロー テンプレートを使用できます。
• GeoConfidenceSurface − 詳細な分析に利用できる GeoConfidence Surface を作成するテンプレー
トです。 入力は、Enterprise Geocoding モジュールから返された GeoConfidence 情報です。 現在、
818
Spectrum™ Technology Platform 8.0.0
第 26 章 : GeoConfidence モジュール
Geocode US Address ステージのみがこの情報を返すことができます。 このテンプレートをカスタ
マイズするには、少なくとも 5 桁の ZIP Code 空間ソースを ZIP ステージ (Query Spatial) で指定す
る必要があります。
• CreatePointsConvexHull − GeoConfidenceSurface テンプレートで使われるサブフローです。 通
常、このサブフローを変更する必要はありません。
• FloodRiskAnalysis − サンプルのテンプレートです。 このテンプレートをカスタマイズするには、
少なくとも Flood 空間ソースを Find Nearest ステージで指定する必要があります。
ユーザ ガイド
819
Global Sentry モジュール
このセクションの構成
• Global Sentry モジュールとは . . . . . . . . . . . . . . . . . . . . .822
• Global Sentry . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .823
27
Global Sentry モジュールとは
Global Sentry モジュールとは
Global Sentry モジュールは、政府の警戒リスト (ブラックリスト) に載せられているかもしれない人物
の身元を確認します。 ここでは OFAC、OSFI、イングランド銀行、および欧州連合 (EU) を情報提供
源とする最適化されたブラックリスト データ、マッチングやスコアリングのアルゴリズム、そして
120 のカルチャーから収集した名前とそれに関連する性別および派生形データからなる知識ベースが
利用されます。
Global Sentry は Universal Name、Data Normalization、Advanced Matching の各モジュールを利用し
てマッチングのための定義済みの最適ルールを生成します。 認可国、名前、住所、ID 番号、その他、
誕生日などの情報と照合してマッチングを実行することにより、総合的なリスク スコアが生成されま
す。 この情報に基づいて組織は特定の取引 (トランザクション) を阻止すべきかどうか判断することが
できます。 これらのリストに関する補足的な情報は、以下にあります。
ec.europa.eu/external_relations/cfsp/sanctions/list/consol-list.htm
www.bankofengland.co.uk/publications/financialsanctions/index.htm
www.treas.gov/offices/enforcement/ofac/sdn/index.shtml
www.osfi-bsif.gc.ca/osfi/index_e.aspx?DetailID=525
www.treas.gov/offices/enforcement/ofac/programs/index.shtml
Global Sentry モジュールは、米国の愛国者法や世界中の同様の法律が定めるところの、政府のブラッ
クリストに載せられた対象国、個人、および組織に金融制裁を課すという要件に対応しています。
関係規制組織
米国には外国資産管理局 (OFAC: Office of Foreign Assets Control) という財務省下の組織があり、 こ
こが米国の外交政策や国家安全保障目標に基づき、標的となる諸外国、テロリスト、国際麻薬密輸団、
および大量破壊兵器の拡散に深く関わる団体に対して経済および通商上の制裁措置を講じます。 OFAC
は特定の法律が定める関係当局の規制の他、大統領の戦時非常事態権限に基づいて活動します。 OFAC
は米国司法権のもとで取引の規制や外国資産の凍結を行います。
OFAC の使命は、敵対する政府や個人に経済制裁を課すことで米国の外交政策や国家安全保障目標を
押し進めることにあります。
OFAC と似た組織に金融機関監督庁 (OSFI: Office of the Superintendent of Financial Institutions) があ
ります。 OSFI は、カナダ政府の大蔵大臣直属の独立機関です。 OSFI は、銀行、保険会社、および
年金制度に関係するカナダの主要な規制組織です。
英国では、金融上の勧告および制裁措置に関係する法律を扱うのはイングランド銀行です。 しかし、
世界規模の危機や地域紛争と欧州連合 (EU) 内部の情勢が相まって EU の対外活動に対する新たな要求
が生まれました。 そこで、欧州連合を対象に共通外交安全保障政策 (CFSP: Common and Foreign
Security Policy) なるものを作成することが決定されたわけです。 金融制裁を的確に適用することは、
共通外交安全保障政策 (CFSP) の目標を満たす上で、また特にテロリズムへの資金供与を阻止する上
で、何よりも重要です。 金融制裁の適用によって公共部門と民間部門の両方に法律上の義務が生じま
す。 これを受けて、EU はクレジット会社や金融機関に特定の責務を与えています。これらの組織は
関連規則の影響を受ける大部分の資金移転や金融取引に関係しているからです。
822
Spectrum™ Technology Platform 8.0.0
第 27 章 : Global Sentry モジュール
Global Sentry のコンポーネント
Global Sentry は、Enterprise Designer で部分的に修正できる 5 つのデータフロー テンプレートを展
開しています。 個々のデータフローは、Spectrum™ Technology Platform、Universal Name、Data
Normalization、Advanced Matching の各モジュールからインストールされた各種のコンポーネントに
よって構成されます。
以下のデータフローが使用可能です。
• Global Sentry
•
•
•
•
Global Sentry Name Check
Global Sentry Address Check
Global Sentry ID Number Check
Global Sentry Other Data Check
詳細については、Global Sentry(823ページ)を参照してください。
Global Sentry データベース
Global Sentry は、Advanced Matching、Data Normalization、Universal Naming の各モジュールと同
じデータベースを使用します。 詳細については、本ドキュメントの関連セクションを参照してくださ
い。
Global Sentry をリアルタイム モードで運用する場合には次のデータベースも必要です。
• globalsentrydb.script
• globalsentrydb.properties
また、Global Sentry をバッチ モードで運用する場合は、次のデータベースが必要です。
•
•
•
•
•
•
globalsentrydb.script
globalsentrydb.properties
globalsentrydb.addresses.csv
globalsentrydb.fullnames.csv
globalsentrydb.ids.csv
globalsentrydb.names.csv
Global Sentry
Global Sentry は Spectrum™ Technology Platform 上の展開済みのサービスです。 これには Management
Console からアクセスできます。 Global Sentry は、各国から得られたデータによる政府提供のブラッ
クリストと照合してトランザクション (取引) のマッチングを試みます。 Global Sentry サービスは、
Spectrum™ Technology Platform、Universal Name、Data Normalization、Advanced Matching の各モ
ジュールを利用します。 Global Sentry サービスは、正規化された統合ブラックリストと照合して、最
適化された定義済みのルールを生成します。 これらのリストには次のものがあります。
ユーザ ガイド
823
Global Sentry
• Denied Persons List (米国)
• Unverified List (BIS Red Flag) (米国)
• Consolidated Financial Sanction Targets (Individuals and Entities) (英国/欧州連合)
• Consolidated lists of persons, groups, and entities subject to EU financial sanctions (欧州連合)
• DFAT Consolidated List (オーストラリア)
• OSFI Consolidated List (Individuals and Entities) (カナダ)
• Specially Designated Nationals, Terrorists, Narcotic Traffickers and other Blocked Persons List (米国)
• Statutorily Debarred Parties List (米国)
認可国、名前、住所、ID 番号、その他、誕生日などの情報と照合してマッチングを実行することによ
り、"総合的なリスク水準のスコア" が生成され、この情報に基づいて組織は特定の取引 (トランザク
ション) を阻止すべきかどうかを的確に判断し、誤検出を回避できます。
Global Sentry がデータをどのように処理するかを以下のステップで説明します。
1. Global Sentry サービス (以下、単に "サービス") は、最初にトランザクション内のすべての必須デー
タをスキャンして制裁対象国を特定します。 制裁対象国の一致が見つかったトランザクションに
ついては、他のすべての検索条件がバイパスされ、最大級のリスク スコアが設定されます。
2. 制裁対象国の一致が見つからなかった場合、サービスは Global Sentry Name Check、Global Sentry
Address Check、または Global Sentry ID Number Check サブフローを使用して Global Sentry デー
タベースとの照合によるトランザクションのマッチングを試みます。
3. Global Sentry Name Check は、個人、団体、および船舶に対してマッチングを試みます。 これで
名前の一致が見つかった場合、サービスから名前スコアが返されます。
4. Global Sentry Address Check は、特定国内の住所に対してマッチングを試みます。 これで住所の
一致が見つかった場合、サービスから住所スコアが返されます。
5. Global Sentry ID Number Check は、パスポート、国民背番号、社会保障番号 (SSN)、納税者番号
などの識別番号に対してマッチングを試みます。 識別番号の一致が見つかった場合、サービスか
ら識別番号スコアが返されます。
6. 名前、住所、および識別番号の一致が見つからなかったトランザクションについては、トランザク
ション レコードが出力に書き出され、総合リスク水準スコアがゼロに設定されます。
7. 名前、住所、または識別番号の一致が見つかったトランザクションに対して、サービスは Global
Sentry Other Data Check サブフローを使用して Global Sentry データベースとの照合によるマッチ
ングを試みます。
8. Global Sentry Other Data Check は、出生地、出生日、国籍または市民権に対してマッチングを試
みます。 ここで一致が見つかった場合は、サービスから出生地スコア、出生日スコア、国籍スコ
ア、または市民権スコアが返されます。
9. Global Sentry は、各トランザクションに総合リスク水準スコアを設定します。 このスコアは、0
〜 16 の間の値を取り、OverallRiskLevel フィールドに返されます。 リスク水準を計算するとき、
Global Sentry は入力レコードに含まれているデータの種類を考慮し、さらに Global Sentry データ
ベースに一致するエントリがある場合には、それがどの入力に対応するかも考慮します。 一般に、
値が大きいほど、そのトランザクションに関係するリスクが高いことを示します。
これらの各入力に対しては、入力の有無と Global Sentry データベース内に一致するレコードがあるか
どうかに応じて、リスク解析処理が一定のポイント値を割り当てます。 リスク解析スコアは、これら
のポイント値の合計です。 ポイントがどのように割り当てられるかを表 152 : リスク解析のスコアリ
ング方法(825ページ)に示します。
824
Spectrum™ Technology Platform 8.0.0
第 27 章 : Global Sentry モジュール
表 152 : リスク解析のスコアリング方法
入力
入力データなし
一致あり
一致なし
名前
0
4
0
住所
1
2
0
ID
1
2
0
出生日
1
2
0
出生地
1
2
0
市民権
1
2
0
国籍
1
2
0
一般に、データベースと一致した各入力には 2 ポイントが割り当てられます。ただし、名前は例外で
す。 名前の一致は 4 ポイントとカウントされます。 名前スコアの加重が高いのは、OFAC などの情報
源から得られる指針に従っているからで、そこでは名前の一致はその他の種類の一致よりもより重要
であるとされています。
一方、入力があっても、データベースのどのエントリとも一致しない場合、割り当てられるポイント
は 0 で、総合リスク水準には影響しません。 これは、名前の一致があっても、その他の相当量のデー
タがデータベース内のエントリと一致しなければ、その一致を特定リストとの照合による "ヒット" と
は見なすべきでないという指針に従うものです。
データのない入力に 1 ポイントが設定されています。 これには、1 つ以上の入力がデータベースと一
致する一方で、マッチングに使用できる入力が一部欠けているようなトランザクションを、よりリス
クが高いトランザクションであると見なす効果があります。 このタイプのトランザクションについて
は、データが欠けているが故に真のリスク水準を正確に計算できません。 OFAC などの機関から得ら
れる指針によれば、こうしたケースではトランザクションに関係するリスクのより正確な評価を与え
るために、欠けているデータの入手に努力することになっています。
スコアが高ければそれだけトランザクションのリスクも大きくなりますが、リスク水準だけで必ずし
も適切なアクションを決定できるわけではありません。 これはスコアが同じでも、一致あり、一致な
し、データなしの入力について、さまざまな組み合わせが考えられるからです。 禁止措置の妥当性を
判断する補足的な情報を提供するために、Global Sentry サービスはマッチングで使われる 7 つの入力
のそれぞれについて、さらに 2 つの指標を返します。 これらは入力のデータの有無と、データベース
の一致の有無を示します。 これで、リスク範囲の中程にあるトランザクションに対して追加的な解析
を行うことにより、ブラックリストの管理当局にトランザクションを報告する、正確なリスク評価の
ために追加的な入力データが必要とのマークをトランザクションに付ける、トランザクションを承認
する、または、その他の何らかのアクションを行うなど、どの対処が妥当かを判断できます。
ユーザ ガイド
825
Global Sentry
始める前に
Global Sentry の使用を開始する前に次の手順を完了してください。
1. Global Sentry データベースをロードします。
2. Global Sentry サービスを開始します。
3. 使用するサーバーのデータベース接続をセットアップします。
詳細については、 Spectrum™ Technology Platform インストール ガイドを参照してください。.
Global Sentry の使用
Global Sentry は、リアルタイム モードとバッチ モードで使用できます。 Global Sentry は、次の機能
をリアルタイム モードで実行します。
•
•
•
•
•
Global Sentry
Global Sentry Name Check
Global Sentry Address Check
Global Sentry ID Number Check
Global Sentry Other Data Check
Global Sentry のリアルタイム モードでの使用の詳細については、 Spectrum™ Technology Platform
API ガイドを参照してください。.
Global Sentry は、次の機能をバッチ モードで実行します。
•
•
•
•
Global Sentry Batch
Global Sentry Name Check Batch
Global Sentry Address Check Batch
Global Sentry ID Number Check Batch
• Global Sentry Other Data Check Batch
Global Sentry のバッチ モードでの使用の詳細については、ジョブ(42ページ)を参照してください。
次の方法により、Management Console でデータをプレビューすることもできます。
1. [スタート] > [プログラム ファイル] > [Pitney Bowes] > Spectrum™ Technology Platform > [Client
Tools] > [Management Console] を選択して Management Console を開始します。
2. [サービス] リストで、Global Sentry を選択します。
注: セットアップすべきオプションはありません。 このサービスについては、Global Sentry サー
ビスのカスタマイズ(831ページ)を参照してください。
3. [プレビュー] タブをクリックします。
4. [プレビュー入力] の各フィールドにデータを入力するか、[データのインポート] をクリックして、
コンピュータに保存されているデータ ファイルによるプレビューを実行します。
5. [プレビューを実行] をクリックしてサンプル出力を表示します。
826
Spectrum™ Technology Platform 8.0.0
第 27 章 : Global Sentry モジュール
入力
表 153 : Global Sentry の入力フィールド
入力フィールド
説明
Name
省略なしの完全な名前。
FirstName と LastName を使用しない場合は必須です。
FirstName
ファースト ネーム (姓名の名)、またはラスト ネーム (姓) 以外のすべ
ての名前要素。
Name を使用しない場合は必須です。
LastName
ラスト ネーム (姓) のみ。
Name を使用しない場合は必須です。
AddressLine1
最初の住所行。
データありの場合は推奨項目です。
AddressLine2
2 行目の住所行。
データありの場合は推奨項目です。
AddressLine3
3 行目の住所行。
データありの場合は推奨項目です。
Country
省略なしの完全な国名。
住所行を使用する場合は必須です。
IDNumber
SSN、パスポート、Visa などの識別番号。
データありの場合は推奨項目です。
PlaceOfBirth
任意の出生地データ。
データありの場合は推奨項目です。
DOB
出生日 (Year, Month, Day の形式)。
データありの場合は推奨項目です。
ユーザ ガイド
827
Global Sentry
入力フィールド
説明
Citizenship
省略なしの完全な国名。
データありの場合は推奨項目です。
Nationality
省略なしの完全な国名。
データありの場合は推奨項目です。
Output
表 154 : Global Sentry Service の出力
出力フィールド
説明
名前
828
InputName
元のデータ ソースからの入力名。
InputFilteredName
元のデータ ソースから肩書き、接尾語、および特殊文字を取り除いた
入力名。
Name
データベースから返された名前。
InputFirstName
元のデータ ソースからの入力ファースト ネーム。
InputFilteredFirstName
元のデータ ソースから肩書き、接尾語、および特殊文字を取り除いた
入力ファースト ネーム。
FirstName
データベースから返されたファースト ネーム。
InputLastName
元のデータ ソースからの入力ラスト ネーム。
InputFilteredLastName
元のデータ ソースから肩書き、接尾語、および特殊文字を取り除いた
入力ラスト ネーム。
LastName
データベースから返されたラスト ネーム。
NameScore
名前一致スコア。 0 〜 100。
Spectrum™ Technology Platform 8.0.0
第 27 章 : Global Sentry モジュール
出力フィールド
説明
NameMatchIdentified
名前が一致したかどうかを示します。 「はい」または「いいえ」
NameProvided
名前が一致したかどうかを示します。 「はい」または「いいえ」
住所
InputAddressLine1
元のデータ ソースからの入力住所行。
AddressLine1
データベースから返された住所行。
InputAddressLine2
元のデータ ソースからの入力住所行。
AddressLine2
データベースから返された住所行。
InputAddressLine3
元のデータ ソースからの入力住所行。
AddressLine3
データベースから返された住所行。
AddressScore
住所一致スコア。 0 〜 100。
AddressMatchIdentified
住所が一致したかどうかを示します。 「はい」または「いいえ」。
AddressProvided
入力データに住所があるかどうかを示します。 「はい」または「いい
え」。
InputCountry
元のデータ ソースからの入力国名。
Country
データベースからの国名。
識別番号
InputIDNumber
元のデータ ソースからの入力識別番号。
IDNumber
データベースからの識別番号。
IDNumberScore
識別番号一致スコア。 0-100.
IDMatchNumberIdentified
識別番号が一致したかどうかを示します。「はい」または「いいえ」。
ユーザ ガイド
829
Global Sentry
出力フィールド
説明
IDNumberProvided
入力データに識別番号があるかどうかを示します。 「はい」または
「いいえ」。
出生地
InputPlaceOfBirth
元のデータ ソースからの入力出生地。
PlaceOfBirth
データベースから返された出生地。
PlaceOfBirthScore
出生地一致スコア。 0-100.
PlaceOfBirthMatchIdentified
出生地が一致したかどうかを示します。 「はい」または「いいえ」。
PlaceOfBirthProvided
入力データに出生地があるかどうかを示します。 「はい」または「い
いえ」。
出生日
InputDOB
元のデータ ソースからの入力出生日。
DOB
データベースから返された出生日。
DOBScore
出生日一致スコア。 0-100.
DOBMatchIdentified
出生日が一致したかどうかを示します。 「はい」または「いいえ」。
DOBProvided
入力データに出生日があるかどうかを示します。 「はい」または「い
いえ」。
市民権
830
InputCitizenship
元のデータ ソースからの入力市民権。
Citizenship
データベースから返された市民権。
CitizenshipScore
市民権一致スコア。 0 〜 100。
CitizenshipMatchIdentified
市民権が一致したかどうかを示します。 「はい」または「いいえ」。
Spectrum™ Technology Platform 8.0.0
第 27 章 : Global Sentry モジュール
出力フィールド
説明
CitizenshipProvided
入力データに市民権があるかどうかを示します。 「はい」または「い
いえ」。
国籍
InputNationality
元のデータ ソースからの入力国籍。
Nationality
データベースから返された国籍。
NationalityScore
国籍一致スコア。 0-100.
NationalityMatchIdentified
国籍が一致したかどうかを示します。 「はい」または「いいえ」。
NationalityProvided
入力データに国籍があるかどうかを示します。 「はい」または「いい
え」。
政府リスト情報
EntryID
名前、団体、船舶、住所、識別番号、出生地、出生日、市民権、また
は国籍を示すエントリ ID。 これは各政府機関から提供されます。
ListType
政府機関から提供されるリストの名前。 SDN、EU、イングランド銀
行、カナダ金融機関監督庁。
リスク解析
OverAllRiskLevel
一致ごとのリスク ソース。 0-16.
SanctionCountryIdentified
制裁対象国の一致が見つかったかどうかを示します。 「はい」または
「いいえ」。
Global Sentry サービスのカスタマイズ
Global Sentry は、Enterprise Designer で部分的に修正できる 5 つのデータフロー テンプレートを展
開しています。 個々のデータフローは、Spectrum™ Technology Platform、Universal Name、Data
Normalization、Advanced Matching の各モジュールからインストールされた各種のコンポーネントに
よって構成されます。
ユーザ ガイド
831
Global Sentry
データフロー テンプレートの詳細については、 Spectrum™ Technology Platform テンプレート ガイ
ド. インストール済みのデータフローの各コンポーネントの詳細については、 Spectrum™ Technology
Platform ユーザ ガイドを参照してください。.
以下のデータフローが使用可能です。
•
•
•
•
•
•
•
•
•
•
832
Global Sentry
Global Sentry Name Check
Global Sentry Address Check
Global Sentry ID Number Check
Global Sentry Other Data Check
Global Sentry Batch
Global Sentry Name Check Batch
Global Sentry Address Check Batch
Global Sentry ID Number Check Batch
Global Sentry Other Data Check Batch
Spectrum™ Technology Platform 8.0.0
Location Intelligence モ
ジュール
このセクションの構成
• Location Intelligence モジュールとは . . . . . . . . . . . . . . .834
• Centrus データベース リソース . . . . . . . . . . . . . . . . . . . .834
• Closest Site . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .836
• Find Nearest . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .841
• 名前付き接続 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .847
• 名前付きテーブル . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .848
•
•
•
•
•
•
Point In Polygon . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .850
Query Spatial Data . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .859
Read Spatial Data . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .862
Spatial Calculator . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .864
Spatial Union . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .877
ユーザ定義の Centrus データベース . . . . . . . . . . . . . . . . .879
• MapInfo SQL Language のリファレンス . . . . . . . . . . . . .885
28
Location Intelligence モジュールとは
Location Intelligence モジュールとは
Location Intelligence モジュールは、空間分析を提供します。ユーザは、この空間分析を使用して、任
意の位置と対象領域または対象地点との関係を調査できます。 Location Intelligence モジュールでは、
領域、結合、交差、Point In Polygon 等、さまざまな空間分析を実行できます。
Location Intelligence コンポーネント
• Closest Site — 指定されたロケーションに最も近いサイトを検索します。詳細については、Closest
Site(836ページ)を参照してください。
• Find Nearest — 指定されたロケーションに最も近い POI (point-of-interest) を検索します。詳細につ
いては、Find Nearest(841ページ)を参照してください。
• Point In Polygon — ロケーションが指定されたエリアに存在するかどうかを調べます。詳細につい
ては、Point In Polygon(850ページ)を参照してください。
• Query Spatial Data — 空間関数および標準の SQL 関数を用いた空間データベースに対するクエリ
を実行できます。詳細については、Query Spatial Data(859ページ)を参照してください。
• Read Spatial Data — 一般的に使用される様々な空間データ フォーマットの空間データにアクセス
できます。 詳細については、Read Spatial Data(862ページ)を参照してください。
• Spatial Calculator — ポリゴンの面積、ポイント間の距離、エリアの周囲長など、空間データに対
する様々な計算を実行します。詳細については、Spatial Calculator(864ページ)を参照してくださ
い。
• Spatial Union — 2 つの入力ジオメトリ オブジェクトを結合したジオメトリ オブジェクトを返しま
す。詳細については、Spatial Union(877ページ)を参照してください。
Location Intelligence モジュール データベース
Location Intelligence モジュール データベースは、地域または POI (points of interest) を定義します。
空間分析に使いたい情報が格納されているデータベースを選択します。Pitney Bowes Software には
Location Intelligence モジュールで利用できる広範なデータベース ライブラリが用意されています。
使用可能なデータベースのリストについては、www.pbinsight.com/products/data を参照してくださ
い。 Location Intelligence モジュールは、Centrus GSB 形式および MapInfo TAB 形式のデータベース
に対応しています。
Centrus データベース リソース
Centrus データベース リソースは、Location Intelligence モジュールで使用できます。 Centrus データ
は、Closest Site および Point in Polygon で使用されます。
834
Spectrum™ Technology Platform 8.0.0
第 28 章 : Location Intelligence モジュール
Centrus データベース リソースの追加
1. Management Console を開きます。
2. [モジュール] > [Location Intelligence] > [ツール] の順に展開してから [Centrus Database
Resources] をクリックします。
3. 新しいデータベースをインストールするには [追加] をクリックし、既存のデータベース リソース
を変更するには [変更] をクリックします。
4. 新しいデータベースをインストールする場合は、[名前] フィールドにデータベース リソースの名
前を入力します。 任意の名前にすることができます。 既存のデータベース リソース名を変更する
ことはできません。 既存のデータベース リソース名を変更すると、そのデータベース リソースを
参照するサービスまたはジョブが失敗します。
5. [パス] フィールドにデータベース ファイルへのフル パスを入力します。 Centrus データベース
ファイルには、拡張子 .gsb が付きます。 Spectrum™ Technology Platform で使用できるようにす
るには、.gsb ファイルのファイル名を Unix および Linux システム上ですべて小文字にする必要が
あります。
6. [キャッシュ サイズ] フィールドで、データのキャッシュに使用するメモリの量を選択します。 一
般的には、キャッシュを大きくするほどパフォーマンスが向上します。 次のオプションがありま
す。
•
なし — データをキャッシュしません。
•
中 — 最大 5 MB のメモリを使用してデータをキャッシュします。 キャッシュに使用できるメ
モリの量が少ない場合は、この設定を使用してください。
•
大 — 最大 20 MB のメモリを使用してデータをキャッシュします。 多数のレコードを処理する
場合はこの設定を使用してください。
•
巨大 — 最大 100 MB のメモリを使用してデータをキャッシュします。 多数のレコードを処理
する場合はこの設定を使用してください。
7. [OK] をクリックします。 データベースの一覧に次の情報が表示されます。
•
名前 — データベースに付与した名前。 このデータベースをステージまたはサービスから参照
する際に使用する名前です。
•
パス — データベース ファイルの場所。
•
キャッシュ サイズ — このデータベースのデータのキャッシュに使用するメモリの量。
•
フィーチャー タイプ — データベースに格納されている空間データのタイプを示します (ポイン
ト、ポリゴン、またはライン)。 ポイント データベースは、Closest Site ステージおよび Point
In Polygon ステージで使用できます。 ポリゴン データベースおよびライン データベースは、
Point In Polygon ステージで使用できます。
•
バッファ有効 — データベースがバッファリングをサポートしているかどうかを示します。バッ
ファリングは Point in Polygon 機能の 1 つで、ポイント、ポリゴン、またはラインに近い領域
を指定するのに使用します。
Closest Site および Point in Polygon で使用できるデータベース リソースの一覧にこのデータベース
リソースが表示されるようになります。
ユーザ ガイド
835
Closest Site
Closest Site
Closest Site コンポーネントは、指定されたロケーションに最も近いサイトを特定します。 例として
は、以下のものが挙げられます。
• 銀行 — 夜間金庫が利用できる、小売店舗に最も近い支店を検索します。
• 保険 — 患者に最も近い場所に診療所がある医者の一覧を示します。
• 小売 — 顧客の集合から特定の店舗までの距離を、統計モデルの変数として使用します。
• 公共安全 — 消防署から半径 3 マイル以内の家屋数を調べます。
Closest Site は、Location Intelligence モジュールに含まれています。 このモジュールの詳細 (これに
含まれるその他のコンポーネント等) については、Location Intelligence コンポーネント(834ページ)
を参照してください。
Closest Site は、半径分析を行います。半径分析とは、指定された地図上のポイントの周囲に円を描
き、その円の内部にあるサイトを検索するプロセスです。 次の図は、その概念を表したものです。 こ
の例では、入力されたロケーションが "X" で示されています。 サイトを検索するエリアは、半径によっ
て定義されます。 入力フィールド "Radius" を使用することにより、半径をレコードごとに指定できま
す。 入力フィールド "Radius" で半径を指定しない場合は、Closest Site オプションで指定されたデ
フォルト半径が使用されます。 この例で指定された半径では、サイト A とサイト B の 2 つのサイト
が返されます。 サイト C とサイト D は、半径によって定義された検索エリア外にあるため、返され
ません。 検索半径を広げれば、サイト C とサイト D を返すことができます。 同様に、検索半径を狭
めることにより、サイト B だけを返すようにすることができます。
Closest Site が実行する計算には誤差が生じ得ることに注意してください。 ポイント間の南北距離が
大きくなるほど、誤差の幅は大きくなります。 赤道から北または南方向に離れるにつれて、各緯線の
長さが短くなるため、計算に誤差が生じるようになります。 次の表は、起点からの南北方向の距離に
対する最大誤差を示したものです。
836
南北方向の距離
最大誤差
50 マイル
0.25% (0.1 マイル)
200 マイル
0.9% (1.8 マイル)
Spectrum™ Technology Platform 8.0.0
第 28 章 : Location Intelligence モジュール
南北方向の距離
最大誤差
400 マイル
1.25% (5 マイル)
1000 マイル
1.9% (19 マイル)
誤差は、南北方向の距離を計算する場合にのみ生じ、東西距離を計算する場合には生じません。経線
の長さは常に一定であるためです。 地球上の任意の 2 地点に対し、その東西距離の計算では必ず正し
い結果が得られます。
Input
表 155 : Closest Site 入力
フィールド名
書式
説明/有効値
Latitude
文字列
[11]
場所を示す座標の緯度の部分。 緯度を、[座標フォーマット]
オプションで選択したフォーマットで指定します。
注: 正数が北東の半球を表し、負数が南西の半球を表す形
式で緯度と経度を 100 万分の 1 度で指定します。 例え
ば、想定小数度形式では、ポイント 140A°W, 30A°N は
-140000000, 30000000 と表現されます。
Longitude
文字列
[11]
場所を示す座標の経度の部分。 経度を、[座標フォーマット]
オプションで選択したフォーマットで指定します。
注: 正数が北東の半球を表し、負数が南西の半球を表す形
式で緯度と経度を 100 万分の 1 度で指定します。 例え
ば、想定小数度形式では、ポイント 140A°W, 30A°N は
-140000000, 30000000 と表現されます。
Radius
文字列
検索エリアの半径。 [距離単位] オプションで選択した単位
で半径を指定します。 半径を指定しない場合、デフォルト
の半径が使われます。 デフォルトの半径は、[デフォルト半
径] オプションで指定されます。
検索エリアを制限しない場合は、0 を指定します。 Closest
Site は、[結果の最大数] オプションで指定されたサイト数を
上限として最も近いサイトを返します。
ユーザ ガイド
837
Closest Site
オプション
表 156 : Closest Site オプション
オプション
説明
データベース
対象とするサイトが含まれるデータベースの名前。 このフィールドに
は、Spectrum™ Technology Platform システムで Management Console
から利用できるデータベースがリストされます。 詳細については、
Location Intelligence モジュール Centrus データベース リソースの
追加(234ページ)を参照してください。
データベースを選択すると、そのデータベースに関する次の情報が表
示されます。
ClosestSite を 選択中のデータベースが Closest Site で使用できる
サポート
かどうかを示します。 ポイント データが含まれる
データベースのみが Closest Site で使用できます。
座標系
デフォルト半径 (フィート)
選択中のデータベースで座標を指定するために使わ
れる表記方式を示します。
検索エリアの半径を指定します。 [Radius] 入力フィールドを使って、
レコード単位でデフォルト半径を変更できます。
検索エリアを制限しない場合は、0 を指定します。 Closest Site は、
[結果の最大数] オプションで指定されたサイト数を上限として最も近
いサイトを返します。
座標フォーマット
距離単位
838
入力座標の緯度/経度のフォーマットを指定します。 次のいずれかを
選択します。
小数度
(90.000000, 180.000000)
想定小数度
(90000000, 180000000)。 こちらがデ
フォルトです。
度-分-秒
(90 00 00N, 180 00 00W)
ゼロ補完想定小数度
(090000000N, 180000000W)
ゼロ補完小数度
(090.000000N, 180.000000W)
距離を表す単位を指定します。 次のいずれかを選択します。
Spectrum™ Technology Platform 8.0.0
第 28 章 : Location Intelligence モジュール
オプション
結果の最大数
説明
マイル
距離はマイルで測ります。
Km
距離はキロメートルで測ります。
フィート
距離はフィートで測ります (デフォルト)。
メートル
距離はメートルで測ります。
ユーザ定義
距離はユーザが定義した単位で測ります。 この設定
は、非地理的座標を含むデータベースに使用します。
このオプションを選択して地理的座標を含むデータ
ベースを使用した場合、距離はフィートで計測され
ます。
返すサイトの最大数を指定します。 デフォルト値は 10 です。 検索半
径にあるサイトの数が、このオプションで指定した値を超える場合
は、最も近いサイトが返されます。 例えば、検索半径内に 15 個のサ
イトがあり、[結果の最大数] が 10 に設定されている場合、最も近い
10 個のサイトが返されます。
出力
Closest Site は、検索半径内の各サイトに関する情報を返します。 一致したサイトは、以下の表に示
すデータと共に個別のレコードで返されます。 サイトは、入力した場所からの距離が近いものから順
番に返されます。
表 157 : Closest Site 出力
フィールド名
書式
説明/有効値
[DataSource].[Attribute]
文字列
サイトに関する情報を格納します。[DataSource] は [データ
ベース] オプションで選択したデータベースの名前で、
[Attribute] はサイト属性の名前です。 [DataSource].[Attribute]
フィールドに返される具体的な値はデータベースによって
異なります。 例えば、雹災データベースにマッチングを探
す場合、これらのフィールドには雹災が発生した日付、雹
の直径、負傷者数などの情報が格納されます。 属性フィー
ルドの完全なリストについては、データベースに付属する
ドキュメントを参照してください。
ユーザ ガイド
839
Closest Site
フィールド名
書式
説明/有効値
[DataSource].SiteCount
文字列
入力した場所に関連して返されたサイトの数。 サイトが 1
つも見つからなければ、このフィールドは "0" です。 検索
半径内にあるサイトの数が [結果の最大数] オプションに指
定された値を超えた場合、このフィールドには、検索半径
内のサイトの総数ではなく、実際に返されたサイトの数が
格納されます。
[DataSource] は、[データベース] オプションで選択された
データベースの名前です。
[DataSource].SiteDirection
文字列
サイトへの方向 (コンパスの度)。 例えば、入力された場所
から真南にサイトがあれば、このフィールドの値は "180" で
す。
[DataSource] は、[データベース] オプションで選択された
データベースの名前です。
[DataSource].SiteDistance
文字列
入力された場所からサイトまでの距離。[距離単位] オプショ
ンに指定された単位で表わされます。
[DataSource] は、[データベース] オプションで選択された
データベースの名前です。
[DataSource].SiteName
Status
Status.Code
文字列
[128]
サイトの名前。
文字列
[1]
マッチの成功または失敗を報告します。
文字列
[100]
[DataSource] は、[データベース] オプションで選択された
データベースの名前です。
null
成功
F
失敗
失敗の原因 (ある場合)。 値は以下のいずれかです。
NoMatchFound
Closest Site は、検索エリアにサイ
トを見つけられませんでした。
InsufficientInputData 場所を特定するには入力レコードの
データが十分でありません。
MalformedInputData 入力された場所が、認識可能な
フォーマットでありません。
840
Spectrum™ Technology Platform 8.0.0
第 28 章 : Location Intelligence モジュール
フィールド名
書式
説明/有効値
InputOutOfRange
Status.Description
文字列
[100]
緯度または経度が、対応可能な範囲
の外にあります。 緯度の座標は、
-90A° 〜 90A° である必要がありま
す。 経度の座標は、-180A° 〜 180A°
である必要があります。
Status.Code で示される失敗に関する説明。
レポート
Closest Site は、 Closest Site Summary Report を提供します。 このレポートには、ジョブ、マッチン
グ統計、パフォーマンス統計、およびデータベースに関する情報が含まれます。 "Database Attributes"
セクションに表示される属性の数が 10 個に制限されることに注意してください。 使用される属性は
データベースによって異なります。 データベースの属性に関する詳細な説明については、データベー
ス ファイルと共にインストールされる PDF ファイルを参照してください。
レポートの使用方法については、レポート(185ページ)を参照してください。
Find Nearest
Find Nearest は、指定されたロケーションに最も近い POI (point-of-interest) を検索します。 例えば、
指定されたロケーションから最も近い銀行を検索するために使用できます。 Find Nearest では、次の
検索が可能です。
• ある地点からの直線距離が最短であるもの
• ある地点からの移動距離が最短であるもの
• ある地点からの移動時間が最短であるもの
Find Nearest は POI を、ポイント、ライン、またはポリゴンで特定できます。
ポイントの例としては銀行の ATM、ラインの例としては道路セグメント、ポリゴンの例としては国立
公園が挙げられます。 任意の種類のジオメトリを含む空間データベースを対象に、検索を行うことが
できます。
入力
Find Nearest への入力は、検索を開始する起点であり、距離や移動時間の計算の起点となるポイント
です。
ユーザ ガイド
841
Find Nearest
表 158 : Find Nearest 入力
フィールド名
Latitude
書式
説明
文字列
検索の起点とするポイントの緯度座標。 [座標フォーマット]
オプションに指定された座標フォーマットを使用します。
Longitude
文字列
MaxDistance
文字列
検索の起点とするポイントの経度座標。 [座標フォーマット]
オプションに指定された座標フォーマットを使用します。
(オプション) 近くの POI (points of interest) を検索する検索
エリアの半径。 このフィールドに値を指定すると、その値
が [最大距離] オプションで指定されたデフォルト値に優先
して使用されます。 半径は、[距離単位] オプションで選択
された単位で指定します。
オプション
Options
表 159 : Find Nearest オプション
842
オプション
説明
名前付きテーブル
検索する POI (points of interest) が含まれる名前付きテーブルの名前。 例
えば、最も近いスーパーマーケットを探す場合は、空間データにすべての
スーパーマーケットの座標が含まれる必要があります。 Management
Console に定義された Location Intelligence モジュールの名前付きテーブル
ツールで指定されたテーブル名を使用してください。 詳細については、
Location Intelligence モジュールの名前付きテーブル リソースの追加
(237ページ).
ルーティング データ
ベース
最も近い、または遠い道順を判定するために使うルーティング データが含
まれるデータベースの名前。 Management Console のデータベース リソー
ス ツールで指定したデータベース名を使用します。 詳細については、
Enterprise Routing モジュールのデータベース リソースの追加(234ペー
ジ).
検索条件
最も近い POI (point of interest) を識別する方法を指定します。 次のいずれ
かです。
Spectrum™ Technology Platform 8.0.0
第 28 章 : Location Intelligence モジュール
オプション
説明
最速
最短時間で到達できる POI (point of interest) を探します。
近接度
直線距離が最も近い POI (point of interest) を探します。
こちらがデフォルトです。
最短
移動距離が最短の POI (point of interest) を探します。
移動距離が最短の POI (point of interest) が、最短時間で到達できるポイン
トと異なる場合があります。 例えば、移動距離が最短のポイントへは一般
道しかなく、それより遠いポイントに高速道路で到達できる場合などが、
これに該当します。 高速道路を使うと移動速度が速くなり、結果的に移動
距離は長くても移動時間は短くなります。
同様に、直線距離で最短の POI (point of interest) が、移動距離で最短では
ないこともあります。 以下の図では、直線距離が最短のポイントが、移動
距離が最短のポイントと異なっています。直線距離が最短のポイントに到
達するには、湖を迂回して移動する必要があるため、このような結果とな
ります。
注: このフィールドで "最速" または "最短" を選択すると、[時間] 出力フィー
ルドに、入力ポイントから POI (point of interest) までの移動にかかる
時間が表示されます。
座標系
入力される座標の座標系。 フォーマットは、European Petroleum Survey
Group (EPSG) コード、SRID コード、または MAPINFO コードでなければ
なりません。 codespace:code という形式で、座標参照系を指定します。
例えば、緯度/経度 (WGS 84) で表されるジオメトリは、EPSG:4326 とな
ります。 デフォルト値は、緯度/経度 (WGS 84) として知られる EPSG:4326
です。 これは、世界規模の座標系であり、ナビゲーションや測量に広く使
用されている NAVSTAR Global Positioning System (GPS: 全地球測位シス
テム) に関連付けられた地球基準座標系です。 この測地系は、地球の中心
("地心") を原点とし、衛星および地上データによって定義されています。
以下の表に、使用頻度の高い EPSG コードを示します。
ユーザ ガイド
843
Find Nearest
オプション
座標フォーマット
説明
座標系
EPSG コード
緯度/経度 (WGS 72)
4322
緯度/経度 (WGS 84)
4326
緯度/経度 (NAD 83)
4269
緯度/経度 (OSGB 36)
4277
British National Grid
27700
入力に使う緯度/経度の座標フォーマットを指定します。
注: このオプションは、緯度/経度座標系を指定した場合のみに使用しま
す。 座標系が緯度/経度座標系ではない場合は、座標フォーマットを
[小数] に設定します。
次のいずれかです。
距離単位
最大距離
844
小数度
(90.000000, 180.000000)。 こちらがデフォ
ルトです。
想定小数度
(90000000, 180000000)。
度-分-秒
(90 00 00N, 180 00 00W)
ゼロ補完想定小数度
(090000000N, 180000000W)
ゼロ補完小数度
(090.000000N, 180.000000W)
距離値を返す方法を示します。 次のいずれかです。
フィート
距離をフィートで返します。
キロメートル
距離をキロメートルで返します。
メートル
距離をメートルで返します。
マイル
距離をマイルで返します。 こちらがデフォルトで
す。
ヤード
距離をヤードで返します。
近くの POI (points of interest) を検索する検索エリアのデフォルト半径。
このデフォルト値は、[MaxDistance] 入力フィールドを使ってレコード単位
で上書きできます。 半径は、[距離単位] オプションで選択した単位で指定
します。 例えば、POI (points of interest) を半径 10 マイル内で検索するに
Spectrum™ Technology Platform 8.0.0
第 28 章 : Location Intelligence モジュール
オプション
説明
は、このフィールドで "10" を指定し、[距離単位] オプションで "マイル" を
選択します。 デフォルト値は 0 です。
時間単位
最大候補数
時間値を返す方法を示します。 次のいずれかです。
時間
距離を時単位で返します。
分
距離を分単位で返します。 こちらがデフォルトです。
秒
距離を秒単位で返します。
返す POI (points of interest) の最大数を指定します。 "1" を指定すると、最
も近い POI (points of interest) のみが返されます。 "2" を指定すると、最も
近い 2 つの POI (points of interest) が返されます。以降もこれと同様です。
デフォルト値は 1 です。
POI (point-of-interest) ジオメトリを返すかどうかを指定します。 POI (pointPOI (point-of-interest) ジ
of-interest) ジオメトリは、ポイント (店舗の場所など)、ライン (道路セグメ
オメトリを返す
ントなど)、またはポリゴン (国立公園など) です。 返されるジオメトリの
タイプは、名前付きテーブルに含まれるデータによって決まります。
出力フィールド オプション
[出力フィールド] タブを使って、Find Nearest 出力に含めるフィールドを選択できます。 フィールド
を出力に含めるには、その列のボックスをクリックしてオンにします。 [データベースフィールド] 列
には、入力空間データで使用される名前が表示されます。 [ステージフィールド] 列には、データフロー
で使用されるフィールドの名前が表示されます。 データフローでフィールドの名前を変更した場合、
これらの列に表示される名前は異なります。 例えば、入力空間データに [Latitude] という名前のフィー
ルドがある場合、これを [PointOfInterest_Latitude] に変更することができます。
出力
Find Nearest からの出力は、使用するデータによって決まります。 Find Nearest は、以下に示すフィー
ルドを返します。 また、データのフィールドを [出力フィールド] タブで選択した場合、それらのフィー
ルドも出力に含められます。 例えば、データに店舗名と営業時間が格納されている場合、それらの
フィールドを [出力フィールド] タブで選択すると、出力に追加されます。
表 160 : Find Nearest 出力
フィールド名
書式
説明/有効値
Distance
文字列
[距離単位] オプションで指定された単位で表された、入力ポ
イントから POI (point of interest) までの距離。
ユーザ ガイド
845
Find Nearest
フィールド名
書式
DistanceUnits
文字列
Time
文字列
説明/有効値
距離値を返す方法を示します。 値は以下のいずれかです。
Feet
距離をフィートで返します。
Kilometers
距離をキロメートルで返します。
Meters
距離をメートルで返します。
Miles
距離をマイルで返します。 こちらがデフォ
ルトです。
Yards
距離をヤードで返します。
[時間単位] オプションで指定された単位で表された、入力ポ
イントから POI (point of interest) までの移動時間。
注: このフィールドは、Find Nearest の [検索条件] オプショ
ンで "最速" または "最短" を選択した場合のみに返され
ます。
TimeUnits
846
文字列
時間値を返す方法を示します。 値は以下のいずれかです。
Hours
距離を時単位で返します。
Minutes
距離を分単位で返します。 こちらがデフォ
ルトです。
Seconds
距離を秒単位で返します。
Geometry
Geometry POI (point of interest) のジオメトリ。 このフィールドの名
オブジェ 前はデフォルトで "Geometry" ですが、[出力フィールド] タ
クト
ブで他の名前を選択できます。
<FieldName>
文字列
データに固有のフィールド。 例えば、データに StoreID と
いう名前のフィールドがある場合、StoreID という名前の出
力フィールドが使用されます。 これらのフィールドには、
テーブルに格納されているデータがそのままのフォーマッ
トで返されます。
Status
文字列
[1]
処理の成功または失敗を報告します。
null
成功
F
失敗
Spectrum™ Technology Platform 8.0.0
第 28 章 : Location Intelligence モジュール
フィールド名
書式
説明/有効値
Status.Code
文字列
[100]
失敗の原因 (ある場合)。
Status.Description
文字列
[100]
Status.Code に示される失敗に関する説明。
名前付き接続
Location Intelligence モジュールは、既存のデータ リポジトリをジョブへの入力として使って、データ
ベースとファイル サーバーからデータを読み取ることができます。 Location Intelligence モジュール
は、内部リポジトリに保存された名前付きエンティティを使用します。このエンティティの名前を呼
び出すことでデータベース内のデータにアクセスできます。 ここでは、特定のソースを使う前に設定
する必要がある、名前付き接続の追加、表示、および管理の方法について説明します。
名前付き接続の追加または変更
1. Management Console を開きます。
2. [モジュール] > [Location Intelligence] > [ツール] の順に展開してから [Named Connections] を
クリックします。
3. [追加] または [変更] をクリックします。 [接続 プロパティ] ダイアログ ボックスが表示されます。
4. リソースの名前を [接続名] フィールドに入力します。 任意の名前にすることができます。 既存の
データベース リソース名を変更することはできません。 既存のデータベース リソース名を変更す
ると、そのデータベース リソースを参照するサービスまたはジョブが失敗します。
5. [URL] フィールドで、データベースへの JDBC 接続 URL を指定します。 この URL は、
jdbc:[subprotocol]:[node]/[databaseName] という形式です。 例:
•
•
•
Oracle — jdbc:oracle:thin:@pbs-lim:8080:pbspatial
SQL Server — jdbc:sqlserver://PBS-LIM:8080;databaseName=pbspatial
PostGres/GIS — jdbc:postgresql://111.111.11.111:8080/pbspatial
6. [ユーザ名] フィールドで、データベース リソースに接続するユーザを指定します。
7. [パスワード] フィールドで、データベース リソースに接続するユーザのパスワードを指定します。
8. [プロパティ] フィールドで、データベース固有の接続プロパティを指定します。 接続文字列に追
加できるプロパティ名と値のタイプについては、データベースのドキュメントを参照してくださ
い。 例えば、プロパティ値 networkProtocol とキー tcp を追加できます。
注: 現在、Oracle はダイアログからプロパティをサポートする唯一のデータベースです。
PostGres/GIS および SQL Server の場合は、プロパティを URL に追加します。
ユーザ ガイド
847
名前付きテーブル
9. [テスト] をクリックして、接続が有効であることを確認します。
10. [OK] をクリックします。
Find Nearest、Query Spatial Data、および Read Spatial Data で使用可能なリソースの一覧にこのデー
タベース リソースへの名前付き接続が表示されるようになります。 これらの接続は、データベース
リソース内の名前付きテーブルへのアクセスにも使用できます。
名前付き接続の削除
1. Management Console を開きます。
2. [モジュール] > [Location Intelligence] > [ツール] の順に展開してから [Named Connections] を
クリックします。
3. 削除する名前付き接続をハイライト表示にして、[削除] をクリックします。 名前付き接続を削除
するかどうかを尋ねる確認メッセージが表示されます。
4. [OK] をクリックして確認します。
名前付きテーブル
Location Intelligence モジュールのステージ、サービス、および操作では、さまざまなデータ タイプに
アクセスする名前付きテーブルが必要です。 名前付きテーブルはデータを指すリソースで、MapInfo
TAB、Shape、またはデータベース ファイルへのアクセスに使用できます。 この手順では、Location
Intelligence モジュールの名前付きテーブル リソースを追加または変更する方法について説明します。
これらの名前付きテーブルは、Location Intelligence モジュールのリポジトリに保存され、すべての空
間サービスが使用できます。
データベースをまだインストールしていない場合は、データをシステムにインストールしてください。
データベース リソース内の名前付きテーブルを追加するには、まずデータベース リソースに名前付き
接続を追加する必要があります。 名前付き接続の追加については、名前付き接続の追加または変更
(847ページ)を参照してください。
注: read、add、および modify 権限を持つユーザのみが、Management Console を使用して名前付
きテーブルを追加できます。 権限の割り当ての詳細については、
http://reference.mapinfo.com/software/spectrum/lim/8_0/index.html で『ユーザ管理ガイド』
を参照してください。
名前付きテーブルの追加または変更
1. Management Console を開きます。
2. [モジュール] > [Location Intelligence] > [ツール] の順に展開してから [Named Tables] をクリッ
クします。
3. [追加] または [変更] をクリックします。 [名前付きテーブルの追加] または [名前付きテーブルの更
新] ダイアログ ボックスが表示されます。
848
Spectrum™ Technology Platform 8.0.0
第 28 章 : Location Intelligence モジュール
4. 新しい名前付きテーブルを追加する場合は、その名前付きテーブル リソースのリポジトリ パスと
名前を [名前付きテーブル名] フィールドに入力します。 名前付きテーブルの名前の前に、名前付
きテーブルを作成するリポジトリ内の場所を付加する必要があります。 例えば、名前付きテーブ
ル World をリポジトリの NamedTables フォルダ内に作成する場合、[名前付きテーブル名] フィー
ルドに /NamedTables/World と入力します。 既存の名前付きテーブル リソース名を変更するこ
とはできません。 既存のリソース名を変更すると、そのリソースを参照するサービスまたはジョ
ブが失敗します。
5. [名前付きテーブル タイプ] フィールドで、次のいずれかを選択します。
•
Tab — データがファイル システム上に MapInfo TAB 形式で存在する場合はこのオプションを
選択します。
•
Shape — 空間データが ESRI シェイプ ファイル形式の場合はこのオプションを選択します。
•
データベース — データがデータベース内にあり、名前付き接続を作成済みの場合はこのオプ
ションを選択します。
6. ソース タイプとして TAB を選択した場合は、TAB ファイルへのパスを [パス] フィールドに指定
します。
7. ソース タイプとして Shape File を選択した場合は、Shape ファイルへのパスを [パス] フィールド
に指定します。
8. ソース タイプとしてデータベースを選択した場合は、次のフィールドに入力します。
•
接続名 — データベースにアクセスするために使用する一連のパラメータを定義する、データ
ベースへの名前付き接続です。 既存の名前付き接続を指定するには、一覧から名前を選択しま
す。
•
スキーマ — オプションのデータベース スキーマ オブジェクト。 通常は、ユーザ名と同じで
す。
•
テーブル — データフローに読み込む空間データを格納しているテーブル。
9. [OK] をクリックします。
Find Nearest、Query Spatial Data、および Read Spatial Data で使用可能なリソースの一覧にこの名
前付きテーブル リソースが表示されるようになります。
名前付きテーブルの削除
1. Management Console を開きます。
2. [モジュール] > [Location Intelligence] > [ツール] の順に展開してから [Named Tables] をクリッ
クします。
3. 削除する名前付きテーブルをハイライト表示にして、[削除] をクリックします。 名前付きテーブ
ルを削除するかどうかを尋ねる確認メッセージが表示されます。
4. [OK] をクリックして確認します。
ユーザ ガイド
849
Point In Polygon
Point In Polygon
Point In Polygon コンポーネントは、緯度/経度座標を入力として受け取り、その地点が存在する地図
上のエリア (つまり "ポリゴン") を特定します。 また、ラインのデータベースとともに使用した場合は
ラインへの距離、ポイントのデータベースとともに使用した場合はポイントへの距離を算出できます。
ポリゴンは、関心のある特定の空間的特徴を表すものとして定義できます。 関心のあるエリアの例と
しては、洪水発生地帯、米下院議員選挙区、販売区域などが挙げられます。 その他の例としては、以
下のものがあります。
• 銀行 — 個々の支店の、周辺地域への市場参入度を調べます。
• 保険 — 保険料適用地域、洪水帯、または海岸までの距離を調べます。
• 小売 — カタログ、ダイレクト メール、地域限定の新聞広告、特定市場向けの掲示板のメッセージ
のターゲットを特定します。
• 通信 — 潜在顧客が DSL サービスを利用可能かどうかを判断します。
Point In Polygon は、Location Intelligence モジュールに含まれています。 このモジュールの詳細 (こ
れに含まれるその他のコンポーネント等) については、Location Intelligence モジュールとは(834ペー
ジ) を参照してください。
入力
表 161 : Point In Polygon の入力
フィールド名
書式 [最 説明/有効値
大]
Latitude
文字列
[11]
ロケーションを示す座標の緯度の部分。経度を、[座標フォー
マット] オプションで選択したフォーマットで指定します。
注: 正数が北東の半球を表し、負数が南西の半球を表す形
式で緯度と経度を 100 万分の 1 度で指定します。 例え
ば、小数 (想定小数点) 形式では、ポイント 140A°W,
30A°N は -140000000, 30000000 と表現されます。
Longitude
文字列
[11]
ロケーションを示す座標の経度の部分。緯度を、[座標フォー
マット] オプションで選択したフォーマットで指定します。
注: 正数が北東の半球を表し、負数が南西の半球を表す形
式で緯度と経度を 100 万分の 1 度で指定します。 例え
ば、小数 (想定小数点) 形式では、ポイント 140A°W,
30A°N は -140000000, 30000000 と表現されます。
850
Spectrum™ Technology Platform 8.0.0
第 28 章 : Location Intelligence モジュール
フィールド名
書式 [最 説明/有効値
大]
BufferWidth
Long
[10]
ポリゴン/ライン/ポイント バッファの幅を指定します。 バッ
ファ幅を使用して、ロケーションがポリゴン/ライン/ポイン
トの端に近いかどうかを判断します。 出力フィールド
BufferRelation は、ロケーションがバッファエリア内にある
かどうかを示します。
このフィールドによって、[バッファ幅のデフォルト] で指定
された値がオーバーライドされます。 バッファ幅を指定し
ない場合、デフォルトが使われます。
[距離単位] オプションで指定した単位でバッファ幅を指定し
てください。
注: この機能には、マッチング対象のデータベースがポイ
ントのみのファイルであるか、バッファをサポートし
ている必要があります。 Point in Polygon ステージで
[バッファリングのサポート] フィールドを確認するこ
とにより、データベースがこの機能をサポートしてい
るかどうかわかります。
オプション
表 162 : Point In Polygon のオプション
オプション
説明
データベース
検索プロセスで使用するポリゴン データを含むデータベースの名前。
このフィールドには、Spectrum™ Technology Platform システムで
Management Console から利用できるデータベースがリストされま
す。 詳細については、Location Intelligence モジュール Centrus デー
タベース リソースの追加(234ページ)を参照してください。
データベースを選択すると、そのデータベースに関する次の情報が表
示されます。
座標系
選択中のデータベースで座標を指定するために使わ
れる表記方式を示します。
バッファリング 選択中のデータベースが境界バッファリングをサ
のサポート
ポートしているかどうかを示します。 バッファリ
ユーザ ガイド
851
Point In Polygon
オプション
説明
ングの詳細については、バッファリング(858ペー
ジ)を参照してください。
デフォルト バッファ幅
バッファのデフォルトの幅を指定します。 バッファ幅は、ポイントが
ポリゴン/ライン/ポイントの端に近いかどうかを判断するのに使用さ
れます。 例えば、1 マイルのバッファ幅を指定した場合、Point In
Polygon はそのロケーションがポリゴンの端から内側または外側 1 マ
イル以内にあるかどうかを識別します。
ここで指定するデフォルト バッファ幅は、BufferWidth 入力フィール
ドを使用して、レコード単位でオーバーライドできます。
出力フィールド BufferRelation は、ポイントがバッファエリア内にあ
るかどうかを示します。
[距離単位] オプションで指定した単位でバッファ幅を指定してくださ
い。
注: この機能には、マッチング対象のデータベースがポイントのみの
ファイルであるか、バッファをサポートしている必要がありま
す。 データベースがこの機能をサポートしていない場合、この
フィールドは使用できません。
座標フォーマット
距離単位
852
Point In Polygon が返す緯度/経度座標のフォーマットを指定します。
次のいずれかを選択します。
小数度
(90.000000, 180.000000)。 こちらがデ
フォルトです。
想定小数度
(90000000, 180000000)。
度-分-秒
(90 00 00N, 180 00 00W)
ゼロ補完想定小数度
(090000000N, 180000000W)
ゼロ補完小数度
(090.000000N, 180.000000W)
距離を表す単位を指定します。 次のいずれかを選択します。
マイル
距離をマイルで測ります。
Km
距離をキロメートルで測ります。
フィート
距離をフィートで測ります (デフォルト)。
Spectrum™ Technology Platform 8.0.0
第 28 章 : Location Intelligence モジュール
オプション
説明
メートル
結果の最大数
距離をメートルで測ります。
1 つのロケーションに対して返すポリゴン/ライン/ポイントの最大数を
指定します。 デフォルトは 10 です。
次の状況では、1 つのロケーションが複数のポリゴン/ライン/ポイント
に存在することがあります。
• データベース内に重複したポリゴン/ライン/ポイントが存在する。
• 大きなバッファ エリアが指定されていて、結果としてバッファ エ
リアが重なっている。
ポリゴンの辺までの距離を出 ロケーションから、ポリゴン/ライン/ポイントの境界上にある最も近
力
いポイントまでの距離を計算し、その距離を出力フィールド
DistanceToBorder に入れるかどうかを指定します。 このオプション
を選択しない場合、このフィールドは出力に含まれません。
注: このオプションを選択すると、境界への距離を求めるための追加
の計算が必要となるため、処理時間は長くなります。
出力
Point In Polygon は、ロケーションが存在する各ポリゴン/ライン/ポイントに関する情報を返します。
マッチした各ポリゴンは、以下のテーブルに列挙されたデータとともにそれぞれ別個のレコードで返
されます。
表 163 : Point In Polygon 出力
フィールド名
書式
説明/有効値
[DataSource].[Attribute]
String
ポリゴン/ライン/ポイントに関する情報を含みます。
[DataSource] は、[データベース] オプションで選択したデー
タベース名で、[Attribute] は属性名です。
[DataSource].[Attribute] フィールドで返される具体的な情報
は、データベースによって異なります。 例えば、米下院選
挙区のデータベースに対してマッチングを行う場合、フィー
ルドには、下院議員の名前、その議員の所属党、下院選挙
区番号などが含まれる可能性があります。 属性フィールド
ユーザ ガイド
853
Point In Polygon
フィールド名
書式
説明/有効値
の完全な一覧については、データベースに付属するドキュ
メントを参照してください。
[DataSource].BufferRelation
String [1] ポリゴン/ライン/ポイントに対するポイントの位置を表しま
す。 [DataSource] は、[データベース] オプションで選択し
たデータベース名です。
次のいずれかの値をとります。
P ポイントは、ポリゴン/ライン/ポイントの中にあり、境
界線からの距離は指定されたバッファ幅よりも大きく
なっています。 バッファ幅は、[デフォルト バッファ
幅] オプションまたは入力フィールド BufferWidth に
よって指定します。
I
ポイントはポリゴン/ライン/ポイントの中にあります
が、端の近くです。 これは、ポイントが [デフォルト
バッファ幅] オプションまたは入力フィールド
BufferWidth によって指定されたバッファ エリア内に
あることを示します。
B ポイントはポリゴン/ライン/ポイントの外にあります
が、端の近くです。 これは、そのロケーションが [デ
フォルト バッファ幅] オプションまたは入力フィール
ド BufferWidth によって指定されたバッファ エリア内
にあることを示します。
E ロケーションはすべてのポリゴン/ライン/ポイントの外
にあり、バッファ エリア内にありません。
バッファリングの詳細については、バッファリング(858ペー
ジ)を参照してください。
854
[DataSource].DistanceToBorder 文字列
ポイントからポリゴン/ライン/ポイントの境界までの距離を
示します。 距離は [距離単位] オプションで指定された単位
になります。 [DataSource] は、[データベース] オプション
で選択したデータベース名です。
[DataSource].PolygonName
ロケーションが存在するポリゴン/ライン/ポイントの名前で
す。 [DataSource] は、[データベース] オプションで選択し
たデータベース名です。
文字列
[128]
Spectrum™ Technology Platform 8.0.0
第 28 章 : Location Intelligence モジュール
フィールド名
書式
説明/有効値
PolygonCount
文字列
ロケーションに適用されるポリゴン/ライン/ポイントの数を
示します。 例えば、PolygonCount=3 は、そのロケーショ
ンをカバーするポリゴン/ライン/ポイントが 3 つあることを
意味します。
注: 住所がバッファ エリアの外にある場合、そのポリゴン/
ライン/ポイントが数に含まれます。
Status
Status.Code
文字列
[1]
文字列
[100]
マッチの成功または失敗を報告します。
NULL
成功
F
失敗
失敗の原因 (ある場合)。 次のいずれかを選択します。
NoMatchFound
Point In Polygon は入力されたロケー
ションに適用されるポリゴンまたは
ラインを見つけられませんでした。
InsufficientInputData ロケーションを特定するには入力レ
コードのデータが十分でありませ
ん。
MalformedInputData 入力されたロケーションが、認識可
能なフォーマットでありません。
InputOutOfRange
Status.Description
文字列
[100]
緯度または経度が、対応可能な範囲
の外にあります。 緯度の座標は、
-90A° 〜 90A° である必要がありま
す。 経度の座標は、-180A° 〜 180A°
である必要があります。
Status.Code に示された失敗の説明です。
レポート
Point In Polygon で使用できるレポートは、 Point In Polygon Summary Report です。 このレポートに
は、Point In Polygon の設定、処理済みレコード数、パフォーマンス統計、使用されたデータベースな
ど、ジョブに関する一般的な情報が含まれます。
ユーザ ガイド
855
Point In Polygon
レポートの使用方法については、ジョブへのレポートの追加(186ページ)を参照してください。
このレポートには、次の情報が含まれます。
• Processing Statistics — このセクションには、処理済みレコード数と得られたマッチの数が表示さ
れます。
• Total Number of Records Processed — このジョブで正しく処理されたレコードの総数です。
• Record-Level Matches — ポリゴン/ライン/ポイント グループの総数です。
• Polygon-Level Matches — ロケーションにマッチするものとして検出されたポリゴン/ライン/ポイ
ントの総数です。 結果の最大数の設定によって、1 つのポイントが複数のポリゴン/ライン/ポイント
になることがあります。
• Configuration — このセクションには、このジョブに影響を与えた設定オプションが表示されます。
これらの設定の詳細については、オプション(851ページ)を参照してください。
• Database Name — このジョブの境界データに使用されたデータベースの名前です。
• GSB File — データベース ファイルへのパス。
• Maximum Results — ロケーションに対して返すポリゴン/ライン/ポイントの最大数。
• Cache Size — ポリゴン/ライン/ポイント データをキャッシュするために使用するメモリ容量。
• Distance Units — 距離の単位。
• Default Buffer Width — バッファのデフォルト サイズ。 詳細については、バッファリング(858ペー
ジ)を参照してください。
• Coordinate Format — 出力の座標に使用するフォーマット。
• Include distance to border — このジョブで、各ポイントからポリゴン/ライン/ポイントの境界線ま
での距離を計算したかどうかを示します。
• Performance Statistics — このセクションは、ジョブの実行時間に関する情報を示します。
• Processing Start Time — ジョブが開始した日時。
• Processing End Time — ジョブが終了した日時。
• Records Per Hour — このジョブにおけるレコードの処理速度。
• Database Attributes — このセクションは、処理に使用されたデータベースに含まれるポリゴンま
たはライン属性の一覧を示します。 属性には、データベース内の各ポリゴン/ライン/ポイントに関
する情報が含まれます。 例えば、下院選挙区のデータベースには、下院選挙区番号、下院議員の名
前、その議員の所属党、議員の Web サイト URL などの属性が存在する場合があります。
Point In Polygon の例
以下のマップを使用して、Point In Polygon の処理を説明します。 このマップは、保険会社の販売区
域を表しているものとします。 マップ上には、これらの販売区域に存在する洪水発生地帯も示されて
います。
856
Spectrum™ Technology Platform 8.0.0
第 28 章 : Location Intelligence モジュール
この保険会社に対し、ある潜在顧客が住宅所有者保険の見積もりを依頼したとします。 保険会社は見
積もりを作成するために、その家屋が洪水発生地帯に存在するかどうかを確認しなければなりません。
また、その家屋が存在する販売区域を特定する必要があります。 保険会社はこれらの情報を得るため
に、家屋が存在する "ポリゴン"、つまりエリアを特定する必要があります。 まず、家屋の住所を緯度/
経度座標に変換します (この処理は、Enterprise Geocoding モジュールによって行うことができます)。
得られた座標を、Point In Polygon の入力として使用します。 座標により、家屋が以下のロケーショ
ンに存在することがわかったとします。
ユーザ ガイド
857
Point In Polygon
Point In Polygon では、この家屋が「販売区域 4」のポリゴン内に存在することを特定します。 また、
Point In Polygon により、この家屋が「洪水発生地帯」のポリゴンには含まれないため、見積もりに洪
水保険を入れる必要がないこともわかります。
この例が示すように、与えられたロケーションに対し、複数の分析処理を行います。 この例では、確
認したい項目は、 販売区域と、洪水発生地帯に含まれるか否かの 2 点でした。 この確認を行うには、
洪水発生地帯の場所を含むデータベースと、保険会社の販売区域の場所を含むデータベースの 2 つの
データベースに対するマッチングが必要になります。 複数のデータベースに対するマッチングを行う
には、Enterprise Designer で、各データベースに対して 1 つずつ、複数の Point In Polygon ステージ
を含むジョブを作成します。
バッファリング
ポリゴン、ライン、ポイントに近いエリアを指定するのにバッファリングを使用します。
バッファリングされたポリゴン
(zone)
バッファリングされたライン
(corridor)
バッファリングされたポイント
(circle)
例えば、あなたが保険会社に勤務している場合、潜在的な顧客の家が洪水発生地帯の 500 フィート以
内にあるかどうかを知ることができれば、実際に洪水発生地帯内になかったとしても、洪水保険を勧
めることができます。 下記の図は、バッファリングされたポリゴンを使用してこのシナリオを表して
います。 点線は、洪水発生地帯の境界線を示しており、色の付いているエリアは境界線から 500 フィー
トの範囲にあるエリアを示しています。
バッファエリアは、境界線の両サイド (内側と外側) に及んでいます。 バッファリングを使用する場
合、出力フィールド BufferRelation はそのポイントがバッファリングに含まれているかどうか、また、
ポリゴンの内側と外側のどちらにあるかを示します。以下の図は、これを表したものです。
858
Spectrum™ Technology Platform 8.0.0
第 28 章 : Location Intelligence モジュール
ポイントはポリゴンの中にあり、 ポイントは、ポリゴンの中にあ
バッファエリア内にはありませ り、バッファエリア内にありま
ん。
す。
ポイントは、ポリゴンの外にあ
りますが、バッファエリア内に
あります。
出力フィールド BufferRelation は 出力フィールド BufferRelation は 出力フィールド BufferRelation は
"P" となります。
"I" となります。
"B" となります。
レコードごとのポリゴン バッファのサイズは BufferWidth 入力フィールドで指定し、ジョブ用のデフォ
ルトのポリゴン バッファ幅は [デフォルト バッファ幅] オプションで設定します。
データベース
Point In Polygon は、ポリゴンのデータベースとラインのデータベースに対応します。
• ポリゴン データベース — ポリゴン データベースには、Point In Polygon において分析に使用するポ
リゴンの境界線が定義されています。 洪水発生地帯と販売区域のデータベースの代わりに、米下院
選挙区のデータベースを使用する場合は、その家屋の居住者を代表する議員の名前が特定でき、ZIP
Code のデータベースを使用する場合は、その家屋の ZIP Code が特定できます。
• ライン データベース — ライン データベースには、断層線、海岸線、ハリケーンの進路などが定義
されています。 バッファリングを使用することにより、ポイントがラインから一定の距離の範囲に
存在するかどうかを確認できます。
• ポイント データベース — ポイント データベースには、ハリケーン (暴風雨) の位置など、特定のポ
イントが定義されています。 バッファリングを使用することにより、与えられたロケーションがポ
イントから一定の距離の範囲に存在するかどうかを確認できます。
Point In Polygon の分析を実行するにはまず、対象とするポリゴンまたはラインを含むデータベースを
取得する必要があります。 これらのデータベースは、Pitney Bowes Software から購入できます。 提
供されているデータベースの一覧については、Location Intelligence モジュール データベース(834ペー
ジ)を参照してください。 販売区域や保険料適用区域など、特定の組織において対象とするエリアや
ラインを定義する、ユーザ定義ファイルを作成することもできます。 詳細については、ユーザ定義の
Centrus データベース(879ページ)を参照してください。
Query Spatial Data
Query Spatial Data ステージでは、空間関数と標準的な SQL 関数を使用して、空間データに対するク
エリを実行できます。 フィールドを空間データ クエリのパラメータとして使用できます。 例えば、
ユーザ ガイド
859
Query Spatial Data
フラット ファイルから "AddressLine1" フィールドを読み込む場合、AddressLine1 の値をパラメータ
値に使用して空間データ ソースから選択するクエリを作成できます。
オプション
[全般] タブ
表 164 : Query Spatial Data の全般オプション
オプション
説明
名前付きテーブル
アクセスしたい空間データを含む名前付きテーブル リソースの名前。 この
フィールドには、Management Console によって定義された名前付きテー
ブル リソースの一覧が含まれます。 詳細については、Location Intelligence
モジュールの名前付きテーブル リソースの追加(237ページ)を参照してく
ださい。
座標系
クエリによって返されるジオメトリ オブジェクトの座標系。 Query Spatial
Data は、ここで指定した座標系にジオメトリを変換します。 フォーマット
は、European Petroleum Survey Group (EPSG) コード、SRID コード、ま
たは MAPINFO コードでなければなりません。 codespace:code という
形式で、座標参照系を指定します。 例えば、緯度/経度 (WGS 84) で表され
るジオメトリは、EPSG:4326 となります。 デフォルト値は、緯度/経度
(WGS 84) として知られる EPSG:4326 です。 これは、世界規模の座標系
であり、ナビゲーションや測量に広く使用されている NAVSTAR Global
Positioning System (GPS: 全地球測位システム) に関連付けられた地球基準
座標系です。 この測地系は、地球の中心 ("地心") を原点とし、衛星および
地上データによって定義されています。
以下の表に、使用頻度の高い EPSG コードを示します。
860
座標系
EPSG コード
緯度/経度 (WGS 72)
4322
緯度/経度 (WGS 84)
4326
緯度/経度 (NAD 83)
4269
緯度/経度 (OSGB 36)
4277
British National Grid
27700
Spectrum™ Technology Platform 8.0.0
第 28 章 : Location Intelligence モジュール
オプション
説明
WHERE
データフローに読み込まれたレコードをフィルタリングする SQL WHERE
節。
データ内のフィールドと Query Spatial Data 入力フィールドを表示するに
は、[プレビュー] をクリックします。 データの最初の 50 個のレコードが
表示されます。 [プレビュー] では、フィールドの名前と、フィールドから
のデータに対してデータフローで使用される名前であるステージ名が表示
されます。 これら 2 つの名前は、データフローにおいてフィールドの名前
を変更した場合のみ、互いに異なります。 それ以外の場合、この名前はス
テージ名と同じです。
WHERE 節を指定する場合は、ここに入力します。 ポップアップ ウィンド
ウに、フィールドや関数の一覧が表示され、入力内容に応じてその一覧が
絞り込まれていきます。
ステージ フィールドからのデータを WHERE 節のパラメータとして使用す
るには、 ${<フィールド名>} という形式でステージ名を指定します。 例え
ば、${StoreID} と指定します。
注: WHERE 節の作成時に、Query Spatial Data 入力フィールドをパラメー
タとして使用する場合は、ステージ名を使用します。 検索対象のテー
ブルの列を参照する場合は、この名前を使用します。
例えば、カリフォルニア州にある店舗から 100 km の範囲内にいる顧客の
顧客データに対してクエリを行う WHERE 節は、以下のようになります。
StateProvince='CA' And MI_Distance(${StoreLocation},
CustHome, 'km', 'Spherical')<100
この WHERE 節では、
• StateProvice は、クエリされるデータ内の列です。
• ${StoreLocation} は、上流の Read Spatial Data ステージのフィール
ドです。
• CustHome は、クエリされるデータ内の列です。
使用可能な関数の詳細については、このステージのオンライン ヘルプを参
照してくださいを参照してください。
ソート オプション
ソート オプションを使用して、クエリによって返されるレコードをレコードのフィールドの値に基づ
いて特定の順序にソートすることができます。 これは、データ内に存在する順序と異なる順序でレ
コードを処理したい場合に役立ちます。 例えば、データ内のレコードがアカウント番号でソートされ
ているが、郵便番号順に Spectrum で処理したい場合、ソート オプションを使用して郵便番号フィー
ユーザ ガイド
861
Read Spatial Data
ルドでレコードをソートすることができます。 すると、レコードは郵便番号順に Spectrum で処理さ
れます。 分析を行いやすいよう、データをソートすることもできます。 ソートの基とするフィールド
がデータ内でインデックス付けされていない場合、パフォーマンスが低下する可能性があります。
出力
Query Spatial Data では、指定された SQL WHERE 節 (ある場合) を適用し、レコードをソートしてか
ら (ソート オプションが指定されている場合)、指定されたデータ ソースからデータを読み込みます。
返されるフィールドは、[全般] タブで含めるよう選択されたフィールドです。
Read Spatial Data
Read Spatial Data では、Oracle Spatial、MapInfo TAB、SQL Server, PostGIS/Gres、および ESRI
シェイプ ファイル形式のデータにアクセスし、そのデータをデータフローの入力として使用できま
す。 これらの形式の空間データにアクセスするには、Read from DB または Read from File の代わり
に、Read Spatial Data を使用する必要があります。
オプション
[一般] タブ
表 165 : Read Spatial Data の全般オプション
オプション
説明
名前付きテーブル
アクセスしたい空間データを含む名前付きテーブル リソースの名前。 この
フィールドには、Management Console によって定義された名前付きテー
ブル リソースの一覧が含まれます。 詳細については、Location Intelligence
モジュールの名前付きテーブル リソースの追加(237ページ)を参照してく
ださい。
座標系
クエリによって返されるジオメトリ オブジェクトの座標系。 Read Spatial
Data は、ここで指定した座標系にジオメトリを変換します。 フォーマット
は、European Petroleum Survey Group (EPSG) コード、SRID コード、ま
たは MAPINFO コードでなければなりません。 codespace:code という
形式で、座標参照系を指定します。 例えば、緯度/経度 (WGS 84) で表され
るジオメトリは、EPSG:4326 となります。 デフォルト値は、緯度/経度
(WGS 84) として知られる EPSG:4326 です。 これは、世界規模の座標系
であり、ナビゲーションや測量に広く使用されている NAVSTAR Global
Positioning System (GPS: 全地球測位システム) に関連付けられた地球基準
862
Spectrum™ Technology Platform 8.0.0
第 28 章 : Location Intelligence モジュール
オプション
説明
座標系です。 この測地系は、地球の中心 ("地心") を原点とし、衛星および
地上データによって定義されています。
以下の表に、使用頻度の高い EPSG コードを示します。
パラメータ
座標系
EPSG コード
緯度/経度 (WGS 72)
4322
緯度/経度 (WGS 84)
4326
緯度/経度 (NAD 83)
4269
緯度/経度 (OSGB 36)
4277
British National Grid
27700
データフローに読み込まれたレコードをフィルタリングする SQL WHERE
節。 例えば、次の場合は StateProvice フィールドが CA のレコードから読
み込まれます。
StateProvince='CA'
データ内のフィールドと Read Spatial Data の入力フィールドを表示するに
は、[プレビュー] をクリックします。 データの最初の 50 個のレコードが
表示されます。 [プレビュー] では、フィールドの名前と、フィールドから
のデータに対してデータフローで使用される名前であるステージ名が表示
されます。 この名前と異なるフィールド名をデータフローで使用する場合
は、新しい名前を [ステージ フィールド] 列に入力します。
WHERE 節を指定する場合は、ここに入力します。 ポップアップ ウィンド
ウに、フィールドや関数の一覧が表示され、入力内容に応じてその一覧が
絞り込まれていきます。 使用可能な関数の詳細については、このステージ
のオンライン ヘルプを参照してくださいを参照してください。
ソート オプション
ソート オプションを使用して、入力レコードをレコードのフィールドの値に基づいて特定の順序に
ソートすることができます。 これは、データ内に存在する順序と異なる順序でレコードを処理したい
場合に役立ちます。 例えば、データ内のレコードがアカウント番号でソートされているが、郵便番号
順に Spectrum で処理したい場合、ソート オプションを使用して郵便番号フィールドでレコードをソー
トすることができます。 すると、レコードは郵便番号順に Spectrum で処理されます。 分析を行いや
すいよう、データをソートすることもできます。 ソートの基とするフィールドがデータ内でインデッ
クス付けされていない場合、パフォーマンスが低下する可能性があります。
ユーザ ガイド
863
Spatial Calculator
出力
Read Spatial Data では、指定された SQL WHERE 節 (ある場合) を適用し、レコードをソートしてか
ら (ソート オプションが指定されている場合)、指定されたデータ ソースからデータを読み込みます。
返されるフィールドは、[全般] タブで含めるよう選択されたフィールドです。
Spatial Calculator
Spatial Calculator は、ポリゴンの面積、2 つのポイント間の距離、エリアの周囲長等、空間データに
対する様々な計算を実行します。
オプション
実行する計算のタイプによる Spatial Calculator のオプション。
面積
ジオメトリ オブジェクトの地理的な面積を返します。
表 166 : 面積のオプション
オプション名
説明
面積の単位
面積の計算に使用する単位を指定します。 次のいずれかを選択します。
• 平方センチメートル
• 平方フィート
• 平方インチ
• 平方キロメートル
• 平方メートル
• 平方マイル
• 平方ヤード
ジオメトリ フィールド
面積を計算するジオメトリを含む入力フィールドの名前。
面積サイズ フィールド
Spatial Calculator が返す面積を含める出力フィールド。
バッファ
ジオメトリ オブジェクトの周囲のバッファ距離を表すジオメトリ オブジェクトを返します。
864
Spectrum™ Technology Platform 8.0.0
第 28 章 : Location Intelligence モジュール
表 167 : バッファ オプション
オプション名
説明
距離単位
バッファの計算に使用する単位を指定します。 次のいずれかを選択しま
す。
• センチメートル
• フィート
• インチ
• キロメートル (デフォルト)
• メートル
• マイル
• ヤード
バッファ幅
ソース ジオメトリからバッファの端までの距離を [距離単位] フィールドで
指定した単位で表します。 このオプションによってバッファのサイズを制
御します。
滑らかさ
ポイントのバッファリングからの円の作成に使用するセグメントの最小数。
デフォルトは 12 です。
ジオメトリ フィールド
バッファするジオメトリを含む入力フィールド。
バッファ幅フィールド
(オプション) デフォルトのバッファ幅のオーバーライドに使用するバッファ
サイズを含む入力フィールドがある場合、ここでそのフィールドを指定し
ます。 入力バッファ幅フィールドを使用すると、バッファ幅をレコード単
位で設定できます。
ジオメトリ フィールド
Spatial Calculator が返すジオメトリを含める出力フィールド。
凸包
入力ジオメトリの周囲の凸包を表すジオメトリ オブジェクトを返します。 凸包は、図形の周囲にゴム
を巻く様子に似た操作です。
ユーザ ガイド
865
Spatial Calculator
注: 複数の接続されていない図形に対して凸包操作を実行する場合 (上図参照)、まず Spatial Union ス
テージを使用して結合を生成し、次にそのジオメトリを Spatial Calculator ステージに送って凸包
操作を実行します。
表 168 : 凸包のオプション
オプション名
説明
ジオメトリ フィールド 凸包操作で囲むジオメトリを含む入力フィールド。
(「入力フィールド」の
下)
ジオメトリ フィールド Spatial Calculator が返すジオメトリを含める出力フィールド。
(「出力フィールド」の
下)
座標系変換
ある座標系から別の座標系へとジオメトリを変換します。
表 169 : 座標系変換のオプション
オプション名
変換先
説明
ジオメトリの変換先の座標系を指定します。 フォーマットは、European
Petroleum Survey Group (EPSG) コード、SRID コード、または MAPINFO
コードでなければなりません。 codespace:code という形式で、座標参
照系を指定します。 例えば、緯度/経度 (WGS 84) で表されるジオメトリ
は、EPSG:4326 となります。 デフォルト値は、緯度/経度 (WGS 84) とし
て知られる EPSG:4326 です。 これは、世界規模の座標系であり、ナビゲー
ションや測量に広く使用されている NAVSTAR Global Positioning System
(GPS: 全地球測位システム) に関連付けられた地球基準座標系です。 この
測地系は、地球の中心 ("地心") を原点とし、衛星および地上データによっ
て定義されています。
以下の表に、使用頻度の高い EPSG コードを示します。
866
Spectrum™ Technology Platform 8.0.0
第 28 章 : Location Intelligence モジュール
オプション名
説明
座標系
EPSG コード
緯度/経度 (WGS 72)
4322
緯度/経度 (WGS 84)
4326
緯度/経度 (NAD 83)
4269
緯度/経度 (OSGB 36)
4277
British National Grid
27700
ジオメトリ フィールド 別の座標系に変換するジオメトリを含むフィールド。
(「入力フィールド」の
下)
ジオメトリ フィールド Spatial Calculator が返すジオメトリを含めるフィールドの名前です。
(「出力フィールド」の
下)
ポイント ジオメトリの作成
緯度/経度で指定されたロケーションを、ポイント ジオメトリに変換します。
表 170 : 座標変換のオプション
オプション名
座標系
説明
ポイント ジオメトリに使用する座標系を指定します。 フォーマットは、
European Petroleum Survey Group (EPSG) コード、SRID コード、または
MAPINFO コードでなければなりません。 codespace:code という形式
で、座標参照系を指定します。 例えば、緯度/経度 (WGS 84) で表されるジ
オメトリは、EPSG:4326 となります。 デフォルト値は、緯度/経度 (WGS
84) として知られる EPSG:4326 です。 これは、世界規模の座標系であり、
ナビゲーションや測量に広く使用されている NAVSTAR Global Positioning
System (GPS: 全地球測位システム) に関連付けられた地球基準座標系です。
この測地系は、地球の中心 ("地心") を原点とし、衛星および地上データに
よって定義されています。
以下の表に、使用頻度の高い EPSG コードを示します。
ユーザ ガイド
座標系
EPSG コード
緯度/経度 (WGS 72)
4322
緯度/経度 (WGS 84)
4326
867
Spatial Calculator
オプション名
説明
座標系
EPSG コード
緯度/経度 (NAD 83)
4269
緯度/経度 (OSGB 36)
4277
British National Grid
27700
緯度フィールド
ポイント ジオメトリに変換するロケーションの緯度を含むフィールド。
経度フィールド
ポイント ジオメトリに変換するロケーションの経度を含むフィールド。
ジオメトリ フィールド
Spatial Calculator が返すポイント ジオメトリを含めるフィールドの名前。
ライン ジオメトリの作成
緯度/経度で指定された 2 つのロケーションを、ライン ジオメトリに変換します。
表 171 : 座標変換のオプション
オプション名
座標系
説明
ライン ジオメトリに使用する座標系を指定します。 フォーマットは、
European Petroleum Survey Group (EPSG) コード、SRID コード、または
MAPINFO コードでなければなりません。 codespace:code という形式
で、座標参照系を指定します。 例えば、緯度/経度 (WGS 84) で表されるジ
オメトリは、EPSG:4326 となります。 デフォルト値は、緯度/経度 (WGS
84) として知られる EPSG:4326 です。 これは、世界規模の座標系であり、
ナビゲーションや測量に広く使用されている NAVSTAR Global Positioning
System (GPS: 全地球測位システム) に関連付けられた地球基準座標系です。
この測地系は、地球の中心 ("地心") を原点とし、衛星および地上データに
よって定義されています。
以下の表に、使用頻度の高い EPSG コードを示します。
868
座標系
EPSG コード
緯度/経度 (WGS 72)
4322
緯度/経度 (WGS 84)
4326
緯度/経度 (NAD 83)
4269
緯度/経度 (OSGB 36)
4277
British National Grid
27700
Spectrum™ Technology Platform 8.0.0
第 28 章 : Location Intelligence モジュール
オプション名
説明
セグメント ポイント
ライン ジオメトリに変換する緯度/経度で指定されたロケーションの集合を
含むフィールド。
ジオメトリ フィールド
Spatial Calculator が返すライン ジオメトリを含めるフィールドの名前。
距離
2 つのジオメトリの間の地理的距離を次のように計算します。
• ポイント — 2 ポイント間の距離を返します。
• ライン — 2 つのライン間の最短距離を返します。
• ポリゴン — 2 つのポリゴン間の最短距離を返します。 例えば、2 つのポリゴンが湖を表すものであ
る場合、距離は、最も近い 2 つの湖岸の間の距離になります。
表 172 : 距離オプション
オプション名
説明
距離単位
距離の計算に使用する単位を指定します。 次のいずれかを選択します。
• センチメートル
• フィート
• インチ
• キロメートル (デフォルト)
• メートル
• マイル
• ヤード
ジオメトリ 1 フィールド ジオメトリ 2 との間の距離を算出するために、ジオメトリ 2 と比較するジ
オメトリを含むフィールド。
ジオメトリ 2 フィールド ジオメトリ 1 との間の距離を算出するために、ジオメトリ 1 と比較するジ
オメトリを含むフィールド。
距離フィールド
Spatial Calculator が返す距離を含めるフィールドの名前。
エンベロープ
入力ジオメトリの最小外接矩形 (MBR) を表すエンベロープ ジオメトリ オブジェクトを返します。
ユーザ ガイド
869
Spatial Calculator
表 173 : エンベロープ オプション
オプション名
説明
ジオメトリ フィールド 最小外接矩形で囲むジオメトリを含む入力フィールド。
(「入力フィールド」の
下)
ジオメトリ フィールド Spatial Calculator が返す最小外接矩形を含める出力フィールド。
(「出力フィールド」の
下)
エンベロープ座標
最小外接矩形の頂点の緯度/経度座標を返します。 最小外接矩形の詳細については、エンベロープ
(869ページ)を参照してください。
表 174 : エンベロープ座標のオプション
オプション名
説明
ジオメトリ フィールド
座標を返すエンベロープ (最小外接矩形) を含むフィールド。
左下緯度フィールド
最小外接矩形の左下隅の緯度を含める出力フィールド。
左下経度フィールド
最小外接矩形の左下隅の経度を含める出力フィールド。
右上緯度フィールド
最小外接矩形の右上隅の緯度を含める出力フィールド。
右上経度フィールド
最小外接矩形の右上隅の経度を含める出力フィールド。
ジオメトリ座標
以下のようにジオメトリ オブジェクトの緯度/経度座標を返します。
• ポイント — ポイントの座標を返します。
• ライン — 代表的なポイントがあればそれを返します。ない場合はセントロイドを返します。
• ポリゴン — 代表的なポイントがあればそれを返します。ない場合はセントロイドを返します。
870
Spectrum™ Technology Platform 8.0.0
第 28 章 : Location Intelligence モジュール
代表的なポイントとは、重要なポイントのことです。 例としては、道路セグメントの主要な交差点
や、国の首都があります。 ジオメトリに代表的なポイントがない場合は、セントロイドが計算されま
す。 計算では、ジオメトリの中央に位置するポイントを検出します。
表 175 : ジオメトリ座標のオプション
オプション名
座標系
説明
座標を計算する際に使用する座標系を指定します。 フォーマットは、
European Petroleum Survey Group (EPSG) コード、SRID コード、または
MAPINFO コードでなければなりません。 codespace:code という形式
で、座標参照系を指定します。 例えば、緯度/経度 (WGS 84) で表されるジ
オメトリは、EPSG:4326 となります。 デフォルト値は、緯度/経度 (WGS
84) として知られる EPSG:4326 です。 これは、世界規模の座標系であり、
ナビゲーションや測量に広く使用されている NAVSTAR Global Positioning
System (GPS: 全地球測位システム) に関連付けられた地球基準座標系です。
この測地系は、地球の中心 ("地心") を原点とし、衛星および地上データに
よって定義されています。
以下の表に、使用頻度の高い EPSG コードを示します。
座標系
EPSG コード
緯度/経度 (WGS 72)
4322
緯度/経度 (WGS 84)
4326
緯度/経度 (NAD 83)
4269
緯度/経度 (OSGB 36)
4277
British National Grid
27700
ジオメトリ フィールド
調べたいジオメトリを含むフィールドです。
緯度フィールド
Spatial Calculator が返す緯度を含める出力フィールド。
経度フィールド
Spatial Calculator が返す経度を含める出力フィールド。
交差
2 つの入力ジオメトリ オブジェクトの交差領域を表すジオメトリ オブジェクトを返します。 オプショ
ンで、最初のジオメトリに対するパーセンテージとして、重複領域の割合を返します。
ユーザ ガイド
871
Spatial Calculator
表 176 : 交差のオプション
オプション名
説明
重複割合を返す
ジオメトリ 2 と交差するジオメトリ 1 の割合を計算するかどうかを指定し
ます。 このオプションは、デフォルトで有効になっています。
ジオメトリ 1 フィールド 交差の領域を特定するために、ジオメトリ 2 と比較するジオメトリを含む
フィールド。 重複割合は、ジオメトリ 1 の割合として計算されます。
ジオメトリ 2 フィールド 交差の領域を特定するために、ジオメトリ 1 と比較するジオメトリを含む
フィールド。
ジオメトリ フィールド
交差の領域のジオメトリを含める出力フィールド。
重複割合フィールド
ジオメトリ 2 と交差するジオメトリ 1 の割合を含める出力フィールド。
Is Intersection (交差する)
あるジオメトリ オブジェクトが他のジオメトリ オブジェクトと交差するかどうかを調べます。
表 177 : Is Intersection のオプション
オプション名
説明
ジオメトリ 1 フィールド ジオメトリが交差しているかどうかを調べるために、ジオメトリ 2 と比較
するジオメトリを含むフィールド。
ジオメトリ 2 フィールド ジオメトリが交差しているかどうかを調べるために、ジオメトリ 1 と比較
するジオメトリを含むフィールド。
Is Intersect フィールド
交差インジケータを含めるフィールドの名前です。 フィールドの値は、ジ
オメトリが交差する場合は "Y"、交差しない場合は "N" となります。
Is Line (ラインである)
ジオメトリに長さがあるが領域がなく、したがってラインであるかどうかを調べます。
872
Spectrum™ Technology Platform 8.0.0
第 28 章 : Location Intelligence モジュール
表 178 : Is Line のオプション
オプション名
説明
ジオメトリ フィールド
調べたいジオメトリを含むフィールドです。
Is Linear フィールド
操作結果を含めるフィールドの名前です。 フィールドの値は、ジオメトリ
がラインの場合は "Y"、ポリゴンでない場合は "N" となります。
Is Point (ポイントである)
ジオメトリが単一のポイントであるかどうかを調べます。
表 179 : Is Point オプション
オプション名
説明
ジオメトリ フィールド
調べたいジオメトリを含むフィールドです。
Is Point フィールド
操作結果を含めるフィールドの名前です。 フィールドの値は、ジオメトリ
がポイントの場合は "Y"、ポイントでない場合は "N" となります。
Is Polygon (ポリゴンである)
ジオメトリが領域を持ち、したがってポリゴンであるかどうかを調べます。
表 180 : Is Polygon オプション
オプション名
説明
ジオメトリ フィールド
調べたいジオメトリを含むフィールドです。
Is Polygon フィールド
操作結果を含めるフィールドの名前です。 フィールドの値は、ジオメトリ
がポリゴンの場合は "Y"、ポリゴンでない場合は "N" となります。
Is Within (含有される)
あるジオメトリ オブジェクトが他のジオメトリ オブジェクトに完全に含まれているかどうかを調べま
す。
ユーザ ガイド
873
Spatial Calculator
表 181 : Is Intersects オプション
オプション名
説明
ジオメトリ 1 フィールド ジオメトリ 2 に含まれる可能性のあるジオメトリを含むフィールドです。
ジオメトリ 2 フィールド ジオメトリ 1 を含む可能性のあるジオメトリを含むフィールドです。
Is Within フィールド
操作結果を含めるフィールドの名前です。 フィールドの値は、ジオメトリ
1 がジオメトリ 2 に含まれる場合は "Y"、含まれない場合は "N" となりま
す。
長さ
ラインの地理的な長さを返します。
表 182 : 長さのオプション
オプション名
説明
距離単位
長さの計算に使用する単位を指定します。 次のいずれかを選択します。
• センチメートル
• フィート
• インチ
• キロメートル (デフォルト)
• メートル
• マイル
• ヤード
ジオメトリ フィールド
長さを計算するジオメトリを含むフィールドの名前です。
長さフィールド
Spatial Calculator が返す長さを含めるフィールドの名前です。
周囲長
ジオメトリ オブジェクトの地理的な周囲長を返します。
874
Spectrum™ Technology Platform 8.0.0
第 28 章 : Location Intelligence モジュール
表 183 : 周囲長のオプション
オプション名
説明
距離単位
周囲長の計算に使用する単位を指定します。 次のいずれかを選択します。
• センチメートル
• フィート
• インチ
• キロメートル (デフォルト)
• メートル
• マイル
• ヤード
ジオメトリフィールド
周囲長を計算するジオメトリを含むフィールドの名前です。
長さフィールド
Spatial Calculator が返す周囲長を含めるフィールドの名前です。
出力
Spatial Calculator の出力は、計算の種類に依存します。
面積
この操作は、ジオメトリの面積を指定した単位で返します。
バッファ
この操作は、バッファリングされた形状を表すジオメトリを返します。
凸包
この操作は、凸包計算を適用した形状を表すジオメトリを返します。
座標系変換
この操作は、ジオメトリを指定された座標系で返します。
ポイント ジオメトリの作成
この操作は、ポイント ジオメトリを返します。
距離
この操作は、距離を指定された単位で返します。
ユーザ ガイド
875
Spatial Calculator
エンベロープ
この操作は、ジオメトリを返します。
エンベロープ座標
この操作は、エンベロープの左下および右上隅の緯度/経度座標を返します。
ジオメトリ座標
この操作は、ジオメトリの緯度および経度座標を返します。
交差
この操作は、次の 1 つまたは 2 つの情報を返します。
• ジオメトリ — 交差領域のジオメトリ
• 重複割合 — 1 つめのジオメトリのうち、2 つめのジオメトリに重なっている部分の割合。 この情報
は、返すと選択した場合のみ返されます。
Is Intersection (交差する)
2 つのジオメトリが交差する場合は "Y"、交差しない場合は "N" を返します。
Is Line (ラインである)
ジオメトリがラインである場合は "Y"、ラインでない場合は "N" を返します。
Is Point (ポイントである)
ジオメトリがポイントである場合は "Y"、ポイントでない場合は "N" を返します。
Is Polygon (ポリゴンである)
ジオメトリがポリゴンである場合は "Y"、ポリゴンでない場合は "N" を返します。
Is Within (含有される)
1 つめのジオメトリが 2 つめのジオメトリに含まれる場合は "Y"、含まれない場合は "N" を返します。
長さ
指定された単位でのジオメトリの長さ。
周囲長
指定された単位での周囲長。
876
Spectrum™ Technology Platform 8.0.0
第 28 章 : Location Intelligence モジュール
Spatial Union
Spatial Union は、2 つ以上の入力ジオメトリを結合したジオメトリ オブジェクトを返します。
入力
Spatial Union への入力は、結合操作を実行するジオメトリ オブジェクトで構成されます。 オプショ
ンとして、レコードをグループ化するフィールドも指定できます。 これを指定する場合、Spatial Union
は、各グループに対して個別に結合操作を実行します。 [グループ化方法] フィールドを指定しない場
合、入力ストリームのすべてのレコードに対して結合操作が実行されます。
[グループ化方法] フィールドを指定すると、入力の各グループに対して個別に結合操作が実行できま
す。 例えば、ある都市におけるすべての自動車販売店とその顧客を含む入力ファイルがあるとしま
す。 各自動車販売店に対し、その販売店のすべての顧客の自宅住所の結合を表すジオメトリを作成し
たいとします。 これを行うには、[入力ジオメトリ] フィールドに、顧客の自宅の場所を含むフィール
ドを指定します。 [グループ化方法] フィールドに、各自動車販売店の販売店 ID を含むフィールドを
指定します。 Spatial Union ステージは、各グループのジオメトリに対して結合操作を実行します。こ
の例の場合は、各販売店 ID グループに含まれるすべてのポイントに対する結合操作になります。 入
力が以下のとおりであるとします。
DealerID
Customer
HomeLocation
1
Benny
[ジオメトリ オブジェクト]
1
Jennie
[ジオメトリ オブジェクト]
1
Eric
[ジオメトリ オブジェクト]
1
Ruby
[ジオメトリ オブジェクト]
2
Mark
[ジオメトリ オブジェクト]
2
James
[ジオメトリ オブジェクト]
3
Brian
[ジオメトリ オブジェクト]
3
Michelle
[ジオメトリ オブジェクト]
ユーザ ガイド
877
Spatial Union
DealerID
Customer
HomeLocation
3
Stephen
[ジオメトリ オブジェクト]
[入力ジオメトリ] フィールドには HomeLocation を、[グループ化方法] フィールドには DealerID を指
定します。
Spatial Union 操作の結果は、3 つのジオメトリになります。 1 つめには Benny、Jennie、Eric、およ
び Ruby の自宅、2 つめには Mark と James の自宅、3 つめには Brian、Michelle、および Stephen の
自宅が含まれます。
注: [グループ化方法] によって入力がソートされていない場合は、レコードごとに 1 つのジオメトリ
が作成されます。
オプション
表 184 : Spatial Union のオプション
オプション名
説明
各グループの行数を返す 各結合に含まれるジオメトリ オブジェクトの数を知りたい場合は、このオ
プションを有効にします。 この個数フィールドは、ストリームのルーティ
ングに使用することができます。 例えば、個数が 1 個の場合は、レコード
を異なる方法でルーティングしたいというケースが考えられます。
入力ジオメトリ
ジオメトリ オブジェクトを含むフィールドの名前。
グループ化方法
(オプション) グループごとに 1 つの結合操作を実行するために、レコー
ドをグループ化するフィールドです。 詳細については、入力(877ページ)
を参照してください。
出力ジオメトリ
出力の結合ジオメトリを含めるフィールドです。
グループ数
[各グループの行数を返す] を有効にした場合は、個数を含めるフィールド
を指定します。
出力
Spatial Union は、結合操作の結果を表すジオメトリ オブジェクトを返します。 この出力のフィール
ド名は、Spatial Union オプションで指定します。 Spatial Union は、オプションとして、結合に含まれ
るオブジェクトの数を含むフィールドを返します。
出力フィールドの名前を指定する方法の詳細については、オプション(878ページ)を参照してくださ
い。
878
Spectrum™ Technology Platform 8.0.0
第 28 章 : Location Intelligence モジュール
ユーザ定義の Centrus データベース
Spectrum™ Technology Platform 空間分析を実行する Spectrum™Technology Platform モジュールは、
対象となるポリゴン (またはエリア) およびポイントが定義されているデータベースに依存します。 こ
れらのファイルで定義可能なエリアの種類には、実質的に制約がなく、例えば、保険料適用地域、販
売区域、店舗の場所などが定義できます。 ユーザの組織に固有の対象エリアまたはポイントを識別す
る独自のカスタム データベースを作成することができます。
Centrus 空間カスタム データベースを使用するには、まずサポートされている形式でデータ ファイル
を作成してから、インポート ユーティリティを使用して、そのデータ ファイルを Spectrum™ Technology
Platform で使用可能な形式に変換します。 以下の表に、ユーザ定義空間データベースの作成に使用す
る形式とユーティリティの概要を示します。
表 185 : ユーザ定義空間データベースの使用方法の概要
Spectrum™ Technology
Platform モジュール
ユーザ定義データベース
をサポートするコンポー
ネント
ユーザ定義データとして
サポートされる形式
インポート ユー
ティリティ
Enterprise Tax モジュール
Assign GeoTAX Info
ESRI シェイプ (.SHP)
MapInfo MIF (.MIF)
createtxb.exe
Location Intelligence モ
ジュール
PointInPolygon
ESRI (.SHP) カンマ区切り FMTMakr2.exe
(.CSV) DBF 形式 (.DBF) SpatialImport.exe
Microsoft Access (.MDB)
Tab ファイル (.TAB) テキ
スト (.TXT)
ユーザ定義 Centrus 空間データベースの作成
ユーザ定義 Centrus 空間データベースを作成するには、空間分析の実行に使用するモジュールでサポー
トされる形式を選択します。 以下の形式は、1 つ以上の Spectrum™ Technology Platform モジュール
でサポートされています。 各モジュールがサポートする具体的な形式の一覧については、ユーザ定義
の Centrus データベース(879ページ)を参照してください。
ESRI シェイプファイル
ESRI シェイプファイル (.SHP) は、ポイント、ライン、およびポリゴンを含むことができます。 シェ
イプファイルの形式の詳細については、次を参照してください。
http://www.esri.com/library/whitepapers/pdfs/shapefile.pdf
ユーザ ガイド
879
ユーザ定義の Centrus データベース
MapInfo MIF/MID
MIF/MID 形式は、2 つのファイルで構成されます。一方のファイルの拡張子は MIF で、もう一方のファ
イルは名前は同じで拡張子が MID になっています。 MIF ファイルは、オブジェクトを表す実際のポイ
ントを含むのに対し、MID ファイルはオブジェクトに関するテキスト情報を含みます。 形式の詳細な
説明については、以下を参照してください。
http://resource.mapinfo.com/static/files/document/1074660800077/interchange_file.pdf
MIF ファイルには、トークン化されたヘッダに続いて、DATA セクションがあります。 カンマ区切り
文字は必須です。 ファイル内に DELIMITER トークンが存在する場合は、そのファイルはインポート
されません。
ファイル ヘッダの次の部分には、MIF ファイルの中の列の定義が含まれます。 フィーチャー名と、
フィーチャーに関する数値データがここに格納されます。 これらの列のうちの 1 つは、オブジェクト
とともに保存する識別子として使用されます。
列定義は、COLUMN トークンで始まり、MIF ファイルの列数が続きます。 COLUMN トークンの次には、
各列に対してそれぞれ 1 つの行があります。 行の最初のエントリは列名で、2 つめのエントリは列タ
イプです。 以下の例は、MIF ファイルの 3 つの列を示したものです。
COLUMN 3 FEAT_NAME char (15) POPULATION integer AREA decimal (8,4)
名前には任意の列タイプが使用できますが、文字列を表す char を使用するのが最も一般的です。
char に続く、カッコで囲まれた数字は、文字列の最大長 (127 文字を超えることはできません) を表
します。 列タイプの完全な一覧については、MapInfo にお問い合わせください。
トークン DATA は、ヘッダの終わりを表し、その後にはオブジェクトのリストが続きます。 各オブ
ジェクトに対し、PEN や BRUSH など、いくつかの属性が並ぶ場合があります。 これらの設定は無視
されます。 MapInfo は、多様なオブジェクト タイプをサポートしますが、地理的オブジェクトを表す
ものはほんの数種類です。 サポートされているオブジェクト タイプは、リージョン、ポリライン、ポ
イントの 3 つです。
MIF ファイルにおいて、緯度/経度座標は、小数点以下桁数が最大 6 桁までの小数度で表す必要があり
ます。 経度は X 座標で、緯度は Y 座標です。 西経と南緯は常に負になります。 つまり、米国におい
ては、経度は負となり、緯度は正となります。 ユーザ座標は、整数値として入力されます。小数部分
は無視されるためです。
リージョンの定義
リージョンは、1 つまたは複数のポリゴンで構成されます。 各ポリゴンは、それぞれ一意に定義され
ます。 MIF/MID ファイルでは、ポリゴンを "閉じる" 必要はありません。 ポリゴンの最後のポイント
は、ライン セグメントによって自動的にポリゴンの最初のポイントに接続されます。 リージョン オ
ブジェクトのフォーマットは、次のようになります。
REGION #pgons numpts1 x1 y1 x2 y2 . . numpts2 x1 y1 x2 y2 . .
ポリラインの定義
ポリライン (PLINE) は、その形状を定義する任意の数のポイントを含むラインです。 PLINE 識別子
の後に、ラインに含まれるポイント数が続きます。 PLINE オブジェクトのフォーマットを以下に示し
ます。
880
Spectrum™ Technology Platform 8.0.0
第 28 章 : Location Intelligence モジュール
PLINE numpts x1 y1 x2 y2 . .
ポイントの定義
ポイントは、1 つの座標ペアとして定義されます。 ポイント オブジェクトのフォーマットを以下に示
します。
POINT x y
MID ファイルには、MIF ファイルで定義されるオブジェクトの名前などのデータが列挙されています。
MIF ファイルの中の各オブジェクトごとに、MID ファイルに 1 つのエントリがあります。 MID ファイ
ルのエントリは、MIF ファイルのオブジェクトと同じ順序である必要があります。 MID ファイルの
データは、MIF ファイルの DELIMITER 文で他の設定がされていない限り、カンマで区切られます。
サポートされる区切り文字はカンマのみです。
例として、前出の MIF ファイルの列定義を以下に再度示します。
COLUMN 3 FEAT_NAME char (15) POPULATION integer AREA decimal (8,4)
この列定義に対し、カンマ区切り文字が指定されているとすると、MID ファイルのサンプル エントリ
は次のようになります。
First Feature,180232,1000.2345 California,4345105,56023.3569 Last
Feature,12643,136.4000
注: 列は、単一のカンマで区切られます。 MIF ファイルには、ヘッダなどの他の情報は含まれませ
ん。
MapInfo TAB
MapInfo .tab ファイル形式は、MapInfo Professional で使用されています。 詳細については、 『MapInfo
Professional ユーザ ガイド』を参照してください。.
DBF
DBF 形式は、一般的なデータベース フォーマットです。Spectrum™ Technology Platform は、DBF 形
式のポイント データのみをサポートします。 ラインやポリゴンのユーザ定義の空間ファイルを作成す
る場合は、シェイプファイル形式を使用する必要があります。
DBF ファイルは、以下の名前の経度フィールドと緯度フィールドを含む必要があります。
•
•
•
•
経度フィールドの名前は、次のいずれかでなければなりません。
LON
LONGITUDE
N_LON
•
•
•
•
緯度フィールドの名前は、次のいずれかでなければなりません。
LAT
LATITUDE
N_LAT
ユーザ ガイド
881
ユーザ定義の Centrus データベース
注: フィールド タイプは、Character、Date、Numeric、または Float のいずれかである必要がありま
す。
Microsoft Access データベース
Microsoft Access で作成したデータベース ファイルは、ポイント データしか含まなければ Spectrum™
Technology Platform で使用できます。 ラインやポリゴンのユーザ定義の空間ファイルには、シェイプ
ファイル形式を使用する必要があります。
.MDB ファイルは、以下の名前のフィールドを含む必要があります。
•
•
•
•
経度フィールドの名前は、次のいずれかでなければなりません。
LON
LONGITUDE
N_LON
•
•
•
•
緯度フィールドの名前は、次のいずれかでなければなりません。
LAT
LATITUDE
N_LAT
ファイルには、上記以外のフィールドがあってもかまいません。 フィールド名は、10 文字以下でなけ
ればなりません。
注: フィールド タイプは、Character、Date、Numeric、または Float のいずれかである必要がありま
す。
テキスト/CSV
テキスト ファイル (.TXT) とカンマ区切りファイル (.CSV) は、ポイントのみを含むことができ、ポリ
ゴンを含むことはできません。 ラインやポリゴンのユーザ定義の空間ファイルを作成する場合は、
シェイプファイル形式を使用する必要があります。
•
•
•
•
経度フィールドの名前は、次のいずれかでなければなりません。
LON
LONGITUDE
N_LON
•
•
•
•
緯度フィールドの名前は、次のいずれかでなければなりません。
LAT
LATITUDE
N_LAT
ファイルには、上記以外のフィールドがあってもかまいません。 フィールド名は、10 文字以下でなけ
ればなりません。
882
Spectrum™ Technology Platform 8.0.0
第 28 章 : Location Intelligence モジュール
ユーザ定義 Centrus 空間データベースのインポート
上記のいずれかの形式のカスタム Centrus 空間ファイルを作成したら、Spectrum™ Technology Platform
モジュールで提供されている変換ユーティリティを使用して、このモジュールで使用可能な形式に変
換します。 各モジュールに、独自のユーティリティがあります。 入力ファイルのすべてのフィールド
が、属性ファイルにおいて変換されます。
注: これらのユーティリティは、Windows においてのみ動作します。
Enterprise Tax モジュール変換ユーティリティ
Enterprise Tax モジュール ユーティリティは、createtxb.exe です。 GeoTAX ユーティリティ CD
に収容されています。 この CD には、ユーティリティの使用方法を説明する PDF ファイルも含まれ
ています。
Location Intelligence モジュール変換ユーティリティ
Location Intelligence モジュール ユーティリティには、 FMTMakr2.exe と SpatialImport.exe の
2 つの変換ユーティリティがあります。 これらのユーティリティは、Spectrum™ Technology Platform
サーバーの以下の場所にあります。
<Spectrum インストール ディレクトリ>\modules\lim\lib
両方とも、コマンド ライン ユーティリティです。 形式によって、一方または両方のユーティリティ
を使用してデータを変換します。
.TXT および .CSV ファイルの変換
.TXT および .CSV ファイルの変換は、次の 2 つのステップからなります。
まず、Data Formatter ユーティリティ (FMTMAKR2.exe) を使用して、.TXT または .CSV ファイルの
フォーマット ファイル (.FMT) を作成します。 このユーティリティは、Spectrum™ Technology Platform
サーバーの以下の場所にあります。
<Spectrum インストール ディレクトリ>\modules\lim\lib
このディレクトリには、Data Formatter ユーティリティの詳細な使用方法が記載されたヘルプ ファイ
ル (FMTMAKR2.HLP) もあります。
注: フィールド名は 10 文字に制限されています。
次に、SpatialImport.exe ユーティリティを使用して、データを Spectrum™ Technology Platform で使
用可能な形式にインポートします。 .SHP、TAB、.DBF ファイルの変換(884ページ) の指示に従っ
て、.TXT または .CSV ファイルを変換します。 SpatialImport.exe で .TXT または .CSV ファイルを処
理するには、Data Formatter ユーティリティによって作成された .FMT ファイルが、.TXT または .CSV
ファイルと同じディレクトリに存在する必要があることに注意してください。
ユーザ ガイド
883
ユーザ定義の Centrus データベース
.SHP、TAB、.DBF ファイルの変換
ESRI シェイプファイル (.SHP)、TAB ファイル (.TAB)、または DBF ファイル (.DBF) を、Location
Intelligence モジュールで使用するためにインポートするには、コマンド プロンプトを開いて次のよう
に入力します。
SpatialImport [-u] InputFile OutputFile [PolygonNameField]
ここで、
• -u は、バッファなしのファイルを作成します。 バッファなしのファイルでは、マッチング時に使用
するバッファを指定できません。 バッファの詳細については、使用するコンポーネントのドキュメ
ントを参照してください。 このオプションを使用すると、作成される .gsb ファイルのサイズはかな
り小さくなります。 これはオプションです。
• InputFile は、対象とするユーザ定義ファイルです。
• OutputFile は、作成される .gsb ファイルの名前です。
注: Unix および Linux システムでは、.gsb ファイルの名前はすべて小文字でなければなりません。
注: フィールド名は 10 文字に制限されています。
• PolygonNameField はオプションのパラメータで、ポリゴンの名前として使用する入力ファイル
のフィールドを指定します。 Spectrum™ Technology Platform から返される Polygon.Name 出力
フィールドの設定に使われるのは、このフィールドです。 例えば、ユーザ定義ファイルのフィール
ドが、LON、LAT、Congressman、URL、および PartyAffiliation で、PointInPolygon を使用する場
合、PointInPolygon は、マッチしたデータを返す際に、Congressman、URL、および PartyAffiliation
を属性として返します。 PolygonNameField パラメータで Congressman を指定する場合、
Congressman フィールドの値は、Polygon.Name 出力フィールドでも返されます。
.MDB ファイルの変換
Microsoft Access (.MDB) ファイルを、Location Intelligence モジュールで使用するためにインポートす
る場合は、次のように入力します。
SpatialImport dbfile.mdb:tablename
ここで、
• dbfile.mdb は、ユーザ定義の空間データを含む Access データベースです。
• tablename は、ユーザ定義の空間データを含む Access データベースのテーブルです。
注: フィールド名は 10 文字に制限されています。
884
Spectrum™ Technology Platform 8.0.0
第 28 章 : Location Intelligence モジュール
MapInfo SQL Language のリファレンス
このセクションでは、Location Intelligence モジュールとともに使用できる MapInfo SQL Language 関
数のリファレンス情報を提供します。
MapInfo SQL 関数
このセクションでは、一部の MI_SQL 関数とその構文について説明します。
数値関数
このセクションでは、すべての数値関数について説明します。
Abs
説明
絶対値を計算します。
構文
Abs ( d )
引数
d は double 型の値です。
Acos
説明
アークコサインを計算します。
構文
Acos ( d )
引数
d は、アークコサインを計算する、-1 から 1 の間の double 型の値です。
Asin
説明
アークサインを計算します。
ユーザ ガイド
885
MapInfo SQL Language のリファレンス
構文
Asin ( d )
引数
d は、アークサインを計算する double 型の値です。
Atan
説明
アークタンジェントを計算します。
構文
Atan ( d )
引数
d は、アークタンジェントを計算する double 型の値です。
Ceil
説明
Ceiling - 引数以上の最小の整数を返す関数です。
構文
Ceil ( d )
引数
d は double 型の値です。
Cos
説明
コサインを計算します。
構文
Cos ( d )
引数
d は、コサインを計算する double 型の値です。
886
Spectrum™ Technology Platform 8.0.0
第 28 章 : Location Intelligence モジュール
Exp
説明
e (自然対数の底) の値の (引数) 乗を返します。
構文
Exp ( d )
引数
d は double 型の値です。
Floor
説明
引数以下の最大の整数を返します。
構文
Floor ( d )
引数
d は double 型の値です。
Log
説明
自然対数を計算します。
構文
Log ( d )
引数
d は double 型の値です。
Mod
説明
除算の余りを返します。
ユーザ ガイド
887
MapInfo SQL Language のリファレンス
構文
Mod ( d, v )
引数
d は double 型の値です。
v は double 型の値です。
コメント
ある数式を別の数式で割り、その余りを返します。 注意: MapBasic ではこれを演算子として扱いま
す。
Trunc
説明
引数 X の小数第 d 位未満を切り捨てます。
構文
Trunc ( X, d )
引数
X は double 型の値です。
d は integer 型の値です。
コメント
例えば、Trunc(12.345, 1) は 12.3 を返します。 d として負の値を指定することもでき、その場合は、
小数点の左側の桁を表します。 Trunc(12.345, -1) は 10 を返します。d はオプションで、省略すると
0 を指定する場合と同じになります。
Round
説明
X を最も近い m の倍数に四捨五入します。 引数 m はオプションで、省略すると最も近い整数に四捨
五入します。
構文
Round ( X, m )
888
Spectrum™ Technology Platform 8.0.0
第 28 章 : Location Intelligence モジュール
引数
X は、四捨五入する値を表す double 型の値です。
m は double 型の値で、この値の倍数に X を四捨五入します。
Sign
説明
引数の符号を返します。引数が負、ゼロ、正の場合に、それぞれ -1、0、1 を返します。
構文
Sign ( d )
引数
d は double 型の値です。
Sin
説明
サインを計算します。
構文
Sin ( d )
引数
d は double 型の値です。
Sqrt
説明
平方根を計算します。
構文
Sqrt ( d )
引数
d は double 型の値です。
ユーザ ガイド
889
MapInfo SQL Language のリファレンス
Tan
説明
タンジェントを計算します。
構文
Tan ( d )
引数
d は double 型の値です。
文字列関数
このセクションでは、すべての文字列関数について説明します。
Char_Length
説明
文字列引数の文字数を返します。
構文
Char_Length ( s)
引数
s は文字列式です。
コメント
s が NULL の場合、Char_Length はゼロ (0) を返します。
InStr
説明
ある文字列の中で、別の文字列を検索します。
構文
InStr ( str1,str2[,start_at[,occurrence]])
890
Spectrum™ Technology Platform 8.0.0
第 28 章 : Location Intelligence モジュール
引数
str1 は検索対象の文字列です。
str2 は、str1 の中で検索する文字列です。
start_at は、str1 において検索を開始する位置 (最初の文字を 1 として数えます) を表す整数です。
occurrence は、str1 において str2 を検出する回数を表す整数です。
コメント
所定の回数番目に検出した str2 の最初の文字の str1 における位置 (最初の文字を 1 として数えます)
を返します。 str2 が所定の回数だけ検出されなかった場合や、str1 または str2 が NULL であった場合
は、0 を返します。 引数 start_at と occurrence はオプションで、どちらも省略時のデフォルト値は 1
です。
Left
説明
文字列の左端から指定した文字数を取り出します。
構文
Left ( str, len)
引数
str は文字列です。
len は 0 以上の整数です。
コメント
Left は、文字列式 str の左端から len 個分の文字を含む文字列を返します。 引数 len は、0 以上の整数
値でなければなりません。 len が 0 の場合、NULL 値が返されます。 len が文字列 str の長さ以上であ
る場合、str の文字列全体が返されます。
Lower
説明
文字列を小文字に変換します。
構文
Lower ( str)
ユーザ ガイド
891
MapInfo SQL Language のリファレンス
引数
str は文字列です。
Ltrim
説明
文字列の先頭から空白文字を削除した文字列を返します。
構文
Ltrim ( str)
引数
s は文字列です。
Right
説明
文字列の右端から指定した文字数を取り出します。
構文
Right ( str, len)
引数
str は文字列です。
len は 0 以上の整数です。
コメント
Right は、文字列式 str の右端から len 個分の文字を含む文字列を返します。 引数 len は、0 以上の整
数値でなければなりません。 len が 0 の場合、NULL 値が返されます。 len が文字列 str の長さ以上で
ある場合、str の文字列全体が返されます。
Rtrim
説明
文字列の末尾から空白文字を削除した文字列を返します。
構文
Rtrim ( str)
892
Spectrum™ Technology Platform 8.0.0
第 28 章 : Location Intelligence モジュール
引数
str は文字列です。
Space
説明
指定された数の空白文字からなる文字列を返します。
構文
Space ( len)
引数
len は整数です。
コメント
len が 0 以下の場合、NULL 値が返されます。
Substring
説明
文字列の一部を抽出して、新しい文字列を作成します。
構文
Substring ( str1, start[, length])
引数
str1 は元の文字列です。
start は、文字列 str1 における抽出開始位置を表す、1 を基数とするインデックス値です。
length は、取り出す文字数を表す整数です。
コメント
引数 length はオプションで、省略した場合のデフォルト値は str1 の最後までになります。
Trim
説明
文字列の先頭と末尾から空白文字を削除した文字列を返します。
ユーザ ガイド
893
MapInfo SQL Language のリファレンス
構文
Trim ( str)
引数
str は文字列です。
Upper
説明
文字列を大文字に変換します。
構文
Upper ( str)
引数
str は文字列です。
日付関数
このセクションでは、すべての日付関数について説明します。
Current_Date
説明
現在の日付を返します。
構文
Current_Date ( )
コメント
Current_Date 関数が返す値は、その日によって変わります。
Day
説明
日付の日の部分を整数として返します。
構文
Day ( date)
894
Spectrum™ Technology Platform 8.0.0
第 28 章 : Location Intelligence モジュール
引数
date は Date 型の式です。
コメント
Day は、1 〜 31 の整数値を返します。 date が NULL の場合、Day は NULL を返します。
Day は、Date 型と DateTime 型の両方の式に対応します。
Month
説明
日付の月の部分を整数として返します。
構文
Month ( date)
引数
date は Date 型の式です。
コメント
Month は、1 〜 12 の整数値を返します。 date が NULL の場合、Month は NULL を返します。
Month は、Date 型と DateTime 型の両方の式に対応します。
Weekday
説明
指定した日付の曜日を表す 1 〜 7 の整数値を返します。
構文
Weekday ( date)
引数
date は Date 型の式です。
コメント
Weekday は、曜日を表す整数値を返します。1 は日曜日、2 は月曜日を表します。date が NULL の場
合、Weekday は NULL を返します。
Weekday は、Date 型と DateTime 型の両方の式に対応します。
ユーザ ガイド
895
MapInfo SQL Language のリファレンス
Year
説明
日付の年の部分を整数として返します。
構文
Year ( date)
引数
date は Date 型の式です。
コメント
Year は、世紀を含む年を表す整数値を返します (2003 など)。 date が NULL の場合、Year は NULL
を返します。
Year は、Date 型と DateTime 型の両方の式に対応します。
変換関数
このセクションでは、すべての変換関数について説明します。
Ascii
説明
文字列の先頭文字の文字コードを返します。
構文
Ascii ( str)
引数
str は文字列です。
コメント
Ascii は、str の先頭文字の文字コードを返します。 str が空の文字列である場合、Ascii は 0 を返しま
す。 str が NULL の場合、Ascii は NULL を返します。
896
Spectrum™ Technology Platform 8.0.0
第 28 章 : Location Intelligence モジュール
Char
説明
指定された文字コードに対応する長さ 1 の文字列を返します。
構文
Char ( n )
引数
n は、文字に対応するバイナリ コードを表す数値です。
コメント
If n が NULL の場合、Char は NULL を返します。
NumberToDate
説明
数値から Date を作成します。
構文
NumberToDate ( n )
引数
n は、日付を YYYYMMDD として表す 8 桁の整数です。
StringToDate
説明
文字列から Date を作成します。
構文
StringToDate ( str, fmt)
引数
str は、日付を表す文字列です。
fmt は、str のフォーマットを表す文字列です。
ユーザ ガイド
897
MapInfo SQL Language のリファレンス
コメント
引数 日付フォーマット文字列(922ページ)fmt の詳細については、 というタイトルのセクションを参
照してください。
StringToDate は、DateTime 文字列を変換することはできません。
DateToNumber
説明
日付を数値に変換します。
構文
DateToNumber ( date )
引数
date は日付です。
コメント
DateToNumber は、日付値 (date) を、YYYYMMDD という 8 桁の整数表現に変換します。
DateToNumber は、DateTime 型の値には対応していません。
StringToNumber
説明
文字列を数値に変換します。
構文
StringToNumber ( str, fmt)
引数
str は、数値を表す文字列です。
fmt は、str のフォーマットを表す文字列です。
コメント
StringToNumber は、文字列テンプレート (fmt) を使用して数値文字列 (str) を解釈することにより、文
字列値 (str) を数値表現に変換します。 引数 数値フォーマット文字列(923ページ)fmt の詳細につい
ては、 というタイトルのセクションを参照してください。
898
Spectrum™ Technology Platform 8.0.0
第 28 章 : Location Intelligence モジュール
DateToString
説明
Date 型を文字列に変換します。
構文
DateToString ( date, fmt)
引数
date は日付です。
fmt は、日付のフォーマットを指定する文字列です。
例
国がカナダであるすべてのフィーチャーに対し、日付を mm-dd-yy というフォーマットの文字列に変
換します。
select DateToString(RANDOMDATE, 'mm-dd-yy') as dateToSt
country='Canada'
from countries where
コメント
引数 日付フォーマット文字列(922ページ)fmt の詳細については、 というタイトルのセクションを参
照してください。
DateToString は、Date 型と DateTime 型の両方の値に対応します。
NumberToString
説明
数値を文字列に変換します。
構文
NumberToString ( n, fmt)
引数
n は数値です。
fmt は、数値 (n) のフォーマットを表す文字列です。
ユーザ ガイド
899
MapInfo SQL Language のリファレンス
コメント
引数 数値フォーマット文字列(923ページ)fmt の詳細については、 というタイトルのセクションを参
照してください。
ジオメトリ作成関数
このセクションでは、すべてのジオメトリ作成関数について説明します。
MI_Box
説明
矩形のボックスを表す新しいフィーチャー ジオメトリ オブジェクトを作成します。
構文
MI_Box ( x1, y1, x2, y2, csys )
引数
x1、y1、x2、y2 は、ボックスの範囲を表す double 型の値です。
csys は、座標系です。
例
矩形のボックスを表す新しいフィーチャー ジオメトリ オブジェクトを作成します。
select MI_Box(-79.376,43.648,-79.383,43.663,'epsg:4326') as mi_box
countries where country='Canada'
from
コメント
引数 csys は、境界付き座標系オブジェクトへの参照、または、codespace:code という形式で座標系
を表記した文字列とすることができます。
MI_Point
説明
ポイントを表す新しいフィーチャー ジオメトリ オブジェクトを作成します。
構文
MI_Point ( x, y, csys )
引数
x と y は、ポイントの座標を表す double 型の値です。
900
Spectrum™ Technology Platform 8.0.0
第 28 章 : Location Intelligence モジュール
csys は、座標系です。
例
ポイントを表す新しいフィーチャー ジオメトリ オブジェクトを作成します。
select MI_Point(-75,46,'epsg:4326') as mi_point
country='Canada'
from countries where
コメント
引数 csys は、境界付き座標系オブジェクトへの参照、または、codespace:code という形式で座標系
を表記した文字列とすることができます。
ジオメトリ述語関数 (boolean)
このセクションでは、すべてのジオメトリ述語関数について説明します。
MI_Contains
説明
あるジオメトリ オブジェクトが他のジオメトリ オブジェクトを完全に含むかどうかを調べます。
構文
MI_Contains ( containerGeometry, testGeometry )
引数
containerGeometry と testGeometry はジオメトリ オブジェクト (または式) です。
例
カナダの国が指定されたポイントを含むかどうかを調べます。
select MI_Contains(MI_Point(-76,45,'epsg:4326'),[Geometry_Column]) from
countries where country='Canada'
コメント
containerGeometry が testGeometry を完全に含む場合は真、それ以外の場合は偽を返します。
containerGeometry または testGeometry が NULL の場合は偽を返します。 この関数は、最初の引数
(containerGeometry) の座標系を使用して実行されます。
これは MI_Within ( testGeoemtry, containerGeometry ) と同義です。
ユーザ ガイド
901
MapInfo SQL Language のリファレンス
MI_Intersects
説明
あるジオメトリ オブジェクトが他のジオメトリ オブジェクトと交差するかどうかを調べます。
構文
MI_Intersects ( geometry1, geometry2 )
引数
geometry1 と geometry2 は、ジオメトリ オブジェクト (または式) です。
例
指定されたボックスがその国のジオメトリと交差するかどうかを調べます。
select MI_Intersects(MI_Box(13.36676789,8.05796847,79.06334219,62.70540978,'epsg:4326'),[Geometry_Column])
from countries where country = ANY ('Mauritania','Mali','Algeria')
コメント
geometry1 が geometry2 と交差する場合は真、それ以外の場合は偽を返します。 geometry1 または
geometry2 が NULL の場合は偽を返します。 この関数は、最初の引数 (geometry1) の座標系を使用し
て実行されます。
MI_Within
説明
あるジオメトリ オブジェクトが他のジオメトリ オブジェクトに完全に含まれているかどうかを調べま
す。
構文
MI_Within ( testGeometry, containerGeometry )
引数
containerGeometry と testGeometry はジオメトリ オブジェクト (または式) です。
例
指定された国の 1 つが定義されたボックス内に完全に含まれているかどうかを調べます。
select MI_Within([Geometry_Column],MI_Box(13.36676789,8.05796847,79.06334219,62.70540978,'epsg:4326')) as theResult
from countries where country = ANY ('Mauritania','Mali','Algeria')
902
Spectrum™ Technology Platform 8.0.0
第 28 章 : Location Intelligence モジュール
コメント
testGeometry が containerGeometry を完全に含んでいる場合に真を返し、それ以外の場合に偽を返し
ます。 testGeometry または containerGeometry が NULL の場合は偽を返します。 この関数は、最初
の引数 (testGeometry) の座標系を使用して実行されます。
これは、MI_Contains (containerGeoemtry, testGeometry ) と同義です。
MI_CentroidWithin
説明
ジオメトリ オブジェクトのセントロイドが、別のジオメトリ オブジェクトに含まれているかどうかを
調べます。
構文
MI_CentroidWithin ( testGeometry, containerGeometry )
引数
containerGeometry と testGeometry はジオメトリ オブジェクト (または式) です。
例
指定されたジオメトリのセントロイドが、指定された国に含まれているかどうかを調べます。
select MI_CentroidWithin([Geometry_Column],MI_Box(13.36676789,8.05796847,79.06334219,62.70540978,'epsg:4326')) as theResult
from countries where country in ('Mauritania','Mali','Algeria')
コメント
testGeometry が containerGeometry に含まれている場合は真を返し、それ以外の場合は偽を返しま
す。 testGeometry または containerGeometry が NULL の場合は偽を返します。 この関数は、最初の
引数 (testGeometry) の座標系を使用して実行されます。
これは、MI_Contains (containerGeoemtry, testGeometry ) と同義です。
MI_ContainsCentroid
説明
ジオメトリ オブジェクトのセントロイドが、別のジオメトリ オブジェクトに含まれているかどうかを
調べます。
構文
MI_ContainsCentroid ( containerGeometry, testGeometry )
ユーザ ガイド
903
MapInfo SQL Language のリファレンス
引数
containerGeometry と testGeometry はジオメトリ オブジェクト (または式) です。
例
指定されたポイントがカナダ国内にあるかどうかを調べます。
select MI_ContainsCentroid(MI_Point(-76,45,'epsg:4326'),[Geometry_Column])
from countries where country='Canada'
コメント
containerGeometry のセントロイドが testGeometry に含まれている場合は真を返し、それ以外の場合
は偽を返します。 containerGeometry または testGeometry が NULL の場合は偽を返します。 この関
数は、最初の引数 (containerGeometry) の座標系を使用して実行されます。
MI_EnvelopesIntersect
説明
2 つのジオメトリ オブジェクトの最小外接矩形 (MBR) が交差するかどうかを調べます。
構文
MI_EnvelopesIntersect ( geometry1, geometry2 )
引数
geometry1 と geometry2 は、ジオメトリ オブジェクト (または式) です。
例
ポイントと国のジオメトリの最小外接矩形 (MBR) が交差するかどうかを調べます。
select MI_EnvelopesIntersect(MI_Point(-76,45,'epsg:4326'),[Geometry_Column])
from countries where country='Canada'
コメント
geometry1 の MBR が geometry2 の MBR と交差する場合に真を返し、それ以外の場合に偽を返しま
す。 geometry1 または geometry2 が NULL の場合は偽を返します。 この関数は、最初の引数
(geometry1) の座標系を使用して実行されます。
ジオメトリ観測関数 (スカラ値を返す)
このセクションでは、すべてのジオメトリ観測関数について説明します。
904
Spectrum™ Technology Platform 8.0.0
第 28 章 : Location Intelligence モジュール
MI_CentroidX
説明
ジオメトリ オブジェクトのセントロイドの x 座標を返します。
構文
MI_CentroidX ( geometry )
引数
geometry は、ジオメトリを返す式です。
例
指定した国ジオメトリのセントロイドの x 座標を返します。
select MI_CentroidX([Geometry_Column]) as mi_centroidX from countries where
country= ANY ('Bermuda','Cuba')
コメント
戻り値は double 型で、入力の geometry の座標系における値を表します。
MI_CentroidY
説明
ジオメトリ オブジェクトのセントロイドの y 座標を返します。
構文
MI_CentroidY ( geometry )
引数
geometry は、ジオメトリを返す式です。
例
指定された国ジオメトリのセントロイドの y 座標を返します。
select MI_CentroidY([Geometry_Column]) as mi_centroidY from countries where
country= ANY ('Bermuda','Cuba')
コメント
戻り値は double 型で、入力の geometry の座標系における値を表します。
ユーザ ガイド
905
MapInfo SQL Language のリファレンス
MI_MinX
説明
ジオメトリの MBR の最小 x 値を返します。
構文
MI_MinX ( geometry )
引数
geometry は、ジオメトリを返す式です。
例
指定された国ジオメトリの MBR の最小 x 値を返します。
select MI_MinX([Geometry_Column]) as MI_MinX from countries where country in
('Canada','Cuba')
コメント
戻り値は double 型で、入力の geometry の座標系における値を表します。
MI_MinY
説明
ジオメトリの MBR の最小 y 値を返します。
構文
MI_MinY ( geometry )
引数
geometry は、ジオメトリを返す式です。
例
指定された国ジオメトリの MBR の最小 y 値を返します。
select MI_MinY([Geometry_Column]) as MI_MinY from countries where
country='Canada'
コメント
戻り値は double 型で、入力の geometry の座標系における値を表します。
906
Spectrum™ Technology Platform 8.0.0
第 28 章 : Location Intelligence モジュール
MI_MaxX
説明
ジオメトリの MBR の最大 x 値を返します。
構文
MI_MaxX ( geometry )
引数
geometry は、ジオメトリを返す式です。
例
指定された国ジオメトリの MBR の最大 x 値を返します。
select MI_MaxX([Geometry_Column]) as MI_MaxX from countries where
country='Canada'
コメント
戻り値は double 型で、入力の geometry の座標系における値を表します。
MI_MaxY
説明
ジオメトリの MBR の最大 y 値を返します。
構文
MI_MaxY ( geometry )
引数
geometry は、ジオメトリを返す式です。
例
指定されたジオメトリにある国の首都の MBR の最大 y 値を返します。
select Country,Capital,MI_MaxY([Geometry_Column]) as MI_MaxY from countries
where MI_MaxY([Geometry_Column]) in (1046576.2866985824,1613157.9334406711,3841249.1128774667)
コメント
戻り値は double 型で、入力の geometry の座標系における値を表します。
ユーザ ガイド
907
MapInfo SQL Language のリファレンス
MI_GeometryType
説明
ジオメトリ オブジェクトのタイプを示す文字列を返します。
構文
MI_GeometryType ( geometry )
引数
geometry は、ジオメトリを返す式です。
例
指定された国のジオメトリ タイプを返します。
select MI_GeometryType([Geometry_Column]) as MI_GEOMETRYTYPE
where country in ('Canada','Brazil','China')
from countries
コメント
戻り値は次のいずれかです (MapInfo.Geometry.GeometryType の 1 つでもあります)。
•
•
•
•
•
•
•
Envelope
Point
MultiPoint
MultiCurve
MultiPolygon
FeatureGeometryCollection
Curve
•
•
•
•
•
•
•
•
Ring
Polygon
LineString
Rectangle
RoundedRectangle
Ellipse
LegacyText
LegacyArc
MI_X
説明
ポイント ジオメトリの X 座標を返します。
908
Spectrum™ Technology Platform 8.0.0
第 28 章 : Location Intelligence モジュール
構文
MI_X ( point_geometry )
引数
point_geometry は、Point 型のフィーチャー ジオメトリを返す式です。
例
'bra' で始まる国のセントロイドの X 座標を返します。
select Country,MI_X(MI_Centroid([Geometry_Column])) as MI_X from countries
where country like 'bra%'
コメント
戻り値は double 型で、入力の point_geometry の座標系における値を表します。 入力ジオメトリがポ
イント ジオメトリでない場合は、NULL を返します。
MI_Y
説明
ポイント ジオメトリの Y 座標を返します。
構文
MI_Y ( point_geometry )
引数
point_geometry は、Point 型のフィーチャー ジオメトリを返す式です。
例
'G' で始まる国のセントロイドの Y 座標を返します。
select Country,MI_Y(MI_Centroid([Geometry_Column])) as MI_Y from countries
where country like 'G%'
コメント
戻り値は double 型で、入力の point_geometry の座標系における値を表します。 入力ジオメトリがポ
イント ジオメトリでない場合は、NULL を返します。
ジオメトリ測定関数
このセクションでは、すべてのジオメトリ測定関数について説明します。
ユーザ ガイド
909
MapInfo SQL Language のリファレンス
MI_Area
説明
ジオメトリ オブジェクトの地理的な面積を返します。
構文
MI_Area ( geometry, unit, calculationType )
引数
geometry は、ジオメトリを返す式です。
unit は、面積の単位です。
calculationType は、球形またはカルテシアンのどちらの計算を実行するかを表す文字列です。 デフォ
ルト値はありません。
例
カナダの国の面積を平方マイルで返します。
select MI_Area(Obj,'sq mi','Spherical') as mi_area from countries where
country='Canada'
コメント
戻り値は double 型で、引数 unit で指定された単位の値を表します。 MI_Area は、Envelope、Polygon、
Multipolygon、および Ring の各ジオメトリ タイプにしか適用できません。 入力ジオメトリがその他
のタイプである場合は、値 0 を返します。
以下の面積単位が、unit の値として有効です。
910
値
説明
sq mi
平方マイル
sq km
平方キロメートル
sq in
平方インチ
sq ft
平方フィート
sq yd
平方ヤード
sq mm
平方ミリメートル
sq cm
平方センチメートル
sq m
平方メートル
Spectrum™ Technology Platform 8.0.0
第 28 章 : Location Intelligence モジュール
値
説明
sq survey ft
平方アメリカ測量フィート
sq nmi
平方海里
sq twip
平方トゥイップ
sq pt
平方ポイント
sq pica
平方パイカ
sq degree
平方度
acre
エーカー
hectare
ヘクタール
sq li
平方リンク
sq ch
平方チェーン
sq rd
平方ロッド
perch
パーチ
rood
ルード
MI_Distance
説明
2 つのジオメトリ オブジェクトの間の地理的距離を返します。
構文
MI_Distance ( geom1, geom2, unit, calculationType )
引数
geom1 は、ジオメトリを返す式です。
geom2 は、ジオメトリを返す式です。
unit は、距離の単位です。
calculationType は、球形またはカルテシアンのどちらの計算を実行するかを表す文字列です。 デフォ
ルト値はありません。
ユーザ ガイド
911
MapInfo SQL Language のリファレンス
例
指定されたジオメトリと各国間の距離を返します。
select MI_Distance(MI_Box(-20,-20,20,20,'epsg:4326'),Obj,'mi','Spherical')
as distance from countries where country in
('Canada','Vietnam','Brazil','China','Japan')
コメント
2 つのジオメトリの間の距離を計算します。 戻り値は double 型で、引数 unit で指定された単位の値
を表します。
以下の距離単位が、unit の値として有効です。
912
値
説明
mi
マイル
km
キロメートル
in
インチ
ft
フィート
yd
ヤード
mm
ミリメートル
cm
センチメートル
m
メートル
survey ft
アメリカ測量フィート
nmi
海里
twip
トゥイップ
pt
ポイント
pica
パイカ
degree
度
li
リンク
ch
チェーン
rd
ロッド
Spectrum™ Technology Platform 8.0.0
第 28 章 : Location Intelligence モジュール
MI_CentroidDistance
説明
2 つのジオメトリ オブジェクトのセントロイド間の地理的距離を返します。
構文
MI_CentroidDistance ( geom1, geom2, unit, calculationType )
引数
geom1 は、ジオメトリを返す式です。
geom2 は、ジオメトリを返す式です。
unit は、距離の単位です。
calculationType は、球形またはカルテシアンのどちらの計算を実行するかを表す文字列です。 デフォ
ルト値はありません。
例
指定されたジオメトリと国について、双方のセントロイド間の距離を返します。
select MI_CentroidDistance(Obj,MI_Box(13.36676789,8.05796847,79.06334219,62.70540978,'epsg:4326'),'mi','Cartesian')
as theResult from countries where country in ('Mauritania','Mali','Algeria')
コメント
2 ポイント間の距離を計算します。 ジオメトリ引数 geom1 または geom2 のどちらかがポイント ジオ
メトリではない場合、そのジオメトリのセントロイドが計算に使われます。 戻り値は double 型で、
引数 unit で指定された単位の値を表します。
以下の距離単位が、unit の値として有効です。
値
説明
mi
マイル
km
キロメートル
in
インチ
ft
フィート
yd
ヤード
mm
ミリメートル
cm
センチメートル
ユーザ ガイド
913
MapInfo SQL Language のリファレンス
値
説明
m
メートル
survey ft
アメリカ測量フィート
nmi
海里
twip
トゥイップ
pt
ポイント
pica
パイカ
degree
度
li
リンクリンク
ch
チェーン
rd
ロッド
MI_Length
説明
ラインまたはポリライン ジオメトリ オブジェクトの地図上の長さを返します。
構文
MI_Length ( geometry, unit, calculationType )
引数
geometry は、ジオメトリを返す式です。
unit は、距離の単位です。
calculationType は、球形またはカルテシアンのどちらの計算を実行するかを表す文字列です。 デフォ
ルト値はありません。
例
高速道路の長さを CanadaHighway テーブルから取得して返します。
select highway from CanadaHighway where MI_Length(Obj,'mi','Spherical') <=
50
914
Spectrum™ Technology Platform 8.0.0
第 28 章 : Location Intelligence モジュール
コメント
戻り値は double 型で、引数 unit で指定された単位の値を表します。 MI_Length は、タイプが Curve、
LineString、または MultiCurve のジオメトリにのみ適用できます。 入力ジオメトリがその他のタイプ
である場合は、値 0 を返します。
以下の距離単位が、unit の値として有効です。
値
説明
mi
マイル
km
キロメートル
in
インチ
ft
フィート
yd
ヤード
mm
ミリメートル
cm
センチメートル
m
メートル
survey ft
アメリカ測量フィート
nmi
海里
twip
トゥイップ
pt
ポイント
pica
パイカ
degree
度
li
リンクリンク
ch
チェーン
rd
ロッド
MI_Perimeter
説明
ジオメトリ オブジェクトの地理的な周囲長を返します。
構文
MI_Perimeter ( geometry, unit, calculationType )
ユーザ ガイド
915
MapInfo SQL Language のリファレンス
引数
geometry は、ジオメトリを返す式です。
unit は、距離の単位です。
calculationType は、球形またはカルテシアンのどちらの計算を実行するかを表す文字列です。 デフォ
ルト値はありません。
例
選択された国を対象に、名前が 'Ar' で始まる国の周囲長を返します。
select Country from countries where MI_Perimeter(Obj,'km','Spherical') AND
Country like 'Ar%'
コメント
戻り値は double 型で、引数 unit で指定された単位の値を表します。 MI_Perimeter は、Envelope、
Polygon、Multipolygon、および Ring の各ジオメトリ タイプにしか適用できません。 入力ジオメトリ
がその他のタイプである場合は、値 0 を返します。
以下の距離単位が、unit の値として有効です。
916
値
説明
mi
マイル
km
キロメートル
in
インチ
ft
フィート
yd
ヤード
mm
ミリメートル
cm
センチメートル
m
メートル
survey ft
アメリカ測量フィート
nmi
海里
twip
トゥイップ
pt
ポイント
pica
パイカ
degree
度
li
リンク
Spectrum™ Technology Platform 8.0.0
第 28 章 : Location Intelligence モジュール
値
説明
ch
チェーン
rd
ロッド
ジオメトリ関数 (ジオメトリを返す)
このセクションでは、すべてのジオメトリ関数について説明します。
MI_Buffer
説明
他のジオメトリ オブジェクトの周囲のバッファ距離を表す MultiPolygon ジオメトリ オブジェクトを
返します。
構文
MI_Buffer ( geometry, dist, unit, calculationType, res )
引数
geometry は、ジオメトリを返す式です。
dist は、バッファのソース ジオメトリからの距離を表す数値です。
unit は、面積の単位です。
calculationType は、球形またはカルテシアンのどちらの計算を実行するかを表す文字列です。 デフォ
ルト値はありません。
res は、ポイントのバッファリングからの円の作成に使用されるセグメントの最小数を指定する数値で
す。
コメント
返されるジオメトリ オブジェクトは、指定された geometry 引数と同じ座標系で表されます。 距離
(dist) は units 引数で指定された単位になります。 res が NULL またはゼロの場合、合理的なデフォル
ト値が使用されます。 それ以外の場合、res は少なくとも 3 でなければなりません。 長方形の角の
バッファ時に形成されるような、部分的な円に使用されるセグメントの最小数は、比例的に小さくな
ります (例えば、半円の場合は少なくとも res/2 セグメントになります)。 距離は正または負です。
ユーザ ガイド
917
MapInfo SQL Language のリファレンス
以下の距離単位が、unit の値として有効です。
値
説明
mi
マイル
km
キロメートル
in
インチ
ft
フィート
yd
ヤード
mm
ミリメートル
cm
センチメートル
m
メートル
survey ft
アメリカ測量フィート
nmi
海里
twip
トゥイップ
pt
ポイント
pica
パイカ
degree
度
li
リンク
ch
チェーン
rd
ロッド
MI_Centroid
説明
ジオメトリ オブジェクトのセントロイドをポイント ジオメトリ オブジェクトとして返します。
918
Spectrum™ Technology Platform 8.0.0
第 28 章 : Location Intelligence モジュール
構文
MI_Centroid ( geometry )
引数
geometry は、ジオメトリを返す式です。
コメント
返されるポイント ジオメトリ オブジェクトの座標系は、入力ジオメトリの座標系と同じです。
MI_Envelope
説明
入力ジオメトリの最小外接矩形 (MBR) を表すエンベロープ ジオメトリ オブジェクトを返します。
構文
MI_Envelope ( geometry )
引数
geometry は、ジオメトリを返す式です。
例
複数のジオメトリ オブジェクトの集合の最小外接矩形 (MBR) を表すエンベロープ ジオメトリ オブ
ジェクトを返します。
select MI_Envelope([Geometry_Column]) from countries where country in
('Canada','Brazil','Argentina','Greenland')
コメント
返されるジオメトリ オブジェクトの座標系は、入力ジオメトリの座標系と同じです。
MI_Union
説明
2 つの入力ジオメトリ オブジェクトを結合したジオメトリ オブジェクトを返します。
ユーザ ガイド
919
MapInfo SQL Language のリファレンス
構文
MI_Union ( geometry1, geometry2 )
引数
geometry1 は、ジオメトリを返す式です。
geometry2 は、ジオメトリを返す式です。
MI_Intersection
説明
2 つの入力ジオメトリ オブジェクトの交差領域を表すジオメトリ オブジェクトを返します。
構文
MI_Intersection ( geometry1, geometry2 )
引数
geometry1 は、ジオメトリを返す式です。
geometry2 は、ジオメトリを返す式です。
920
Spectrum™ Technology Platform 8.0.0
第 28 章 : Location Intelligence モジュール
MI_ConvexHull
説明
入力ジオメトリに含まれるポイント集合の凸包を表す MultiPolygon ジオメトリ オブジェクトを返しま
す。
構文
MI_ConvexHull ( geometry )
引数
geometry は、ジオメトリを返す式です。
例
カナダを含む最小ジオメトリを表す ConvexHull ジオメトリ オブジェクトを返します。
select MI_ConvexHull([Geometry_Column]) from countries where country = 'Canada'
MI_Transform
説明
ある座標系から別の座標系へとジオメトリを変換します。
構文
MI_Transform ( geometry, csys )
引数
geometry は、ジオメトリを返す式です。
csys は、座標系です。
MapInfo SQL フォーマット文字列
このセクションでは、MapInfo SQL 言語の日付および数値文字列フォーマットについて説明します。
ユーザ ガイド
921
MapInfo SQL Language のリファレンス
日付フォーマット文字列
フォーマット文字列は、文字列から日付、および日付から文字列への変換のテンプレートとして使用
されます。 以下のトークンが、フォーマット文字列 fmt において解釈され、StringToDate におい
て文字列から日付値の部分を読んだり、DateToString において指定された日付のコンポーネント値
を置き換えて文字列を作成したりするために使用されます。
トークン
値
yyyy
4 桁の年 (2003 など)
yy
2 桁の年 (03 など)
mmmm
完全な月の名前 (January など)
mmm
省略形の月の名前 (Jan など)
mm
2 桁の月 (必要に応じて数字の前にゼロを入れます) 1 月 = 1、12 月 = 12
m
1 桁または 2 桁の月 (数字の前にゼロを入れません) 1 月 = 1、12 月 = 12
dddd
完全な曜日の名前 (Tuesday など)
ddd
省略形の曜日の名前 (Tues など)
dd
2 桁の日 (必要に応じて数字の前にゼロを入れます)
d
1 桁または 2 桁の日 (数字の前にゼロを入れません)
DateToString を呼び出すとき、フォーマット文字列 fmt には、結果として返される文字列にその
まま引き渡される他のトークンや文字が含まれる場合があります。
日付フォーマット文字列の使用例
引数 date の値として 2003 年 10 月 7 日火曜日という日付が設定されている場合の、以下の
DateToString の呼び出しの結果をそれぞれ示します。
DateToString(date,
DateToString(date,
DateToString(date,
DateToString(date,
'mm-dd-yy')
'm-d-yyyy')
'dddd, mmmm d, yyyy')
'Today is dddd')
:
:
:
:
10-07-03
10-7-2003
Tuesday, October 7, 2003
Today is Tuesday
以下の StringToDate の呼び出しはすべて、2003 年 10 月 7 日を表す Date 値を生成します。
StringToDate('10/7/2003', 'm/d/yyyy')
StringToDate('10-07-03', 'm-dd-yy')
StringToDate('Today is 2003-Oct-03', 'Today is yyyy-ddd-dd')
922
Spectrum™ Technology Platform 8.0.0
第 28 章 : Location Intelligence モジュール
数値フォーマット文字列
数値フォーマット文字列
フォーマット文字列は、文字列から数値、および数値から文字列への変換のテンプレートとして使用
されます。 フォーマット文字列 fmt では以下の要素を組み合わせて、NumberToString における数
値から文字列の生成、または StringToNumber における文字列から数値の生成に使用します。
要素
値
9
各 9 は、表示する有効桁数を表します。 数値の前のゼロは表示されるか、
空白として処理されます。 データに対して十分な有効桁数を指定する必要
があります。 例えば、データが最大 5 桁である場合、フォーマット文字列
の有効桁数は少なくとも 5 桁でなければなりません。
0
各 0 は、有効桁数を表します。 数値の前のゼロは表示されるか、ゼロとし
て処理されます。
$
接頭文字です。 数値の前に $ (ドル記号) を付けます。 他の通貨記号につい
ては、要素 L を参照してください。
, (カンマ)
数値文字列の中のカンマを表します。 カンマは必ず、桁区切り文字として
解釈されます。 他の桁区切り文字については、要素 G を参照してくださ
い。
. (ピリオド)
数値文字列の中の小数点を表します。 他の小数点文字については、要素 D
を参照してください。
MI
接尾文字です。 数値が負の場合は、末尾にマイナス符号を付け、正の場合
は空白を付けます。
S
接頭文字または接尾文字です。 正数の前にプラス (+) 符号を付け、負数の
前にマイナス (-) 符号を付けます。
D
小数点の位置を指定します。 D の左側のフォーマット要素はすべて、数値
の整数部分の書式を設定するためのものです。 D の右側のフォーマット要
素はすべて、数値の小数部分の書式を設定するためのものです。 小数点を
表す文字は、プラットフォームごとに定められています。 MapInfo.NET で
は、現在のスレッドの Culture 設定によってこの値が決まります。
Spatialware または Envinsa では、データベース (初期化パラメータである
場合が多い) によってこの値が決まります。
G
桁区切り文字 (6,234 における千の位ごとのカンマなど) の位置を指定しま
す。 小数点を表す文字 D と同様に、桁区切り文字はプラットフォームごと
に定められています。
ユーザ ガイド
923
MapInfo SQL Language のリファレンス
要素
値
L
その地域の通貨記号 ($ など) の位置を指定します。 小数点を表す文字 D と
同様に、桁区切り文字はプラットフォームごとに定められています。
数値が科学的記数法で表記されることを表します。 要素 E の後にある 9 ま
E
EE+
たは 0 は、指数部に対するフォーマット文字であると解釈されます。 要素
E の後に、小数点や桁区切り文字を配置することはできません。 プラス (+)
符号またはマイナス (-) 符号は、要素 E の直後に配置することができます。
要素 E の後に、プラス (+) 符号またはマイナス (-) 符号を明示的に指定する
場合、正の指数部にはプラス (+) 符号、負の指数部にはマイナス (-) 符号が
必ず表示されることになります。 要素 E の後に符号が指定されず、指数部
が負である場合は、要素 E の直後にマイナス符号が表示されます。 そのた
め、要素 E の直後の 9 または 0 の数は、指数部が負である場合に、マイナ
ス符号を入れても表示できるだけの幅である必要があります (そうでなけれ
ば桁あふれが生じてしまいます)。
数値フォーマット文字列の使用例
数値の書式設定や文字列のパースを行うための数値フォーマット要素の使用例を以下に示します。 空
白 (スペース) の存在がわかるように、結果を引用符で囲んで示しています。引用符自体は、結果には
含まれません。
NumberToString(123.4567, '999999.99')
NumberToString(123.4567, '099999.99')
NumberToString(1234567, '99,999,999')
NumberToString(1234567, '9,999,999,999')
NumberToString(1234567, '0,999,999,999')
NumberToString(123.4567, '0.9999E99')
NumberToString(123.4567, '0.9999E09')
NumberToString(123.4567, '0.9999E+09')
NumberToString(12.345, '9.99')
StringToNumber('123456', '99999')
StringToNumber(' 123.456', '9999.999')
StringToNumber(' 123.456-', '9999.999')
StringToNumber(' 123.456-', '9999.999MI')
StringToNumber('1,234.56', '999,999.99')
StringToNumber('1,234.56', '999,999.9')
924
:
:
:
:
:
:
:
:
:
:
:
:
:
:
:
'123.46'
'000123.46'
' 1,234,567'
'1,234,567'
' 0,001,234,567'
'1.2346E2'
'1.2346E02'
'1.2346E+02'
'####'
Error
123.456
Error
-123.456
1234.56
Error
Spectrum™ Technology Platform 8.0.0
Universal Addressing モ
ジュール
このセクションの構成
• Universal Addressing モジュールとは . . . . . . . . . . . . . . .926
• Get Candidate Addresses . . . . . . . . . . . . . . . . . . . . . . . .939
• Get City State Province . . . . . . . . . . . . . . . . . . . . . . . . . .950
• Validate Address . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .953
• Validate Address Global . . . . . . . . . . . . . . . . . . . . . . . . .1022
• 誤検出 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .1044
• Validate Address Confidence アルゴリズム . . . . . . . . .1047
29
Universal Addressing モジュールとは
Universal Addressing モジュールとは
Universal Addressing モジュールは、住所品質モジュールで、住所の正規化とバリデーションを実行し
て、郵便物の配達品質を高めることができます。 Universal Addressing モジュールを使用すると、住
所データに対して郵便当局が定める品質規格への準拠を徹底できます。 住所がこれらの規格に準拠し
ていれば、郵便物を規定の配達日数でより確実に配達できます。 また、差出人も、これらの規格に準
拠すれば、郵便料金の大幅な割引を受けることができます。 米国における郵便料金の割引について
は、USPS Domestic Mail Manual ((DMM) の www.usps.com を参照してください。 カナダにおける
郵便料金の割引については、カナダ郵便当局の Web サイトの www.canadapost.ca を参照してくださ
い。 オーストラリアにおける郵便料金の割引については、オーストラリア郵便当局の Web サイトの
www.auspost.com.au を参照してください。
Universal Addressing モジュールは、供与されているライセンスに応じて、バッチ モード、リアルタ
イム モード、またはホステッド サービスとして使用できます。 バッチ バージョンの Universal
Addressing モジュールは USPS™ による CASS Certified® です。 また、オーストラリア郵便当局によ
る AMAS 認定でもあります。
Spectrum™ Technology Platform では、2 つの住所品質モジュールを使用でき、Universal Addressing
モジュールはその 1 つです。 もう 1 つは Address Now モジュールです。このモジュールは、米国と
カナダ以外の住所のサポートを強化しており、より多くの国のバリデーションが可能で、2 バイトに
も対応しています。 国際住所データが大量にある場合は、住所の正規化とバリデーションの両面で利
点があることから、Address Now モジュールの使用を検討してください。
Universal Addressing コンポーネント
Universal Addressing モジュールは、次のコンポーネントで構成されます。 適切なデータベース (独自
の環境で Universal Addressing を稼働している場合)、またはホステッド サービス (Pitney Bowes
Software ホステッド サービスを介して Universal Addressing を利用している場合) のライセンスを取
得していれば、これらのコンポーネントを、米国、カナダ、オーストラリア、および国際住所に対し
て適用できます。
• Get Candidate Addresses — 与えられた住所に一致する可能性のあるもののリストを返します。
詳細については、Get Candidate Addresses(939ページ)を参照してください。
• Get City State Province — 与えられた郵便番号に対する都市および州/省を返します。 詳細につい
ては、Get City State Province(950ページ)を参照してください。
• Get Postal Codes — 与えられた都市の郵便番号を返します。 詳細については、Get Postal Codes
を参照してください。
• Validate Address — 米国、カナダ、および国際郵便データを使用して、住所を正規化し、妥当性を
確認します。 詳細については、Validate Address(953ページ)を参照してください。
• Validate Address AUS — オーストラリアの郵便データを使用して、住所を正規化し、妥当性を確
認します。 詳細については、Validate Address AUSを参照してください。
926
Spectrum™ Technology Platform 8.0.0
第 29 章 : Universal Addressing モジュール
Universal Addressing データベース
Universal Addressing モジュールは、いくつかの必須データベースとオプション データベースを使用
します。 これらのデータベースは Spectrum™ Technology Platform サーバーにインストールされま
す。 一部のデータベースは、Pitney Bowes Software が提供するサブスクリプションによって利用可
®
能で、月に 1 回、または年に 4 回更新されます。 その他のデータベースは、USPS がライセンス提
供しています。 以下の表に、Universal Addressing データベースの一覧を示します。
表 186 : Universal Addressing モジュールのデータベース
データベース名とその説明
必須またはオプショ 提供元
ンの区別
米国住所処理に必須 Pitney Bowes
Software サブスク
米国 郵便データベースは、Pitney Bowes 独自のフォーマッ
リプション (月 1
トで提供されています。 米国内のすべての家番号範囲が含
回更新)
まれており、月に 1 回更新されます。 このデータベース
ファイルには、次の情報が含まれています。
米国 郵便データベース
®
• ZIP + 4 Code
• 正規化済みの住所要素
• 都市および州の情報
米国 郵便データベースには、Enhanced Street Matching
(ESM) および All Street Matching (ASM) の実行に必要なデー
タも含まれています。 ESM および ASM は、通常の住所検
証プロセスでマッチしなかった任意の入力住所に対して、
追加のマッチング ロジックを適用します。
カナダ住所処理に必 Pitney Bowes
Software サブスク
須
カナダ郵便データベースは、Pitney Bowes Software 独自の
リプション (月 1
フォーマットです。 このデータベース ファイルには、次の
回更新)
情報が含まれています。
カナダ郵便データベース
• 郵便番号
• 正規化済みの住所要素
• 自治体および州の情報
オーストラリア郵便公社の郵便住所ファイル データベース オーストラリア住所 Pitney Bowes
Software サブスク
処理に必須
郵便住所ファイルは、オーストラリア郵便公社の Address
リプション (月 1
Matching Approval System (AMAS) プログラムに含まれて
回更新)
ユーザ ガイド
927
Universal Addressing モジュールとは
データベース名とその説明
必須またはオプショ 提供元
ンの区別
います。 このデータベース ファイルには、次の情報が含ま
れています。
• 郵便番号
• 正規化済みの住所要素
国際住所処理に必須 Pitney Bowes
Software サブスク
国際郵便データベースは、世界各地の郵便住所データの集
リプション (年 4
まりです。 各国のデータは、提供されているデータのレベ
回更新)
ルに応じて分類されています。 分類カテゴリは、以下のと
おりです。
国際郵便データベース
• カテゴリ A — 住所の郵便番号、都市名、州/郡名、通りの
住所要素、および国名の検証と修正が可能です。
• カテゴリ B — 住所の郵便番号、都市名、州/郡名、および
国名の検証と修正が可能です。 通りの住所要素の検証ま
たは修正はサポートしません。
• カテゴリ C — 国名の検証および修正と、郵便番号の書式
の検証が可能です。
オプションだが、 Pitney Bowes
™
CASS 認定 の処理 Software サブスク
Delivery Point Validation データベースでは、米国内の個々
には必須。米国住所 リプション (月 1
の郵便住所の妥当性確認が可能です (1 億 4500 万以上の場
回更新)
のみに対応
所に相当します)。 DPV データベースにより、米国 郵便デー
タベースによる郵便住所の検証能力を高めることができま
す。 DPV の詳細については、Delivery Point Validation
(DPV)(933ページ) を参照してください。
DPVR データベース
注: DPV データベースには、Commercial Mail Receiving
Agency (CMRA: 民間私書箱) の処理に必要なデータも
含まれています。
米国 郵便データベースの新しいエディションが提供される
度に、DPV データベースの対応するエディションが提供さ
れます。 USPS ライセンスでは、有効期限を過ぎても米国
郵便データベースを使用することを許可しますが (一部制約
があります)、DPV データベースの有効期限後に、DPV 検
索を実行することはできません。
928
Spectrum™ Technology Platform 8.0.0
第 29 章 : Universal Addressing モジュール
データベース名とその説明
必須またはオプショ 提供元
ンの区別
USPS ライセンスでは、DPV データを、住所または住所一
覧の作成に使用することを禁じています。 住所一覧の作成
を防止するために、DPV データベースには「誤検出レコー
ド」が含まれています。 誤検出レコードとは、人為的に作
成された住所のことです。 DPV クエリでマッチしなかった
場合は、DPV データベース内の誤検出テーブルに対するク
エリが実行されます。 このテーブルにマッチすると、DPV
処理は停止します。詳細については、誤検出(1044ページ)
を参照してください。
USPS ライセンスでは、米国外に DPV データを輸出するこ
とも禁じています。
オプション。米国住 Pitney Bowes
Software サブスク
所のみに対応
Enhanced Line of Travel ( eLOT) データベースは、Enhanced
リプション (月 1
Carrier Route の郵送が実際の配達順序にできる限り近くな
回更新)
ることを保証する米国住所データベースです。eLOT データ
ベースは、一部の種類の郵便料金割引を受けるために必須
です。 詳細については、Enhanced Line of Travel(eLot)
(934ページ) を参照してください。
eLOTR データベース
eLOT データベースに対する毎月の更新情報は、米国郵便
データベースと同じメディアで提供されます 。
同一月の米国 郵便データベースと eLOT データベースをイ
ンストールする必要があります (つまり、9 月の eLOT デー
タは、9 月の米国 郵便データベースで処理しなければなり
ません)。 米国 郵便データベースと eLOT データベースが
同一月のものでない場合、eLOT 番号を割り当てられない
ZIP + 4R Code が存在する恐れがあります。 eLOT コード
を割り当てるには、住所の ZIP Code™、ZIP + 4 Code、配
達ルート コード、および配達ポイントが提供される必要が
あります。
EWS データベース
Early Warning System (EWS) データベースは、米国郵便
データベースの郵便データの更新遅れに起因する住所検証
の誤りを防ぎます 。 詳細については、Early Warning
System (EWS)(933ページ) を参照してください。
ユーザ ガイド
®
オプション。米国住 USPS Web サイ
所のみに対応
トから無償でダウ
ンロード可能
929
Universal Addressing モジュールとは
データベース名とその説明
必須またはオプショ 提供元
ンの区別
EWS データベースは、ZIP Code™、通り名、接頭および接
尾方向指示、接尾語という一部の住所情報のみで構成され
ています。 住所が米国郵便データベースの最新版には存在
しない場合に限り、住所レコードに EWS を適用できます。
郵便データベースの最新版に掲載されていないことが必要
です。
USPSR は、EWS ファイルを週に 1 回 (木曜日) 更新しま
す。 USPSR Web サイト www.ribbs.usps.gov から EWS
ファイルをダウンロードできます。
Link
オプションだが、 Pitney Bowes
™
CASS 認定 の処理 Software サブスク
Link
LACS
データベースを使って、地方配送路の住所の通り
には必須。米国住所 リプション (月 1
名に沿った住所への変更、私書箱の再割り当て、または通
回更新)
のみに対応
り名に沿った住所の変更に伴って変更された住所を訂正で
きます。 詳細については、Locatable Address Conversion
System (LACS)(934ページ)を参照してください。
LACS
R データベース
Link
USPS ライセンスでは、LACS
データを、住所または住
所一覧の作成に使用することを禁じています。 住所一覧の
Link
作成を防止するために、LACS
データベースには「誤検
出レコード」が含まれています。 誤検出レコードとは、人
Link
為的に作成された住所のことです。 LACS
クエリでマッ
Link
チしなかった場合は、LACS
データベース内の誤検出テー
ブルに対するクエリが実行されます。 このテーブルにマッ
Link
チすると、LACS
処理は停止します。 詳細については、
誤検出(1044ページ)を参照してください。
Link
USPS ライセンスでは、米国外に LACS
データを輸出す
ることも禁じています。
RDI™ データベース
Residential Delivery Indicator (RDI™) データベースには、郵
送物に対する最良の配送料を調べることができるデータが
含まれます。 詳細については、Residential Delivery
Indicator (RDI)(934ページ)を参照してください。
®
オプション。米国住 USPS から直接ラ
所のみに対応
イセンス
RDI は、RDI データがハッシュ テーブルとして提供される
点で、DPV に似ています。 しかし、住所全体ではなく 9 桁
および 11 桁の ZIP Code™ に対してのみ標準ハッシュ アル
930
Spectrum™ Technology Platform 8.0.0
第 29 章 : Universal Addressing モジュール
データベース名とその説明
必須またはオプショ 提供元
ンの区別
ゴリズムが決定されるため、RDI は DPV よりもはるかにシ
ンプルな処理です。
Link™
オプション。米国住 Pitney Bowes
Software サブスク
所のみに対応
Link
Suite ™ は、補助的な住所情報の妥当性が確認できなかっ
リプション (月 1
た米国の企業住所に対し、その補助的な住所情報を修正し
回更新)
Link
ます。 Suite
処理が有効な場合、Validate Address は
Suite
データベース
FirmName フィールドの値を既知の会社名のデータベース
に照合します。 その後、Validate Address は正しい補助的
な住所情報を提供します。 詳細については、SuiteLink
(935ページ)を参照してください。
米国 住所の概念
米国住所には、通りの住所、地方配送路の住所、Highway Contract の住所、(郵便局に設置された) 私
書箱 の住所、および私設私書箱の住所があります。
通りの住所には、以下の要素が含まれます。
4235
N
MAIN
ST
NW
APT
100
家番号
接頭方向指示
通り名
接尾語
接尾方向指示
アパート ラベ アパート番号
ル
地方配送路、Highway Contract、または私書箱の住所には、以下の要素があります。
RR
123
BOX
地方配送路または Highway
Contract の種別
地方配送路または
Highway Contract の番号
19
地方配送路、
Highway Contract、
または PO Box 番号
私設私書箱の住所には、以下の要素が含まれます。
PMB
345
私設私書箱の種別
私設私書箱の番号
ユーザ ガイド
931
Universal Addressing モジュールとは
住所行は、住所要素と都市/州/ZIP Code 情報の組み合わせによって構成されます。 住所行は、以下の
図に示すように定義されます。
米国住所規格の詳細については、U.S. Postal Service® (USPS®: 米国郵政公社) が発行している 『Postal
Addressing Standards, USPS Publication 28』 (USPS の Web サイトで提供されています) を参照して
ください。
Coding Accuracy Support System (CASS)
Coding Accuracy Support System (CASS™) は、住所検証ソフトウェアの精度を認定する United States
Postal Service® (USPS®) プログラムです。 一部の郵便料金割引を受けるには、ZIP Code™、ZIP + 4™
コード、および配達ポイント バーコードを郵便物に割り当てるための CASS 認定®ソフトウェアを使
用する必要があります。
住所検証ソフトウェアが CASS 認定™を受けるには、USPS が実施するテストに合格する必要があり
ます。 CASS 認定™ソフトウェアは、次の項目において精度テストに合格する必要があります。
• 5 桁のコーディング
• ZIP + 4®/配達ポイント (DP) コーディング
•
•
•
•
•
配達ルート コーディング
Delivery Point Validation (DPV®)
Link
Locatable Address Conversion System (LACS R)
®
Enhanced Line of Travel (eLOT )
Residential Delivery Indicator (RDI™)
CASS 認定™製品を使用する場合には、最小レベルとして以下に示す精度が保証されます。
表 187 : CASS 認定レベル
932
認定レベル
求められる精度レベル
ZIP
98.5%
配達ルート
98.5%
ZIP+4
98.5%
配達ポイント バーコード
100%
eLOT
100%
完全な住所
100%
Spectrum™ Technology Platform 8.0.0
第 29 章 : Universal Addressing モジュール
Commercial Mail Receiving Agency (CMRA: 民間私書箱)
Commercial Mail Receiving Agency (CMRA) は、私書箱の貸し出しを行う民間企業です。 mail drop (郵
便受け) としても知られる CMRA は通常、私設私書箱業者が運営しています。 そのため、CMRA の住
所は、"POB" (郵便局の私書箱) ではなく、"PMB" (私設私書箱) と表記されます。
CMRA の顧客は、自分の住所ではなく、CMRA の住所で郵便物などの配達物を受け取ることができま
す。 顧客と CMRA との間の契約に基づき、CMRA は、郵便物の顧客への転送や、引き取りまでの保
管を行います。
CMRA のサービスを利用する理由としては、プライバシーの保護が挙げられます。 例えば、自宅を拠
点として事業を営む人は、自宅住所を公開したくないと考える場合があります。 あるいは、ある地域
の顧客が、より知名度の高い住所や高級住宅地に存在する CMRA と契約する場合もあります。
Delivery Point Validation (DPV)
Delivery Point Validation ( DPV®) は、住所情報の正確さを個々の郵便アドレスまで照合する米国郵政
公社® (USPS®) のテクノロジーです。 この DPV® を使用して住所の照合をすることによって、住所不
完全のため不達 (UAA) という事態を減少させ、郵便コストや不正な住所情報に関連する他のビジネス
コストを削減することができます。
DPV® なしでの個々の住所検証では、その通り上にある複数の有効な住所までしか照合できません。
例えば、USPS データは Maple Lane 上の住所が 500 から 1000 まであることを示しています。 610
Maple Ln という住所を DPV® なしで検証しようとすると、この住所は 500 〜 1000 の範囲にあるため
有効と見なされます。 しかし、実際には 610 Maple Ln という住所は存在しません。 この通りの当該
区画にある家番号は、608、609、613、および 616 です。 DPV® 処理を使うと、610 Maple Ln が存在
しないことが警告され、住所を訂正する措置をとることができます。
DPV® は、ターゲットを絞り込んだ郵便リストの作成に役立つ独特の住所属性も備えています。 例え
ば、DPV® は郵送先が空き家かどうかを確認したり、それが郵便受取代行業 (CMRA) や私設私書箱の
住所であることを識別できます。
DPV® は既存の住所の正確性を検証できますが、DPV® を使って住所録を作成することはできません。
例えば、123 Elm Street Apartment 6 という住所が存在することは確認できますが、同じ通りに
Apartment 7 があるかどうかを調べることはできません。 住所録の生成を阻止するために、DPV® デー
タベースには誤検出レコードが含まれています。 誤検出レコードは、誤検出テーブルに存在する人為
的に作られた住所です。 DPV® クエリでマッチしなかった場合は、誤検出テーブルに対してクエリが
実行されます。 このテーブルにマッチする場合、DPV® の処理は停止します。
Early Warning System (EWS)
Early Warning System (EWS) は、月に 1 回更新される USPS データベースにまだ反映されていない、
新規の住所や最近変更された住所に関する最新住所情報を提供します。 EWS は USPS® データベース
の郵便データの更新遅れによる、住所レコードの誤った情報提供を防ぐことができます。
米国 郵便データベースが古いほど、住所が誤って変換される可能性は高くなります。 米国郵便データ
ベースにあるマッチングする住所が不正確な場合、有効な住所が誤った住所に変換され、 壊れた住所
が生成されます。
EWS データは、ZIP Code™、通り名、前置/後置方位記号、および接尾語に限定される、部分住所情報
から構成されます。 住所が米国郵便データベースの最新版には存在しない場合に限り、住所レコード
に EWS を適用できます 。
ユーザ ガイド
933
Universal Addressing モジュールとは
USPS® は、EWS ファイルを週に 1 回更新します。 EWS ファイルは、USPS® Web サイト
(ribbs.usps.gov/files/CASS) からダウンロードできます。
Enhanced Line of Travel(eLot)
eLOT は、Enhanced Carrier Route の郵送が実際の配達順序にできる限り近くなることを保証します。
eLOT 順は、正確な順序ではありませんが、配達者によって提供されたルートに従って整えられた ZIP
+ 4® 番号の順になっています。 まず、ZIP + 4® グループが順序付けられます。 次に、各グループ内の
住所が昇順になっているか降順になっているかが識別されます。
eLOT は、配達ルートを使用する大量/125 通または不特定郵便以外の郵便物を準備する差出人が使用
できます。eLOT 順は、自動化に適合したレターサイズの郵便物以外の Basic Enhanced Carrier Route
Standard Mail に必須です。
注: 同一月の米国 郵便データベースと eLOT データベースをインストールする必要があります (つま
り、9 月の eLOT データは、9 月の米国 郵便データベースで処理しなければなりません)。 米国
郵便データベースと eLOT データベースが同一月のものでない場合、eLOT 番号を割り当てられ
ない ZIP + 4® Code が存在する恐れがあります。 eLOT コードを割り当てるには、住所の ZIP
Code™、ZIP + 4® Code、配達ルート コード、および配達ポイントが提供される必要があります。
Locatable Address Conversion System (LACS)
USPS® Locatable Address Conversion System (LACS) は、地方配送路の住所を通り名に沿った住所に
変換した場合、PO Box 番号の再割り当てがあった場合、または通り名に沿った住所が変更した場合
Link
に、それに伴って変更した住所を修正します。 LACS
変換の例を以下に示します。
• 地方配送路の住所の通り名に沿った住所への変換: 旧住所: 231 RR 3 Box 45 新住所: 1292 North
Ridgeland Drive
• 通り名または通り番号の変更: 旧住所: 23 Main Street 新住所: 45 West First Avenue
• PO Box 番号の再割り当て: 旧住所: PO Box 453 新住所: PO Box 10435
Link
LACS
は、CASS 処理に必須です。
Residential Delivery Indicator (RDI)
Residential Delivery Indicator (RDI™) 処理では、郵送物に対する最良の配送料を調べることができま
す。 RDI™ 処理では、住所が企業の住所であるか、個人宅の住所であるかを確認します。 一部の配達
サービスでは、企業住所への配達よりも個人住所への配達に対して高い料金を設定しているため、こ
の違いは重要です。
通り名のエイリアス
米国における通り名のエイリアスとは、通りの一部に付けられた別名のことです。 通り名のエイリア
スには、次の 4 種類があります。
• よく使用される名前 — その地域でよく使用される通り名です。 通常は、通り上の特定の範囲の住
所のみに対して使用されます。
• 省略形 — 通り名の省略形です。AddressLine1 の長さが 31 文字以上になる場合に使用することがで
きます。 例えば、1234 BERKSHIRE VALLEY RD APT 312A という通り名は、1234 BERKSHIRE
VLLY RD APT 312A と省略することができます。
934
Spectrum™ Technology Platform 8.0.0
第 29 章 : Universal Addressing モジュール
• 変更名 — 通り名が正式に変更された場合に、新しい名前を表すエイリアスです。 例えば、SHINGLE
BROOK RD という通り名が CANNING DR と変更された場合、CANNING DR が変更名のエイリア
スとなります。
• その他の名前 — この通り名エイリアスには、通りの他の名前や、通りの一般的な省略形などがあり
ます。
エイリアスではない通り名のことを、基本通り名と呼びます。
Link
Suite
Link
Suite
は、補助的な住所情報の妥当性が確認できなかった米国の企業住所に対し、その補助的な住
Link
所情報を修正します。 Suite
処理が有効になっている場合、既知の企業名とその補助的な住所情報
からなるデータベースに対して、企業名のマッチングが行われます。
次の例を考えます。
企業名: Pitney Bowes Software
住所行 1: 4200 Parliament Place
住所行 2: STE 1
郵便番号: 20706
Link
この場合、Suite
は、Suite 番号を以下の正しい Suite番号に変更します。
企業名: Pitney Bowes Software
住所行 1: 4200 Parliament Place
住所行 2: STE 600
郵便番号: 20706-1844
SuiteLink は、以下の場合に住所における企業名の修正を試みます。
• 企業名が存在する場合
• 有効な ZIP Code™、ZIP + 4® Code、および主要な番号が特定できた場合
• 高層のデフォルト レコードに対してマッチングが行われた場合
• 通常の処理では補助的な住所情報の妥当性が確認できなかった場合
カナダ住所のガイドライン
Canada Post Corporation (CPC: カナダ郵政公社) は、郵便物の処理と適時な配達を目的として住所規
格を定めています。 CPC の住所規約には、以下の項目に対するガイドラインがあります。
• 住所フォーマット(936ページ)
• 住所以外のデータ(936ページ)
• 受取人情報(936ページ)
• 配達住所情報: 正式住所(937ページ)
• 配達住所情報: 非正式住所(937ページ)
• 配達方法情報(937ページ)
• 配達施設情報(938ページ)
• 自治体(938ページ)
ユーザ ガイド
935
Universal Addressing モジュールとは
• 州(938ページ)
• 郵便番号(938ページ)
• 国(939ページ)
住所フォーマット
カナダ郵政公社は、集配ポイントおよび配達ポイントの特定に必要な情報として郵便住所を定義して
います。 カナダ国内から発送され、カナダ国内を宛先とする郵便物について、CPC は、住所ブロック
のコンポーネントの順序を以下のとおりに定めています。
1. 住所以外のデータと受取人情報
2. 配達住所情報
3. 自治体、州、郵便番号
カナダの住所は、以下のガイドラインに従う必要があります。
• 住所要素として、正式な名称よりも記号を使用すること。
• 住所ブロックのすべての行で大文字を使用すること。
• 住所の中に、番号記号 (#) やフランスの番号記号 (no) を使用しないこと。
• 特に記載のない限り、カンマなどの句読記号を、住所要素やコンポーネントの間の区切り文字とし
て使用しないこと。
• 住所のすべての行の左側の余白を揃えること。
• 住所ブロックの最後の 3 行は、 受取人情報、配達住所情報、自治体、州、および郵便番号であるこ
と。
住所以外のデータ
「Attention (注意)」や「Address Correction Required (住所の訂正が必要)」といった住所とは無関係の
データが存在する場合は必ず、配達住所情報行の上の、住所ブロック先頭行の上に記載します。
住所以外のデータとは、差出人が郵便物に記載したい任意の追加情報のことです。これには、「Attention
(注意)」や「Confidential (親展)」などの単語や、アカウント番号や顧客識別番号などがあります。
受取人情報
受取人情報とは、郵便物の宛先である人物、企業、組織を特定するものです。 複数行の情報からなる
受取人情報には、以下の要素を記載の順序で含むことができます。
• 名前または気付の情報
• 肩書
• 部署または部門名
• 企業または組織名
上記の順序は、Large Volume Receiver (LVR) や、政府省庁または政府機関にも適用されます。 部署
が課に分割されている場合は、課名を部署名の上に記載します。
936
Spectrum™ Technology Platform 8.0.0
第 29 章 : Universal Addressing モジュール
配達住所情報: 正式住所
正式住所とは一般的に、宅配または Community Mail Box (superbox) で郵便物を受け取る顧客の住所
のことです。 特に記載のない限り、同一行の住所コンポーネントおよび要素の間は、1 つの空白で区
切ります。
正式住所には、以下の要素を含むことができます。
• 正式番号 — 自治体によってその住所に割り当てられた正式な番号。
• 正式番号接尾語 — 11D JESSOME ST や 91 1/2 KING ST などのように、住所に入れなければなら
ない正式番号の後に記載する、単一または複数の英文字。
• 通り名 — 自治体によって変換することなく認識される、正式な通り名。
"1ST"、"2ND"、"3RD"、"4TH"、または "1E" や "2E" のように、通り名が、番号とそれに続く
"ST"、"ND"、"TH"、"E" などの序数である場合は、番号と序数の間に空白は入れません。 通り名が
英数字からなる場合は、数字部分と英字部分の間に空白は入れません (例: 14 B ST ではなく 14B ST
とします)。
• 通りの種類 — 住所を英語で記載する場合、通り名の後には必ず、通りの種類を記載します。 住所
をフランス語で記載する場合、通りの種類は、通り名が序数である場合を除き、通り名の前に記載
します (例: RUE RENE-LEVESQUE)。 通り名が序数である場合は、通り名の後に通りの種類を記載
します (例: 2061 36E RUE)。 通りの種類には必ず、CPC 記号を使用します。
• 通りの方向 — 必要に応じて、方向を示す 1 文字または 2 文字の記号 (N、S、NE、NW、O、NO な
ど) を、通り情報の最後の要素として記載します。
• ユニット指定子 — ユニット指定子は、建物によって割り当てられた特定のユニットを識別するもの
です。 値は、英字、英数字、または数字です。 ユニット指定子が番号である場合は、数字で表記し
ます ("two" という単語ではなく "2" と表記します)。 ユニット指定子が住所の中に使用されていない
場合は、ユニット指定子を通り情報の前にハイフンで区切って記載します (317-10228 148 ST)。 ユ
ニット指定子の正しい記載方法の例としては、 "1 MAIN ST APT 1"、"APT 1 1 MAIN ST"、または
"1-1 MAIN ST" があります。
配達住所情報: 非正式住所
非正式住所は、顧客に提供されているサービスが、貸金庫、局留め郵便、またはルート サービスなど
で、正式住所情報が存在しない場合に使用されます。
配達方法情報
配達方法情報は、配達施設情報と同一行に記載します。 配達方法情報には、以下の要素を含むことが
できます。
• 配達方法指定子 — Postal Box (PO BOX)、Rural Route (RR)、Suburban Service (SS)、Mobile Route
(MR)、または General Delivery (GD) に対する正式な CPC 記号。
• 配達方法識別子 — 数値識別子。配達方法指定子との間に空白を 1 つ入れて記載します。 配達方法
識別子の前に、番号記号 (#) またはフランスの省略記号 (no) を使用してはいけません (PO BOX 123
と記載し、PO BOX #123 とは記載しません)。
ユーザ ガイド
937
Universal Addressing モジュールとは
配達施設情報
自治体の中に複数の配達施設が存在する地域では、配達方法情報とともに配達施設情報を記載して、
配達住所を担当する具体的な施設を特定します。 配達施設情報は、配達方法情報の後に空白を 1 つ空
けて記載します。
配達施設情報には、以下の要素を含むことができます。
• 配達施設地域名 — 配達施設の大まかな位置を特定する地域名です。通常は、村、町、コミュニティ、
自治体、または大都市圏の名前です。 自治体名と同一である場合は、配達施設地域名を記載する必
要はありません。 次に例を示します。
正しい記載方法:
PO BOX 59
BELL ISLAND FRONT NF A0A 1H0
誤った記載方法:
PO BOX 59 BELL ISLAND FRONT
BELL ISLAND FRONT NF A0A 1H0
• 配達施設の種類と修飾子 — この種類と修飾子により、複数の施設が存在する都市部において、具体
的な配達施設を特定します。 例えば、GD SCARBOROUGH STN LCD WEST HILL という配達住所
において、配達施設地域名は SCARBOROUGH、配達施設の種類は STN、配達施設の修飾子は LCD
WEST HILL です。
自治体
自治体とは、有効な郵便宛先であるとみなされる自治体、町、村、コミュニティ、または住所地域名
のことです。
自治体は、カナダ住所の最終行の最初の要素で、すべての種類の住所において必須です。
州
州は、すべての種類の住所において必須の要素です。 カナダ住所の最終行の 2 番めの要素になりま
す。 自治体と同一行に、空白を 1 つ空けて記載する必要があります。
郵便番号
郵便番号は、すべての種類の住所において必須の要素で、3 文字の英数字が 2 つ、合計 6 文字の英数
字で構成されます。 最初の 3 文字 (文字、数字、文字) は、Forward Sortation Area (FSA) として知ら
れています。 2 つめの 3 文字 (数字、文字、数字) は、Local Delivery Unit (LDU) として知られていま
す。
郵便番号は必ず、A9A 9A9 という形式になります。ここで A は文字、9 は数字を表します。 最初の 3
文字と2 つめの 3 文字との間には必ず空白を 1 つ入れます。
郵便番号は、必ず自治体および州と同一行に記載し、州との間には空白を少なくとも 2 つ入れます。
938
Spectrum™ Technology Platform 8.0.0
第 29 章 : Universal Addressing モジュール
国
国名は、カナダの国外に郵送される郵便物にのみ記載します。 国名は、外国住所の住所ブロックの最
終行に、単独で、正式な英語またはフランス語の綴りで、記載する必要があります。
他の国からカナダ宛てに発送された郵便物は、住所ブロックの最終行に "CANADA" と単独で記載され
ている必要があります。
オーストラリア住所
オーストラリアでは、オーストラリア郵便公社が住所規格を定めています。 これらの規格が記載され
たオーストラリア郵便公社の発行物の一覧と、Address Matching Approval System (AMAS) プログラ
ムについては、オーストラリア郵便公社の Web サイト www.auspost.com.au を参照してください。
国際住所
住所を取り扱う Pitney Bowes Software の製品では、米国およびカナダ以外の住所を、"国際" 住所と
して分類します。 国際住所の規格は、国によって異なります。 Pitney Bowes Software ではこれらの
規格をまとめて、1 つの国際住所コーディング システムを作成しました。このシステムでは、およそ
86 カ国の住所要素を検証および修正でき、141 カ国の郵便番号形式を検証できます。
万国郵便連合 (UPU) の加盟国の郵便規格に関する情報については、万国郵便連合の Web サイト
www.upu.int を参照してください。
Get Candidate Addresses
Get Candidate Addresses は、与えられた入力住所にマッチするとみなされる住所のリストを返しま
す。 Get Candidate Addresses は、入力住所が郵便データベースの複数の住所にマッチする場合のみ、
候補の住所を返します。 入力住所が、郵便データベースの 1 つの住所のみにマッチする場合は、住所
データを返しません。
米国およびカナダ以外の住所については、Validate Address が返す複数のマッチ結果と、Get Candidate
Addresses が同じ住所に対して返す結果の間に、矛盾が存在する場合があります。 矛盾した結果が得
られるのはおそらく、Validate Address のパフォーマンス チューニング設定で 100 以外の値を設定し
ているためです。 Get Candidate Addresses と Validate Address で矛盾のない結果を得るには、パ
フォーマンス チューニング オプションを 100 に設定します。
注: デフォルトでは、Get Candidate Addresses は個々の家番号との一致は確認しません。 各通りの
家番号の範囲とのマッチングを行います。 Get Candidate Addresses は通り名、都市名、州/省
名、および郵便番号を特定した後、入力された家番号が、マッチした通り名の家番号の範囲に含
まれるかどうかを確認します。 ユニット番号についても同様の処理が行われます。 個々の家番号
が有効であることを確認するには、Validate Address Delivery Point Validation (DPV) 処理オプショ
ンを使用する必要があります。 DPV 処理は、米国住所に対してのみ適用できます。
ユーザ ガイド
939
Get Candidate Addresses
カナダのコーダーには、特定の郵便番号を入力として受け取り、その郵便番号のデータベースに格納
された通り情報を返す逆検索ルーチンが含まれています。 この機能を使用するには、PostalCode フィー
ルドにカナダの郵便番号を入力します。 カナダの郵便番号を入力した場合の結果については、以下の
2 つめの例を参照してください。
Get Candidate Addresses は、Universal Addressing モジュールに含まれています。 このモジュールの
詳細 (これに含まれるその他のコンポーネントなど) については、Universal Addressing モジュール
とは(926ページ) を参照してください。
米国 住所の例
AddressLine1: PO Box 1 City: NY State: NY
カナダ住所の例
PostalCode: A1A1A1
940
Spectrum™ Technology Platform 8.0.0
第 29 章 : Universal Addressing モジュール
入力
Get Candidate Addresses の入力の一覧を以下の表に示します。
注: API を介してこのサービスを利用する場合は、DataTable クラスを使用して入力を指定します。
以下で説明するフィールドは、DataTable クラスにおける有効な列名です。DataTable クラスの
詳細については、『Spectrum Technology Platform API ガイド』の「API の基礎」のセクション
を Spectrum™ Technology Platform API ガイド.
表 188 : 入力フォーマット
フィールド名
説明/有効値
AddressLine1
最初の住所行。
AddressLine2
2 行目の住所行。
AddressLine3
3 行目の住所行。
米国およびカナダの住所には存在しません。
AddressLine4
4 行目の住所行。
米国およびカナダの住所には存在しません。
City
都市名。
StateProvince
州または省。
ユーザ ガイド
941
Get Candidate Addresses
フィールド名
説明/有効値
米国住所の場合のみ、州を StateProvince フィールドの代わりに City
フィールドに入れることができます。
PostalCode
™
住所の郵便番号。 米国住所の場合は、次のいずれかの形式の ZIP Code
になります。
99999
99999-9999
A9A9A9
A9A 9A9
9999 999
注: カナダ住所の場合は、このフィールドのみを入力すると、候補と
なる住所データが返されます。 その他の国の場合は、
AddressLine1 と AddressLine2 も入力する必要があります。
Country
国コードまたは国名を、次のいずれかのフォーマットで入力します。
• 2 桁の ISO 国コード
• 3 桁の UPU 国コード
• 英語の国名
• フランス語の国名
• ドイツ語の国名
• スペイン語の国名
ISO コードの一覧については、各国の ISO コードとモジュール サポー
ト(1086ページ) を参照してください。
FirmName
企業名。
USUrbanName
米国住所都市化名。 主にプエルトリコの住所に使用します。
オプション
表 189 : Get Candidate Addresses のオプション
942
オプション名
説明
米国住所処理を有効にする
米国住所を処理するかどうかを指定します。 米国住所処理
を有効にすると、Get Candidate Addresses は、米国住所の
Spectrum™ Technology Platform 8.0.0
第 29 章 : Universal Addressing モジュール
オプション名
説明
候補となる住所の取得を試みます。 米国住所処理を無効に
すると、米国住所は失敗します。つまり、Status 出力フィー
ルドに "F" が設定されて返されます。 出力フィールド
Status.Code は、"DisabledCoder" となります。 米国住所処
理のライセンスを取得していない場合は、ジョブに米国住
所が含まれるか否かにかかわらず、米国住所処理を無効に
しなければ、ジョブを正常に実行することはできません。
注: 米国住所を正常に処理するには、米国住所処理の有効
なライセンスを取得する必要があります。 米国住所処
理のライセンスを取得していないか、ライセンスの期
限が切れているにもかかわらず、米国住所処理を有効
にすると、ジョブ全体が失敗します。
データベース
米国住所処理に使用するデータベースを指定します。
Management Console の [米国データベース リソース] パネ
ルで定義されたデータベースのみが使用可能です。
カナダ住所処理を有効にする
カナダ住所を処理するかどうかを指定します。 カナダ住所
処理を有効にすると、Get Candidate Addresses は、カナダ
住所の候補となる住所の取得を試みます。 カナダ住所処理
を無効にすると、カナダ住所は失敗します。つまり、Status
出力フィールドに "F" が設定されて返されます。 出力フィー
ルド Status.Code は、"DisabledCoder" となります。 カナダ
住所処理のライセンスを取得していない場合は、ジョブに
カナダ住所が含まれるか否かにかかわらず、カナダ住所処
理を無効にしなければ、ジョブを正常に実行することはで
きません。
注: カナダ住所を正常に処理するには、カナダ住所処理の
有効なライセンスを取得する必要があります。 カナダ
住所処理のライセンスを取得していないか、ライセン
スの期限が切れているにもかかわらず、カナダ住所処
理を有効にすると、ジョブ全体が失敗します。
データベース
ユーザ ガイド
カナダ住所処理に使用するデータベースを指定します。
Management Console の [カナダ データベース リソース] パ
ネルで定義されたデータベースのみが使用可能です。
943
Get Candidate Addresses
オプション名
説明
国際住所処理を有効にする
国際住所 (米国およびカナダ以外の住所) を処理するかどう
かを指定します。 国際住所処理を有効にすると、Get
Candidate Addresses は、国際住所の候補となる住所の取得
を試みます。 国際住所処理を無効にすると、国際住所は失
敗します。つまり、Status 出力フィールドに "F" が設定さ
れて返されます。 出力フィールド Status.Code
は、"DisabledCoder" となります。 国際住所処理のライセン
スを取得していない場合は、ジョブに国際住所が含まれる
か否かにかかわらず、国際住所処理を無効にしなければ、
ジョブを正常に実行することはできません。
注: 国際住所を正常に処理するには、国際住所処理の有効
なライセンスを取得する必要があります。 国際住所処
理のライセンスを取得していないか、ライセンスの期
限が切れているにもかかわらず、国際住所処理を有効
にすると、ジョブ全体が失敗します。
データベース
国際住所処理に使用するデータベースを指定します。
Management Console の [国際データベース リソース] パネ
ルで定義されたデータベースのみが使用可能です。
大文字小文字
出力データの大文字と小文字の区別を指定します。 次のい
ずれかを選択します。
混在
出力には、大文字と小文字が混在します (デ
フォルト)。 例えば、
123 Main St
Mytown FL 12345
大文字
出力に大文字を使用します。 例えば、
123 MAIN ST
MYTOWN FL 12345
返されるレコードの最大数
Get Candidate Addresses が返す候補住所の最大数。 デフォ
ルトは 10 です。 最大数は 10 になります。
短い都市名を返す
米国住所に対し、USPS が承認する都市の略称がある場合
®
®
に、それを返すかどうかを指定します。 USPS は、14 文
字以上の都市名に対し、略称を定めています。 都市の略称
944
Spectrum™ Technology Platform 8.0.0
第 29 章 : Universal Addressing モジュール
オプション名
説明
は 13 文字以下で、宛名ラベルのサイズが限られている場合
に使用できます。 短い都市名が存在しない都市に対しては、
正式な都市名が返されます。
二重住所マッチ ロジック
(米国住所のみ)。 通り情報と PO Box/地方配送路/Highway
Contract 情報の両方が住所に含まれる場合に、Get Candidate
Addresses が、通り一致を返すか、または PO Box/地方配
送路/Highway Contract 一致を返すかを制御します。 詳細に
ついては、二重住所ロジックについて(967ページ)を参照
してください。
通常一致
®
™
(デフォルト) USPS CASS の規則では、
以下の優先順位に基づいて、返す住所を決
定します。
1. PO Box
2. 企業
3. 高層
4. 通り
5. 地方配送路
6. 局留め郵便
通り一致
住所行に関係なく、通り一致を返します。
PO Box 一致 住所行に関係なく、PO Box 一致を返しま
す。
通りマッチング
企業マッチング
ユーザ ガイド
通りマッチングの精度 (米国住所のみ)。
完全一致
入力された通り名は、データベースに完全
に一致する必要があります。
厳格
マッチング アルゴリズムは "厳格" です。
中
マッチング アルゴリズムは "中" です (デフォ
ルト)。
あいまい
マッチング アルゴリズムは "あいまい" で
す。
企業名マッチングの精度 (米国住所のみ)。
945
Get Candidate Addresses
オプション名
道順マッチング
説明
完全一致
入力された企業名は、データベースに完全
に一致する必要があります。
厳格
マッチング アルゴリズムは "厳格" です。
中
マッチング アルゴリズムは "中" です (デフォ
ルト)。
あいまい
マッチング アルゴリズムは "あいまい" で
す。
道順マッチングの精度。
完全一致
入力された道順は、データベースに完全に
一致する必要があります。
厳格
マッチング アルゴリズムは "厳格" です。
中
マッチング アルゴリズムは "中" です (デフォ
ルト)。
あいまい
マッチング アルゴリズムは "あいまい" で
す。
Enhanced Street Matching を実行
Enhanced Street Matching (ESM) を実行するかどうかを指
定します。 ESM は、通常の住所検証プロセスでマッチしな
かった任意の入力住所に対して、追加データによる別のマッ
チング ロジックを適用します。 ESM は、米国住所にのみ
適用されます。
失敗時に住所行を検索
ValidateAddress において、住所行で都市、州/省、郵便番号
の検索を行うかどうかを指定します。
このオプションにより、Validate Address において、City、
StateProvince、および PostalCode の各入力フィールドの値
を使用して住所にマッチする結果が得られなかった場合に、
AddressLine 入力フィールドで都市、州/省、郵便番号、お
よび国を検索することができます。
入力住所において、AddressLine フィールドに都市、州/省、
および郵便番号の情報が存在する場合は、このオプション
を有効にすることを検討してください。
入力住所において、City、State/Province、および PostalCode
フィールドが使用されている場合は、このオプションを無
946
Spectrum™ Technology Platform 8.0.0
第 29 章 : Universal Addressing モジュール
オプション名
説明
効にしてください。 これらのフィールドが使用されている
場合にこのオプションを有効にすると、Validate Address が
これらのフィールドの値の修正に失敗する確率が高まりま
す (都市名のスペルミスなど)。
出力
Get Candidate Addresses は、次の出力を返します。
注: API を介してこのサービスを利用する場合は、出力は DataTable クラスを使用して返されます。
以下で説明するフィールドは、DataTable クラスにおける有効な列名です。DataTable クラスの
詳細については、API ユーザ ガイドの「API の基礎」のセクションを Spectrum™ Technology
Platform API ガイド.
表 190 : Get Candidate Addresses の出力
フィールド名
説明/有効値
AddressLine1
最初の住所行。
AddressLine2
2 行目の住所行。
AddressLine3
3 行目の住所行。
AddressLine4
4 行目の住所行。
City
都市名。
Country
3 文字の ISO 3116-1 Alpha-3 国コード。 ISO コードのリストについ
ては、各国の ISO コードとモジュール サポート(1086ページ)を参照
してください。
FirmName
企業名。
HouseNumberHigh
候補住所の家番号が含まれる範囲の終了家番号。
HouseNumberLow
候補住所の家番号が含まれる範囲の開始家番号。
ユーザ ガイド
947
Get Candidate Addresses
フィールド名
説明/有効値
HouseNumberParity
HouseNumberLow と HouseNumberHigh の間の家番号の番号付けス
キームを次のように示します。
MatchLevel
E
偶数値のみ
O
奇数値のみ
B
両方
米国およびカナダ以外の住所に対し、候補住所のマッチ レベルを特定
します。 米国およびカナダの住所では常に "A" になります。 次のいず
れかを選択します。
A
候補は通りレベルで入力住所にマッチします。
B
候補は州/省レベルで入力住所にマッチします。
™
PostalCode
郵便番号。 米国では、ZIP Code と呼びます。
PostalCode.AddOn
ZIP + 4 Code の末尾 4 桁。 米国住所のみ。
RecordType
米国およびカナダの郵政当局が定義した住所レコードのタイプ (米国
およびカナダの住所のみ)
®
•
•
•
•
•
•
RecordType.Default
FirmRecord
GeneralDelivery
HighRise
PostOfficeBox
RRHighwayContract
Normal
"デフォルト" マッチを示すコード
Y
住所はデフォルト レコードにマッチしています。
NULL
住所はデフォルト レコードにマッチしていません。
StateProvince
州または省の省略形。
Status
マッチの成功または失敗を報告します。
NULL
948
成功
Spectrum™ Technology Platform 8.0.0
第 29 章 : Universal Addressing モジュール
フィールド名
説明/有効値
F
Status.Code
失敗
失敗の原因 (ある場合)。 次のいずれかの値になります。
• DisabledCoder
• RequestFailed
Status.Description
問題の説明 (ある場合)。
Did not return multiples
入力住所はデータベース内の 1 つ
の住所とのみマッチしました。
Get Candidate Addresses は、一
致する可能性のある住所が複数見
つかった場合にデータを返しま
す。
Number of candidates is not
greater than 1
入力住所はデータベース内の複数
の住所にマッチしましたが、住所
が返されませんでした。
PerformUSProcessing disabled Status.Code=DisabledCoder の場
合にこの値が表示されます。
PerformCanadianProcessing
disabled
Status.Code=DisabledCoder の場
合にこの値が表示されます。
PerformInternationalProcessing Status.Code=DisabledCoder の場
disabled
合にこの値が表示されます。
UnitNumberHigh
候補住所のユニット番号が含まれる範囲の終了ユニット番号。
UnitNumberLow
候補住所のユニット番号が含まれる範囲の開始ユニット番号。
UnitNumberParity
UnitNumberLow と UnitNumberHigh の間のユニット番号の番号付けス
キームを次のように示します。
ユーザ ガイド
E
偶数値のみ
O
奇数値のみ
B
両方
949
Get City State Province
フィールド名
説明/有効値
USUrbanName
妥当性が確認された都市の都市化名。 都市化名は、主にプエルトリコ
住所に使用されます。
Get City State Province
Get City State Province は、与えられた入力郵便番号に対する都市および州/省を返します。
注: Get City State Province は、米国およびカナダの住所のみに対応します。
Get City State Province は、Universal Addressing モジュールに含まれています。 このモジュールの詳
細 (これに含まれるその他のコンポーネントなど) については、Universal Addressing モジュールと
は(926ページ) を参照してください。
入力
入力フィールドを以下の表に示します。
注: API を介してこのサービスを利用する場合は、DataTable クラスを使用して入力を指定します。
以下で説明するフィールドは、DataTable クラスにおける有効な列名です。DataTable クラスの
詳細については、API ユーザ ガイドの「API の基礎」のセクションを Spectrum™ Technology
Platform API ガイド
表 191 : Get City State Province の入力
フィールド名
説明/有効値
PostalCode
米国企業の ZIP Code またはカナダの郵便番号を次のいずれかのフォー
™
マットで示します。
99999
99999-9999
A9A9A9
A9A 9A9
950
Spectrum™ Technology Platform 8.0.0
第 29 章 : Universal Addressing モジュール
オプション
表 192 : Get City State Province のオプション
オプション名
説明/有効値
米国住所処理を有効にする
米国住所を処理するかどうかを指定します。 米国住所処理を有効にし
た場合、Get City State Province は米国住所の州を返します。 米国住
所処理を無効にすると、米国住所は失敗します。つまり、Status 出力
フィールドに "F" が設定されて返されます。 出力フィールド
Status.Code は、"DisabledCoder" となります。 米国住所処理のライ
センスを取得していない場合は、ジョブに米国住所が含まれるか否か
にかかわらず、米国住所処理を無効にしなければ、ジョブを正常に実
行することはできません。
注: 米国住所を正常に処理するには、米国住所処理の有効なライセン
スを取得する必要があります。 米国住所処理のライセンスを取得
していないか、ライセンスの期限が切れているにもかかわらず、
米国住所処理を有効にすると、ジョブ全体が失敗します。
データベース
米国住所処理に使用するデータベースを指定します。 Management
Console の [米国データベース リソース] パネルで定義されたデータ
ベースのみが使用可能です。
カナダ住所処理を有効にする カナダ住所を処理するかどうかを指定します。 カナダ住所処理を有効
にした場合、Get City State Province はカナダ住所の州を返します。
カナダ住所処理を無効にすると、カナダ住所は失敗します。つまり、
Status 出力フィールドに "F" が設定されて返されます。 出力フィール
ド Status.Code は、"DisabledCoder" となります。 カナダ住所処理の
ライセンスを取得していない場合は、ジョブにカナダ住所が含まれる
か否かにかかわらず、カナダ住所処理を無効にしなければ、ジョブを
正常に実行することはできません。
注: カナダ住所を正常に処理するには、カナダ住所処理の有効なライ
センスを取得する必要があります。 カナダ住所処理のライセンス
を取得していないか、ライセンスの期限が切れているにもかかわ
らず、カナダ住所処理を有効にすると、ジョブ全体が失敗しま
す。
ユーザ ガイド
951
Get City State Province
オプション名
説明/有効値
データベース
カナダ住所処理に使用するデータベースを指定します。 Management
Console の [カナダ データベース リソース] パネルで定義されたデー
タベースのみが使用可能です。
非正式な都市名を含める
非正式な都市名を出力に含めるかどうかを指定します。 非正式な都市
名は、主要都市名の代替名です。 例えば、Hollywood は Los Angeles
の非正式な都市名です。
返されるレコードの最大数
返される都市と州/省のペアの最大数を指定します。 デフォルト値は
10 です。
出力
Get City State Province は、入力郵便番号に一致する都市と州/省、およびマッチングの成功または失
敗を示すコードを返します。 複数の都市/州または都市/省が入力郵便番号にマッチする場合、複数の
出力レコードが返されます。
注: API を介してこのサービスを利用する場合は、出力は DataTable クラスを使用して返されます。
以下で説明するフィールドは、DataTable クラスにおける有効な列名です。DataTable クラスの
詳細については、『Spectrum Technology Platform API ガイド』の「API の基礎」のセクション
を Spectrum™ Technology Platform API ガイド.
表 193 : Get City State Province の出力
フィールド名
説明/有効値
City
一致した都市名。
City.Type
USPS によって正規化された都市名のタイプ (米国住所のみ)。
PostalCode
952
®
V
非正式 (Non-Mailing) 都市名。
P
主要都市名。 都市名は、主要な郵送都市名です。
S
補助的な都市名。 都市名は、代替都市名ですが、許容されま
す。 都市は複数の補助的な都市名を持つことができます。
入力郵便番号。
Spectrum™ Technology Platform 8.0.0
第 29 章 : Universal Addressing モジュール
フィールド名
説明/有効値
ProcessedBy
住所を処理した住所コーダーを示します。 次のいずれかを選択しま
す。
USA
米国住所コーダーが住所を処理しました。
CAN
カナダ住所コーダーが住所を処理しました。
StateProvince
州または省の省略形。
Status
マッチの成功または失敗を報告します。
Status.Code
NULL
成功
F
失敗
失敗の原因 (ある場合)。 次の値のみが有効です。
• DisabledCoder
• UnrecognizedPostalCode
Status.Description
失敗の説明。 有効な値は次のとおりです。
Postal code not found
Status.Code=UnrecognizedPostalCode
の場合にこの値が表示されます。
PerformUSProcessing
disabled
Status.Code=DisabledCoder の場合に
この値が表示されます。
PerformCanadianProcessing Status.Code=DisabledCoder の場合に
disabled
この値が表示されます。
Validate Address
Validate Address は、郵便当局の住所データを使用して、住所を正規化し、妥当性を確認します。
Validate Address は、情報を修正し、管轄の郵便当局が推奨する書式で住所の書式を整えることがで
きます。 また、郵便番号、都市名、州/省名など、欠落している郵便情報を追加します。
Validate Address は、Validate Address が住所の妥当性を確認したかどうか、返した住所の確信レベ
ル、住所の妥当性が確認できなかった場合はその理由など、バリデーション処理に関する結果インジ
ケータも返します。
ユーザ ガイド
953
Validate Address
Validate Address は、住所のマッチングと正規化において、住所行をコンポーネントに分割し、それ
らを Universal Addressing モジュールの各種データベースの内容と比較します。 マッチを検出した場
合、入力住所をデータベース情報に合わせて正規化します。 データベースにマッチしなかった場合、
Validate Address は、オプションで入力住所の書式を整えます。 書式設定処理では、管轄の郵便当局
の慣例にしたがって、住所行の構成を試みます。
Validate Address は、Universal Addressing モジュールに含まれています。 このモジュールの詳細 (こ
れに含まれるその他のコンポーネント等) については、Universal Addressing モジュールとは(926ペー
ジ) を参照してください。
入力
Validate Address は、入力として住所を受け取ります。 住所がある国にかかわらず、すべての国がこ
のフォーマットを使用します。 米国住所の場合の住所行データの処理方法に関する重要な情報は、米
国 住所に対する住所行処理(956ページ)を参照してください。
注: API を介してこのサービスを利用する場合は、DataTable クラスを使用して入力を指定します。
以下で説明するフィールドは、DataTable クラスにおける有効な列名です。DataTable クラスの
詳細については、『Spectrum Technology Platform API ガイド』の「API の基礎」のセクション
を Spectrum™ Technology Platform API ガイド.
表 194 : 入力フォーマット
フィールド名
書式
説明/有効値
AddressLine1
文字列
[50]
最初の住所行。
AddressLine2
文字列
[50]
2 行目の住所行。
AddressLine3
文字列
[50]
3 行目の住所行。
文字列
[50]
4 行目の住所行。
文字列
[50]
都市名。
AddressLine4
City
カナダの住所には適用されません。
カナダの住所には適用されません。
™
米国の住所に限り、都市、州、および ZIP Code を City
フィールドに入力することができます。 これを行う場合は、
StateProvince フィールドと PostalCode フィールドを空白
のままにする必要があります。
954
Spectrum™ Technology Platform 8.0.0
第 29 章 : Universal Addressing モジュール
フィールド名
書式
説明/有効値
StateProvince
文字列
[50]
州または省。
文字列
[10]
住所に対する郵便番号を次のいずれかのフォーマットで示
します。
PostalCode
米国の住所に限り、州を StateProvince フィールドの代わり
に City フィールドに入れることができます。
99999
99999-9999
A9A9A9
A9A 9A9
9999 999
™
米国の住所に限り、ZIP Code を City フィールドに入力す
ることができます。
™
米国の住所に限り、都市、州、または ZIP Code が
PostalCode フィールドにある場合に、Validate Address が
データをパーシングして、住所を正しく処理することがで
きます。 最適な結果を得るため、このデータを適切なフィー
ルド (City、StateProvince、PostalCode) に入力してくださ
い。
Country
文字列
[50]
国コードまたは名前を、以下のいずれかのフォーマットで
入力します。
• 2 文字の ISO 3116-1 Alpha-2 国コード
• 3 文字の ISO 3116-1 Alpha-3 国コード
• 英語の国名
• フランス語の国名
• ドイツ語の国名
• スペイン語の国名
ISO コードのリストについては、各国の ISO コードとモ
ジュール サポート(1086ページ)を参照してください。
FirmName
文字列
[50]
会社名または企業名。
USUrbanName
文字列
[50]
米国の住所の都市化名。 主にプエル トリコの住所で使用さ
れます。
ユーザ ガイド
955
Validate Address
フィールド名
書式
説明/有効値
CustomerID
文字列
[9]
この郵便物が汎用バーコードを使用している場合、 USPS
®
が割り当てた顧客 ID をこのフィールドに指定します。
®
Validate Address の汎用バーコードは、OneCode ACS サー
ビスを使用する郵便物に使用されます。
CanLanguage
文字列
カナダの住所に限り、[カナダ住所オプション] タブの [使用
言語判断対象] フィールドが "CanLanguage (カナダ言語) 入
力フィールド" にセットされている場合に、住所が英語かフ
ランス語かを示します。 このフィールドが空白の場合、ア
ドレスは英語でフォーマットされています。 このフィール
ドに空白以外の値が含まれる場合、住所はフランス語で
フォーマットされています。 ケベックの住所は、このフィー
ルドの値に関係なく常にフランス語でフォーマットされま
す。
米国 住所に対する住所行処理
米国住所の場合、AddressLine1 から AddressLine4 の入力フィールドの処理方法は、企業名抽出また
は都市化コード抽出のオプションが有効になっているかどうかによって異なります。 2 つのオプショ
ンのいずれかが有効になっている場合は、Validate Address は、4 つすべてのフィールドのデータを参
照して、住所の妥当性を確認し、要求されたデータ (企業名または都市化コード) を抽出します。 どち
らのオプションも有効でない場合は、Validate Address は、空白でない最初の 2 つの住所行フィール
ドのみを使用して、妥当性を確認します。 他の住所行フィールドのデータは、AdditionalInputData 出
力フィールドに返されます。 例を次に示します。
AddressLine1: A1 Calle A
AddressLine2:
AddressLine3: URB Alamar
AddressLine4: Pitney Bowes Software
この住所において、企業名抽出または都市化コード抽出が有効である場合は、Validate Address は、4
つすべての住所行を確認します。 企業名抽出と都市化コード抽出がどちらも有効でない場合は、Validate
Address は、AddressLine1 と AddressLine3 (空白でない最初の 2 つの住所行) を参照して、そのデー
タを使用して住所の妥当性を確認します。AddressLine4 のデータは、AdditionalInputData 出力フィー
ルドに返されます。
オプション
出力データ オプション
以下の表に、Validate Address が返す情報の種類を制御するオプションの一覧を示します。 これらの
オプションのうちの一部は、カナダ住所に対してオーバーライドすることができます。 詳細について
は、カナダ住所のオプション(978ページ)を参照してください。
956
Spectrum™ Technology Platform 8.0.0
第 29 章 : Universal Addressing モジュール
表 195 : 出力データ オプション
オプション
説明
標準住所を含める
住所データの 1 〜 4 行に加えて、都市、州、郵便番号、企
業名、および都市化名情報を返します。 各住所行は、封筒
に記載される住所の実際の行に対応しています。 詳細につ
いては、出力(989ページ)を参照してください。
Validate Address が住所の妥当性を確認できた場合は、住所
行には正規化済み住所が含まれます。 正規化済み住所では、
句読文字が取り除かれ、方向指示と通り接尾語には省略形
が使用され、住所要素が修正されています。
Validate Address が住所の妥当性を確認できなかった場合
は、住所行には入力住所がそのまま含まれます ("パス スルー"
データ)。 このオプションを指定しなかった場合でも、妥当
性が確認されなかった住所は必ず、パス スルー データとし
て住所行フィールドに含まれます。
一致した住所要素を含める
家番号、通り名、通り接尾語、方向指示などの住所の各要
素が、個別のフィールドに返されます。 詳細については、
パース済み住所要素出力(991ページ)を参照してください。
このオプションとともに、[マッチしなかった場合に正規化
データを返す] を選択した場合は、住所要素に、妥当性が確
認できなかった住所の入力住所が含まれることになります。
郵便情報を含める
出力住所には、妥当性が確認された各住所の様々な追加デー
タが含まれます。詳細については、郵便データ出力(995ペー
ジ)を参照してください。
正規化された入力住所要素を含める
このオプションでは、Validate Address が住所の妥当性を確
認できたかどうかにかかわらず、入力住所をパース済み形
式で返します。 家番号、通り名、通り接尾語、方向指示な
どの入力住所の各要素が、個別のフィールドに返されます。
[正規化された入力住所要素を含める] オプションは、マッチ
しなかった場合に検証できなかった入力だけでなくすべて
の入力住所をパース済み形式で返す点で、[一致した住所要
素を含める] と [マッチしなかった場合に正規化データを返
す] の組み合わせと異なります。 詳細については、パース済
み入力(993ページ)を参照してください。
ユーザ ガイド
957
Validate Address
オプション
説明
個々のフィールドの結果コードを含め
る
フィールドレベルの結果インジケータを含めるかどうかを
指定します。 フィールドレベルの結果インジケータは、
Validate Address が各住所要素をどのように処理したかを示
します。 フィールドレベルの結果インジケータは、修飾子
"Result" で返されます。 例えば、HouseNumber のフィール
ドレベルの結果インジケータは HouseNumber.Result に格
納されます。 結果インジケータの出力フィールドの完全な
一覧は、フィールドレベルの結果インジケータ(1002ページ)
を参照してください。
マッチしなかった場合に正規化データ
を返す
住所の妥当性を確認できない場合に書式を整えた住所を返
すかどうかを指定します。 住所には、その国の標準住所書
式が設定されます。 このオプションを選択しない場合、
Validate Address が住所の妥当性を確認できないと、出力住
所フィールドは空白になります。
注: このオプションは、米国およびカナダの住所のみに適
用されます。 その他の住所に対して書式を整えたデー
タは返されません。
[標準住所を含める]、[住所行の要素を含める]、および [郵便
情報を含める] の各チェック ボックスで指定されたフォー
マットを使用して、書式を整えた住所が返されます。 [住所
行の要素を含める] を選択した場合は、妥当性が確認できた
住所に対しては、パース済みで妥当性を確認済みの住所が、
パース済み住所要素に含まれることになります。 住所の妥
当性が確認できなかった場合には、パース済み住所要素に
は、入力住所がパース済み形式で含まれることになります。
Validate Address が住所の妥当性を確認できたかどうかにか
かわらず、必ず入力住所をパース済み形式で出力したい場
合は、[正規化された入力住所要素を含める]します。
このオプションをオンにする場合は、[標準住所を含める] ま
たは [住所行の要素を含める] を選択する必要があります。
通り名のエイリアスを返す
958
米国住所に対してのみ、通り名のエイリアスを出力に使用
するかどうかを指定します。 通り名のエイリアスとは、通
りに対する別名で、通常は、通り上の特定の範囲の住所の
みに対して使用されます。 通り名のエイリアスを出力に使
用しないと指定した場合は、通りにエイリアス名があるか
Spectrum™ Technology Platform 8.0.0
第 29 章 : Universal Addressing モジュール
オプション
説明
どうかにかかわらず、出力では通りの "基本" 名が使用され
ます。 基本名とは、通り全体に適用される名称です。
通り名のエイリアスを返す
米国住所に対してのみ、入力に使用されている通り名のエ
イリアスの処理方法を指定します。 通り名のエイリアスと
は、通りに対する別名で、通常は、通り上の特定の範囲の
住所のみに対して使用されます。
このオプションを有効にすると、入力に使用されている通
り名のエイリアスが、出力にも使用されます。 このオプショ
ンを有効にしない場合は、入力に使用されている通り名の
エイリアスが、出力では基本通り名に変換されますが、次
の例外があります。
• 入力において、よく使用されるエイリアスが使用されてい
る場合は、そのエイリアスが必ず出力で使用されます。
• 入力で使用されている変更名のエイリアスは、出力では必
ず基本通り名に変換されます。
これは、Validate Address で通り名のエイリアスを処理する
方法を制御する 3 つのオプションのうちの 1 つです。 他の
2 つは、[通り名に対してよく使用されるエイリアスの処理]
と [通り名に対する省略形エイリアスの処理] です。 これら
のオプションの詳細については、米国 住所のオプション
(969ページ) を参照してください。
注: [通り名に対する省略形エイリアスの処理] を有効にし
た場合は、[通り名のエイリアスを返す] を無効にした
場合でも、必ず省略形エイリアスが出力に使用されま
す。
住所データ ブロックを返す
実際の郵便物に印字される、書式を整えた住所を返すかど
うかを指定します。 住所の各行が、それぞれ個別の住所ブ
ロック フィールドに返されます。 住所ブロック出力フィー
ルドは最大で、 AddressBlock1 から AddressBlock9 の 9
つになります。
例えば、入力住所が次のとおりであるとします。
AddressLine1: 4200 Parliament Place
AddressLine2: Suite 600
City: Lanham
ユーザ ガイド
959
Validate Address
オプション
説明
StateProvince: MD
PostalCode: 20706
この場合の住所ブロック出力は、次のようになります。
AddressBlock1: 4200 PARLIAMENT PL STE 600
AddressBlock2: LANHAM MD 20706-1882
AddressBlock3: UNITED STATES OF AMERICA
Validate Address は、郵便当局の規格に従って、住所の書式
を整えて、住所ブロックの形式にします。 国名は、万国郵
便連合 (UPU) の国名で返されます。 [国フォーマット] オプ
ションは、住所ブロックの国名には影響を与えないことに
注意してください。[国フォーマット] オプションは、Country
出力フィールドに返される名前のみに影響を与えます。
米国およびカナダ以外の住所に対しては、Validate Address
で住所の妥当性が確認できなかった場合、住所ブロックは
返されません。 米国およびカナダの住所に対しては、妥当
性が確認できなかった場合も住所ブロックが返されます。
下院選挙区の取得
Validate Address は、住所に対する米下院選挙区を特定できます。
下院選挙区を取得するには、[出力データ オプション] タブの [郵便情報を含める] チェック ボックスを
選択します。 これにより、下院選挙区を含む、住所に関する様々なデータが返されます。 このオプ
ションで返される具体的なデータについては、郵便データ出力(995ページ) を参照してください。
出力
[米国またはカナダの郵便情報を含める] を選択OutputRecordType=P を指定した場合、以下の出力
に、下院選挙区が含まれます。
表 196 : 下院選挙区出力
960
フィールド名
説明/有効値
USCongressionalDistrict
下院選挙区番号。 住所が州以外の住所 (プエルトリコやワシントン
D.C. など) である場合は、このフィールドは空白になります。
Spectrum™ Technology Platform 8.0.0
第 29 章 : Universal Addressing モジュール
郡名の取得
Validate Address は、ある住所が所在する郡を特定し、その郡名を返すことができます。
注: 郡名は、米国住所に対してのみ存在します。
郡名を取得するには、[出力データ オプション] タブの [郵便情報を含める] チェック ボックスを選択し
ます。 これにより、郡名を含む、住所に関する様々なデータが返されます。 このオプションによって
返される具体的なデータについては、郵便データ出力(995ページ) を参照してください。
出力
を選択OutputRecordTypに、郡名が含まれます。
表 197 : 郡名出力
フィールド名
説明/有効値
USCountyName
郡名
FIPS 郡番号の取得
連邦情報処理標準 (FIPS) 郡番号は、州の中の各郡を識別する番号です。 これらの番号は、州レベルに
おいてのみ一意であり、国レベルでは一意ではないことに注意してください。 詳細については、
http://www.census.gov を参照してください。
注: FIPS 郡番号は、米国住所に対してのみ存在します。
FIPS 郡番号を取得するには、[出力データ オプション] タブの [郵便情報を含める] チェック ボックス
を選択します。 これにより、FIPS 郡番号を含む、住所に関する様々なデータが返されます。 このオ
プションによって返される具体的なデータについては、郵便データ出力(995ページ) を参照してくだ
さい。
出力
[米国またはカナダの郵便情報を含める] を選択OutputRecordType=P を指定した場合、以下の出力
に、FIPS 郡番号が含まれます。
表 198 : FIPS 郡番号出力
フィールド名
説明/有効値
USFIPSCountyNumber
FIPS (連邦情報処理標準) 郡番号
ユーザ ガイド
961
Validate Address
配達ルート コードの取得
配達ルート コードとは、個々の郵便配達者に割り当てられた一意の識別子で、これによって米国の各
配達ルートを一意に識別することができます。 Validate Address は、宛先の配達ルートを表すコード
を返すことができます。
注: 配達ルート コードは、米国住所に対してのみ存在します。
配達ルート コードを取得するには、[出力データ オプション] タブの [郵便情報を含める] チェック ボッ
クスを選択します。 これにより、配達ルート コードを含む、住所に関する様々なデータが返されま
す。 このオプションで返される具体的なデータについては、郵便データ出力(995ページ) を参照し
てください。
出力
[郵便情報を含める] を指定した場合、以下の出力フィールド列に、配達ルート コードが含まれます。
表 199 : 配達ルート コード出力
フィールド名
説明/有効値
USCarrierRouteCode
配達ルート コード
配達ポイント バーコードの作成
™
配達ポイント バーコード (DPBC) は、住所に対する POSTNET バーコード表記です。 開始および終
®
了フレーム バーと、ZIP + 4 Code、通りの住所の番号に基づいて計算された値、および修正ディジッ
トの 1 桁ごとに 5 本のバーがあり、合計 62 本のバーで構成されます。 DPBC により、配達業者の徒
歩経路のレベルにまで手紙を自動仕分けすることができます。 Validate Address は、DPBC の作成に
必要なデータを生成します。
注: 配達ポイント バーコードは、米国住所に対してのみ存在します。 配達ポイント バーコードの詳
細については、http://www.usps.com を参照してください。
DPBC の作成に必要なデータを生成するには、[出力データ オプション] タブの [郵便情報を含める]
チェック ボックスを選択します。 これにより、DPBC の作成に必要なデータを含む、住所に関する
様々なデータが返されます。 このオプションで返される具体的なデータについては、郵便データ出力
(995ページ) を参照してください。
出力
[郵便情報を含める] を指定した場合、以下の出力フィールドに、DPBC 情報が含まれます。
962
Spectrum™ Technology Platform 8.0.0
第 29 章 : Universal Addressing モジュール
表 200 : 配達ポイント バーコード出力
フィールド名
説明/有効値
PostalBarCode
配達ポイント バーコードの配達ポイント部分
USBCCheckDigit
11 桁の配達ポイント バーコードのチェック ディジット部分
DPBC の作成
DPBC を作成するには、Validate Address 出力フィールドの値を次のように結合します。
PostalCode.Base + PostalCode.Addon + PostalBarcode + USBCCheckDigit
例えば、次のデータがあるとします。
•
•
•
•
PostalCode.Base = 49423
PostalCode.Addon = 4506
PostalBarcode = 29
USBCCheckDigit = 2
このデータから作成されるバーコードは、次のようになります。
494234506292
デフォルト オプション
以下の表に、住所のフォーマットと処理を制御するオプションの一覧を示します。 これらのオプショ
ンはデフォルトですべての住所に適用されるので、"デフォルト オプション" と言います。 これらのオ
プションのうちの一部は、カナダの住所に対してオーバーライドすることができます。 詳細について
は、カナダ住所のオプション(978ページ)を参照してください。
表 201 : デフォルト オプション
オプション
説明
大文字小文字
出力データの大文字と小文字の区別を指定します。 次のい
ずれかを選択します。
混在
出力には、大文字と小文字が混在します (デ
フォルト)。 例えば、
123 Main St
Mytown FL 12345
ユーザ ガイド
963
Validate Address
オプション
説明
大文字
出力に大文字を使用します。 例えば、
123 MAIN ST
MYTOWN FL 12345
郵便番号区切り文字を挿入する
™
ZIP Code またはカナダの郵便番号に区切り文字 (スペース
またはハイフン) を使用するかどうかを指定します。
®
例えば、空切り文字ありの ZIP + 4 Code は 20706-1844 、
区切り文字なしは 207061844 になります。 区切り文字あり
のカナダの郵便番号は P5E"1S7、区切り文字なしは P5E1S7
になります。
®
注: カナダの郵便番号ではスペースが、米国の ZIP + 4 コー
ドではハイフンが使用されます。
多国籍文字を出力
ウムラウト記号やアクセント記号などの付加記号を含む多
国籍文字を返すかどうかを指定します (米国住所ではサポー
トされていません)。
複数の住所を返す
一致する可能性のある住所を複数持つ入力住所に対して複
数の住所を返すかどうかを示します。
詳細については、複数マッチを返す(968ページ)を参照し
てください。
セカンダリ住所の配置
米国住所の補助的な住所情報を配置する場所を指定します。
補助的な住所情報とは、部屋番号やアパート番号などの指
定子のことです。 例えば、次の住所の補助的な住所情報は
"Apt 10E" で、主要な住所情報は "424 Washington Blvd" で
す。
Apt 10E 424 Washington Blvd Springfield MI 49423
住所と同じ 主要な住所情報と補助的な住所情報の両方を
行
AddressLine1に配置します (デフォルト)。
住所行を分 主要な住所情報を AddressLine1に、補助的な
割
住所情報を AddressLine2 に配置します。
二重住所を 主要な住所情報と補助的な住所情報の両方を
分割
AddressLine1に配置し、二重住所からドロッ
プされた情報を AddressLine2 に配置します。
964
Spectrum™ Technology Platform 8.0.0
第 29 章 : Universal Addressing モジュール
オプション
説明
二重住所とは、通り情報と、PO Box/地方配
送路/Highway Contract 情報の両方を含む住所
のことです。 詳細については、二重住所ロ
ジックについて(967ページ)を参照してくだ
さい。
都市フォーマット
短い都市名または非正式な都市名を代替名として持つ都市
名を書式設定する方法を指定します。 米国およびカナダの
住所に適用されます。
短
®
USPS が承認した都市の略称が 1 つある場合、そ
®
れを返します。 USPS は、14 文字以上の都市名
に対し、略称を定めています。 都市の略称は 13
文字以下で、宛名ラベルのサイズが限られている
場合に使用できます。 短い都市名が存在しない都
市に対しては、正式な都市名が返されます。
長
長い都市名を返します (デフォルト)。
標準
入力住所に省略された都市名が使用されている場
合にのみ、省略された都市名を返します。 入力住
所に短い都市名が使用されていない場合は、その
®
都市に対する USPS の規則によって、長い都市
™
名または短い都市名が返されます。 CASS テス
トを実行する場合は、このオプションを選択しま
す。
NonMailing
(非正
式)
国フォーマット
ユーザ ガイド
入力都市名が非正式な都市名の場合、非正式な都
市名 (非正式名) を出力します。 例え
ば、"Hollywood" は "Los Angeles" の非正式な都市
名です。 このオプションを選択せず、入力都市名
が非正式な都市名の場合、長いバージョンの郵送
都市名が返されます。
Country 出力フィールドに返される国名に使用するフォー
マットを指定します。 例えば、英語を選択した場
合、"Deutschland" という国名は "Germany" として返されま
す。
英語名
英語の国名を使用します (デフォルト)。
スペイン語名
スペイン語の国名を使用します。
965
Validate Address
オプション
説明
フランス語名
フランス語の国名を使用します。
ドイツ語名
ドイツ語の国名を使用します。
ISO コード
国名の代わりにその国の 2 文字の ISO
の略語を使用します。
UPU コード
国名の代わりにその国の万国郵便連合
(Universal Postal Union: UPU) の略語を
使用します。
デフォルト国
デフォルト国を指定します。 大部分の住所が存在する国を
指定してください。 例えば、処理する住所の大部分がカナ
ダにある場合は、カナダを指定します。 Validate Address
は、StateProvince、PostalCode、および Country 住所フィー
ルドから国を判断できない場合、指定された国を使用して
検証を行います。
二重住所ロジック
複数の空白以外の住所行が存在する、または複数の住所タ
イプが同じ住所行に存在する場合、Validate Address はマッ
チを返します (米国住所のみ)。
通常一致
®
™
(デフォルト) USPS CASS の規則では、
以下の優先順位に基づいて、返す住所を決
定します。
1.
2.
3.
4.
5.
6.
通り一致
PO Box
Firm
Highrise
Street
Rural Route
General Delivery
住所行に関係なく、通り一致を返します。
PO Box 一致 住所行に関係なく、PO Box 一致を返しま
す。
詳細については、二重住所ロジックについて(967ページ)
を参照してください。
966
Spectrum™ Technology Platform 8.0.0
第 29 章 : Universal Addressing モジュール
二重住所ロジックについて
[二重住所ロジック] オプションは、米国住所に対してのみ、通り情報と PO Box/地方配送路/Highway
Contract 情報の両方が住所に含まれる場合に、Validate Address が、通り一致を返すか、または PO
Box/地方配送路/Highway Contract 一致を返すかを制御します。
注: 通り情報が PO Box/地方配送路/Highway Contract 情報と別の住所行入力フィールドに含まれてい
る場合、[二重住所ロジック] オプションは、効果を持ちません。
例えば、次の入力住所が与えられたとします。
AddressLine1: 401 N Main St Apt 1 POB 1
City: Kemp
StateProvince: TX
PostalCode: 75143
Validate Address は、次のいずれかを返します。
• [二重住所ロジック] が [通常一致] または [PO Box 一致] に設定されている場合、Validate Address
は、次の住所を返します。
AddressLine1: PO Box 1
City: Kemp
StateProvince: TX
PostalCode: 75143-0001
• [二重住所ロジック] が [通り一致] に設定されている場合、Validate Address は、次の住所を返し
ます。
AddressLine1: 401 N Main St Apt 1
City: Kemp
StateProvince: TX
PostalCode: 75143-4806
住所の正規化に使用されない住所データは、次の 2 カ所のいずれかに返すことができます。
• AddressLine2 — StandardAddressFormat=D を指定 フィールドで [二重住所を分割] を選択した
場合、住所の正規化に使用されない住所情報は、AddressLine2 フィールドに返されます。 このオ
プションの詳細については、デフォルト オプション(963ページ) を参照してください。 例えば、
二重住所に対して通り一致を返すと選択すると、次のようになります。
AddressLine1: 401 N Main St Apt 1
AddressLine2: PO Box 1
City: Kemp
StateProvince: TX
PostalCode: 75143-0001
• AdditionalInputData — [セカンダリ住所の配置] フィールドで [二重住所を分割] を選択しない場
合、住所の正規化に使用されない住所情報は、AdditionalInputData フィールドに返されます。 こ
のオプションの詳細については、デフォルト オプション(963ページ) を参照してください。 例え
ば、二重住所に対して通り一致を返すと選択すると、次のようになります。
ユーザ ガイド
967
Validate Address
AddressLine1: 401 N Main St Apt 1
City: Kemp
StateProvince: TX
PostalCode: 75143-0001
AdditionalInputData: PO Box 1
ドロップされた住所情報は、[セカンダリ住所の配置] で [二重住所を分割] を設定することによって取
得することができます。 詳細については、 デフォルト オプション(963ページ) を参照してくださ
い。
複数マッチを返す
Validate Address が、入力住所に一致する可能性のある複数の住所を郵便データベース内で検出した
場合、一致する可能性のある住所を Validate Address が返すよう設定できます。 例えば、次の住所は
米国郵便データベース内の複数の住所にマッチします。
PO BOX 1 New York, NY
オプション
複数マッチを返すには、次の表に示すオプションを使用します。
表 202 : 複数マッチのオプション
オプション名
説明/有効値
複数の住所を返す
一致する可能性のある住所を複数持つ入力住所に対して複数の住所を
返すかどうかを示します。
結果の最大数
[複数の住所を返す] チェック ボックスの横に、返す住所の最大数を示
す 1 〜 10 の数字を入力します。 デフォルト値は 1 です。
注: [複数の住所を返す] のチェックをはずした場合 と [複数の住所を
返す] にチェックを入れ、結果の最大数として 1 を指定した場合
の違いは、[複数の住所を返す] のチェックをはずした場合 は複数
マッチによって失敗が返され、[複数の住所を返す] にチェックを
入れ、結果の最大数として 1 を指定した場合 は複数マッチによっ
て 1 つのレコードが返される点です。
個々のフィールドの結果コー どの出力住所が候補住所かを特定するには、 [出力データ] タブの [個々
ドを含める
のフィールドの結果コードを含める] にチェックを入れる必要があり
ます。 このように設定すると、候補住所のレコードのフィールドレベ
ルの結果インジケータに 1 つ以上の値 "M" が格納されます。
968
Spectrum™ Technology Platform 8.0.0
第 29 章 : Universal Addressing モジュール
出力
複数マッチを返すよう選択した場合、住所は指定した住所フォーマットで返されます。 住所フォー
マットの指定については、出力データ オプション(956ページ)を参照してください。 どのレコード
が候補住所であるかを特定するには、フィールドレベルの結果インジケータに複数の値 "M" があるか
どうかを調べます。 詳細については、フィールドレベルの結果インジケータ(1002ページ)を参照して
ください。
米国 住所のオプション
オプション名
説明/有効値
米国住所処理を有効にする
米国住所を処理するかどうかを指定します。 米国住所処理を有効にし
た場合、Validate Address は米国住所の妥当性を確認します。 米国住
所処理を無効にすると、米国住所は失敗します。つまり、Status 出力
フィールドに "F" が設定されて返されます。 出力フィールド
Status.Code は、"DisabledCoder" となります。 米国住所処理のライ
センスを取得していない場合は、ジョブに米国住所が含まれるか否か
にかかわらず、米国住所処理を無効にしなければ、ジョブを正常に実
行することはできません。
注: 米国住所を正常に処理するには、米国住所処理の有効なライセン
スを取得する必要があります。 米国住所処理のライセンスを取得
していないか、ライセンスの期限が切れているにもかかわらず、
米国住所処理を有効にすると、ジョブ全体が失敗します。
データベース
米国住所の妥当性の確認に使用するデータベースを指定します。
Management Console の [米国データベース リソース] パネルで定義さ
れたデータベースのみが使用可能です。
Line of travel
Enhanced Line of Travel (eLOT) 処理は、Line of Travel シーケンス
コードを住所に割り当てます。 Validate Address は eLOT 順へのソー
トを行いませんが、住所を eLOT 順にソートできるデータ (Line of
Travel シーケンス コード) を提供します。
eLOT 処理を実行するには、eLOT データベースをインストールして
おく必要があります。 詳細については、Universal Addressing デー
タベース(927ページ)を参照してください。
このオプションで返される出力フィールドの一覧については、
Enhanced Line of Travel 出力(1013ページ) を参照してください。
ユーザ ガイド
969
Validate Address
オプション名
説明/有効値
Residential Delivery Indicator Residential Delivery Indicator (RDI™) 処理は、住所が (企業住所ではな
™
™
処理
く) 個人住所であることを調べます。 RDI 処理を実行するには、RDI
データベースをインストールしておく必要があります。
®
™
™
DPV と RDI の両方の処理を有効にしている場合は、RDI 情報は、
®
住所が有効な配達ポイントである場合のみ返されます。 DPV で住所
™
の妥当性が確認されなかった場合は、RDI データは返されません。
Enhanced street matching
Enhanced Street Matching (ESM) は、追加のマッチング ロジックを適
用することにより、綴りに誤りがある通り名や複雑な通り名を修正
し、マッチ結果を得ます。 ESM により、Validate Address はより多
くの住所の妥当性を確認できるようになりますが、パフォーマンスは
低下します。 ASM が有効な場合は、ESM を実行することはできませ
ん。
All street matching
All Street Matching (ASM) は、ESM 処理に加えて追加のマッチング
ロジックを適用することにより、通り名の誤りを修正し、マッチ結果
を得ます。 通りの最初の文字が誤っている場合の通りのマッチングに
有効です。 ASM は、最良の住所検証結果を提供しますが、パフォー
マンスは低下します。
Delivery Point Validation &
CMRA
Delivery Point Validation (DPV ) は、特定の住所が有効な住所の範囲
®
内にあるかどうかを確認するのではなく、特定の住所が存在するかど
うかを確認します。 CMRA 処理は、住所が、Commercial Mail
Receiving Agency (CMRA: 民間私書箱) と呼ばれる民間企業が貸し出
す私書箱であるかどうかを確認します。
DPV および CMRA 処理を実行するには、DPV データベースをインス
トールしておく必要があります。 DPV データベースには、DPV と
CMRA の両方のデータが含まれます。 詳細については、Universal
Addressing データベース(927ページ)を参照してください。
このオプションで返される出力フィールドの一覧については、DPV お
よび CMRA 出力(1015ページ) を参照してください。
DPV キーを無効にする可能性のある誤検出マッチの詳細については、
DPV 誤検出違反の報告(1044ページ) を参照してください。
LACS/Link 変換
®
USPS Locatable Address Conversion System (LACS) は、地方配送
路の住所を通り名に沿った住所に変換した場合、PO Box 番号の再割
り当てがあった場合、または通り名に沿った住所が変更した場合に、
Link
それに伴って変更した住所を修正します。 LACS
処理を有効にし
970
Spectrum™ Technology Platform 8.0.0
第 29 章 : Universal Addressing モジュール
オプション名
説明/有効値
た場合、妥当性が確認できなかった住所、または妥当性が確認され、
Link
LACS
変換のフラグが付けられた住所に対し、その処理が実行され
ます。
Link
LACS
Link
処理を実行するには、LACS
データベースをインストー
ルしておく必要があります。 詳細については、Universal Addressing
データベース(927ページ)を参照してください。
このオプションで返される出力フィールドの一覧については、 を参照
してください。 LACSLink 出力(1014ページ)
Link
LACS
キーを無効にする可能性のある誤検出マッチの詳細について
は、LACS/Link 誤検出違反のレポート(1047ページ) を参照してくだ
さい。
Early Warning System
(EWS)
®
Early Warning System (EWS) は、USPS EWS ファイルを使用して、
®
ZIP + 4 データベースには存在しない住所の妥当性を確認します。
EWS 処理を実行するには、EWS データベースをインストールしてお
く必要があります。 詳細については、Universal Addressing データ
ベース(927ページ)を参照してください。
入力住所が、EWS ファイルの住所に一致する場合、Validate Address
は次のレコード レベルの結果インジケータを返します。
• Status="F"
• Status.Code="EWSFailure"
• Status.Description="Address found in EWS table"
企業名抽出
AddressLine1 〜 AddressLine4 から企業名を抽出し、FirmName 出力
フィールドに入れるかどうかを指定します。 このオプションは、入力
レコードの FirmName フィールドが空白で、住所行が複数存在する場
合に適用されます。
住所行の中の企業名を特定するために、Validate Address は、住所行
をスキャンし、どのフィールドが住所行で、どのフィールドが企業名
の行であるかを特定するためのキーワードおよびパターンを検索しま
す。 この処理はパターンに基づいて行われるため、Validate Address
はフィールドを誤って認識する場合があります。 最適な企業名抽出を
行うためのヒントを、以下に示します。
• 可能ならば、主要な住所要素を AddressLine1、補助的な要素を
AddressLine2、都市化名を AddressLine3、企業名を AddressLine4
に配置します。 住所に都市化コードが存在しない場合は、企業名を
ユーザ ガイド
971
Validate Address
オプション名
説明/有効値
AddressLine3 に配置し、AddressLine4 を空白にします。 例を次に
示します。
AddressLine1: 4200 Parliament Place
AddressLine2: Suite 600
AddressLine3: Pitney Bowes Software
AddressLine4: <空白>
• 住所行を 2 行だけ定義する場合は、ほとんどの場合 AddressLine2
には補助的な住所が入ります。 Validate Address が AddressLine2
を企業名として処理する確率を上げるには、企業名を AddressLine3
に配置し、AddressLine2 は空白にします。
• 企業名に数字が含まれていると ("1 Stop Software" の "1" など)、
Validate Address がそのフィールドを住所行として処理する確率が
高くなります。
以下に、企業名抽出の例をいくつか示します。
• 次の例では、AddressLine2 が FirmName 出力フィールドに抽出さ
れます。
FirmName: <空白>
AddressLine1: 4200 Parliament Place Suite 600
AddressLine2: International Goose Feathers inc.
• 次の例では、AddressLine3 が FirmName 出力フィールドに抽出さ
れます。
FirmName: <空白>
AddressLine1: 4200 Parliament Place
AddressLine2: Suite 600
AddressLine3: Pitney Bowes Software
• 次の例では、AddressLine3 は AdditionalInputData 出力フィールド
に配置されます。 FirmName 入力フィールドが空白ではないため、
企業名は抽出されません。
FirmName: International Goose Feathers Inc.
AddressLine1: 4200 Parliament Place
AddressLine2: Suite 600
AddressLine3: Pitney Bowes Software
• 次の例では、空白でない住所行が 1 行しかなく、その行は必ず主要
な住所要素として処理されるため、企業名は抽出されません。
972
Spectrum™ Technology Platform 8.0.0
第 29 章 : Universal Addressing モジュール
オプション名
説明/有効値
FirmName: <空白>
AddressLine1: 4200 Parliament Place Suite 600
• 次の例では、AddressLine2 は補助的な住所要素として処理されま
す。数字の "1" が含まれているために、Validate Address がその
フィールドを補助的な住所要素とみなすためです。
FirmName: <空白>
AddressLine1: 4200 Parliament Place Suite 600
AddressLine2: Pitney Bowes Software
米国都市化名を抽出
AddressLine1 〜 AddressLine4 から都市化名を抽出し、USUrbanName
出力フィールドに入れるかどうかを指定します。 このオプションは、
入力レコードの USUrbanName フィールドが空白で、住所行が複数存
在する場合に適用されます。
都市化名を特定するために、Validate Address は、住所行をスキャン
し、どのフィールドが住所行で、どのフィールドが都市化名の行であ
るかを特定するためのキーワードおよびパターンを検索します。 この
処理はパターンに基づいて行われるため、Validate Address はフィー
ルドを誤って認識する場合があります。 最適な都市化名抽出を行うに
は、できる限り、主要な住所要素を AddressLine1、補助的な要素を
AddressLine2、都市化名を AddressLine3、企業名を AddressLine4 に
配置します。 例を次に示します。
AddressLine1: A1 Calle A
AddressLine2:
AddressLine3: URB Alamar
AddressLine4: Pitney Bowes Software
Suite/Link サポート
Link™
Suite
Link™
処理を実行するかどうかを指定します。 Suite
は、企
業住所に対し、補助的な住所情報 (Suite 番号など) を修正します。 詳
細については、米国 住所の概念(931ページ)を参照してください。
Link™
Suite
Link™
処理を実行するには、Suite
データベースをインストー
ルしておく必要があります。
このオプションで返されるフィールドの一覧については、SuiteLink
出力(1017ページ) を参照してください。
通り名に対してよく使用され 通り名に対してよく使用されるエイリアスを出力に使用するかどうか
るエイリアスの処理
を指定します。 入力において、よく使用されるエイリアスが使用され
ている場合は、このオプションを選択しているかどうかにかかわら
ユーザ ガイド
973
Validate Address
オプション名
説明/有効値
ず、そのエイリアスが出力の通り名になります。 通り名のエイリアス
については、通り名のエイリアス(934ページ) を参照してください。
これは、Validate Address で通り名のエイリアスを処理する方法を制
御する 3 つのオプションのうちの 1 つです。 他の 2 つは、[通り名の
エイリアスを返す] と [通り名に対する省略形エイリアスの処理] です。
多くの場合、[通り名に対してよく使用されるエイリアスの処理] と [通
り名に対する省略形エイリアスの処理] の両方が選択されており、
Validate Address が、郵便データベース内でよく使用されるエイリア
スと省略形エイリアスの両方を検出した場合は、省略形エイリアスが
出力に使用されます。 入力の通り名がよく使用されるエイリアスであ
る場合は、例外になります。 この場合は、よく使用されるエイリアス
が出力に使用されます。
注: 入力住所に、"変更名"である通り名のエイリアスが含まれている
場合は、指定したオプションにかかわらず、出力住所には必ず、
基本通り名が使用されます。
通り名に対する省略形エイリ 出力住所行の長さが 31 文字以上になる場合に、通り名に対する省略
アスの処理
形エイリアスを出力に使用するかどうかを指定します。 通り名のエイ
リアスについては、通り名のエイリアス(934ページ) を参照してくだ
さい。
これは、Validate Address で通り名のエイリアスを処理する方法を制
御する 3 つのオプションのうちの 1 つです。 他の 2 つは、[通り名の
エイリアスを返す] と [通り名に対してよく使用されるエイリアスの処
理] です。
注: 入力において、よく使用されるエイリアスが指定されている場合
は、通り名に対する省略形エイリアスの処理を有効にしていて
も、出力の通り名は必ず、よく使用されるエイリアスになりま
す。
注: 入力住所に、"変更名"である通り名のエイリアスが含まれている
場合は、指定したオプションにかかわらず、出力住所には必ず、
基本通り名が使用されます。
配達ポイントが郵便物受領可 住所の "no stat" ステータスを調べます。 住所が存在するが、郵便物
能かどうかを調べる
を受け取れない場合、その住所は "no stat" とみなされるため、配達
ルートに関する配達統計としてカウントされません (そのため "no stat"
という用語が使用されます)。 例としては、建設中の建物や、郵便物
974
Spectrum™ Technology Platform 8.0.0
第 29 章 : Universal Addressing モジュール
オプション名
説明/有効値
を受け取る可能性が低いと郵便配達業者が識別した建物などがありま
す。
注: このオプションを使用するには DPV 処理を有効にする必要があ
ります。
結果は DPVNoStat フィールドに返されます。 詳細については、を参
照してください。 LACSLink 出力(1014ページ)
住所が空家であるかを調べる そのロケーションがすくなとも 90 日間使用されていないかどうかを
調べます。
注: このオプションを使用するには DPV 処理を有効にする必要があ
ります。
結果は DPVVacant フィールドに返されます。 詳細については、を参
照してください。 LACSLink 出力(1014ページ)
VeriMove 詳細データを返す
出力に VeriMove 詳細データを返します。
通りマッチング
入力住所が郵便データベース内の住所にマッチするかどうかを調べる
際に使用するアルゴリズムを指定します。 次のいずれかを選択しま
す。
企業マッチング
ユーザ ガイド
完全一致
入力された通り名は、データベースに完全に一致す
る必要があります。
厳格
マッチング アルゴリズムは "厳格" です。
中
マッチング アルゴリズムは "中" です (デフォルト)。
あいまい
マッチング アルゴリズムは "あいまい" です。
入力住所が郵便データベース内の住所にマッチするかどうかを調べる
際に使用するアルゴリズムを指定します。 次のいずれかを選択しま
す。
完全一致
入力された企業名は、データベースに完全に一致す
る必要があります。
厳格
マッチング アルゴリズムは "厳格" です。
中
マッチング アルゴリズムは "中" です (デフォルト)。
あいまい
マッチング アルゴリズムは "あいまい" です。
975
Validate Address
オプション名
説明/有効値
道順マッチング
入力住所が郵便データベース内の住所にマッチするかどうかを調べる
際に使用するアルゴリズムを指定します。 次のいずれかを選択しま
す。
DPV 成功条件
完全一致
123 N Main St. における "N" など、入力された道順
がデータベースに完全に一致する必要があります。
厳格
マッチング アルゴリズムは "厳格" です。
中
マッチング アルゴリズムは "中" です。 こちらがデ
フォルトです。
あいまい
マッチング アルゴリズムは "あいまい" です。
DPV 結果がレコードの失敗の原因とならない一致条件を選択します。
CMRA との一致をマッチとみ 民間私書箱 (CMRA) との一致をマッチとみなしませんか。
なさない
PMB 要素配置箇所
Validate Address が私書箱 (PMB) の情報をどこに配置するかを指定し
ます。
どの住所行にも 標準住所出力に PMB 情報を含めません (デフォル
配置しない
ト)。
AddressLine1
PMB 情報を AddressLine1 に配置します。
AddressLine1 を選択した場合は、[住所フォーマッ
ト] フィールドに[結合ユニット] または [二重住
所を分割]をセットする必要があります。
AddressLine2
PMB 情報を AddressLine2 に配置します。このオ
プションは、[3553 Form を作成] をオンにしてい
る場合は選択できません。
CASS Certified 処理
™
特定のオプションの組み合わせを有効にすると、Validate Address を CASS Certified
™
させることができます。 CASS Certified
モードで動作
®
処理を使用すると、 USPS の郵便料金値引きのための条
件を揃えることができます。
™
CASS Certified
処理を使用すると、Validate Address が USPS CASS Form 3553 を生成します。 こ
のフォームを USPS に郵便物と一緒に渡さなければ、値引きを受けることができません。 フォームに
は CASS 処理に使用したソフトウェアに関する情報、名前と住所のリストに関する情報、出力ファイ
976
Spectrum™ Technology Platform 8.0.0
第 29 章 : Universal Addressing モジュール
ルに関する情報、差出人に関する情報、およびその他の郵便物に関する統計が含まれます。 USPS
Form 3553 の詳細については、www.usps.com を参照してください。
注: USPS CASS Form 3553 はバッチ処理でのみ使用可能です。
™
Validate Address を CASS Certified
モードで実行するには、以下の手順に従います。
1. Validate Address を CASS Certified™ モードにする必要があります。 ウィンドウの一番上に (CASS
認定でないもの) と表示される場合は、[CASS 有効] ボタンをクリックしてください。 [CASS ルー
ルを強制] チェック ボックスが表示されます。
2. [CASS 3553 を設定] をクリックします。 [CASS レポート フィールド] ダイアログ ボックスが表
示されます。
3. [リスト処理元] に会社名を入力し、このジョブで処理する [リスト名または ID#]、および [リスト
数] を入力します。
4. 差出人の名前、住所および都市、州、ZIP を入力します。
5. [OK] をクリックします。
生成された USPS® CASS Form 3553 のセクション B にリストの情報が、セクション D に差出人
の情報が表示されます。
6. Enterprise Designer で、CASS3553 レポートをレポートのパレットからキャンバスにドラッグし
ます。
7. キャンバスの [CASS3553] アイコンをダブルクリックします。
ユーザ ガイド
977
Validate Address
8. [ステージ] タブで、[Validate Address] チェックボックスをオンにします。 Validate Address ス
テージを何か別の名前に変更している場合は、住所検証ステージに指定した名前のチェック ボッ
クスをオンにする必要があります。
9. [パラメータ] タブで、レポートのフォーマットを選択します。 PDF、 HTML、またはプレーン テ
キストのフォーマットでレポートを作成できます。
10. [OK] をクリックします。
注: Validate Address ステージと CASS3553 レポートの間にコネクタを引く必要はありません。
カナダ住所のオプション
オプション名
説明/有効値
カナダ住所処理を有効にする
カナダ住所を処理するかどうかを指定します。 カ
ナダ住所処理を有効にした場合、Validate Address
はカナダ住所の検証を試みます。 カナダ住所処理
を無効にすると、カナダ住所は失敗します。つま
り、Status 出力フィールドに "F" が設定されて返
されます。 出力フィールド Status.Code
は、"DisabledCoder" となります。 カナダ住所処
理のライセンスを取得していない場合は、ジョブ
にカナダ住所が含まれるか否かにかかわらず、カ
ナダ住所処理を無効にしなければ、ジョブを正常
に実行することはできません。
注: カナダ住所を正常に処理するには、カナダ住
所処理の有効なライセンスを取得する必要が
あります。 カナダ住所処理のライセンスを取
得していないか、ライセンスの期限が切れて
いるにもかかわらず、カナダ住所処理を有効
にすると、ジョブ全体が失敗します。
978
データベース
カナダ住所の検証に使用するデータベースを指定
します。 カナダ住所検証用のデータベースを指定
するには、[データベース] ドロップダウン リスト
からデータベースを選択します。 Management
Console の [カナダ データベース リソース] パネ
ルで定義されたデータベースのみが使用可能で
す。
使用言語判断対象
住所及び方向指示の書式設定に使用する言語 (英
語またはフランス語) の判断方法を指定します。
Spectrum™ Technology Platform 8.0.0
第 29 章 : Universal Addressing モジュール
オプション名
説明/有効値
以下に、英語およびフランス語で書式設定された
住所の例を示します。
英語: 123 Main St W フランス語: 123 Rue Main O
このパラメータは、住所の書式設定を制御しま
す。 また、方向指示の綴りにも影響を与えます
が、接尾語の綴りには影響を与えません。
通り接尾語
マッチング処理によって返される
通り接尾語によって、言語を判断
します。 マッチング処理によっ
て返される通り接尾語は、
Validate Address が処理において
内部で使用するもので、入力住所
のものとは異なる場合がありま
す。 あいまいなレコードは、入
力と同様に書式設定されます。
これがデフォルトです。 ケベッ
ク州の住所はすべて、フランス語
で書式設定されます。
CPC データ
ベース
カナダ データベースによって、
言語を判断します。 カナダ デー
タベースには、Canada Post
Corporation (CPC: カナダ郵政公
社) からのデータが含まれていま
す。 ケベック州の住所はすべて、
フランス語で書式設定されます。
CanLanguage CanLanguage 入力フィールドに
フィールド
よって、言語を判断します。 こ
のフィールドに空白以外の値が設
定されている場合は、住所はフラ
ンス語で書式設定されます。
デフォルト英語アパートメント ラベル
英語の住所に対し、入力住所にアパートメント ラ
ベルが存在しない場合に、出力に使用するデフォ
ルト アパートメント ラベルを指定します。 [セ
カンダリ住所フォーマット] フィールドで [先頭
と番号のみ]を選択 した場合、この設定は無視さ
れます。
ユーザ ガイド
979
Validate Address
オプション名
説明/有効値
Apt
ラベルとして "Apt" を使用します。
これがデフォルトです。
Apartment ラベルとして "Apartment" を使用し
ます。
デフォルト フランス語アパートメント ラベル
Suite
ラベルとして "Suite" を使用します。
Unit
ラベルとして "Unit" を使用します。
フランス語の住所に対し、入力住所にアパートメ
ント ラベルが存在しない場合に、出力に使用する
デフォルト アパートメント ラベルを指定します。
[セカンダリ住所フォーマット] フィールドで [先
頭と番号のみ]を選択 した場合、この設定は無視
されます。
App
ラベルとして "App" を使用しま
す。 これがデフォルトです。
Appartement ラベルとして "Appartement" を使
用します。
Bureau
ラベルとして "Bureau" を使用しま
す。
Suite
ラベルとして "Suite" を使用しま
す。
Unite
ラベルとして "Unite" を使用しま
す。
郵便番号の競合時に家番号を優先
家番号と郵便番号がともに有効だが競合するとい
う場合、[郵便番号の競合時に家番号を優先] を選
択することによって、家番号に合わせて郵便番号
を強制的に修正することができます。 このオプ
ションを選択しない場合、郵便番号に合わせて家
番号が変更されます。
都市名のエイリアスを返す
入力住所に都市名のエイリアスがある場合、その
エイリアスを返すかどうかを指定します。 [都市
フォーマット] フィールドで [デフォルト オプショ
980
Spectrum™ Technology Platform 8.0.0
第 29 章 : Universal Addressing モジュール
オプション名
説明/有効値
ンを使用] を選択している場合は、このオプショ
ンは無効です。
正式住所ではないキーワードを短縮します。
出力において、正式住所ではないキーワードを短
縮するかどうかを指定します。 例えば、Post
Office Box と PO Box のどちらを使用するかが決
まります。
SERP 設定を有効にする
SERP オプションを使用するかどうかを指定しま
す。
セカンダリ住所フォーマット
出力住所における、補助的な住所情報の配置場所
を指定します。 補助的な住所情報とは、部屋番号
やアパート番号などの指定子のことです。
デフォルト アパート情報を、 [デフォルト オ
オプションを プション] タブの [セカンダリ住所
使用
フォーマット] フィールドで指定
された場所に配置します。 これが
デフォルトです。
住所行の末尾 アパート情報を、AddressLine1
フィールドの末尾 に配置します。
先頭と番号の アパート番号のみ (ラベルは除く)
み
を、AddressLine1 フィールドの
先頭に配置します。 例えば、400123 Rue Main とします。
先頭、番号、 アパート番号とラベルを、
ラベル
AddressLine1 フィールドの先頭
に配置します。 例えば、Apt 400
123 Rue Main とします。
住所行を分割 アパート情報を別の行に配置しま
す。
入力と同じ
都市フォーマット
ユーザ ガイド
アパート情報を入力住所と同じ場
所に配置します。
都市の名前が長い場合に、長、中、短のどの都市
名を使用するかを指定します。 例を次に示しま
す。
981
Validate Address
オプション名
説明/有効値
長: BUFFALO HEAD PRAIRIE
中: BUFFALO-HEAD-PR
短: BUFFALO-HD-PR
デフォル
ト オプ
ションを
使用
[デフォルト オプション] タブの [都市
フォーマット] フィールドで指定され
たデフォルト オプションを使用しま
す。 これがデフォルトです。 [都市
フォーマット] フィールドで [NonMailing (非正式)] を選択した場合、
都市は、このオプションで [長] を選
択し (以下を参照)、
CanOutputCityAlias を チェック ボッ
クスをオンにした場合と同じように
書式設定されます。
短
短い都市名を出力します。
長
長い都市名を出力します。
中
中の長さの都市名を出力します。
入力と同 入力住所と同じ都市フォーマットを
じ
使用します。 出力は、L、M、または
S です。
地方集配路線情報配置箇所
地方配送路の配達情報を配置する場所を指定しま
す。 地方配送路の配達情報を含む住所の例を以下
に示します。
36 GRANT RD RR 3 ANTIGONISH NS
この住所において、"RR 3" は地方配送路の配達情
報です。
AddressLine1 地方配送路の配達情報を、住所と
同一行の住所情報の後に配置しま
す。 こちらがデフォルトです。
例えば、36 GRANT RD RR 3 と
します。
AddressLine2 地方配送路の配達情報を、別の住
所行に配置します。 例えば、36
GRANT RD RR 3 とします。
982
Spectrum™ Technology Platform 8.0.0
第 29 章 : Universal Addressing モジュール
オプション名
説明/有効値
配達オフィス情報配置箇所
配達局情報の配置場所を指定します。 配達局情報
を含む住所の例を次に示します。 PO BOX 8625
STN A ST. JOHN'S NL
入力と同じ
配達局情報を、入力住所と同じ場
所に配置します。 これがデフォ
ルトです。
AddressLine1 配達局情報を、住所と同一行の住
所情報の後に配置します。 例え
ば、PO BOX 8625 STN A としま
す。
AddressLine2 配達局情報を、別の住所行に配置
します。 例えば、PO BOX 8625
STN A とします。
二重住所ロジック
住所に、正式情報と非正式情報の両方が含まれて
いる場合に、Validate Address が通り一致と、PO
Box/非正式一致のどちらを返すかを指定します。
次のいずれかを選択します。
デフォルト オ DualAddressLogic のグローバ
プションを使用 ル オプションを使用します。
これがデフォルトです。
PO Box 一致
P
通り一致
PO Box など通り以外のデータ
とマッチングします。
通りとマッチングします。
例えば、次の入力住所が与えられたとします。
AddressLine1: 36 GRANT RD
AddressLine2: RR 4
City: ANTIGONISH
StateProvince: NS
Validate Address は、次のいずれかを返します。
• [二重住所ロジック] が [通り一致] に設定され
ている場合、Validate Address は、次の住所を
返します。
ユーザ ガイド
983
Validate Address
オプション名
説明/有効値
AddressLine1: 36 GRANT RD
AddressLine2: RR 3
City: ANTIGONISH
StateProvince: NS
PostalCode: B2G 2L1
• [二重住所ロジック] が [PO Box 一致] に設定
されている場合、Validate Address は、次の住
所を返します。
AddressLine1: RR 4
City: ANTIGONISH
StateProvince: NS
PostalCode: B2G 2L2
住所の正規化に使用されない住所データは、
AdditionalInputData フィールドに返されます。
このオプションの詳細については、出力データ オ
プション(956ページ) を参照してください。
SERP の処理
Validate Address は Software and Evaluation Recognition Processing ( SERP ) に対応しています。
®
SERP 処理を使用すると、 Canada Post の郵便料金値引きのための条件を揃えることができます。
Validate Address が PoCAD データを返し、これによって家番号とアパートのデータの精度を向上させ
ることができます。
注: PoCAD データはバッチ モードでのみ返すことができます。 PoCAD データをリアル タイムで返
そうとすると、 Validate Address がエラーを返します。
™
SERP Certified 処理を使用すると、 Validate Address は Canada Post SERP Statement of Accuracy
を生成します。 このフォームを Canada Post に郵便物と一緒に渡さなければ、値引きを受けることが
できません。 フォームには SERP 処理に使用したソフトウェアに関する情報、名前と住所のリストに
関する情報、出力ファイルに関する情報、差出人に関する情報、およびその他の郵便物に関する統計
が含まれます。 Canada Post の Address Accuracy Statement について詳しくは、
http://www.canadapost.ca/cpo/mc/business/productsservices/atoz/addressaccuracy.jsfを参照し
てください。
™
Validate Address を SERP Certified モードで実行するには、以下の手順に従います。
1. Validate Address を SERP Certified™ モードにする必要があります。 ウィンドウの一番上に (SERP
認定でないもの) と表示される場合は、[SERP 設定を有効にする] ボタンをクリックしてください。
[SERP を設定] ボックスが表示されます。
984
Spectrum™ Technology Platform 8.0.0
第 29 章 : Universal Addressing モジュール
2. [SERP を設定] をクリックします。 [SERP レポート フィールド] ダイアログ ボックスが表示され
ます。
3. 荷主の CPC 番号を入力してください。
4. 差出人の名前、住所および都市、州、ZIP を入力します。
5. [OK] をクリックします。
6. Enterprise Designer で、SERP レポートをレポートのパレットからキャンバスにドラッグします。
注: Validate Address ステージと CASS3553 レポートの間にコネクタを引く必要はありません。
7. キャンバスの [SERP Report] アイコンをダブルクリックします。
8. [ステージ] タブで、[Validate Address] チェックボックスをオンにします。 Validate Address ス
テージを何か別の名前に変更している場合は、住所検証ステージに指定した名前のチェック ボッ
クスをオンにする必要があります。
9. [パラメータ] タブで、レポートのフォーマットを選択します。 PDF、 HTML、またはプレーン テ
キストのフォーマットでレポートを作成できます。 デフォルトでは PDF フォーマットで作成され
ます。
10. [OK] をクリックします。
ユーザ ガイド
985
Validate Address
SERP リターン コードの取得
SERP リターン コードは、カナダ郵政公社の Software Evaluation and Recognition Program の規定に
よって定められる入力住所の品質を表します。
SERP リターン コードを取得するには、[出力データ] タブで [郵便情報を含める] チェック ボックスを
選択します。これにより、SERP リターン コードを含む、住所に関する様々なデータが返されます。
このオプションによって返される具体的なデータについては、郵便データ出力(995ページ) を参照し
てください。
出力
SERP リターン コードは、以下の出力フィールドに返されます。
表 203 : SERP リターン コード出力
フィールド名
説明/有効値
CanadianSERPCode
検証/修正リターン コード (カナダ住所のみ)。
V 入力は有効です。 カナダ郵政公社は、以下のすべての条件を満た
す住所を、「有効な」住所であると定義しています。
注: 一部例外があります。 詳細については、CPC にお問い合わ
せください。
• 住所は、CPC の Postal Code Data Files に示されるとおりに、
すべての必須コンポーネントを含む必要があります。
• 住所は、CPC の Postal Code Data Files の単一の住所のみに対
し、すべてのコンポーネントにおいて完全に一致する必要があ
ります。ただし、CPC Postal Code Data Files に示されてい
る、許容される別の語および名前が使用されていてもかまいま
せん。
• 住所コンポーネントは、あいまいな部分がなく、はっきりと認
識できる形式である必要があります。 一部のコンポーネントに
は、それらを識別するための "修飾子" が必要な場合がありま
す。 例えば、Route Service の住所には、同じ番号の "Suburban
Service" または "SS" の住所と区別するために、"Rural Route"
または "RR" のキーワードが必要です。
I
986
入力は無効です。 「無効な」住所とは、有効な住所に対する CPC
の条件を満たさない住所のことです (上記を参照)。 例としては、
Spectrum™ Technology Platform 8.0.0
第 29 章 : Universal Addressing モジュール
フィールド名
説明/有効値
住所コンポーネントが欠落している、無効である、または矛盾が
存在する場合が挙げられます。
C 入力は修正可能です。 「修正可能な」住所とは、修正することに
よって、単一の住所のみに一致させることのできる住所のことで
す。
N 入力は修正不可能です。 「修正不可能な」住所とは、複数の異な
る修正方法があり得るために Validate Address が単一の修正住所
を特定できない住所のことです。
F 入力住所は外国 (カナダ以外) の住所です。
国際住所オプション
米国とカナダ以外の住所は "国際" 住所と呼ばれます。 以下に、国際住所の処理をコントロールするオ
プションについて説明します。
オプション名
説明/有効値
国際住所処理を有効にする
国際住所 (米国およびカナダ以外の住所) を処理す
るかどうかを指定します。 国際住所処理を有効に
した場合、Validate Address は国際住所の妥当性
を確認します。 国際住所処理を無効にすると、国
際住所は失敗します。つまり、Status 出力フィー
ルドに "F" が設定されて返されます。 出力フィー
ルド Status.Code は、"DisabledCoder" となりま
す。 国際住所処理のライセンスを取得していない
場合は、ジョブに国際住所が含まれるか否かにか
かわらず、国際住所処理を無効にしなければ、
ジョブを正常に実行することはできません。
注: 国際住所を正常に処理するには、国際住所処
理の有効なライセンスを取得する必要があり
ます。 国際住所処理のライセンスを取得して
いないか、ライセンスの期限が切れているに
もかかわらず、国際住所処理を有効にする
と、ジョブ全体が失敗します。
データベース
ユーザ ガイド
国際住所の妥当性の確認に使用するデータベース
を指定します。 国際住所検証用のデータベースを
987
Validate Address
オプション名
説明/有効値
指定するには、[データベース] ドロップダウン リ
ストからデータベースを選択します。
Management Console の [国際データベース リソー
ス] パネルで定義されたデータベースのみが使用
可能です。
世界の都市および通りの検索
デフォルトでは、Validate Address は、住所マッ
チングの精度とパフォーマンスのバランスをうま
くとります。 マッチング精度を犠牲にしてパ
フォーマンスを向上させる場合は、[世界の都市お
よび通りの検索] フィールドを使用して、処理速
度を上げます。 これを実行すると、精度はやや低
下します。 このオプションは、米国およびカナダ
以外の住所のパフォーマンスのみを制御します。
この設定が影響を与えるレコードの割合は少な
く、大部分が英国の住所です。米国およびカナダ
住所処理のパフォーマンスは制御できません。
Get Candidate Addresses を使用した場合に Get
Candidate Addresses が返す候補住所は、国際住
所のパフォーマンス チューニング オプションを
100 以外の任意の値に設定した場合に Validate
Address が返す複数マッチと異なることがありま
す。
米国およびカナダ以外の住所のパフォーマンスを
制御するには、[世界の都市および通りの検索] ス
ライダーを使用します。 マッチング精度を上げる
には、スライダーを右に動かします。 値 100 が
最高精度になります。 処理速度を上げるには、ス
ライダーを左に動かします。 値 を 0 にすると、
処理速度が最速になります。
失敗時に住所行を検索
このオプションにより、Validate Address におい
て、City、StateProvince、および PostalCode の
各入力フィールドの値を使用して住所にマッチす
る結果が得られなかった場合に、AddressLine 入
力フィールドで都市、州/省、郵便番号、および国
を検索することができます。
入力住所において、AddressLine フィールドに都
市、州/省、および郵便番号の情報が存在する場合
988
Spectrum™ Technology Platform 8.0.0
第 29 章 : Universal Addressing モジュール
オプション名
説明/有効値
は、このオプションを有効にすることを検討して
ください。
入力住所において、City、State/Province、および
PostalCode フィールドが使用されている場合は、
このオプションを無効にしてください。 このオプ
ションを有効にしてこれらのフィールドを使用す
ると、Validate Address がこれらのフィールド値
(たとえば、スペルミスのある都市名など) の修正
に失敗する可能性が高くなります。
出力
Validate Address からの出力には、選択した出力カテゴリに応じて異なる情報が含まれます。
出力カテゴリは、以下のとおりです。
• 標準住所出力(989ページ)
• パース済み住所要素出力(991ページ)
• パース済み入力(993ページ)
• 郵便データ出力(995ページ)
• 結果インジケータ(997ページ)
• オプションによる出力(1013ページ)
• AdditionalInputData について(1019ページ)
注: API を介してこのサービスを利用する場合は、出力は DataTable クラスを使用して返されます。
以下で説明するフィールドは、DataTable クラスにおける有効な列名です。DataTable クラスの
詳細については、『Spectrum Technology Platform API ガイド』の「API の基礎」のセクション
を Spectrum™ Technology Platform API ガイド.
標準住所出力
標準住所出力は、実際の宛名ラベルに表記される住所に対応する 4 行の住所で構成されます。 都市、
州/省、郵便番号などのデータも、標準住所出力に含まれます。 [標準住所を含める] チェック ボックス
を選択OutputRecordType = は、妥当性を確認した住所に対し、標準住所出力を返します。 [標準住
所を含める] チェック ボックスを選択したかどうかにかかわらず、妥当性が確認できなかった住所に
対しては、標準住所フィールドが必ず返されます。 妥当性が確認されなかった住所に対しては、標準
住所出力フィールドには、入力住所がそのまま含まれます ("パス スルー" データ)。 Validate Address
において、妥当性が確認できなかった場合に、郵便当局の規格に従って住所を正規化する場合は、[マッ
チしなかった場合に正規化データを返す] チェック ボックスを選択します。
ユーザ ガイド
989
Validate Address
表 204 : 標準住所出力
フィールド名
説明/有効値
AdditionalInputData
Validate Address で使用されない入力データ。 詳細については、
AdditionalInputData について(1019ページ)を参照してください。
AddressLine1
住所の妥当性が確認された場合は、妥当性が確認され、正規化された
住所の 1 行目です。 住所の妥当性が確認できなかった場合は、入力住
所の 1 行目がそのまま出力されます。
AddressLine2
住所の妥当性が確認された場合は、妥当性が確認され、正規化された
住所の 2 行目です。 住所の妥当性が確認できなかった場合は、入力住
所の 2 行目がそのまま出力されます。
AddressLine3
住所の妥当性が確認された場合は、妥当性が確認され、正規化された
住所の 3 行目です。 住所の妥当性が確認できなかった場合は、入力住
所の 3 行目がそのまま出力されます。
AddressLine4
住所の妥当性が確認された場合は、妥当性が確認され、正規化された
住所の 4 行目です。 住所の妥当性が確認できなかった場合は、入力住
所の 4 行目がそのまま出力されます。
City
妥当性が確認された都市名。
Country
[国フォーマット] で選択した、以下のいずれかのフォーマットで示さ
れた国。
• ISO コード
• UPU コード
• 英語
• フランス語
• ドイツ語
• スペイン語
990
DepartmentName
企業内の下位区分 (英国住所においてのみ)。 例えば、エンジニアリン
グ部門などです。
FirmName
妥当性が確認された企業名。
PostalCode
妥当性が確認された ZIP Code または郵便番号。
™
Spectrum™ Technology Platform 8.0.0
第 29 章 : Universal Addressing モジュール
フィールド名
説明/有効値
PostalCode.AddOn
ZIP Code の 4 桁のアドオン部分。 例えば、60655-1844 という ZIP
™
™
Code において、4 桁のアドオン部分は 1844 になります (米国住所
のみ)。
™
PostalCode.Base
5 桁の ZIP Code 。例えば、20706 (米国住所のみ)。
StateProvince
妥当性が確認された州または省の略称。
USUrbanName
妥当性が確認された都市化名 (米国住所のみ)。
パース済み住所要素出力
[一致した住所要素を含める] チェック ボックスを選択した場合、出力住所は、パース済み住所の形式
で書式設定されます。 Validate Address で、妥当性が確認できなかった場合に、パース済み住所形式
で書式設定されたデータ (正規化済み住所) を返すには、[マッチしなかった場合に正規化データを返す]
チェック ボックスを選択します。
注: Validate Address で、妥当性が確認できたかどうかにかかわらず、常にパース済み入力データを
返すには、[正規化された入力住所要素を含める] を選択します。 詳細については、パース済み入
力(993ページ)を参照してください。
表 205 : パース済み住所出力
フィールド名
説明/有効値
AdditionalInputData
Validate Address で使用されない入力データ。 詳
細については、AdditionalInputData について
(1019ページ)を参照してください。
ApartmentLabel
アパート指定子 (STE や APT など)。例: 123 E
Main St APT 3
ApartmentLabel2
補助的なアパート指定子。例: 123 E Main St APT
3, 4th Floor
注: このリリースでは、このフィールドは常に空
白になります。
ApartmentNumber
ユーザ ガイド
アパート番号。 例: 123 E Main St APT 3
991
Validate Address
フィールド名
説明/有効値
ApartmentNumber2
補助的なアパート番号。 例: 123 E Main St APT
3, 4th Floor
注: このリリースでは、このフィールドは常に空
白になります。
CanadianDeliveryInstallationAreaName
配達施設名 (カナダ住所のみ)
CanadianDeliveryInstallationQualifierName
配達施設の修飾子 (カナダ住所のみ)
CanadianDeliveryInstallationType
配達施設の種類 (カナダ住所のみ)
City
妥当性が確認された都市名
Country
国。 フォーマットは、[国フォーマット] で選択し
たものになります。
• ISO コード
• UPU コード
• 英語
• フランス語
• ドイツ語
• スペイン語
992
DepartmentName
企業内の下位区分 (英国住所においてのみ)。 例え
ば、エンジニアリング部門などです。
FirmName
妥当性が確認された企業名
HouseNumber
家番号。例: 123 E Main St Apt 3
LeadingDirectional
接頭方向指示。例: 123 E Main St Apt 3
POBox
私書箱番号。 住所が地方配送路住所である場合
は、地方配送路の私書箱番号がここに表示されま
す。
PostalCode
妥当性が検証された郵便番号。 米国住所では、
ZIP Code と呼びます。
Spectrum™ Technology Platform 8.0.0
第 29 章 : Universal Addressing モジュール
フィールド名
説明/有効値
PrivateMailbox
私設私書箱のインジケータ。
PrivateMailbox.Type
私設私書箱の種別。 次のような値があります。
• Standard
• Non-Standard
注: PrivateMailboxType (フィールド名にピリオ
ドなし) に換わるものです。 これに従って
API 呼び出しを修正してください。
RRHC
地方配送路/Highway Contract のインジケータ
StateProvince
妥当性が確認された州または省の名前
StreetName
通り名。例: 123 E Main St Apt 3
StreetSuffix
通り接尾語。例: 123 E Main St Apt 3
TrailingDirectional
接尾方向指示。例: 123 Pennsylvania Ave NW
USUrbanName
USPS 都市化名。 プエルトリコ住所のみ。
®
パース済み入力
出力には、パース済み形式で入力住所を含めることができます。 このようなタイプの出力は、"パース
済み入力" と呼ばれます。 パース済み入力フィールドには、Validate Address が住所の妥当性を検証
したかどうかにかかわらず、入力として使用される住所データが含まれます。 パース済み入力は、住
所の妥当性を検証できた場合にパース済み住所要素に妥当性が検証された住所が含まれ、オプション
で、住所の妥当性が検証できなかった場合には入力データが含まれるという点で、"パース済み住所要
素" 出力と異なります。 パース済み入力には、Validate Address が住所の妥当性を検証したかどうか
にかかわらず、常に入力住所が含まれます。
パース済み入力フィールドを出力に含めるには、[パースした入力データを返す] チェック ボックスを
オンにします。
ユーザ ガイド
993
Validate Address
表 206 : パース済み入力
フィールド名
説明/有効値
ApartmentLabel.Input
アパート指定子 (STE や APT など)。例: 123 E
Main St APT 3
ApartmentNumber.Input
アパート番号。例: 123 E Main St APT 3
CanadianDeliveryInstallationAreaName.Input
配達施設名 (カナダ住所のみ)
CanadianDeliveryInstallationQualifierName.Input
配達施設の修飾子 (カナダ住所のみ)
CanadianDeliveryInstallationType.Input
配達施設の種類 (カナダ住所のみ)
City.Input
妥当性が確認された都市名
Country.Input
国。 フォーマットは、[国フォーマット] で選択し
たものになります。
• ISO コード
• UPU コード
• 英語
• フランス語
• ドイツ語
• スペイン語
994
FirmName.Input
妥当性が確認された企業名
HouseNumber.Input
家番号。例: 123 E Main St Apt 3
LeadingDirectional.Input
接頭方向指示。例: 123 E Main St Apt 3
POBox.Input
私書箱番号。 住所が地方配送路住所である場合
は、地方配送路の私書箱番号がここに表示されま
す。
PostalCode.Input
妥当性が検証された郵便番号。 米国住所では、
ZIP Code と呼びます。
PrivateMailbox.Input
私設私書箱のインジケータ
Spectrum™ Technology Platform 8.0.0
第 29 章 : Universal Addressing モジュール
フィールド名
説明/有効値
PrivateMailbox.Type.Input
私設私書箱の種別。 次のような値があります。
• 標準
• 非標準
RRHC.Input
地方配送路/Highway Contract のインジケータ
StateProvince.Input
妥当性が確認された州または省の名前
StreetName.Input
通り名。例: 123 E Main St Apt 3
StreetSuffix.Input
通り接尾語。例: 123 E Main St Apt 3
TrailingDirectional.Input
接尾方向指示。例: 123 Pennsylvania Ave NW
USUrbanName.Input
USPS 都市化名
®
郵便データ出力
[郵便情報を含める] を選択した場合、以下のフィールドが出力として返されます。
表 207 : 郵便データ出力
フィールド名
説明/有効値
CanadianSERPCode
検証/修正リターン コード (カナダ住所のみ)。 詳細については、SERP
リターン コードの取得(986ページ)を参照してください。
IntHexaviaCode
通りを表す数値コード (フランスの住所の場合のみ)。 Hexavia コード
の詳細つについては、www.laposte.fr を参照してください。
IntINSEECode
都市を表す数値コード (フランスの住所の場合のみ)。 INSEE コードの
一覧については、www.insee.fr を参照してください。
PostalBarCode
配達ポイント バーコードの 2 桁の配達ポイント部分 (米国住所のみ)。
詳細については、配達ポイント バーコードの作成(962ページ) を参照
してください。
ユーザ ガイド
995
Validate Address
フィールド名
説明/有効値
USAltAddr
他の住所マッチング ロジックを使用したかどうか、使用した場合はど
のロジックを使用したかを表します (米国住所のみ)。 次のいずれかに
なります。
NULL
他の住所スキームを使用していません。
D
別の配達ポイント ロジックを使用しました。
E
別の高層マッチ ロジックを使用しました。
S
小都市デフォルト ロジックを使用しました。
U
ユニークな ZIP Code ロジックを使用しました。
USBCCheckDigit
11 桁の配達ポイント バーコードのチェック ディジット部分 (米国住所
のみ)。 詳細については、配達ポイント バーコードの作成(962ページ)
を参照してください。
USCarrierRouteCode
配達ルート コード (米国住所のみ)。 詳細については、配達ルート コー
ドの取得(962ページ)を参照してください。
USCongressionalDistrict
下院選挙区 (米国住所のみ)。 詳細については、下院選挙区の取得
(960ページ)を参照してください。
USCountyName
郡名 (米国住所のみ)。 詳細については、郡名の取得(961ページ)を参
照してください。
USFinanceNumber
住所の所在地の Finance Number (米国住所のみ)。 Finance Number と
は、複数の ZIP Code を含む地域に USPS が割り当てた番号です。
Validate Address は、住所の Finance Number が米国 データベースの
候補住所の Finance Number に一致した場合のみ、住所の妥当性確認
に成功します。
USFIPSCountyNumber
FIPS (連邦情報処理標準) 郡番号 (米国住所のみ)。 詳細については、
FIPS 郡番号の取得(961ページ)を参照してください。
USLACS
住所が、LACS
Link
変換の候補であるかどうかを表します (米国住所の
み)。 次のいずれかになります。
Y 住所は LACSLink 処理の候補です。 LACSLink が有効である場合は、
Link
Validate Address は、LACS
データベースを使用して住所を変
Link
換します。 変換に成功した場合、出力住所は LACS
996
データベー
Spectrum™ Technology Platform 8.0.0
第 29 章 : Universal Addressing モジュール
フィールド名
説明/有効値
スから取得した新しい住所になります。 変換できなかった場合
は、住所は変換されません。
N 住所は LACSLink 処理の候補ではありません。 ただし、LACSLink
Link
処理が要求され、LACS
データベースがインストールされてお
Link
り、かつ、次の条件のいずれかが満たされている場合は、LACS
処理が行われる場合があります。
• 住所が地方配送路住所にマッチし、RecordType.Default フィー
ルドで Y が返された場合。
• 入力住所が、米国 郵便データベースのいずれの住所にもマッチ
Link
しなかった場合 (複数にマッチしたことによる失敗は、LACS
の候補にはなりません)。
USLastLineNumber
主要都市が同一である複数の ZIP Code を同一グループにまとめる 6
文字の英数字の値。 例えば、最終行が次の 2 つのいずれかである住所
は、最終行番号が同一になります。
Chantilly VA 20151 Chantilly VA 20152
結果インジケータ
結果インジケータは、住所に対して実行した処理の種類に関する情報を提供します。 結果インジケー
タには、次の 2 種類があります。
• レコード レベルの結果インジケータ(997ページ)
• フィールドレベルの結果インジケータ(1002ページ)
レコード レベルの結果インジケータ
レコード レベルの結果インジケータは、各レコードに対する Validate Address 処理の結果に関する
データを提供します。例えば、マッチングの成功または失敗、住所を処理したコーダーなどの詳細情
報を示します。 以下の表に、Validate Address が返すレコード レベルの結果インジケータの一覧を示
します。
表 208 : レコード レベル インジケータ
フィールド名
説明/有効値
AddressFormat
返された住所データのタイプ。
ユーザ ガイド
997
Validate Address
フィールド名
説明/有効値
F
フランス語フォーマット (例: 123 Rue Main)
E
英語フォーマット (例: 123 Main St)
Confidence
返された住所に割り当てられた確信レベル。 範囲は 0 〜
100 です。0 は失敗を表し、100 はマッチ結果が正しいこと
に対する確信レベルが非常に高いことを表します。 複数の
マッチ結果がある場合、確信レベルは 0 です。 この数値の
計算方法については、Validate Address Confidence (確信)
アルゴリズムの概要(1047ページ) を参照してください。
CouldNotValidate
マッチしなかった場合の、妥当性が確認できなかった住所
コンポーネント。
•
•
•
•
•
•
•
•
•
•
ApartmentNumber
HouseNumber
StreetName
PostalCode
City
Directional
StreetSuffix
Firm
POBoxNumber
RuralRoute
注: 複数のコンポーネントがカンマ区切りリストとして返
されることがあります。
CountryLevel
利用可能な住所マッチングのカテゴリ。 米国およびカナダ
の住所に対しては、常に "A" です。 次のいずれかを選択し
ます。
A 住所は非常に詳細な郵便データを利用できる国にあり
ます。 このマッチ レベルにある住所では、以下の住所
要素を検証および修正でき、入力から欠落している場
合は追加できます。
• 郵便番号
• 都市名
• 州/郡名
• 通り住所要素
998
Spectrum™ Technology Platform 8.0.0
第 29 章 : Universal Addressing モジュール
フィールド名
説明/有効値
• 国名
B 住所は中程度の詳細さの郵便データを利用できる国に
あります。 このマッチ レベルにある住所では、以下の
住所要素を検証および修正でき、入力から欠落してい
る場合は追加できます。
• 郵便番号
• 都市名
• 州/郡名
• 国名
C 住所は郵便データが詳細ではない国にあります。 この
マッチ レベルにある住所に対して、以下のアクション
を実行することができます。
• 国名の検証および修正 (欠落している国名を補うこと
はできません)
• 郵便番号のフォーマットの検証 (欠落している郵便番
号を補ったり、番号を検証することはできません)
MatchScore
MatchScore は、出力住所がどの程度正しいかを示します。
Confidence はマッチ結果を得るために入力住所をどれくら
い変更したかを示すという点で、Confidence とは大きく異
なりますが、MatchScore の意味は米国住所と米国以外の住
所で異なります。
米国住所では、MatchScore は 0 〜 9 の段階に対応する 1 桁
のスコアで、通り名マッチの近さを反映します (Validate
Address による変換があれば実行後)。 0 は完全一致を意味
し、9 は最も可能性の低い一致を意味します。 マッチしな
かった場合、このフィールドは空白です。
米国カナダ以外の住所では、MatchScore は 5 桁のスコア
で、最大値は 00999 です。 数字が大きいほど、より近い一
致を意味します。
このフィールドは、カナダの住所には適用されません。
米国住所のマッチ スコアと米国以外の住所のマッチ スコア
は、同等と見なすことはできません。 例えば、米国住所に
ユーザ ガイド
999
Validate Address
フィールド名
説明/有効値
対するマッチ スコア 4 は、米国以外の住所に対する 00004
と同じマッチ レベルを意味するものではありません。
注: Validate Address および Advanced Matching モジュー
ルのコンポーネントは、どちらも MatchScore フィール
ドを使用します。 データフローの出力の MatchScore
フィールドの値は、出力ステージに送られる前に最後に
値を変更したステージによって決まります。 データフ
ローに Validate Address および Advanced Matching モ
ジュールのコンポーネントが含まれ、各ステージの
MatchScore 出力フィールドを確認したい場合は、
Transformer ステージを使用して、MatchScore 値を他
のフィールドにコピーしてください。 例えば、Validate
Address によって MatchScore という出力フィールドが
作成され、Transformer ステージによって Validate
Address の MatchScore フィールドが
AddressMatchScore というフィールドにコピーされま
す。 マッチャー ステージを実行すると、マッチャーか
ら得た値が MatchScore フィールドに設定され、Validate
Address から得た AddressMatchScore の値が 引き渡さ
れます。
MultimatchCount
複数のマッチが検出された場合、一致する可能性のあるレ
コードの数を示します。
MultipleMatches
複数のマッチが検出された場合に、複数のマッチを持つ次
の住所コンポーネントを示します。
•
•
•
•
•
•
•
Firm
LeadingDirectional
PostalCode
StreetName
StreetSuffix
TrailingDirectional
Urbanization
注: 複数のコンポーネントがカンマ区切りリストとして返
されることがあります。
ProcessedBy
1000
住所を処理した住所コーダーです。
Spectrum™ Technology Platform 8.0.0
第 29 章 : Universal Addressing モジュール
フィールド名
RecordType
説明/有効値
USA
米国住所コーダー
CAN
カナダ住所コーダー
INT
国際住所コーダー
米国およびカナダの郵政当局が定義した住所レコードのタ
イプ (米国およびカナダの住所のみサポート)
•
•
•
•
•
•
RecordType.Default
Status
Status.Code
"デフォルト" マッチを示すコード
Y
住所はデフォルトレコードにマッチしています。
NULL
住所はデフォルト レコードにマッチしていませ
ん。
マッチの成功または失敗を報告します。 複数のマッチがあ
る場合、一致する可能性のあるすべてのものに対してこの
フィールドが "F" になります。
NULL
成功
F
失敗
失敗の原因 (ある場合)。 複数のマッチがある場合、一致す
る可能性のあるすべてのものが "MultipleMatchesFound" に
なります。
•
•
•
•
Status.Description
ユーザ ガイド
FirmRecord
GeneralDelivery
HighRise
PostOfficeBox
RRHighwayContract
Normal
DisabledCoder
InsufficientInputData
MultipleMatchesFound
UnableToValidate
問題の説明 (ある場合)。
1001
Validate Address
フィールド名
説明/有効値
Possible Multiple Addresses
Found
Status.Code=MultipleMatchesFound
の場合にこの値が表示されます。
Address Not Found
Status.Code=UnableToValidate の
場合にこの値が表示されます。
PerformUSProcessing disabled Status.Code=DisabledCoder の場
合にこの値が表示されます。
PerformCanadianProcessing
disabled
Status.Code=DisabledCoder の場
合にこの値が表示されます。
PerformInternationalProcessing Status.Code=DisabledCoder の場
disabled
合にこの値が表示されます。
フィールドレベルの結果インジケータ
フィールドレベルの結果インジケータは、Validate Address が各住所要素をどのように処理したかを
示します。 フィールドレベルの結果インジケータは、修飾子 "Result" で返されます。 例えば、
HouseNumber のフィールドレベルの結果インジケータは HouseNumber.Result に格納されます。
フィールドレベルの結果インジケータを有効にするには、[個々のフィールドの結果コードを含める]
チェックボックスをオンにします。このオプションの詳細については、出力データオプション(956ペー
ジ)を参照してください。
次の表に、フィールドレベルの結果インジケータの一覧を示します。 特定のフィールドが住所に適用
されない場合、結果インジケータが空白になる場合があります。
表 209 : フィールドレベルの結果インジケータ
1002
フィールド名
有効な値
AddressRecord.Result
これらの結果コードは国際住所のみに適用されます。
M
複数。 入力住所が郵便データベース内の複数レコードにマッ
チし、マッチする各レコードのこのフィールドの値が異なり
ます。
S
正規化。 このオプションには、標準の略語が含まれます。
U
不一致。
V
検証済み。 データは正しいことが確認され、入力から変更さ
れていません。
Spectrum™ Technology Platform 8.0.0
第 29 章 : Universal Addressing モジュール
フィールド名
ApartmentLabel.Result
ApartmentNumber.Result
ユーザ ガイド
有効な値
A
追加済み。 フィールドが空白の入力フィールドに追加されま
した。 米国およびカナダの住所のみ。
C
修正済み。 米国およびカナダの住所のみ。
D
ドロップ済み。 入力に与えられたフィールドが削除されまし
た。 米国およびカナダの住所のみ。 詳細については、
AdditionalInputData について(1019ページ)を参照してくださ
い。
F
書式設定済み。 郵便規格に準拠するよう、スペースや句読文
字が変更されました。 米国またはカナダの住所には適用され
ません。
P
パススルー。 データは検証プロセスで使用されませんでした
が、出力に保持されました。 米国およびカナダの住所のみ。
R
アパート ラベルが必須ですが、入力住所から欠落しています。
米国住所のみ。
S
正規化。 このオプションには、標準の略語が含まれます。
U
不一致。 カナダの住所には適用されません。
V
検証済み。 データは正しいことが確認され、入力から変更さ
れていません。
A
追加済み。 フィールドが空白の入力フィールドに追加されま
した。 米国およびカナダの住所のみ。
C
修正済み。 カナダの住所のみ。
D
ドロップ済み。 入力に与えられたフィールドが削除されまし
た。 米国住所のみ。 詳細については、AdditionalInputData
について(1019ページ)を参照してください。
F
書式設定済み。 郵便規格に準拠するよう、スペースや句読文
字が変更されました。 米国またはカナダの住所には適用され
ません。
P
パススルー。 データは検証プロセスで使用されませんでした
が、出力に保持されました。 EWS にマッチする米国の住所に
は、P の値が割り当てられます。米国またはカナダの住所の
み。
1003
Validate Address
フィールド名
City.Result
Country.Result
1004
有効な値
R
アパート番号が必須ですが、入力住所から欠落しています。
米国住所のみ。
S
正規化。 このオプションには、標準の略語が含まれます。 米
国住所には適用されません。
U
不一致。
V
検証済み。 データは正しいことが確認され、入力から変更さ
れていません。
A
追加済み。 フィールドが空白の入力フィールドに追加されま
した。 米国およびカナダの住所のみ。
C
修正済み。 米国およびカナダの住所のみ。
F
ハイフンの欠落または句読文字エラー。 カナダの住所のみ。
M
複数。 入力住所が郵便データベース内の複数レコードにマッ
チし、マッチする各レコードのこのフィールドの値が異なり
ます。 米国またはカナダの住所には適用されません。
P
パススルー。 データは検証プロセスで使用されませんでした
が、出力に保持されました。
R
都市名が必須ですが、入力住所から欠落しています。 米国住
所のみ。
S
正規化。 このオプションには、標準の略語が含まれます。 米
国住所には適用されません。
U
不一致。 カナダの住所には適用されません。
V
検証済み。 データは正しいことが確認され、入力から変更さ
れていません。
これらの結果コードは、米国またはカナダの住所に適用されません。
M
複数。 入力住所が郵便データベース内の複数レコードにマッ
チし、マッチする各レコードのこのフィールドの値が異なり
ます。
S
正規化。 このオプションには、標準の略語が含まれます。
U
不一致。
Spectrum™ Technology Platform 8.0.0
第 29 章 : Universal Addressing モジュール
フィールド名
FirmName.Result
HouseNumber.Result
LeadingDirectional.Result
ユーザ ガイド
有効な値
V
検証済み。 データは正しいことが確認され、入力から変更さ
れていません。
C
修正済み。 米国住所のみ。
P
パススルー。 データは検証プロセスで使用されませんでした
が、出力に保持されました。 米国およびカナダの住所のみ。
U
不一致。 米国およびカナダの住所のみ。
V
検証済み。 データは正しいことが確認され、入力から変更さ
れていません。 米国住所のみ。
A
追加済み。 フィールドが空白の入力フィールドに追加されま
した。 カナダの住所のみ。
C
修正済み。 カナダの住所のみ。
D
ドロップ済み。 入力に与えられたフィールドが削除されまし
た。 米国住所のみ。 詳細については、AdditionalInputData
について(1019ページ)を参照してください。
F
書式設定済み。 郵便規格に準拠するよう、スペースや句読文
字が変更されました。 米国またはカナダの住所には適用され
ません。
O
範囲外。. 米国またはカナダの住所には適用されません。
P
パススルー。 データは検証プロセスで使用されませんでした
が、出力に保持されました。 カナダの住所のみ。
R
家番号が必須ですが、入力住所から欠落しています。 カナダ
の住所のみ。
S
正規化。 このオプションには、標準の略語が含まれます。 米
国またはカナダの住所には適用されません。
U
不一致。
V
検証済み。 データは正しいことが確認され、入力から変更さ
れていません。
A
追加済み。 フィールドが空白の入力フィールドに追加されま
した。 米国およびカナダの住所のみ。
1005
Validate Address
フィールド名
POBox.Result
1006
有効な値
C
修正済み。 空白のない入力が、空白のない値に修正されまし
た。 米国住所のみ。
D
ドロップ済み。 入力に与えられたフィールドが削除されまし
た。 米国住所のみ。 詳細については、AdditionalInputData
について(1019ページ)を参照してください。
F
書式設定済み。 郵便規格に準拠するよう、スペースや句読文
字が変更されました。 米国またはカナダの住所には適用され
ません。
M
複数。 入力住所が郵便データベース内の複数レコードにマッ
チし、マッチする各レコードのこのフィールドの値が異なりま
す。 米国住所のみ。
P
パススルー。 データは検証プロセスで使用されませんでした
が、出力に保持されました。 カナダの住所のみ。
S
正規化。 このオプションには、標準の略語が含まれます。
U
不一致。
V
検証済み。 データは正しいことが確認され、入力から変更さ
れていません。 カナダの住所には適用されません。
A
追加済み。 フィールドが空白の入力フィールドに追加されま
した。 カナダの住所のみ。
C
修正済み。 カナダの住所のみ。
D
ドロップ済み。 入力に与えられたフィールドが削除されまし
た。 米国住所のみ。 詳細については、AdditionalInputData
について(1019ページ)を参照してください。
F
書式設定済み。 郵便規格に準拠するよう、スペースや句読文
字が変更されました。 米国またはカナダの住所には適用され
ません。
M
複数マッチ。 入力住所が郵便データベース内の複数レコード
にマッチし、マッチする各レコードのこのフィールドの値が
異なります。 米国住所のみ。
P
パススルー。 データは検証プロセスで使用されませんでした
が、出力に保持されました。 カナダの住所のみ。
R
私書箱. 番号が必須ですが、入力住所から欠落しています。 米
国住所のみ。
Spectrum™ Technology Platform 8.0.0
第 29 章 : Universal Addressing モジュール
フィールド名
PostalCode.Result
PostalCodeCity.Result
ユーザ ガイド
有効な値
S
正規化。 このオプションには、標準の略語が含まれます。
U
不一致。
V
検証済み。 データは正しいことが確認され、入力から変更さ
れていません。
A
追加済み。 フィールドが空白の入力フィールドに追加されま
した。 米国およびカナダの住所のみ。
C
修正済み。 米国およびカナダの住所のみ。
F
書式設定済み。 郵便規格に準拠するよう、スペースや句読文
字が変更されました。 米国またはカナダの住所には適用され
ません。
M
複数。 入力住所が郵便データベース内の複数レコードにマッ
チし、マッチする各レコードのこのフィールドの値が異なりま
す。 カナダの住所には適用されません。
P
パススルー。 データは検証プロセスで使用されませんでした
が、出力に保持されました。 米国住所には適用されません。
R
郵便番号が必須ですが、入力住所から欠落しています。 米国
住所のみ。
S
正規化。 このオプションには、標準の略語が含まれます。 米
国またはカナダの住所には適用されません。
U
不一致。 例えば、通り名と郵便番号が一致しない場合、
StreetName.Result と PostalCode.Result の両方に U が割り当
てられます。
V
検証済み。 データは正しいことが確認され、入力から変更さ
れていません。
これらの結果コードは国際住所のみに適用されます。
M
複数。 入力住所が郵便データベース内の複数レコードにマッ
チし、マッチする各レコードのこのフィールドの値が異なり
ます。
P
パススルー。 データは検証プロセスで使用されませんでした
が、出力に保持されました。
S
正規化。 このオプションには、標準の略語が含まれます。
1007
Validate Address
フィールド名
PostalCode.Source
有効な値
U
不一致。
V
検証済み。 データは正しいことが確認され、入力から変更さ
れていません。
これらの結果コードは米国住所のみに適用されます。
FinanceNumber 入力の ZIP Code™ は、USPS® Finance Number グ
ループを使って検証されました。
ZIPMOVE
™
®
入力住所の ZIP Code は、USPS が改訂した ZIP
™
Code 境界に基づいて修正され、住所に別の ZIP
™
Code が設定されました。
PostalCode.Type
P
™
ZIP Code には、私書箱住所のみが含まれます。 米国住所
のみ。
U
™
ZIP Code は、特定の会社または場所に割り当てられたユ
™
ニークな ZIP Code です。 米国住所のみ。
RRHC.Result
1008
™
M
ZIP Code は、軍施設の住所です。 米国住所のみ。
NULL
ZIP Code は、標準 ZIP Code です。
™
™
C
修正済み。 カナダの住所のみ。
D
ドロップ済み。 入力に与えられたフィールドが削除されまし
た。 米国住所のみ。 詳細については、AdditionalInputData
について(1019ページ)を参照してください。
M
複数マッチ。 入力住所が郵便データベース内の複数レコード
にマッチし、マッチする各レコードのこのフィールドの値が異
なります。 米国住所のみ。
P
パススルー。 データは検証プロセスで使用されませんでした
が、出力に保持されました。 カナダの住所のみ。
R
地方配送路/Highway Contract が必須ですが、入力住所から欠
落しています。 米国住所のみ。
S
正規化。 このオプションには、標準の略語が含まれます。 米
国およびカナダの住所のみ。
U
不一致。 米国およびカナダの住所のみ。
Spectrum™ Technology Platform 8.0.0
第 29 章 : Universal Addressing モジュール
フィールド名
有効な値
V
RRHC.Type
StateProvince.Result
Street.Result
ユーザ ガイド
検証済み。 データは正しいことが確認され、入力から変更さ
れていません。 米国およびカナダの住所のみ。
これらの結果コードは米国住所のみに適用されます。
HC
住所は、Highway Contract 住所です。
RR
住所は、地方配送路住所です。
A
追加済み。 フィールドが空白の入力フィールドに追加されま
した。 米国およびカナダの住所のみ。
C
修正済み。 米国住所のみ。
M
複数。 入力住所が郵便データベース内の複数レコードにマッ
チし、マッチする各レコードのこのフィールドの値が異なり
ます。 米国またはカナダの住所には適用されません。
P
パススルー。 データは検証プロセスで使用されませんでした
が、出力に保持されました。 米国およびカナダの住所のみ。
R
アパート ラベルが必須ですが、入力住所から欠落しています。
米国住所のみ。
S
正規化。 このオプションには、標準の略語が含まれます。 米
国住所には適用されません。
U
不一致。 カナダの住所には適用されません。
V
検証済み。 データは正しいことが確認され、入力から変更さ
れていません。
これらの結果コードは国際住所のみに適用されます。
M
複数。 入力住所が郵便データベース内の複数レコードにマッ
チし、マッチする各レコードのこのフィールドの値が異なり
ます。
P
パススルー。 データは検証プロセスで使用されませんでした
が、出力に保持されました。
R
通りが修正済みです。 家番号が範囲外にあります。 英国およ
び日本のレコードのみに適用。
S
正規化。 このオプションには、標準の略語が含まれます。
1009
Validate Address
フィールド名
有効な値
U
不一致。
V
検証済み。 データは正しいことが確認され、入力から変更さ
れていません。
StreetName.AbbreviatedAlias.Result 省略形エイリアス処理の結果を示します。 次のいずれかを選択しま
す。
StreetName.Alias.Type
NULL
省略形エイリアス処理が実行されませんでした。
B
StreetName フィールドに基本通り名が格納されています。
L
正規化された住所長が 31 文字未満なので、StreetName
フィールドに基本名が格納されています。
N
省略形エイリアスが見つかりませんでした。
Y
省略形エイリアスが入力住所に見つかりました。 StreetName
フィールドに省略形エイリアスが格納されています。
この結果コードは米国住所のみに適用されます。
注: 以前のリリースでは、このフィールドは "Alias" と "Type" の間に
"." がない StreetName.AliasType という名前でした。 この古い名
前は廃止されました。 新しい名前 StreetName.Alias.Type を使用
するよう、プロセスを更新してください。
Abbreviated エイリアスは通り名の省略形です。 例えば、HARTSNM RD は HARTSVILLE NEW MARLBORO RD の省略
形エイリアスです。
1010
Changed
通り名が正式に変更された場合に、新しい名前を表すエ
イリアスです。 例えば、SHINGLE BROOK RD という
通り名が CANNING DR に変更された場合、CANNING
DR が変更済みのエイリアス タイプとなります。
Other
この通り名エイリアスには、通りの他の名前や、通りの
一般的な省略形などがあります。
Preferred
通り名エイリアスはその地域でよく使用されるエイリア
スです。 例えば、ある通りが "South Shore Dr." という
名前なのは、湖の南岸を通っているためで、地方自治体
の境界線の南にあるからではありません。 この場
合、"South" は前置方位記号ではないので、"S" と短縮
Spectrum™ Technology Platform 8.0.0
第 29 章 : Universal Addressing モジュール
フィールド名
有効な値
してはいけません。 したがって、"South Shore Dr." が
よく使用されるエイリアスになります。
StreetName.PreferredAlias.Result よく使用されるエイリアス処理の結果を示します。 次のいずれかを選
択します。
NULL よく使用されるエイリアス処理が実行されませんでした。
StreetName.Result
ユーザ ガイド
A
入力住所がエイリアスにマッチしたため、よく使用されるエ
イリアス処理が実行されませんでした。 よく使用されるエイ
リアス処理は、基本住所に対してのみ実行されます。
N
よく使用されるエイリアスが見つかりませんでした。
Y
入力住所に対してよく使用されるエイリアスが見つかりまし
た。 StreetName フィールドによく使用されるエイリアスが
格納されています。
A
追加済み。 フィールドが空白の入力フィールドに追加されま
した。 カナダの住所のみ。
C
修正済み。 米国およびカナダの住所のみ。
D
ドロップ済み。 入力に与えられたフィールドが削除されまし
た。 米国住所のみ。 詳細については、AdditionalInputData
について(1019ページ)を参照してください。
F
書式設定済み。 郵便規格に準拠するよう、スペースや句読文
字が変更されました。 米国またはカナダの住所には適用され
ません。
M
複数。 入力住所が郵便データベース内の複数レコードにマッ
チし、マッチする各レコードのこのフィールドの値が異なりま
す。 米国住所のみ。
P
パススルー。 データは検証プロセスで使用されませんでした
が、出力に保持されました。 米国住所には適用されません。
S
正規化。 このオプションには、標準の略語が含まれます。 米
国およびカナダの住所のみ。
U
不一致。
V
検証済み。 データは正しいことが確認され、入力から変更さ
れていません。
1011
Validate Address
フィールド名
StreetSuffix.Result
TrailingDirectional.Result
1012
有効な値
A
追加済み。 フィールドが空白の入力フィールドに追加されま
した。 米国およびカナダの住所のみ。
C
修正済み。 米国およびカナダの住所のみ。
D
ドロップ済み。 入力に与えられたフィールドが削除されまし
た。 米国およびカナダの住所のみ。 詳細については、
AdditionalInputData について(1019ページ)を参照してくださ
い。
F
書式設定済み。 郵便規格に準拠するよう、スペースや句読文
字が変更されました。 米国またはカナダの住所には適用され
ません。
M
複数。 入力住所が郵便データベース内の複数レコードにマッ
チし、マッチする各レコードのこのフィールドの値が異なりま
す。 米国住所のみ。
P
パススルー。 データは検証プロセスで使用されませんでした
が、出力に保持されました。 カナダの住所のみ。
S
正規化。 このオプションには、標準の略語が含まれます。
U
不一致。 米国住所には適用されません。
V
検証済み。 データは正しいことが確認され、入力から変更さ
れていません。
A
追加済み。 フィールドが空白の入力フィールドに追加されま
した。 米国およびカナダの住所のみ。
C
修正済み。 米国およびカナダの住所のみ。
D
ドロップ済み。 入力に与えられたフィールドが削除されまし
た。 米国およびカナダの住所のみ。 詳細については、
AdditionalInputData について(1019ページ)を参照してくださ
い。
F
書式設定済み。 郵便規格に準拠するよう、スペースや句読文
字が変更されました。 米国またはカナダの住所には適用され
ません。
M
複数。 入力住所が郵便データベース内の複数レコードにマッ
チし、マッチする各レコードのこのフィールドの値が異なりま
す。 米国住所のみ。
Spectrum™ Technology Platform 8.0.0
第 29 章 : Universal Addressing モジュール
フィールド名
USUrbanName.Result
有効な値
P
パススルー。 データは検証プロセスで使用されませんでした
が、出力に保持されました。 カナダの住所のみ。
S
正規化。 このオプションには、標準の略語が含まれます。
U
不一致。 カナダの住所には適用されません。
V
検証済み。 データは正しいことが確認され、入力から変更さ
れていません。
これらの結果コードは国際住所のみに適用されます。
A
追加済み。 フィールドが空白の入力フィールドに追加されま
した。
C
修正済み。
M
複数。 入力住所が郵便データベース内の複数レコードにマッ
チし、マッチする各レコードのこのフィールドの値が異なり
ます。
U
マッチしませんでした。
V
妥当性が確認されました。 データは正しいことが確認され、
入力から変更されていません。
オプションによる出力
Validate Address は、選択したオプションに応じて、追加のデータを返します。 各オプションによっ
て生成される出力については、以下のセクションのオプションの一覧を参照してください。
Enhanced Line of Travel 出力
Enhanced Line of Travel 処理では、以下の出力を生成します。
フィールド名
説明/有効値
USLOTCode
Line of Travel の順序コードと、USPS LOT 順序を表すインジケー
®
タ。 このフィールドは、"nnnnY" という形式で、以下の要素で構成さ
れます。
nnnn
ユーザ ガイド
4 桁の LOT コード。
1013
Validate Address
フィールド名
説明/有効値
Y
次のいずれかになります。
• A — 昇順の LOT 順序
• D — 降順の LOT 順序
USLOTHex
昇順でのみファイルのソートが可能な 16 進値です。 16 進値の範囲
は、昇順で 0 〜 FF に続き、降順で FF 〜 0 です。
USLOTSequence
アドオンの DPC の代わりに最終仕分けに使用される 2 バイトの値。
大文字 1 文字の後に 0 〜 9 の数字が 1 つ続きます。 値の範囲は、A0
(99 降順) 〜 J9 (00 降順)、および K0 (00 昇順) 〜 T9 (99 昇順) です。
Link
LACS
出力
フィールド名
説明/有効値
USLACS
住所が、LACS
Link
変換の候補であるかどうかを表します (米国住所の
み)。 次のいずれかになります。
Y 住所は LACSLink 処理の候補です。 LACSLink が有効である場合
Link
は、Validate Address は、LACS
データベースを使用して住所
Link
を変換します。 変換に成功した場合、出力住所は LACS
デー
タベースから取得した新しい住所になります。 変換できなかった
場合は、住所は変換されません。
N 住所は LACSLink 処理の候補ではありません。 ただし、LACSLink
Link
処理が要求され、LACS
データベースがインストールされてお
Link
り、かつ、次の条件のいずれかが満たされている場合は、LACS
処理が行われる場合があります。
• 住所が地方配送路住所にマッチし、RecordType.Default フィー
ルドで Y が返された場合。
• 入力住所が、米国 郵便データベースのいずれの住所にもマッチ
Link
しなかった場合 (複数にマッチしたことによる失敗は、LACS
の候補にはなりません)。
USLACS.ReturnCode
1014
Link
LACS
処理の成功または失敗を表します (米国住所のみ)。
Spectrum™ Technology Platform 8.0.0
第 29 章 : Universal Addressing モジュール
フィールド名
説明/有効値
A
Link
LACS
Link
処理によってレコー
Link
処理において、マッ
処理は成功しました。 LACS
ドがマッチしました。
00
Link
LACS
処理は失敗しました。 LACS
チするレコードは見つかりませんでした。
09
Link
LACS
処理において、入力住所は、古い高層のデフォルト
住所にマッチしました。 住所は変換されています。 不明確
Link
な住所の提供を避け、LACS
処理では、新しい住所を提供
しません。
14
Link
LACS
Link
処理は失敗しました。 LACS
処理において、マッ
®
チする結果が検出されましたが、他の USPS の規則に基づ
き、変換は行われませんでした。
92
Link
LACS
Link
処理は成功しました。 LACS
処理によってレコー
ドがマッチしました。 入力のユニット番号はドロップされま
した。
NULL LACSLink はレコードを処理しなかったか、または LACSLink
処理が実行されませんでした。
RDI 出力
フィールド名
説明/有効値
RDI
住所の種類を表す値を返します。
B
住所は、企業住所です。
R
住所は、個人住所です。
M
住所は、個人住所であるとともに企業住所でもあります。
NULL
住所が ZIP + 4 レベルでコード化されなかったか、または
®
™
RDI が実行されなかったため、確認されていません。
DPV および CMRA 出力
フィールド名
説明/有効値
DPV
Delivery Point Validation (DPV) 処理の結果を表します。
ユーザ ガイド
1015
Validate Address
フィールド名
説明/有効値
Y
DPV の確認済みです。
N
配達不可能な住所です。
S
主要な番号の妥当性は確認できましたが、補助的な番号は確
認できませんでした。
D
主要な番号の妥当性は確認できましたが、補助的な番号は入
力に欠落していました。
M
住所は複数の有効な配達ポイントにマッチします。
U
住所は、ZIP + 4 レベルでコード化されなかったため、確認
®
できませんでした。
V
CMRA
DPVFootnote
1016
住所は、誤検出違反を起こしました。 詳細については、DPV
誤検出違反の報告(1044ページ)を参照してください。
住所が Commercial Mail Receiving Agency (CMRA: 民間私書箱) であ
ることを表します。
Y
住所は CMRA です。
N
住所は CMRA ではありません。
U
確認できません。
DPV 補足コード。
®
AA
入力住所は、ZIP + 4 ファイルにマッチしました。
A1
入力住所は、ZIP + 4 ファイルにマッチしませんでした。
BB
入力住所は、DPV にマッチしました (すべてのコンポーネ
ント)。
CC
入力住所の主要な番号は DPV にマッチしましたが、補助
的な番号はマッチしませんでした (存在しましたが有効で
はありませんでした)。
N1
入力住所の主要な番号は DPV にマッチしましたが、高層
住所に補助的な番号が欠落しています。
M1
入力住所の主要な番号が欠落しています。
M3
入力住所の主要な番号が無効です。
P1
入力住所に、PO、RR、または HC Box 番号がありません。
®
Spectrum™ Technology Platform 8.0.0
第 29 章 : Universal Addressing モジュール
フィールド名
DPVVacant
DPVNoStat
Link
Suite
説明/有効値
RR
入力住所は、CMRA にマッチしました。
R1
入力住所は CMRA にマッチしましたが、補助的な番号が
存在しません。
建物が空家 (90 日間使用されていない) かどうかを表します。 次のい
ずれかになります。
Y
建物は空家です。
N
建物は空家ではありません。
NULL
[住所が空家であるかを調べる] オプションが選択されて
いません。
建物が、郵便物を受け取ることのできない "no stat" の建物であるかど
うかを表します。 次のいずれかになります。
Y
建物は、郵便物を受け取ることのできない "no stat" の建物
です。
N
建物は、郵便物を受け取ることのできない "no stat" の建物
ではありません。
NULL
[配達ポイントが郵便物受領可能かどうかを調べる] オプショ
ンが選択されていません。
出力
フィールド名
説明/有効値
SuiteLinkReturnCode
Validate Address が、補助的な住所情報を修正したかどうかを表しま
す (米国住所のみ)。 次のいずれかになります。
ユーザ ガイド
A
Validate Address は、補助的な住所情報を修正しました。
00
Validate Address は、補助的な住所情報を修正しませんで
した。
NULL
Suite
Link
は実行されませんでした。
1017
Validate Address
フィールド名
説明/有効値
XX
Link
処理においてエラーが発生しました。 例えば、
Link
データベースの有効期限が切れている場合にエ
Suite
Suite
ラーが発生します。
SuiteLinkMatchCode
Link
Suite
のマッチング処理に関する追加情報を提供します (米国住所
のみ)。
A
Validate Address は、補助的な住所情報を修正しました。
B
Validate Address は、補助的な住所情報を修正しませんでし
た。 マッチング処理に関するその他の詳細情報はありません。
C
FirmName フィールドの語はすべて、「ノイズ」語です。 ノ
®
イズ語は、USPS によって定義されており、企業名のマッチ
ングの際には無視されます。 ノイズ語の例として
は、"company" や "corporation" があります。 Validate Address
は、ノイズ語のみで構成される企業名に対し、補助的な住所情
報を修正できません。 例えば、"Company and Corporation" と
いう表記は、ノイズ語のみで構成されています。
D
Link
住所は、高層のデフォルト住所ではありません。 Suite
マッ
チングは、高層のデフォルト住所に対してのみ行われます。
高層デフォルトとは、住所に有効な補助的情報が含まれていな
い (アパート番号やアパート種別が欠落している) 場合に使用
されるデフォルトです。
E
Link
Suite
Link
データベースの有効期限が切れているため、Suite
処理は失敗しました。
NULL SuiteLink は実行されなかったか、エラーが発生しました。
SuiteLinkFidelity
Link
Validate Address における、Suite
データベースの企業名に対する
マッチング精度を表します。
Link
1
企業名は、Suite
2
精度の高いマッチです。 企業名に含まれる語が、1 語を除い
Link
てすべて Suite
データベースの企業名に一致しました。
3
精度の低いマッチです。 企業名の中の複数の語が、Suite
データベースに完全に一致しました。
Link
データベースの企業名に一致しませんでした。
NULL SuiteLink が企業名のマッチングに失敗したか、実行されなかっ
たか、またはエラーが発生しました。
1018
Spectrum™ Technology Platform 8.0.0
第 29 章 : Universal Addressing モジュール
AdditionalInputData について
Validate Address は、住所正規化プロセスにおいて、一部の入力データを無視します。 この余分なデー
タ ("ドロップ データ" と呼ばれることもあります) は、AdditionalInputData フィールドに返されます。
ドロップ データの例としては、次のものがあります。
• 配達指示 (「勝手口に置いてください」など)
• 電話番号 ("555-135-8792" など)
• 注意書き ("Attn: John Smith" など)
このようなデータは通常、住所に混在していることはありません。 混在している場合、Validate Address
はほとんどの場合にこの余分なデータを認識することができ、AdditionalInputData フィールドに返し
ます。
注: Validate Address は、split indicia 住所からのドロップ データを返しません。 split indicia 住所と
は、主要な住所が複数の住所行に分割されている住所のことです。 例えば、主要な住所が "1
Green River Valley Rd" である場合、 "1 Green River Valley Rd 01230" はこの住所に対する split
indicia 住所の例です。
住所に複数のドロップ データがある場合、各データは、米国住所の場合はセミコロンと空白 ("; ")、米
国外の住所の場合は空白で区切られます。 AdditionalInputData におけるドロップ データの順序は、次
のようになります。
1. care of (気付)、mail stop (郵便物集配所)(米国住所のみ)
2. 住所行に検出されたその他の余分なデータ
3. まったく未使用のデータ行
例えば、入力住所が次のとおりであるとします。
123 Main St C/O John Smith
Apt 5 Drop at back dock
[email protected]
555-123-4567
05674
この場合、AdditionalInputData には次のデータが含まれます。
C/O John Smith; Apt 5 Drop At Back Dock; 555-123-4567; [email protected]; 555-123-4567
Validate Address では、以下の種類の余分なデータを処理できます。
• Care Of (気付) データ(1019ページ)
• 独立した住所行に存在する余分なデータ(1020ページ)
• 住所行に混在する余分なデータ(1021ページ)
• 二重住所(1021ページ)
Care Of (気付) データ
米国住所のみに対し、"care of" データが AdditionalInputData に返されます。 以下の住所には、"care
of" データの例が含まれています。
ユーザ ガイド
1019
Validate Address
123 Main St C/O John Smith
Apt 5
05674
123 Main St
Apt 5 ATTN John Smith
05674
123 Main St Apt 5
MailStop 2
05674
独立した住所行に存在する余分なデータ
Validate Address は、米国およびカナダの住所に対し、独立した住所行に存在する余分なデータを返
します。
Validate Address は、米国住所に対し、住所行の空白でない最初の 2 行を使用して、住所の正規化を
行います。ただし、企業名抽出または都市化コード抽出のオプションが有効である場合を除きます (詳
細については、米国 住所に対する住所行処理(956ページ) を参照してください)。 他の住所行に存在
するデータは、AdditionalInputData に返されます。 以下の住所において、"John Smith" は
AdditionalInputData に返されます。"John Smith" は 空白でない 3 つめの住所行に存在しており、Validate
Address は、米国住所に対して、空白でない最初の 2 つの住所行のみを使用するためです。
123 Main St
Apt 5
John Smith
05674
空白でない最初の 2 つの住所行に余分なデータが含まれる場合、そのデータは AdditionalInputData に
返されます。 例えば、以下の住所において、"John Smith" は AdditionalAddressData に返されます。
123 Main St
John Smith
05674
John Smith
123 Main St
05674
以下の住所では、"John Smith" と "Apt 5" の両方が AdditionalAddressData に返されます。 "John Smith"
が返されるのは、これが、最初の 2 つの住所行の 1 つに存在する余分なデータであるためです。"Apt
5" が返されるのは、米国住所データは、空白でない最初の 2 行に記載しなければならないためです。
John Smith
123 Main St
Apt 5
05674
1020
Spectrum™ Technology Platform 8.0.0
第 29 章 : Universal Addressing モジュール
住所行に混在する余分なデータ
住所行に混在する余分なデータは、AdditionalInputData に返されます。 例えば、以下の住所におい
て、"John Smith" は AdditionalInputData に返されます。
123 Main St John Smith
05674
123 Main St Apt 5 John Smith
05674
123 Main St John Smith
Apt 5
05674
123 Main St
Apt 5 John Smith
05674
米国住所に対しては、住所行の末尾に存在する余分なデータのみが AdditionalInputData に返されま
す。 米国住所において、住所行の末尾以外に存在する余分なデータは返されません。 例えば、以下の
住所において、"John Smith" は返されません。
John Smith 123 Main St
05674
123 Main John Smith St
05674
マッチさせるために通り名が変更され、通り名または接尾語が行の末尾にあった場合は、
AdditionalInputData フィールドには、元の通り名や接尾語が含まれることがあります。 例えば、次の
住所があるとします。
Pitney Bowes Software
4200 Parlament
Lanham MD
Validate Address は、通り名の綴りを修正し、接尾語を追加して、修正済みの通りの住所として "4200
Parliament Pl" を返し、"Parlament" を AdditionalInputData に返します。
二重住所
二重住所とは、通り情報と、PO Box/地方配送路/Highway Contract 情報の両方を含む住所のことです。
選択した処理オプションに応じて、住所の正規化に使用されない二重住所の一部が、AdditionalInputData
に返される場合があります。 詳細については、二重住所ロジックについて(967ページ)を参照してく
ださい。
ユーザ ガイド
1021
Validate Address Global
レポート
USPS CASS 3553 レポート
USPS から値引きを受けるには、USPS CASS 3553 レポートを郵便物と一緒に渡す必要があります。
レポートには CASS 処理に使用したソフトウェアに関する情報、名前と住所のリストに関する情報、
出力ファイルに関する情報、差出人に関する情報、およびその他の郵便物に関する統計が含まれます。
USPS Form 3553 の詳細については、www.usps.com を参照してください。
CASS 設定の詳細については、CASS Certified 処理(976ページ)を参照してください。 レポートの
使用方法については、レポート(185ページ)を参照してください。
Validate Address サマリ レポート
Validate Address サマリ レポートには、処理されたレコードの合計数や、検証された住所の数など、
ジョブに関する統計が一覧表示されます。 レポートの使用方法については、レポート(185ページ)を
参照してください。
Validate Address Global
Validate Address Globalは、米国およびカナダ以外の住所に対する高度な住所の正規化および検証機能
を提供します。 Validate Address Global は、米国およびカナダの住所の妥当性も確認できますが、そ
の他の国の住所の妥当性を確認する能力に優れています。 米国およびカナダ以外の住所宛ての郵便物
を大量に処理する場合は、Validate Address Global の使用を検討してください。
Validate Address Global は Universal Addressing モジュールの一部です。 Universal Addressing モ
ジュールの詳細 (これに含まれるその他のコンポーネント等) については、Universal Addressing モ
ジュールとは(926ページ) を参照してください。
Validate Address Global は、書き直し、パーシング、バリデーション、書式設定など、いくつもの手
順を実行して、住所の品質を高めています。
文字セットのマッピングと書き直し
Validate Address Global は他国の文字列と、それらの複雑な問題を処理します。 Unicode に完全対応
の文字列処理を使用するため、アルファベット以外の文字をラテン文字セットに書き直したり、異な
る文字セット間でマッピングしたりできます。
文字セットのマッピング、および書き直しについて、以下の機能があります。
• UTF-8、 ISO 8859-1、GBK、BIG5、JIS、EBCDIC など、30 以上の文字セットをサポート
• 言語のルールに従って、付加記号を正しく "除去"
• さまざまなアルファベットをラテン スクリプトに書き直し
• ギリシャ文字 (BGN/PCGN 1962、ISO 843 - 1997)
1022
Spectrum™ Technology Platform 8.0.0
第 29 章 : Universal Addressing モジュール
• キリル文字 (BGN/PCGN 1947、 ISO 9 - 1995)
• ヘブライ文字
• 日本語の片仮名、平仮名、漢字
• 中国語のピンイン (標準中国語、 広東語)
• 韓国語のハングル文字
住所のパーシング、書式設定、および正規化
住所データのフィールド入力の誤りを再構成することは、特に他国の住所で行う場合、複雑で難しい
作業です。 住所データをコンピュータのシステムに入力する際、曖昧になってしまう部分が多いから
です。 特に問題なのが、(企業や個人名を通りの住所フィールドに入力するなど) 要素を誤ったフィー
ルドに入力したり、省略形を使用する場合に、言語固有だけでなく、国固有の省略形に変えてしまう
ケースです。 Validate Address Global は住所行の住所要素を識別し、正しいフィールドに割り当てま
す。 これは実際の検証前に行う重要な作業です。 再構成を行わなければ、"一致が見つからない" とい
う結果になる可能性があります。
住所要素の正しい識別は、特定のフィールド長要件に合わせて住所を切り捨てたり、短縮しなければ
ならない場合にも重要です。 正しい情報が正しいフィールドに割り当てられていれば、特定の切り捨
てルールを適用することができます。
• 住所行をパースおよび解析し、個々の住所要素を識別
• 30 を越える文字セットを処理
• 宛先国の郵便ルールに従って住所の書式を整える
• 住所要素を正規化 (AVENUE を AVE に変更するなど)
Global Address 検証
住所の検証は、正しくパースされた住所データを郵便組織または他のデータ プロバイダが提供する参
照データベースと比較する訂正処理です。 Validate Address Global は、洗練されたファジー マッチン
グ テクノロジーを使用して個々の住所要素を検証し、正しいことを確認するとともに、郵便規格と
ユーザの優先設定に基づいて出力を正規化および書式設定します。 FastCompletion 検証タイプは、簡
易住所入力アプリケーションに使用できます。 いくつかの住所フィールドには切り捨てられたデータ
を入力することができ、この入力に基づいて提案を生成します。
住所を完全に検証できない場合もあります。 Validate Address Global には、配達可能性によって住所
を分類する、ユニークな配達可能性評価機能があります。
入力
Validate Address Global は、入力として標準住所を受け取ります。 どの国の住所であるかにかかわら
ず、すべての住所がこのフォーマットを使用します。
注: API でこのコンポーネントを操作する場合は、DataTable クラスを使用して入力を指定します。
以下で説明するフィールドは、DataTable クラスにおける有効な列名です。DataTable クラスの
詳細については、API ユーザ ガイドの「API の基礎」のセクションを 参照してください。.
ユーザ ガイド
1023
Validate Address Global
表 210 : Validate Address Global の入力
フィールド名
書式
説明/有効値
AddressLine1 から
AddressLine6
文字列
[79]
これらのフィールドには住所行データが格納されます。
AddressLine1 には最初の住所行、AddressLine2 には 2 行目
の住所行が格納されます。以降もこれと同様になります。
都市、州/省、および郵便番号情報は、住所行フィールドで
はなく、それぞれのフィールドに配置する必要があります。
例えば、
AddressLine1: 17413 Blodgett Road
AddressLine2: PO Box 123
City: Mount Vernon
StateProvice: WA
PostalCode: 97273
Country: USA
入力住所が適切な住所行および City、StateProvice、
PostalCode フィールドにまだパースされていない場合は、
住所行フィールドの代わりに UnformattedLine フィールドを
使用してください。
City
文字列
[79]
都市名
StateProvince
文字列
[79]
州または省。
PostalCode
文字列
[79]:
住所の郵便番号。 米国では、ZIP Code と呼びます。
®
99999
999999999
A9A9A9
A9A 9A9
9999
999
Contact
Country
1024
文字列
[79]
受取人の名前。 例えば "Mr. Jones" など。
文字列
[79]
国名。 [強制国 (ISO3 形式)] オプションまたは [デフォルト
国 (ISO3 形式)] オプションに値が指定されていない場合、
国を指定する必要があります。
Spectrum™ Technology Platform 8.0.0
第 29 章 : Universal Addressing モジュール
フィールド名
書式
説明/有効値
FirmName
文字列
[79]
会社名または企業名
Street
文字列
[79]
通り
Number
Building 数値
[79]
Building
文字列
[79]
Building
SubBuilding
文字列
[79]
従属する建物
DeliveryService
文字列
[79]
配送サービス
UnformattedLine1 から
UnformattedLine10
文字列
[79]
入力住所が完全にパースされていない場合、かつ Validate
Address Global によって住所を適切なフィールドにパース
したい場合は、このフィールドを使用してください。 例え
ば、
UnformattedLine1: 17413 Blodgett Road
UnformattedLine2: PO Box 123
UnformattedLine3: Mount Vernon WA 97273
UnformattedLine4: USA
この住所は、以下の出力フィールドにパーシングされます。
AddressLine1: 17413 Blodgett Road
AddressLine2: PO Box 123
City: Mount Vernon
StateProvice: WA
PostalCode: 97273
Country: USA
注: フォーマットされていない行フィールドへの入力を指
定した場合は、住所全体をフォーマットされていない
行フィールドだけを使用して指定する必要があります。
City や StateProvince など、その他のフィールドを、
フォーマットされていない行フィールドと合わせて使
用することはできません。
ユーザ ガイド
1025
Validate Address Global
オプション
入力オプション
表 211 : Validate Address Global 入力オプション
オプション
説明/有効値
データベース
住所検証で使用する郵便データを含むデータベース リソースを指定しま
す。 指定できるのは、Management Console の [グローバル データベース
リソース] パネルで定義されたデータベースに限られます。 詳細について
は、Validate Address Global のデータベース リソースの追加(239ページ)
を参照してください。
デフォルト国 (ISO3
フォーマット)
入力レコードに明示的な国情報が含まれない場合に使用するデフォルト国
を指定します。 指定する際、ISO3 の国コードを使用してください。 デフォ
ルト国を指定しない場合、各入力レコードの Country 入力フィールドに国
を指定する必要があります。 一覧については、各国の ISO コードとモジュー
ル サポート(1086ページ)を参照してください。
住所レコードが、常にここで指定された国から発送されたものとして扱わ
強制国 (ISO3 フォーマッ
れるようにします。住所レコードの国やデフォルト国は上書きされます。
ト)
指定する際、ISO3 の国コードを使用してください。 一覧については、各
国の ISO コードとモジュール サポート(1086ページ)を参照してください。
Output オプション
表 212 : Validate Address Global 出力オプション
オプション
返される結果の最大数
説明/有効値
このオプションには、返される候補住所の最大数を指定します。 デ
フォルト値は 1 です。 最大数は 20 です。 FastCompletion モードを
使用している場合は、1 よりも大きい数を入力して、フィールド入力
のための選択肢が複数返されるようにするとよいでしょう。
入力データを結果とともに返 出力の中に、入力データを含めるかどうかを指定します。 有効にする
す
と、.Input で終わるフィールド (対応する入力フィールドを含む) が出
力に含まれます。 例えば、出力フィールドの AddressLine1.Input に、
入力フィールドの AddressLine1 に指定したデータが含まれます。
1026
Spectrum™ Technology Platform 8.0.0
第 29 章 : Universal Addressing モジュール
オプション
説明/有効値
州/省
StateProvince フィールドのフォーマットを指定します。 次のいずれ
かを選択します。
国フォーマット
略語
州または省の省略形を返します。 例えば、North Carolina
であれば "NC" が返ります。
国標準
その国の郵便当局で使用されるフォーマットに応じて、
省略形または完全な名前が返ります (デフォルト)。
拡張
州または省の (省略形ではなく) 完全な名前が返ります
(例えば、"North Carolina" など)。
Validate Address Global から返される国名で使用する言語またはコー
ドを指定します。
• 中国語
• デンマーク語
• オランダ語
• 英語 (デフォルト)
• フィンランド語
• フランス語
• ドイツ語
• ギリシア語
• ハンガリー語
• ISO 番号 (国の ISO 番号を返します)
• ISO2 (2 文字の ISO 国コードを返します)
• ISO3 (3 文字の ISO 国コードを返します)
• イタリア語
• 日本語
• 韓国語
• ポーランド語
• ポルトガル語
• ロシア語
• サンスクリット語
• スペイン語
• スウェーデン語
スクリプト/アルファベット
ユーザ ガイド
出力がどのアルファベットで返されるかを指定します。 データがどの
アルファベットで返されるかは、国によって異なります。 言語の設定
1027
Validate Address Global
オプション
説明/有効値
で何を選択したかに関わらず、ほとんどの国で出力は Latin I になりま
す。
ASCII 拡張
特殊文字 (A– = OE など) で拡張された ASCII
文字
ASCII 簡易
ASCII 文字
データベース
(デフォルト) Latin I または ASCII 文字 (参照
データベースの標準による)
Latin
Latin I 文字
Latin alternate
Latin I 文字 (代替の書き直し)
Postal admin
alternate
Latin I または ASCII 文字 (現地郵便局の代替)
Postal admin
preferred
Latin I または ASCII 文字 (現地郵便局の選択
による)
Latin I 以外のアルファベットを使用する国の場合、返されるアルファ
ベットは国によって異なります。 詳細については、Latin 1 以外のア
ルファベットを使用する国(1029ページ)を参照してください。
言語
大文字小文字
1028
出力がどの言語で返されるかを指定します。 データがどのアルファ
ベットで返されるかは、国によって異なりますが、ほとんどの国で、
言語の設定に何を選択したかに関わらず、出力は Latin I になります。
データベース
各住所の参照データから得られた言語で返されま
す。 こちらがデフォルトです。
英語
地方および州/省の名前が (可能であれば) 英語で出
力されます。
出力の大文字と小文字の区別を指定します。
ネイティブ
参照データベースの標準に基づいて出力されます。
大文字
すべての国で、大文字で出力されます。
小文字
すべての国で、小文字で出力されます。
混在
国固有のルールに従って大文字と小文字が判断されま
す。
変更なし
パース モードの場合、データは入力された方法で返さ
れます。 バリデーション モードの場合、大文字と小
Spectrum™ Technology Platform 8.0.0
第 29 章 : Universal Addressing モジュール
オプション
説明/有効値
文字の区別には参照データに見つかったものや、郵便
のルールに従ったものを使用します。 参照データを使
用してチェックできなかった値は、入力時の大文字と
小文字の区別を保持します。
Latin 1 以外のアルファベットを使用する国
Latin I 以外のアルファベットを使用する国の場合、返されるアルファベットは国によって異なります。
それらの国々で、出力がどのように返されるかを以下の表に示します。 ここに含まれないすべての国
では、[スクリプト/アルファベット] フィールド オプションに指定された値が使用されます 。
国
データ
ベース
Postal
admin
preferred
Postal
admin
alternate
Latin
RUS
Cyrillic
Cyrillic
Cyrillic
CYRILLIC_ISO CYRILLIC_BGN CYRILLIC_ISO CYRILLIC_ISO
+
+ LATIN
LATIN_SIMPLE
JPN
Kanji
Kanji
Kana
JAPANESE
CHN
Hanzi
Hanzi
Hanzi
CHINESE_ CHINESE_ CHINESE_ CHINESE_
MANDARIN CANTONESE MANDARIN MANDARIN
+
+ LATIN
LATIN_SIMPLE
HKG
Hanzi
Hanzi
Hanzi
CHINESE_ CHINESE_ CHINESE_ CHINESE_
CANTONESE MANDARIN CANTONESE CANTONESE
+
+ LATIN
LATIN_SIMPLE
TWN
Hanzi
Hanzi
Hanzi
CHINESE_ CHINESE_ CHINESE_ CHINESE_
CANTONESE MANDARIN CANTONESE CANTONESE
+
+ LATIN
LATIN_SIMPLE
GRC
Greek
Greek
Greek
GREEK_ISO GREEK_BGN GREEK_ISO GREEK_ISO
+
+ LATIN
LATIN_SIMPLE
KOR
Latin
Hangul
Hanja
KOREAN
KOREAN
KOREAN + KOREAN +
LATIN_SIMPLE LATIN
ISR
Latin
Hebrew
Hebrew
HEBREW
HEBREW
HEBREW + HEBREW +
LATIN_SIMPLE LATIN
ユーザ ガイド
Latin
alternate
JAPANESE
ASCII 簡易
ASCII 拡張
JAPANESE JAPANESE
+
+ LATIN
LATIN_SIMPLE
1029
Validate Address Global
国
データ
ベース
Postal
admin
preferred
Postal
admin
alternate
Latin
Latin
alternate
ASCII 簡易
ROM
Latin-3
Latin-3
Latin-3
Latin-3
Latin-3
LATIN_SIMPLE LATIN
POL
Latin-2
Latin-2
Latin-2
Latin-2
Latin-2
LATIN_SIMPLE LATIN
CZE
Latin-2
Latin-2
Latin-2
Latin-2
Latin-2
LATIN_SIMPLE LATIN
CRI
Latin-2
Latin-2
Latin-2
Latin-2
Latin-2
LATIN_SIMPLE LATIN
HUN
Latin-2
Latin-2
Latin-2
Latin-2
Latin-2
LATIN_SIMPLE LATIN
MDA
Latin-2
Latin-2
Latin-2
Latin-2
Latin-2
LATIN_SIMPLE LATIN
SVK
Latin-2
Latin-2
Latin-2
Latin-2
Latin-2
LATIN_SIMPLE LATIN
LAT
Latin-7
Latin-7
Latin-7
Latin-7
Latin-7
LATIN_SIMPLE LATIN
ASCII 拡張
プロセス オプション
表 213 : Validate Address Global プロセス オプション
オプション
説明/有効値
最適化レベル
このオプションを使用して、処理速度と品質が適切なバランスを保つよう
設定します。 次のいずれかを選択します。
狭く
パーサーは、House Number を Street の情報から分割することを
除き、入力の割り当てに厳密に従います。
標準
パーサーは、以下に示すように住所要素をよりアクティブに分割
します。
• Province は Locality の情報から分割される
• PostalCode は Locality の情報から分割される
• House Number は Street の情報から分割される
• SubBuilding は Street の情報から分割される
• DeliveryService は Street の情報から分割される
• SubBuilding は Building の情報から分割される
• Locality は PostalCode の情報から分割される
広く
1030
パーサーによる分割は [標準] と似た方法で行われますが、追加で
最大 10 のパーシング候補が検証に渡されて処理されます。 検証
は検索のツリーを広げ、参照データのエントリを対象に追加して
マッチングを行います。
Spectrum™ Technology Platform 8.0.0
第 29 章 : Universal Addressing モジュール
オプション
説明/有効値
最適化レベルを調整しても、ここで説明したような分割で必要とされる郵
便参照データ情報が揃っていない国においては、効果が得られない場合が
あります。
分類の精度を [狭く] から [標準] に増やしても処理パワーはある程度消費さ
れますが、最適化レベルを [広く] に設定し、検索ツリーを大きくして検証
を行った場合、指定された入力データから最も精密な結果を得ようとデー
タのアクセスや比較の件数が増加するため、処理速度が非常に遅くなりま
す。
処理モード
住所に対して実行する処理のタイプを指定します。 次のいずれかを選択し
ます。
バッチ このモードは手動でのデータの入力または選択が不可能なバッチ
処理環境で使用します。 処理速度を重視して最適化されている
ため、自動で修正できないあいまいなデータが見つかった場合
は、住所修正の試行が停止します。 指定の国がデータベースに
見つからない場合、バッチ処理モードはパース モードに変更さ
れます。
確認済 このモードはオーストラリア郵便当局のバッチ処理環境で使用し
み
ます。 Validate Address Global はオーストラリア郵便公社の
Address Matching Approval System (AMAS) で認定されていま
す。 これは郵便住所ファイルに照らして郵便の正規化と検証を
行うことで、郵便料金の割引と不達郵便物の最小化を実現しま
す。
高速実 高速実行モードは、切り捨て処理されたデータを住所フィールド
行
に入力して、Validate Address Global による提案の生成を行いた
い場合に使用します。 例えば、コール センターや店頭などで作
業をしている場合に住所要素の一部だけを入力し、高速実行の機
能を使用して、完全な住所の候補を正しく入手することができま
す。
対話型 このモードは、インタラクティブな環境で処理を行い、住所入力
があいまいな場合に提案を生成する場合に使用します。 このタ
イプの検証は、とりわけ顧客や潜在顧客から入手したデータを入
力した環境で使用されます。 住所がほぼ完全に入力されている
必要があり、その入力データの検証や修正を試行します。 あい
まいなデータが検出された場合、この検証 タイプでは最大で 20
の提案が生成され、それを選択候補の一覧として使用できます。
指定の国がデータベースに見つからない場合、インタラクティブ
モードはパース モードに変更されます。
ユーザ ガイド
1031
Validate Address Global
オプション
説明/有効値
パース このモードは住所入力をトークンに分割し、そのあとに他のシス
テムで行われる処理に送る場合、すなわち検証をバイパスする場
合に使用します。 例えば、住所データの品質がすでに高く、単
に素早くトークンに分割して外部のシステムにエクスポートする
か、あるいは下流のステージで使用する場合にこのモードを利用
できます。
マッチング範囲
住所が検証されるために、住所がどの程度参照データと一致する必要があ
るかを指定します。 次のいずれかを選択します。
注: 以下の設定は、必要とされる詳細情報が郵便参照データに見つからな
い国に対しては効果がない場合があります。
すべてのレベル
すべての住所要素が一致する必要があります。
配達ポイント レベ Validate Global Address で州/省、郵便番号、都市/地
ル
方/郊外、通り、家番号、および従属する建物が一致
する必要があります。
通りレベル
Validate Global Address で州/省、郵便番号、都市/地
方/郊外、および通りが一致する必要があります。
地方レベル
Validate Global Address で州/省、郵便番号、および
都市/地方/郊外が一致する必要があります。
出力
住所データ
表 214 : パース済み住所要素
フィールド名
AddressBlock1-9
1032
説明
AddressBlock 出力フィールドには、正規化済み、または標準化済みの
住所が、実際の郵便物に印刷される形式にフォーマットされて入りま
す。 Validate Address Global は住所を郵便当局の規格に従って住所ブ
ロックにフォーマットします。 住所の各行が、別々の住所ブロック
フィールドに入れて返されます。 AddressBlock1 から AddressBlock9
まで、最高で 9 つの住所ブロック出力フィールドが 使用されます。
例えば、以下の住所入力の場合、
Spectrum™ Technology Platform 8.0.0
第 29 章 : Universal Addressing モジュール
フィールド名
説明
AddressLine1: 4200 Parliament Place
AddressLine2: Suite 600
City: Lanham
StateProvince: MD
PostalCode: 20706
以下の住所ブロックが出力されます。
AddressBlock1: 4200 PARLIAMENTPL STE 600
AddressBlock2: LANHAM MD 20706-1882
AddressLine1-6
住所が検証された場合、住所行フィールドには検証済みで正規化済み
の住所行が入ります。 住所が検証できなかった場合、住所行フィール
ドには入力された住所が変更されずに入ります。 ただし、住所の最後
の行は LastLine フィールドに入ります。 例えば、以下のようになり
ます。
AddressLine1: 4200 PARLIAMENT PL STE600Last
Line: LANHAM MD 20706-1882
AdministrativeDistrict
州/省より小さいが、都市よりも大きいエリア
ApartmentLabel
アパートや住宅の種類 (STE や APT など)。例: 123 E Main St Apt 3
ApartmentNumber
アパートや住宅の番号。例: 123 E Main St Apt 3
BlockName
地所やブロックの名前。
BuildingName
建物の名前。例えば Sears Tower など。
City
都市の名前。 例えば Vancouver, BC など。
City.AddInfo
都市の追加情報。
City.SortingCode
例えばプラハやダブリンなど、特定の国の広い地方で、郵便当局が配
達時間を短縮するために使用するコード。
Contact
受取人の名前。 例えば Mr. Jones など。
Country
国が、言語または 国フォーマット オプションで指定されたコードで
入ります。
County
州や省に従属する情報。州や省をさらに細かく分割します。 米国の郡
はその一例です。
FirmName
会社名。
ユーザ ガイド
1033
Validate Address Global
フィールド名
説明
Floor
部屋番号やアパート番号など、建物をさらに細かく分割する情報。 例:
123 E Main St Apt 3, 4th Floor
HouseNumber
家番号 1。例: 298A-1B New South Head Rd
LastLine
最後の住所行を完成させます (都市、州/省、および郵便番号)。
LeadingDirectional
通り名の前に付けて通りの方向を表します。 例えば、138 N Main
Street の N がこれに該当します。
Locality
場所の名前に従属し、地方をさらに細かく分割します。 例としては、
メキシコの Colonia や、スペインの Urbanisaciones などがあります。
POBox
郵便受けの記述子 (POBox、Postfach、Case Postale など) と番号。
PostalCode
住所の郵便番号。 郵便番号のフォーマットは国によって異なります。
PostalCode.AddOn
郵便番号の 2 番目の部分。 例えば、カナダの住所ではこれは LDU で
す。 米国住所では、これは ZIP + 4 アドオンです。 ほとんどの国では
このフィールドを使用しません。
PostalCode.Base
郵便番号の基本部分。
Room
建物の部屋番号。
SecondaryStreet
補助的な通りまたは地方集配路の名前。
StateProvince
州または省の名前。
StreetName
不動産がある通りの名前。例: 123 E Main St Apt 3
StreetSuffix
通り接尾語。例: 123 E Main St Apt 3
SubBuilding
部屋番号など建物の一部。 例えば Suite 102 など。
Suburb
場所の名前に従属し、地方をさらに細かく分割します。 例えばトルコ
の Mahalle など。
Territory
地域の名前。 地域は州/省より大きいものです。
TrailingDirectional
接尾方向指示。例: 123 Pennsylvania Ave NW
元の入力データ
このオプションは、元の入力データを <フィールド名>.Input フィールドに出力します。
1034
Spectrum™ Technology Platform 8.0.0
第 29 章 : Universal Addressing モジュール
表 215 : 元の入力データ
フィールド名
書式
説明/有効値
AddressLine1.Input
文字列
[79]
最初の住所行。
AddressLine2.Input
文字列
[79]
2 行目の住所行。
AddressLine3.Input
文字列
[79]
3 行目の住所行。
AddressLine4.Input
文字列
[79]
4 行目の住所行。
AddressLine5.Input
文字列
[79]
5 行目の住所行。
AddressLine6.Input
文字列
[79]
6 行目の住所行。
City.Input
文字列
[79]
都市名
StateProvince.Input
文字列
[79]
州または省
PostalCode.Input
文字列
[79]
住所の郵便番号。 米国では、ZIP Code と呼びます。 次の
いずれかのフォーマットです。
99999
99999-9999
A9A9A9
A9A 9A9
9999 999
Contact.Input
文字列
[79]
受取人の名前。 例えば "Mr. Jones" など。
Country.Input
文字列
[79]
入力の国フォーマットに選択したフォーマットを使用して
国を指定します (英語名、ISO コード、または UPU コード)。
ユーザ ガイド
1035
Validate Address Global
フィールド名
書式
説明/有効値
有効な値の一覧は、各国の ISO コードとモジュール サポー
ト(1086ページ)を参照してください。
FirmName.Input
文字列
[79]
会社名または企業名
Street.Input
文字列
[79]
通り
Number.Input
Building 数値
[79]
Building.Input
文字列
[79]
建物
SubBuilding.Input
文字列
[79]
従属する建物
DeliveryService.Input
文字列
[79]
配送サービス
結果コード
これらの出力フィールドには、検証処理の結果に関する情報が格納されます。
表 216 : 結果コード
フィールド名
AddressType
1036
結果コード
米国とカナダの住所の場合のみ、AddressType フィールドは住所のタイプ
を示します。 次のいずれかが入ります。
F
住所の妥当性が確認され社名まで修正されました。
B
住所の妥当性が確認され建物名まで修正されました。
G
住所は局留めの住所です。
H
住所の妥当性が確認され高層のデフォルトまで修正されました。
L
住所は、Large Volume Receiver (LVR) です。
M
住所は、軍施設の住所です。
Spectrum™ Technology Platform 8.0.0
第 29 章 : Universal Addressing モジュール
フィールド名
Confidence
CountOverflow
ElementInputStatus
結果コード
P
住所の妥当性が確認され私書箱まで修正されました。
R
住所の妥当性が確認され地方配送路まで修正されました。
S
住所の妥当性が確認され通りの住所まで修正されました。
U
タイプが不明なために住所を検証/修正できませんでした。
返された住所に割り当てられた確信レベル。 範囲は 0 〜 100 です。0 は失
敗を表し、100 はマッチ結果が正しいことに対する確信レベルが非常に高
いことを表します。
候補住所数が返される数より多いかどうかを示します。 次のいずれかを選
択します。
はい
他の候補住所があります。 他の候補を取得するには、[返
される結果の最大数] の値を増やします。
いいえ
いいえ、これ以外の候補はありません。
ElementInputStatus は入力要素を参照データに対してマッチングした際の
要素ごとの情報を提供します。 このフィールドの値は、バッチとパースの
どちらのモードを使用するかによって変わります。 このフィールドの値に
ついては、ElementInputStatus、 ElementResultStatus、および
ElementRelevance の解釈(1040ページ)を参照してください。
ElementRelevance
その土地の郵便当局の基準から基準から判断して、実際にどの住所要素が
関連しているかを示します。 このフィールドの値については、
ElementInputStatus、 ElementResultStatus、および ElementRelevance
の解釈(1040ページ)を参照してください。
ElementResultStatus
ElementResultStatus は、出力フィールドが入力フィールドから変更されて
いるか、またどのように変わっているかを示すことによって、結果を
ProcessStatus フィールドよりも詳細に分類します。 このフィールドの値
については、ElementInputStatus、 ElementResultStatus、および
ElementRelevance の解釈(1040ページ)を参照してください。
MailabilityScore
ユーザ ガイド
郵便が住所にどの程度確実に配達されるかの予測を示します。 次のいずれ
かになります。
5
確実に配達される
4
ほぼ確実に配達される
1037
Validate Address Global
フィールド名
結果コード
3
おそらく配達される
2
五分五分
1
配達されない可能性が高い
0
配達されない
ModeUsed
使用された処理モードを示します。 処理モードは [処理モード] モードの
説明については、プロセス オプション(1030ページ)を参照してください。
MultimatchCount
住所が参照データ内の複数の候補住所と一致した場合、このフィールドに
は一致した候補の数が含まれます。
ProcessStatus
出力の品質に関する一般的な記述が含まれます。 出力の品質について、詳
しくは ElementResultStatus フィールドを参照してください。
次のいずれかが入ります。
1038
V4
検証済み。 正しい入力データです。 すべての要素がチェックさ
れ、入力データが完全に一致しました。
V3
検証済み。 入力されたデータは正しいものですが、一部または
すべての要素が正規化されたか、あるいは入力データに旧式の名
前または外名 (エクソニム) が含まれます。
V2
検証済み。 正しい入力データですが、一部の要素について、参
照データが完全でないために検証できていません。
V1
検証済み。 正しい入力データですが、ユーザによる正規化によっ
て、正しく配達される可能性が損なわれています(たとえば選択
された郵便番号の長さが短すぎるなど、ユーザによって要素の正
規化が正しく行われていない)。 検証によってセットされませ
ん。
C4
修正済み。 すべての要素がチェック済みです。
C3
修正済みですが、一部の要素をチェックできませんでした。
C2
修正済みですが、配達のステータスがわかりません (参照データ
がありません)。
C1
修正済みですが、ユーザによる正規化が正しくなかったため、配
達のステータスがわかりません。 検証によってセットされませ
ん。
Spectrum™ Technology Platform 8.0.0
第 29 章 : Universal Addressing モジュール
フィールド名
ユーザ ガイド
結果コード
I4
データを完全には修正できませんでしたが、かなりの確率で正し
く配達されます。 単一の一致が見つかりました (例えば HNO は
誤りだが、参照データに HNO が 1 件だけ見つかるような場合)。
I3
データを完全には修正できませんでしたが、かなりの確率で正し
く配達されます。 複数の一致が見つかりました (例えば HNO は
誤りだが、参照データに複数の HNO が見つかるような場合)。
I2
データを修正できませんでしたが、この住所で正しく配達される
可能性がわずかにあります。
I1
データを修正することができず、正しく配達される可能性もほと
んどありません。
RA
国が強制国の設定から認識されました。
R9
国が DefaultCountryISO3 の設定から認識されました。
R8
国が名前からエラーなしで認識されました。
R7
国が名前からエラー付きで認識されました。
R6
国が地域から認識されました。
R5
国が省から認識されました。
R4
国が主要な都市から認識されました。
R3
国がフォーマットから認識されました。
R2
国がスクリプトから認識されました。
R1
国が認識されませんでした。複数の一致が見つかりました。
R0
国が認識されませんでした。
S4
完全にパースされました。
S3
パースされ、複数の結果が得られました。
S2
パースされ、エラーが発生しました。 要素の位置が変わってい
ます。
S1
パース エラー。 入力フォーマットが一致しません。
N1
バリデーション エラー。 国が認識されなかったため、検証が実
行されませんでした。
N2
バリデーション エラー。 必要な参照データベースを使用できな
いため、検証が実行されませんでした。
1039
Validate Address Global
フィールド名
Status
結果コード
N3
バリデーション エラー。 国をロック解除できなかったため、検
証が実行されませんでした。
N4
バリデーション エラー。 参照データベースが破損しているか、
フォーマットが正しくないため、検証が実行されませんでした。
N5
バリデーション エラー。 参照データベースが古すぎるため、検
証が実行されませんでした。
N6
バリデーション エラー。 入力データが十分でないため、検証が
実行されませんでした。
Q3
FastCompletion ステータス。 提案 (完全な住所) を利用可能 で
す。
Q2
FastCompletion ステータス。 完全な住所が提案されましたが、
入力データの要素と組み合わせられています (追加または削除)。
Q1
FastCompletion ステータス。 提案された住所は完全ではありま
せん (情報を追加してください)。
Q0
FastCompletion ステータス。 十分でない情報から提案が生成さ
れました。
処理試行が成功したか失敗したかをレポートします。
NULL
成功
F
失敗
Status.Code
失敗したものがあれば、その理由を示します。
Status.Description
失敗したものがあれば、その理由を説明する記述が入ります。
ElementInputStatus、 ElementResultStatus、および ElementRelevance の解釈
ElementInputStatus、ElementResultStatus、および ElementRelevance の出力フィールドには、検証
操作の結果を詳細に示す一連の数字が含まれます。 ElementInputStatus にはパーシング操作に関する
いくつかの情報が含まれます。
ElementInputStatus の値は以下のようになります。
44606040600000000060
ElementResultStatus の値は以下のようになります。
88F0F870F00000000040
ElementRelevance の値は以下のようになります。
1040
Spectrum™ Technology Platform 8.0.0
第 29 章 : Universal Addressing モジュール
11101010100000000000
これらのフィールドの値について理解するためには、各ポジションの数字がどの要素を表すか、およ
び各ポジションの値の意味を知る必要があります。 たとえば、先頭の数字は PostalCode.Base 出力
フィールドの結果を示します。 以下に各ポジションの意味を一覧で示します。
• ポジション 1—PostalCode.Base
• ポジション 2—PostalCode.AddOn
• ポジション 3—City
• ポジション 4—Locality および Suburb
• ポジション 5—StateProvice
• ポジション 6—County
• ポジション 7—StreetName
• ポジション 8—SecondaryStreet
• ポジション 9—HouseNumber
• ポジション 10—Number レベル 1
• ポジション 11—POBox
• ポジション 12—Delivery サービス レベル 1
• ポジション 13—Building レベル 0
• ポジション 14—BuildingName
• ポジション 15—Sub building レベル 0
• ポジション 16—Floor and Room
• ポジション 17—FirmName
• ポジション 18—Organization レベル 1
• ポジション 19—Country
• ポジション 20—Territory
ElementInputStatus の場合、検証の値として以下のいずれかが入ります。
• 0—空
• 1—見つからない
• 2—チェックなし (参照データなし)
• 3—誤り - 検証によってのみセット。 参照データベースによれば、Number または DeliveryService
のいずれかの数が正しい範囲内にない。 入力はコピーされ、バッチモードでは修正されていない。
インタラクティブ モードと FastCompletion では、提案が提供されている
• 4—この要素内でエラーありで一致
• 5—変更ありで一致 (挿入または削除)。例:
• 解析中: "MainSt 1" の家番号を分割するなど
• 検証: 外名 (エクソニム) が入力された場合に置換したり、フィールドのサイズを超えて入力され、
国の参照データベースによって無効とされたデータを短くしたなど
• 6—エラーなしで一致
ユーザ ガイド
1041
Validate Address Global
ElementInputStatus の場合、パーシングの値には以下のいずれかが入ります。
• 0—空
• 1—要素の位置を変更する必要があった
• 2—一致したが、正規化する必要があった
• 3—一致した
ElementRelevance の場合、パーシングの値には以下のいずれかが入ります。
• 0—空
• 1—要素の位置を変更する必要があった
• 2—一致したが、正規化する必要があった
• 3—一致した
ElementResultStatus の場合、(国を除くすべての住所要素に対して) 以下のいずれかの値が入ります。
• 0—空
• 1—検証されず、変更されていない。 元のデータがコピーされている
• 2—検証されなかったが正規化された
• 3—検証されたが、入力が無効 (データベースによれば、数値が正しい範囲内にない) であるため変更
されなかった 入力がコピーされ、修正されていない (このステータス値はバッチ モードでのみセッ
トされる)
• 4—検証されたが、参照データが見つからないため変更されていない
• 5—検証されたが、複数の一致が見つかったため変更されていない。 バッチ モードでのみセットさ
れる。そうでない場合、入力を置換する複数の提案が修正済みとしてマークされる (ステータス値
7)
• 6—検証され、入力値の除外という変更が行われている
• 7—検証され、参照データに基づく修正という変更が行われている
• 8—検証され、参照データに基づく値の追加という変更が行われている
• 9—検証され、変更はされていないが、配達ステータスがわからない (例えば、DPV の値で、指定の
数値範囲が参照データと部分的にしか一致せず正しくないなど)
• C—検証され、妥当性確認済みだが名前が旧式であるため変更されている
• D—検証され、妥当性確認済みだが外名から公式の名前に変更されている
• E—検証され、妥当性確認済みだが大文字と小文字の区別、または言語に基づく正規化のため変更さ
れている。 入力が別の言語と完全に一致する場合に、検証でのみこのステータスがセットされる
• F—検証され、妥当性確認済みで、完全に一致したため変更されなかった
国 (ポジション 19 と 20) に関しては、以下のいずれかの値が入ります。
• 0—空
• 1—国が認識されない
• 4—国が DefaultCountryISO3 の設定から認識された
• 5—国が認識されない。複数の一致が見つかった
• 6—国がスクリプトから認識された
1042
Spectrum™ Technology Platform 8.0.0
第 29 章 : Universal Addressing モジュール
• 7—国がフォーマットから認識された
• 8—国が主要な都市から認識された
• 9—国が省から認識された
• C—国が地域から認識された
• D—国がエラーありで名前から認識された
• E—国が名前からエラーなしで認識された
• F—国が ForceCountryISO3 の設定から認識された
レポート
Validate Address Global サマリ レポート
Validate Address サマリ レポートには、処理されたレコードの合計数、検証された住所の数、その他
のようなジョブに関するサマリ統計が表示されます。レポートの使用方法については、レポート(185ペー
ジ)を参照してください。
ジョブ サマリ
このセクションには、ジョブに関するサマリ情報が含まれます。
• Started—ジョブが開始された日付と時刻。
• Finished—ジョブが終了した日付と時刻。
• Processing time—ジョブの継続時間。
• Total Records—Validate Address Global で処理するために渡されたレコードの合計数。 これはジョ
ブがどのように設計されているかによって、ジョブの入力レコードの数と異なる場合があります。
• Processed Records—Validate Address Global で正しく処理された住所の数。 これはレコードの合
計数から処理されなかったレコードを引いた数です。
• Default country—[デフォルト国 (ISO3 format)] オプションで指定されたデフォルト国。
• Casing— [大文字と小文字の区別]オプションで選択した大文字と小文字の区別。
• Script/Alphabet— [スクリプト/アルファベット] オプションで指定されたスクリプト。
• Countries—入力住所に含まれる国の数。
ステータス サマリ
このセクションには検証と修正の結果が表示されます。
• Validated—入力時に正しかった住所。
• Corrected—Validate Address Global によって修正された住所。
• Good deliverability—修正できなかったが、かなりの確率で正しく配達される住所。
• Fair deliverability—修正できなかったが、正しく配達される可能性が十分にある住所。
• Poor deliverability—修正できず、おそらく配達されない住所。
• Parsed—正しくパーシングされた住所。
• Failed—検証も、修正も、パーシングもできなかった住所。
ユーザ ガイド
1043
誤検出
Validate Address Global 詳細レポート
Validate Address 詳細レポートには、それぞれの国の検証、修正、パーシングの結果が表示されます。
レポートの使用方法については、レポート(185ページ)を参照してください。
ステータスの詳細
このセクションには、各国の検証と修正の結果が表示されます。
• V (検証済み)—入力時に正しかった住所。
• C (修正済み)—Validate Address Global によって修正された住所。
• I4 (配達可能性高)—修正できなかったが、かなりの確率で正しく配達される住所。
• I3 (配達可能性中)—修正できなかったが、配達される可能性が十分にある住所。
• I2 (配達可能性低)—修正できず、正しく配達される可能性が低い住所。
• S (パーシング済み)—正しくパーシングされた住所。
• F (失敗)—検証も、修正も、パーシングもできなかった住所。
誤検出
誤検出とは
Link
住所リストが生成されるのを防ぐため、DPV と LACS
のデータベースに誤検出レコードが含まれ
ています。 誤検出レコードは人為的に作成され、誤検出テーブルに格納された住所です。 DPV や
Link
LACS
のクエリで望ましくない応答が発生すると、誤検出テーブルに対してクエリが行われます。
Link
このテーブルにマッチすると (誤検出マッチと呼ばれます)、ユーザの DPV または LACS
キーが無
効になります。 バッチ処理の場合、この違反を含むジョブでも正しく完了しますが、違反をレポート
Link
Link
して DPV や LACS
を再びアクティベートするためのキーを取得するまでは、DPV や LACS
を
使用する後続のジョブを実行できません。
注: 誤検出レコードにマッチすることを、"シード レコード違反" という言葉を使って表現する場合も
あります。 この 2 つは同じ意味です。
DPV 誤検出違反の報告
Spectrum Technology Platform は、サーバー ログの中のメッセージによって、誤検出マッチを通知し
ます。Spectrum™ Technology Platform誤検出レコード
バッチ処理中は、誤検出レコードが検出されてもジョブは続行します。 そのジョブが完了した後は、
DPV キーが無効になっているため、DPV を使用する他のジョブを実行することはできません。 DPV
誤検出レコード違反が生じると、[実行履歴] に次のテキストが表示されます。
DPV Seed Record Violation. Seed Code S<ZIP, ZIP+4, Address, Unit>
1044
Spectrum™ Technology Platform 8.0.0
第 29 章 : Universal Addressing モジュール
次の手順に従って、違反を報告し、再起動キーを取得することができます。
1. ブラウザで、http://<サーバー>:<ポート>/<製品コード>/dpv.jsp に移動します。 例えば、Universal
Addressing モジュールの場合は http://localhost:8080/unc/dpv.jsp、Enterprise Geocoding モジュー
ルの場合は http://localhost:8080/geostan/dpv.jsp というアドレスになります。
2. 差出人の情報を各フィールドに入力します。 各フィールド名に続く括弧内の数字は、フィールド
の最大長を示します。
3. 終了したら [送信] をクリックします。 [ファイルのダウンロード] ダイアログが表示されます。
4. [保存] をクリックして、ファイルをコンピュータに保存します。 [名前を付けて保存] ダイアログ
が表示されます。
5. ローカルにあるハード ドライブの場所とファイル名 (c:\DPVSeedFile.txt など) を指定して [保
存] をクリックします。
6. www.g1.com/support に移動してログインします。
Link
7. [DPV & LACS
誤検出] の順にクリックします。
8. 画面上の指示に従って、シード ファイルを添付し、再起動キーを取得します。
DPV 誤検出ヘッダ ファイル レイアウト
®
USPS は、DPV 誤検出ヘッダ ファイルで必須となるレイアウトを定義しています。これは現在、180
バイトのレコードを 2 つ以上含む固定長のファイルと決められています。 最初のレコードは常にヘッ
ダ レコードとする必要があります。ヘッダ レコードのレイアウトを以下に示します。
表 217 : DPV 誤検出ヘッダ レコードのレイアウト
位置
長さ
説明
書式
1-40
40
差出人の会社名
英数字
41-98
58
差出人の住所行
英数字
99-126
28
差出人の都市名
英数字
127-128
2
差出人の州の略語
英数字
129-137
9
差出人の 9 桁の ZIP Code
数値
138-146
9
処理されたレコードの合計数
数値
147-155
9
DPV マッチとなったレコードの合計数 数値
156-164
9
DSF に対するマッチ率 (%)
ユーザ ガイド
数値
1045
誤検出
位置
長さ
説明
書式
165-173
9
ZIP +4 に対するマッチ率 (%)
数値
174-178
5
ファイル上の ZIP Code の数
数値
179-180
2
誤検出の数
数値
®
トレーラ レコードには DPV 誤検出マッチに関する情報が含まれます。 誤検出ファイルには、DPV 誤
検出マッチ 1 件につき 1 つのトレーラ レコードを追加する必要があります。 トレーラ レコードのレ
イアウトを以下に示します。
表 218 : DPV 誤検出トレーラ レコードのレイアウト
1046
位置
長さ
説明
書式
1-2
2
通り名の直前で方向を示す文字列
英数字
3-30
28
通り名
英数字
31-34
4
通りの種類の省略形
英数字
35-36
2
通り名の直後で方向を示す文字列
英数字
37-46
10
住所のプライマリの番号
英数字
47-50
4
住所のセカンダリの省略形
英数字
51-58
8
住所のセカンダリの番号
数値
59-63
5
マッチした ZIP Code
数値
64-67
4
マッチした ZIP + 4
数値
68-180
113
空白埋め
スペース
®
Spectrum™ Technology Platform 8.0.0
第 29 章 : Universal Addressing モジュール
LACS/Link 誤検出違反のレポート
Spectrum™ Technology Platform Spectrum™ Technology Platform は、サーバー ログのメッセージを
利用して誤検出マッチを報告します。 誤検出マッチが発生し、クライアント/サーバーの呼び出しが例
外をスローすると、バッチ ジョブはエラーになります。
注: 誤検出レコードにマッチすることを、"シード レコード違反" という言葉を使って表現する場合も
あります。 この 2 つの用語の意味は同じです。
誤検出レコードが見つかった場合、サーバ ログに以下が記録されます。
2005-05-19 09:40:10,758 WARN [com.g1.dcg.component.Log] Seed record violation
for RR 1
R74039 2924
2005-05-19 09:40:10,774 ERROR [com.g1.dcg.component.Log] Feature Disabled:
LLB: LACS Seed Record Violation. Seed Code: R74039 2924
2005-05-19 09:40:10,867 ERROR [com.g1.dcg.job.server.stages.JobRunnerStages]
Error executing job
com.g1.dcg.stage.StageException: com.g1.dcg.component.ComponentException:
Feature Disabled: LLB
1. ブラウザで、http://<サーバ名>:<ポート>/<製品コード>/lacslink.jsp に移動します。 例えば、Universal
Addressing モジュールの場合は http://localhost:8080/unc/lacslink.jsp、Enterprise Geocoding モ
ジュールの場合は http://localhost:8080/geostan/lacslink.jsp というアドレスになります。
2. 差出人の情報を各フィールドに入力します。 フィールド名に続く括弧内の数字は、フィールドの
最大長を示します。 終了したら [送信] をクリックします。 [ファイルのダウンロード] ダイアログ
が表示されます。
3. [保存] をクリックして、ファイルをコンピュータに保存します。 [名前を付けて保存] ダイアログ
が表示されます。
4. ローカルにあるハード ドライブの場所とファイル名 (c:\lacslink.txt など) を指定して [保存]
をクリックします。
5. www.g1.com/support に移動してログインします。
Link
6. [DPV & LACS
誤検出] の順にクリックします。
7. 画面上の指示に従って、シード ファイルを添付し、再起動キーを取得します。
Validate Address Confidence アルゴリズム
Validate Address Confidence (確信) アルゴリズムの概要
ValidateAddress は、妥当性を確認した各住所に対し、確信スコアを計算します。 このスコアは、妥
当性を確認した住所がどの程度正しいかを表します。 確信コードの値は 0 〜 100 で、0 はまったく確
信がなく、100 はマッチ結果が正しいことに対する確信レベルが非常に高いことを表します。 確信コー
ドは、個々の出力フィールドに対するマッチ結果を考慮に入れたアルゴリズムに基づいて計算されま
す。 この計算に関連する出力フィールドは、以下のとおりです。
• 国
ユーザ ガイド
1047
Validate Address Confidence アルゴリズム
• 市
• 州
• 郵便番号
• 通り名
• 家番号
• 接頭方向指示
• 接尾方向指示
• 通り接尾語
• アパート番号
アルゴリズムにおいて、各フィールドにはそれぞれ独自の重みがあります。 また、各フィールドに対
し、"成功"、"失敗"、または "変更" というマッチ結果が存在します ("変更" は、マッチさせるために
フィールドの内容を修正した場合に該当します)。 マッチ結果 ("成功"、"失敗"、または "変更") によっ
て、そのフィールドの係数が決まります。 以上より、確信コードは、重みと係数の積を用いて、次の
ように算出します。
Confidence = (Weight * Factor) for City
+ (Weight * Factor) for Country
+ (Weight * Factor) for State
+ (Weight * Factor) for PostalCode
+ (Weight * Factor) for StreetName
+ (Weight * Factor) for HouseNumber
+ (Weight * Factor) for Directionals
+ (Weight * Factor) for Street Suffix
+ (Weight * Factor) for ApartmentNumber
米国とカナダの住所に対する Confidence アルゴリズム
以下の表で、米国およびカナダの住所に対する ValidateAddress の確信アルゴリズムのスコアリング
とロジックについて説明します。
表 219 : 米国とカナダの住所に対する Confidence アルゴリズム
3
2
1048
2
3
フィールド
重み付け/マッチ スコ
ア
変更の場合の係数
埋めた場合の係数
Country
10
100%
0%
City
10
50%
75%
State
15
50%
75%
PostalCode
15
25%
25%
このフィールドに入力データが存在しないが、マッチを得るためにデータが埋められた場合のこと。
このフィールドの入力データが、マッチを得るために変更された場合のこと。
Spectrum™ Technology Platform 8.0.0
第 29 章 : Universal Addressing モジュール
2
3
フィールド
重み付け/マッチ スコ
ア
変更の場合の係数
埋めた場合の係数
StreetName
15
50%
75%
HouseNumber
15
50%
75%
Directionals
10
50%
75%
StreetSuffix
5
50%
75%
ApartmentNumber
5
50%
75%
国際住所用の確信アルゴリズム
米国およびカナダ以外の住所用に 2 つの確信アルゴリズムがあります。1 つは郵便番号を使用する国
の住所用で、もう 1 つは郵便番号を使用しない国の住所用です。
郵便番号を使用している国の米国およびカナダ以外の住所用の確信アルゴリズムの詳細を以下の表に
示します。
表 220 : 郵便番号がある国用の確信アルゴリズム
3
2
5
4
6
フィールド
重み付け/マッチ スコア 変更の場合の係 埋めた場合の 郵便データが使
4
5
数
係数
用できない場合
の係数
Country
11.1111111111111
100%
0%
City
11.1111111111111
50%
75%
0%
State
16.6666666666667
100%
100
80%
PostalCode
16.6666666666667
100%
100%
80%
StreetName
16.6666666666667
50%
75%
50%
0%
6
このフィールドに入力データが存在しないが、マッチを得るためにデータが埋められた場合のこと。
このフィールドの入力データが、マッチを得るために変更された場合のこと。
このフィールドに入力データが存在しないが、マッチを得るためにデータが埋められた場合のこと。
このフィールドの入力データが、マッチを得るために変更された場合のこと。
カテゴリ C の国の場合、この値は 50% です。 国カテゴリの説明については、Universal Addressing
データベース(927ページ)を参照してください。
ユーザ ガイド
1049
Validate Address Confidence アルゴリズム
フィールド
重み付け/マッチ スコア 変更の場合の係 埋めた場合の 郵便データが使
4
5
数
係数
用できない場合
の係数
HouseNumber
16.6666666666667
50%
75%
50%
Directionals
0
50%
75%
0%
StreetSuffix
5.55555555555556
50%
75%
50%
ApartmentNumber
5.55555555555556
50%
75%
50%
郵便番号を使用しない国用の確信アルゴリズムの詳細を次の表に示します。
表 221 : 郵便番号がない国用の確信アルゴリズム
5
4
8
7
9
1050
フィールド
重み付け/マッチ スコア 変更の場合の係 埋めた場合の
7
8
数
係数
郵便データが使
用できない場合
の係数
Country
13.3333333333333
100%
0%
0%
City
13.3333333333333
50%
75%
0%
State
20
100%
100
80%
StreetName
20
50%
75%
50%
HouseNumber
20
50%
75%
50%
Directionals
0
50%
75%
0%
StreetSuffix
6.66666666666667
50%
75%
50%
ApartmentNumber
6.66666666666667
50%
75%
50%
9
このフィールドに入力データが存在しないが、マッチを得るためにデータが埋められた場合のこと。
このフィールドの入力データが、マッチを得るために変更された場合のこと。
このフィールドに入力データが存在しないが、マッチを得るためにデータが埋められた場合のこと。
このフィールドの入力データが、マッチを得るために変更された場合のこと。
カテゴリ C の国の場合、この値は 50% です。 国カテゴリの説明については、Universal Addressing
データベース(927ページ)を参照してください。
Spectrum™ Technology Platform 8.0.0
第 29 章 : Universal Addressing モジュール
郵便番号がない国の一覧を以下の表に示します。
表 222 : 郵便番号がない国
アフガニスタン
アルバニア
アンゴラ
アンギラ
バハマ
バルバドス
ベリーズ
ベナン
ブータン
ボツワナ
ブルキナファソ
ブルンジ
カメルーン
ケイマン諸島
中央アフリカ共和国
チャド
ココス諸島
コロンビア
コモロ
コンゴ (民主 共和国)
コンゴ (共和国)
コートジボワール
北朝鮮
ジブチ
ドミニカ
赤道ギニア
エリトリア
フィジー
ガボン
ガンビア
ガーナ
グレナダ
ガイアナ
アイルランド
ジャマイカ
キリバス
リビア
マラウィ
マリ
モーリタニア
ナミビア
ナウル
パラオ
パナマ
ペルー
カタール
ルワンダ
セントルシア
セントビンセントおよびグレナ
ディーン諸島
サモア
サントメ・プリンシペ
セーシェル
シエラレオネ
スリナム
ユーザ ガイド
1051
Validate Address Confidence アルゴリズム
1052
タンザニア
ティモール島
トーゴ
トンガ
トリニダード・トバゴ
ツバル
ウガンダ
アラブ首長国連邦
バヌアツ
イエメン
ジンバブエ
Spectrum™ Technology Platform 8.0.0
Universal Name モジュール
このセクションの構成
• Universal Name モジュールとは . . . . . . . . . . . . . . . . . . .1054
• Name Parser . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .1054
• Name Variant Finder . . . . . . . . . . . . . . . . . . . . . . . . . . . .1073
30
Universal Name モジュールとは
Universal Name モジュールとは
正規化を特に正確に行うためにデータ列を複数のフィールドに分割しなければならないことがありま
す。Spectrum™ Technology Platform は、個人名、企業名、その他多くの用語や略語をパース (解析)
する高度なパーシング機能を備えています。 また、スキャン/抽出操作のベースとして使用するカスタ
ム用語のリストを独自に作成することもできます。
• Name Parser — 名前データ フィールドにある個人名、企業名、またはその他の名称を構成要素に
分解します。 これらのパースされた名前要素は、名前のマッチング、名前の正規化、複数レコード
名の統合など、他の自動化処理に使用できます。 名前のパーシングについては、Name Parser
(1054ページ)』
• Name Variant Finder — 名前データベースにクエリを発行して名前の派生形を取得するために、姓
または名のモードで使用されるコンポーネントです。 Name Variant Finder は、性別やカルチャーに
基づいて結果の件数を絞り込むことができます。Spectrum™ Technology Platform には基本となる
名前ファイルが同梱されています。 他のカルチャーのアドオン名前ファイルも用意されています。
アドオン名前ファイルを展開するには、その JAR ファイルを modules/tables/text フォルダにコピー
します。 アラブの名前は、アドオンとして使用できます。 このファイルのデータは、Nomino, Inc.
によって作成されました。詳細については、Name Variant Finder(1073ページ)』
Universal Name モジュール データベース
Universal Name モジュールで使われるオプションのデータベースは次のとおりです。 データベースご
とに個別のライセンスが必要です。
• Arabic Plus Pack: g1-cdq-cjki-arabic-<date>.jar
• Asian Plus Pack - 中国: g1-cdq-cjki-chinese-<date>.jar
• Asian Plus Pack - 日本: g1-cdq-cjki-japanese-<date>.jar
• Asian Plus Pack - 韓国: g1-cdq-cjki-korean-<date>.jar
• Core Names データベース: g1-cdq-nomino-base-<date>.jar
Name Parser
Name Parser は、名前データ フィールドにある個人名、企業名、またはその他の名称を構成要素に分
解します パーシングの処理では、各要素が名前全体に対して持つ関連性が、機能、形式、および構文
を基準に解釈されます。 これらのパースされた名前要素は、名前のマッチング、名前の正規化、複数
レコード名の統合など、他の自動化処理に使用できます。
名前のパーシングは、次の手順で行われます。
• 名前が担う機能を示すために、そのエンティティ タイプを特定します。 名前エンティティ タイプ
は、 個人名と企業名の二つのグループに分かれます。それぞれのグループには、さらに複数のサブ
グループがあります。
1054
Spectrum™ Technology Platform 8.0.0
第 30 章 : Universal Name モジュール
• パーシングに使う構文を把握するために、名前の形式を特定します。 個人名は、通常、自然な (署
名) 順序または逆の順序に従います。 企業名は、通常、階層型の順序に従います。
• 名前を構成する各要素が名前全体に占める構文上の関係を識別するために、要素を特定してラベル
付けします。 個人名の構文は、敬称、名、ミドルネーム、姓、接尾語、アカウントを示す用語、そ
の他の個人名要素で構成されます。 企業名の構文は、メインのテキスト、重要性の低い用語、接頭
語、接頭語の対象となる語、接尾語、その他の企業名要素で構成されます。
• 名前の性別を特定します。 指定したカルチャーの情報に基づいて、性別が判断されます。 たとえ
ば、"Jean" はフランスでは男性名ですが、米国では女性名です。 処理する名前がフランスに由来す
ることがわかっていれば、フランスを性別判断カルチャーとして指定できます。 Name Parser で
は、First Name テーブルと Compound First Names テーブルのデータを使って性別を判断します。
名前がテーブルに見つからない場合は、敬称が名前に含まれていれば、Title テーブルを使って性別
を判断します。 それ以外の場合は、性別は不明とされます。
注: 入力レコードのフィールドに、サポートされるカルチャーの一つが既に設定されている場合は、
入力で GenderDeterminationSource フィールドを事前に設定することで、GUI 上の Gender
Determination Source を上書きできます。
• パーサーで行われたパーシング処理の正確性の確信レベルを示すパーシング スコアを割り振ります。
入力
表 223 : Name Parser 入力
フィールド名
説明/有効値
GenderDeterminationSource 名前データのカルチャーは性別の判断に使います。 デフォルトは異文
化ルールに従います。 例えば、Jean は一般に女性の名前で、デフォ
ルトではそのように認識されますが、フランス語を選択した場合は男
性の名前と認識されます。 以下に、オプションを各カルチャーの代表
的な国と共に示します。 以下の国のリストは網羅的でありません。
ユーザ ガイド
SLAVIC
ボスニア、ポーランド、アルバニア。
ARMENIAN
アルメニア。
DEFAULT
ブルガリア、ケイマン諸島、アイルランド、
米国、イギリス。
FRENCH
フランス。
SCANDINAVIAN
デンマーク、フィンランド、アイスランド、
ノルウェイ、スウェーデン。
GERMANIC
オーストリア、ドイツ、ルクセンブルク、ス
イス、オランダ。
GREEK
ギリシャ。
HUNGARIAN
ハンガリー。
1055
Name Parser
フィールド名
説明/有効値
ITALIAN
イタリア。
PORTUGUESE
ポルトガル。
ROMANIA
ルーマニア。
HISPANIC
スペイン。
ARABIC
チュニジア。
GenderDeterminationSource は Name Variant Finder でも使われ、取
得する名前の派生形がカルチャーで制限されます。 詳細については、
Name Variant Finder(1073ページ)を参照してください。
Name
パースしたい名前。 このフィールドは必須です。
オプション
Name Parser のオプションを指定するには、キャンバスで Name Parser のインスタンスをダブルク
リックします。 Name Parser のオプション ダイアログが表示されます。
表 224 : Name Parser のオプション
オプション
説明
個人名をパース
[個人名をパース] をオンにします。
結合名を複数レコードに分離 このボックスをクリックして、複数の人物を含む結合名、例えば、
Bill & Sally Smithを複数レコードに分離します。
結合名が 2 つの名前レコードに分離されると、パーサーのレコード ID
出力フィールドが生成されます。 分離された名前の各ペアは同じパー
サー レコード ID で識別されます。
Gender Determination Source Name Parser の名前による性別判定方法を決定します。 たいていの
ケースで、デフォルトは性別の判定に最適な設定であり、さまざまな
名前に対応できます。 ただし、特定のカルチャーに属する名前を処理
する場合は、そのカルチャーを選択します。 特定のカルチャーを選択
すると、名前の性別が適切に判定される確率が高くなります。 例え
ば、デフォルトのままで設定した場合、Jean という名前は女性と判定
されます。 フランス語を選択すると、男性と判定されます。
1056
Spectrum™ Technology Platform 8.0.0
第 30 章 : Universal Name モジュール
オプション
説明
注: カルチャーを選択しても名前がそのカルチャーで見つからないと
きは、さまざまなカルチャーのデータを記載したっでフォルト カ
ルチャーが使われます。
順序
入力レコードの名前フィールドの順序を指定します。 次のいずれかで
す。
自然
名前フィールドの順序は、[敬称]、[名]、[ミドル ネー
ム]、[姓]、[接尾語] となります。
逆方向
姓が最初の順序になります。
混在
混在と逆方向を組み合わせた順序になります。
ピリオドを残す
パースされる個人名のフィールドに句読文字を残します。
企業名をパース
企業名をパースするとき、これをオンにします。
ピリオドを残す
企業名をパースするとき句読文字を残すにはこのチェックボックスを
オンにします。
ユーザ定義テーブル
いずれかのユーザ定義テーブルをクリックして、各種パーサー テーブ
ルの現在の値に値を追加します。 これでビジネス環境に適合するよう
にテーブルをカスタマイズできます。 [設定] をクリックして、追加し
たい値の入っている XML ファイルを選択します。 ユーザ定義テーブ
ルの詳細については、ユーザ定義テーブルの変更(1057ページ)を参照
してください。
ユーザ定義テーブルの変更
パーサーのテーブル内の値を追加、変更、削除することで、それらをビジネス環境に応じてカスタマ
イズできます。
ユーザ定義テーブルは XML ファイルで、そのデフォルトの場所は <Drive>:\Program Files\Pitney
Bowes\Spectrum\server\modules\parser\data フォルダです。 Spectrum™ Technology Platform
次のユーザ定義テーブルがあります。
• UserAccountDescriptions.xml(1058ページ)
• UserCompanyPrepositions.xml(1059ページ)
• UserCompanySuffixes.xml(1059ページ)
• UserCompanyTerms.xml(1060ページ)
ユーザ ガイド
1057
Name Parser
• UserCompoundFirstNames.xml(1060ページ)
• UserConjunctions.xml(1062ページ)
• UserFirstNames.xml(1063ページ)
• UserGeneralSuffixes.xml(1064ページ)
• UserLastNamePrefixes.xml(1065ページ)
• UserLastNames.xml(1065ページ)
• UserMaturitySuffixes.xml(1066ページ)
• UserTitles.xml(1067ページ)
UserAccountDescriptions.xml
表 225 : UserAccountDescriptions.xml の列
列名
説明/有効値
LookupValue
アカウント説明内でよく見つかる検索語。 任意の一語です。 大文字
と小文字は区別されません。
入力例:
<table-data>
<deleted-entries delimiter-character="|">
<deleted-entry-group>
<![CDATA[
LookupValue
ART
AND
]]>
</deleted-entry-group>
</deleted-entries>
<added-entries delimiter-character="|">
<![CDATA[
LookupValue
A/C
ACCOUNT
EXP
]]>
</added-entries>
</table-data>
1058
Spectrum™ Technology Platform 8.0.0
第 30 章 : Universal Name モジュール
UserCompanyPrepositions.xml
表 226 : UserCompanyPrepositions.xml の列
列名
説明/有効値
LookupValue
会社名によく使われる接頭語 (例えば、 "of" または "on")。 任意の一語
です。 大文字と小文字は区別されません。
入力例:
<table-data>
<deleted-entries delimiter-character="|">
<deleted-entry-group>
<![CDATA[
LookupValue
AROUND
NEAR
]]>
</deleted-entry-group>
</deleted-entries>
<added-entries delimiter-character="|">
<![CDATA[
LookupValue
ABOUT
AFTER
ACROSS
]]>
</added-entries>
</table-data>
UserCompanySuffixes.xml
表 227 : UserCompanySuffixes.xml の列
列名
説明/有効値
LookupValue
会社名によく使われる接尾語。 例としては、"Inc." や "Co." がありま
す。 任意の一語です。 大文字と小文字は区別されません。
入力例:
<table-data>
<deleted-entries delimiter-character="|">
<deleted-entry-group>
<![CDATA[
LookupValue
SANDY
CLUE
ユーザ ガイド
1059
Name Parser
]]>
</deleted-entry-group>
</deleted-entries>
<added-entries delimiter-character="|">
<![CDATA[
LookupValue
LTD
LLC
CO
INC
]]>
</added-entries>
</table-data>
UserCompanyTerms.xml
表 228 : UserCompanyTerms.xml の列
列名
説明/有効値
LookupValue
会社名によく使われる一般語。 任意の一語です。 大文字と小文字は
区別されません。
入力例:
<table-data>
<deleted-entries delimiter-character="|">
<deleted-entry-group>
<![CDATA[
LookupValue
MARY
BLUE
]]>
</deleted-entry-group>
</deleted-entries>
<added-entries delimiter-character="|">
<![CDATA[
LookupValue
ARC
ARCADE
ASSEMBLY
ARIZONA
]]>
</added-entries>
</table-data>
UserCompoundFirstNames.xml
このテーブルにはユーザ定義の複合ファースト ネームが入っています。 複合名は 2 つの単語からなる
名前です。
1060
Spectrum™ Technology Platform 8.0.0
第 30 章 : Universal Name モジュール
表 229 : UserCompoundFirstNames.xml の列
列名
説明/有効値
FirstName
複合ファースト ネーム。 最大 2 語。 大文字と小文字は区別されませ
ん。
カルチャー
この FirstName/Gender の組み合わせが適用されるカルチャー。
GenderDeterminationSource 入力フィールドで有効な任意の値を使用
できます。詳細については、入力(1055ページ)を参照してください。
性別
性別は一般にこの FirstName/Culture の組み合わせと関係します。 次
のいずれかです。
頻度
M
この名前は男性の名前です。
F
この名前は女性の名前です。
A
曖昧。 この名前は男性でも女性でもあります。
U
不明。 この名前の性別はわかりません。 このフィールドを
空白にすると、未知と仮定されます。
今回のリリースでは使われていません。 この列は空白でかまいませ
ん。
入力例:
<table-data>
<deleted-entries delimiter-character="|">
<deleted-entry-group>
<![CDATA[
FirstName
ANN MARIE
BILLY JOE
]]>
</deleted-entry-group>
<deleted-entry-group>
<![CDATA[
FirstName|Frequency
KAREN SUE|0.126
BILLY JOE|0.421
]]>
</deleted-entry-group>
<deleted-entry-group>
<![CDATA[
FirstName|Gender|Culture
JEAN ANN|M|DEFAULT
JEAN CLUADE|F|FRENCH
]]>
ユーザ ガイド
1061
Name Parser
</deleted-entry-group>
</deleted-entries>
<added-entries delimiter-character="|">
<![CDATA[
FirstName|Gender|Culture
JOHN Henry|M|DEFAULT
A'SHA A'MAR|F|ARABIC
BILLY JO|A|DEFAULT
]]>
</added-entries>
</table-data>
UserConjunctions.xml
このテーブルはユーザ定義の接続詞 ("and"、"or"、"&" など) のリストです。
表 230 : UserConjunctions.xml の列
列名
説明/有効値
LookupValue
任意の接続値。 一語でなければなりません。 大文字と小文字は区別
されません。
入力例:
<table-data>
<deleted-entries delimiter-character="|">
<deleted-entry-group>
<![CDATA[
LookupValue
FIND
CARE
%
]]>
</deleted-entry-group>
</deleted-entries>
<added-entries delimiter-character="|">
<![CDATA[
LookupValue
&
AND
OR
]]>
</added-entries>
</table-data>
1062
Spectrum™ Technology Platform 8.0.0
第 30 章 : Universal Name モジュール
UserFirstNames.xml
表 231 : UserFirstNames.xml の列
列名
説明/有効値
FirstName
このテーブルの行に記述されるファースト ネーム。 大文字と小文字
は区別されません。
性別
性別は一般にこの FirstName/Culture の組み合わせと関係します。 次
のいずれかです。
カルチャー
M
この名前は男性の名前です。
F
この名前は女性の名前です。
A
曖昧。 この名前は男性でも女性でもあります。
U
不明。 この名前の性別はわかりません。 このフィールドを
空白にすると、未知と仮定されます。
この FirstName/Gender の組み合わせが適用されるカルチャー。
GenderDeterminationSource 入力フィールドで有効な任意の値を使用
できます。詳細については、入力(1055ページ)を参照してください。
入力例:
<table-data>
<deleted-entries delimiter-character="|">
<deleted-entry-group>
<![CDATA[
FirstName
AADEL
AADIL
]]>
</deleted-entry-group>
<deleted-entry-group>
<![CDATA[
FirstName
A'SACE
A'BOCKETT
]]>
</deleted-entry-group>
<deleted-entry-group>
<![CDATA[
FirstName|Gender|Culture
ALII|M|DEFAULT
AISHA|F|ARABIC
]]>
</deleted-entry-group>
<deleted-entry-group>
ユーザ ガイド
1063
Name Parser
<![CDATA[
FirstName|Gender
JOHE|M
]]>
</deleted-entry-group>
</deleted-entries>
<added-entries delimiter-character="|">
<![CDATA[
FirstName|Gender|Culture
JOHE|M|DEFAULT
A'SHAN|F|ARABIC
]]>
</added-entries>
</table-data>
UserGeneralSuffixes.xml
このテーブルは個人名で使われる世代接尾語でないユーザ定義の接尾語 ("MD"、"PhD" など) のリスト
です。
表 232 : UserGeneralSuffixes.xml の列
列名
説明/有効値
LookupValue
個人名によく使われ、世代接尾語でない接尾語。 一語でなければなり
ません。 大文字と小文字は区別されません。
入力例:
<table-data>
<deleted-entries delimiter-character="|">
<deleted-entry-group>
<![CDATA[
LookupValue
AND
WILL
TUNA
]]>
</deleted-entry-group>
</deleted-entries>
<added-entries delimiter-character="|">
<![CDATA[
LookupValue
ACCOUNTANT
ATTORNEY
ANALYST
ASSISTANT
]]>
</added-entries>
</table-data>
1064
Spectrum™ Technology Platform 8.0.0
第 30 章 : Universal Name モジュール
UserLastNamePrefixes.xml
このテーブルは個人名のラスト ネームで使われるユーザ定義の頭字語 ("Van"、"De"、"La" など) のリ
ストです。
表 233 : UserLastNamePrefixes.xml の列
列名
説明/有効値
LookupValue
個人名のラスト ネームで使われる頭字語。 任意の一語です。 大文字
と小文字は区別されません。
入力例:
<table-data>
<deleted-entries delimiter-character="|">
<deleted-entry-group>
<![CDATA[
LookupValue
DO
RUN
ANIMAL
]]>
</deleted-entry-group>
</deleted-entries>
<added-entries delimiter-character="|">
<![CDATA[
LookupValue
D'
DA
DEN
DEL
]]>
</added-entries>
</table-data>
UserLastNames.xml
表 234 : UserLastNames.xml の列
列名
説明/有効値
LastName
このテーブルの行に記述されるラスト ネーム。 大文字と小文字は区
別されません。
性別
性別は一般にこの FirstName/Culture の組み合わせと関係します。 次
のいずれかです。
ユーザ ガイド
1065
Name Parser
列名
カルチャー
説明/有効値
M
この名前は男性の名前です。
F
この名前は女性の名前です。
A
曖昧。 この名前は男性でも女性でもあります。
U
不明。 この名前の性別はわかりません。 このフィールドを
空白にすると、未知と仮定されます。
この FirstName/Gender の組み合わせが適用されるカルチャー。
GenderDeterminationSource 入力フィールドで有効な任意の値を使用
できます。詳細については、入力(1055ページ)を参照してください。
入力例:
<table-data>
<deleted-entries delimiter-character="|">
<deleted-entry-group>
<![CDATA[
LastName
Rusod
AADIL
]]>
</deleted-entry-group>
<deleted-entry-group>
<![CDATA[
LastName
KAASEEY
JOIEN
]]>
</deleted-entry-group>
</deleted-entries>
<added-entries delimiter-character="|">
<![CDATA[
LastName|Culture|Gender
SMITH|ENGLISH|A
WILSON|ENGLISH|A
JONES|ENGLISH|A
]]>
</added-entries>
</table-data>
UserMaturitySuffixes.xml
このテーブルは、個人名で使われるユーザ定義の家族接尾語 ("Jr."、"Sr." など) のリストです。
1066
Spectrum™ Technology Platform 8.0.0
第 30 章 : Universal Name モジュール
表 235 : UserMaturitySuffixes.xml の列
列名
説明/有効値
LookupValue
個人名で使われる家族接尾語。 任意の一語です。 大文字と小文字は
区別されません。
入力例:
<table-data>
<deleted-entries delimiter-character="|">
<deleted-entry-group>
<![CDATA[
LookupValue
I
V
18
VI
]]>
</deleted-entry-group>
</deleted-entries>
<added-entries delimiter-character="|">
<![CDATA[
LookupValue
I
II
III
]]>
</added-entries>
</table-data>
UserTitles.xml
このテーブルは、個人名で使われるユーザ定義の肩書き ("Mr." or "Ms."など) のリストです。
表 236 : UserTitles.xml の列
列名
説明/有効値
LookupValue
個人名で使われる肩書き。 任意の一語です。 大文字と小文字は区別
されません。
性別
性別は一般にこの肩書きと関係します。 次のいずれかです。
ユーザ ガイド
M
この名前は男性の名前です。
F
この名前は女性の名前です。
A
曖昧。 この名前は男性でも女性でもあります。
1067
Name Parser
列名
説明/有効値
U
不明。 この名前の性別はわかりません。 このフィールドを
空白にすると、未知と仮定されます。
入力例:
<table-data>
<deleted-entries delimiter-character="|">
<deleted-entry-group>
<![CDATA[
LookupValue
Belt
Friend
Thursday
Red
]]>
</deleted-entry-group>
</deleted-entries>
<added-entries delimiter-character="|">
<![CDATA[
LookupValue|Gender
Mrs|F
Mr|M
Most|F
]]>
</added-entries>
</table-data>
サンプルのユーザ定義テーブル
次の最初の図は、サンプルのテーブル UserFirstNames.xml と、ユーザ定義テーブルを変更するときの
構文です。
<table-data>
<deleted-entries delimiter-character="|">
<deleted-entry-group>
<![CDATA[
FirstName
AADEL
AADIL
]]>
</deleted-entry-group>
<deleted-entry-group>
<![CDATA[
FirstName|Frequency
A'SACE|0.126
A'BECKETT|0.421
]]>
</deleted-entry-group>
<deleted-entry-group>
<![CDATA[
FirstName|Gender|Culture|VariantGroup
1068
Spectrum™ Technology Platform 8.0.0
第 30 章 : Universal Name モジュール
ALI|M|DEFAULT|GROUP88
AISHA|F|ARABIC|GROUP43
]]>
</deleted-entry-group>
<deleted-entry-group>
<![CDATA[
FirstName|Gender
JOHN|M
]]>
</deleted-entry-group>
</deleted-entries>
<added-entries delimiter-character="|">
<![CDATA[
FirstName|Gender|Culture
JOHN|M|DEFAULT
A'SHA|F|ARABIC
JAMES|M|DEFAULT
]]>
</added-entries>
</table-data>
Output
表 237 : Name Parser の出力
フィールド名
書式
説明/有効値
AccountDescription
文字列
名前の一部であるアカウント説明。 例えば、"Mary Jones
Account # 12345" で、アカウント説明は "Account#12345"。
EntityType
文字列
名前の種類を示唆します。 次のいずれかです。
Firm
名前または会社名。
Personal
この名前は、個人の名前です。
会社名関係のフィールド
FirmModifier.1.Object
文字列
会社名の接頭語の最初のオブジェクト。 例えば、会社名
"Pratt & Whitney Division of United Technologies" で、接頭
語の最初のオブジェクトは "United Technologies" です。
FirmModifier.1.Preposition
文字列
会社名で使われる最初の接頭語。 例えば、会社名 "Pratt &
Whitney Division of United Technologies" で、"of" が最初の
接頭語です。
FirmModifier.2.Object
文字列
会社名の接頭語の 2 番目のオブジェクト。 例えば、会社名
"Church of Our Lady of Lourdes" で、接頭語の 2 番目のオブ
ジェクトは "Lourdes" です。
ユーザ ガイド
1069
Name Parser
フィールド名
書式
説明/有効値
FirmModifier.2.Preposition
文字列
会社名の 2 番目の接頭語。 例えば、会社名 "Church of Our
Lady of Lourdes" で、2 番目の接頭語は 2 番目の "of" です。
FirmName
文字列
会社名。 例えば、"Pitney Bowes, Inc."。
FirmPrimary
文字列
会社名の基本部分。 例えば、"Pitney Bowes"。
FirmSuffix
文字列
会社名の接尾語。 例えば、"Co."、"Inc."
FirstName
文字列
個人のファースト ネーム。
FirstNameVariantGroup
文字列
ファースト ネームが属す類似の名前のグループを示す識別
番号。 例えば、Muhammad、Mohammed、Mehmet はいず
れも同じ名前派生グループに属します。 実際のグループ ID
はアドオン データの読み込み時に設定されます。
個人名に関係するフィールド
このフィールドには Name Variant Group 機能を実際に購入
するまで値は設定されません。
GenderCode
1070
文字列
個人名の性別はファースト ネームの分析時に決定されます。
次のいずれかです。
A
曖昧。 この名前は男性と女性のどちらの名前でもあ
ります。 例えば、Pat。
F
女性。 この名前は女性の名前です。
M
男性。 この名前は男性の名前です。
U
不明。 この名前は、性別テーブルでは見つからない
可能性が高いものです。
GenderDeterminationSource 文字列
名前の性別判定に使われるカルチャー。 この名前が性別テー
ブルで見つからなければ、このフィールドは空白です。
GeneralSuffix
文字列
個人名の一般/職業接尾語。 例えば、 MD PhD 。
LastName
文字列
個人名のラスト ネーム。
MaturitySuffix
文字列
個人の世代/家族接尾語。 例えば、Jr.、Sr.。
MiddleName
文字列
個人のミドル ネーム。
Spectrum™ Technology Platform 8.0.0
第 30 章 : Universal Name モジュール
フィールド名
書式
説明/有効値
NameScore
文字列
パース処理の評価ポイントは 0 〜 100。0 は低品質、100 は
高品質を表します。
ParserRecordID
文字列
各入力レコードの識別番号。
TitleOfRespect
文字列
個人の肩書き Mr.、Mrs.、Dr.、Rev.など。
文字列
結合名の 2 番目の人物のファースト ネーム。 結合名は、例
えば、"John and Jane Smith"。
PersonalName.2.FirstNameVariantGroup 文字列
結合名の 2 番目の人物のファースト ネームと類似の名前の
グループを示す識別番号。 例えば、Muhammad、
Mohammed、Mehmet はいずれも同じ名前派生グループに
属します。 実際のグループ ID はアドオン データの読み込
み時に設定されます。
結合名関係のフィールド
PersonalName.2.FirstName
このフィールドには Name Variant Group 機能を実際に購入
するまで値は設定されません。
PersonalName.2.GenderCode 文字列
結合名の 2 番目の人物の性別は、Name Parser によるファー
スト ネームの分析で決定されます。 結合名は、例え
ば、"John and Jane Smith"。 次のいずれかです。
A
曖昧。 この名前は男性と女性のどちらの名前でもり
ます。 例えば、Pat。
F
女性。 この名前は女性の名前です。
M
男性。 この名前は男性の名前です。
U
不明。 この名前は、性別テーブルでは見つからない
可能性が高いものです。
PersonalName.2.GenderDeterminationSource 文字列
結合名の 2 番目の人物の性別を判定するカルチャー。 結合
名は、例えば、"John and Jane Smith"。
PersonalName.2.GeneralSuffix 文字列
結合名の 2 番目の人物の一般/職業接尾語。 結合名は、例え
ば、"John and Jane Smith"。 一般接頭語の例は、MD、
PhD。
PersonalName.2.LastName
結合名の 2 番目の人物のラスト ネーム。 結合名は、例え
ば、"John and Jane Smith"。
ユーザ ガイド
文字列
1071
Name Parser
フィールド名
書式
説明/有効値
PersonalName.2.MaturitySuffix 文字列
結合名の 2 番目の人物の世代/家族接尾語。 結合名は、例え
ば、"John and Jane Smith"。 世代接尾語の例は、Jr.と Sr.。
PersonalName.2.MiddleName 文字列
結合名の 2 番目の人物のミドル ネーム。 結合名は、例え
ば、"John and Jane Smith"。
PersonalName.2.TitleOfRespect 文字列
結合名の 2 番目の名前に対応する肩書き。 例えば、"Mr. and
Mrs. Smith" は結合名。 肩書きの対応の例は、"Mr., Mrs., and
Dr."。
PersonalName.3.FirstName
文字列
結合名の 3 番目の人物のファーストネーム。 例えば、"Mr.
& Mrs. John Smith & Dr. Mary Jones" は結合名。
PersonalName.3.FirstNameVariantGroup 文字列
結合名の 2 番目の人物のファースト ネームと類似の名前の
グループを示す識別番号。 例えば、Muhammad、
Mohammed、Mehmet はいずれも同じ名前派生グループに
属します。 実際のグループ ID はアドオン データの読み込
み時に設定されます。
このフィールドには Name Variant Group 機能を実際に購入
するまで値は設定されません。
PersonalName.3.GenderCode 文字列
1072
結合名の 3 番目の人物の性別は、Name Parser のファース
ト ネームによる性判定で決定されます。 結合名の例は "Mr.
& Mrs. John Smith & Adam Jones"。 次のいずれかです。
A
曖昧。 この名前は男性と女性のどちらの名前でもあ
ります。 例えば、Pat。
F
女性。 この名前は女性の名前です。
M
男性。 この名前は男性の名前です。
U
不明。 この名前は、性別テーブルでは見つからない
可能性が高いものです。
PersonalName.3.GenderDeterminationSource 文字列
結合名の 3 番目の人物の性別判定に使われるカルチャー。
"Mr. & Mrs. John Smith & Adam Jones"。
PersonalName.3.GeneralSuffix 文字列
結合名の 3 番目の人物の一般/職業接尾語。 結合名の例は、
"Mr. & Mrs. John Smith & Adam Jones PhD."。 一般接頭語
の例は、MD、PhD。
PersonalName.3.LastName
結合名の 3 番目の人物のラスト ネーム。 例えば、"Mr. &
Mrs. John Smith & Dr. Mary Jones" は結合名。
文字列
Spectrum™ Technology Platform 8.0.0
第 30 章 : Universal Name モジュール
フィールド名
書式
説明/有効値
PersonalName.3.MaturitySuffix 文字列
結合名の 3 番目の人物の世代/家族接尾語。 結合名の例は
"Mr. & Mrs. John Smith & Adam Jones Sr." 世代接尾語の例
は、Jr.と Sr.。
PersonalName.3.MiddleName 文字列
結合名の 3 番目の人物のミドル ネーム。 例えば、"Mr. &
Mrs. John Smith & Dr. Mary Jones" は結合名。
PersonalName.3.TitleOfRespect 文字列
結合名の 3 番目の人物の肩書き。 例えば、"Mr. & Mrs. John
Smith & Dr. Mary Jones" は結合名。 肩書きの対応の例
は、"Mr., Mrs., and Dr."。
Name Variant Finder
Name Variant Finder は、名モードまたは姓モードで動作し、データベースに問い合わせて名前の派生
形を取得します。 例えば、"John" と "Jon" は名前 "Johnathan" の派生形です。 Name Variant Finder
の実行にはアドオン辞書が必要です。アドオン辞書は、Universal Name モジュール、Data Normalization
モジュール、または Advanced Matching モジュールのデータベース ロード ユーティリティを使って
インストールできます。 オプションであるこれらのカルチャー固有の辞書の入手方法については、営
業担当者にお問い合わせください。
入力
表 238 : Name Variant Finder の入力フィールド
フィールド名
説明/有効値
FirstName
名前が姓名の名の場合、派生形を見つけるために使う名前。
LastName
名前が姓の場合、派生形を見つけるために使う名前。
GenderCode
FirstName フィールドの名前の性別。 次のいずれかです。
注: 性別コードは、ラスト ネームではなく、ファースト ネームにの
み適用されます。
ユーザ ガイド
M
この名前は男性の名前です。
F
この名前は女性の名前です。
A
曖昧。 この名前は男性でも女性でもあります。
1073
Name Variant Finder
フィールド名
説明/有効値
U
Ethnicity
不明。 この名前の性別はわかりません。
カルチャーは通常 FirstName または LastName のフィールドの名前と
関係します。 名前のエスニシティがわかっていなくても、Name Parser
または Open Parser ステージでこのフィールドに値を設定できます。
注: このフィールドは、以前は GenderDeterminationSource と呼ばれ
ていました。
オプション
表 239 : Name Variant Finder のオプション
オプション
説明
名
ファースト ネームで派生形を探します。
姓
ラスト ネームで派生形を探します。
性別コード
性別がレコードの GenderCode フィールドに指定されている場合にの
み名前の派生形を返します。 GenderCode フィールドについては、入
力(1073ページ)を参照してください。
Ethnicity
カルチャーがレコードの Ethnicity フィールドに指定されている場合に
のみ名前の派生形を返します。 Ethnicity フィールドについては、入力
(1073ページ)を参照してください。
Romanized
名前をローマ字で返します。 ローマ字の名前とは、非ラテンの用字系
をラテンの用字系に書き換えたものです。 例えば、韓国名
マ字で書くと Achin になります。
1074
をロー
ネイティブ
名前を、そのカルチャーの本来の用字系で書いたものを返します。 例
えば、韓国名はハングルで返されます。
かな
[ネイティブ] を選択した場合、このオプションを選択して日本語の名
前をかなで返すように設定できます。 かなは、平仮名と片仮名の用字
系で構成されます。
Spectrum™ Technology Platform 8.0.0
第 30 章 : Universal Name モジュール
オプション
説明
注: 日本語の名前の派生形を検索するには、Asian Plus Pack データ
ベースのライセンスを取得する必要があります。 詳細について
は、セールス エグゼクティブに問い合わせてください。
漢字
[ネイティブ] を選択した場合、このオプションを選択して日本語の名
前を漢字で返すように設定できます。 漢字は、日本語で使われる用字
系の 1 つです。
注: 日本語の名前の派生形を検索するには、Asian Plus Pack データ
ベースのライセンスを取得する必要があります。 詳細について
は、セールス エグゼクティブに問い合わせてください。
Output
表 240 : Name Variant Finder の出力
フィールド名
書式
説明/有効値
CandidateGroup
文字列
入力名とその名前の派生形のグループを表します。 各入力
名には、CandidateGroup 番号が与えられます。 その名前の
派生形にも同じ CandidateGroup 番号が与えられます。
Ethnicity
文字列
Core Names およびアドオン辞書によって決定される名前の
カルチャー。
注: このフィールドは、以前は GenderDeterminationSource
と呼ばれていました。
FirstName
文字列
個人の名。
GenderCode
文字列
Core Names およびアドオン辞書によって決定される名前の
性別。 次のいずれかです。
ユーザ ガイド
M
この名前は男性の名前です。
F
この名前は女性の名前です。
A
曖昧。 この名前は男性でも女性でもあります。
U
不明。 この名前の性別はわかりません。
1075
Name Variant Finder
1076
フィールド名
書式
説明/有効値
LastName
文字列
個人の姓。
TransactionalRecordType
文字列
名前がマッチング処理でどう使われたかを示します。 次の
いずれかです。
Suspect
サスペクト レコードは、クエリへの入力と
して使われます。
Candidate
候補レコードは、クエリから結果として返さ
れます。
Spectrum™ Technology Platform 8.0.0
付録
このセクションの構成
• モジュール表 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .1079
• 各国の ISO コードとモジュール サポート . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .1085
モジュール表
このセクションの構成
• モジュール、コンポーネント、データベース . . . . . . . . .1080
A
モジュール、コンポーネント、データベース
モジュール、コンポーネント、データベース
表 241 : モジュール、コンポーネント、データベース
モジュール
説明
コンポーネント
Address Now モジュー
ル
米国以外の住所についての高度なバリデー Build Global Address
ションと正規化を提供します。また、別の住 Get Global Candidate
所処理も提供します。
Addresses
Validate Global Address
Advanced Matching モ
ジュール
入力ファイル内や、入力ファイル間でレコー Best Of Breed
ドを照合します。
Candidate Finder
Duplicate Synchronization
Filter
Interflow Match
Intraflow Match
Match Key Generator
Transactional Match
Business Steward モ
ジュール
例外レコードを特定し、例外レコードを手動 Exception Monitor
で確認するためのブラウザベースのツールを 例外の読み込み
提供します。
例外の書き出し
Country Identifier
国名を、または郵便番号と州/省の組み合わ Country Identifier
せを受け取って、2 文字の ISO 国コード、3
文字の Universal Postal Union (UPU) コー
ド、および国名を英語で返します。
Data Hub モジュール
データをリンクおよび分析して、関係と傾向 Write to Hub
を識別します。
Read From Hub
Query Hub
Graph Visualization
Data Normalization モ
ジュール
データの不整合を取り除きます。
Advanced Transformer
Open Parser
Table Lookup
1080
Spectrum™ Technology Platform 8.0.0
付録 A : モジュール表
モジュール
説明
コンポーネント
Transliterator
Enterprise Geocoding モ 住所を表す地図上のポイント(緯度と経度) Geocode Address AUS
ジュール
に変換します。 また、指定された緯度と経 Geocode Address GBR
度を住所に変換します。
Geocode Address Global
Geocode Address World
Geocode US Address
GNAF PID Location Search
Reverse APN Lookup
Reverse Geocode Address
Global
Reverse Geocode US
Location
Enterprise Routing モ
ジュール
ドライブまたは歩行方向を取得し、ドライブ Get Travel Boundary
時間およびドライブ距離を計算し、始点から Get Travel Cost Matrix
一定の時間または距離内にある位置を特定し
Get Travel Directions
ます。
Enterprise Tax モジュー 特定の地域に適用する税務管轄区域を決定し Assign GeoTAX Info
ル
ます。
Calculate Distance
GeoConfidence モ
ジュール
指定された領域に住所または交差点が含まれ Geo Confidence Surface
る可能性を判定します。
CreatePointsConvexHull
Global Sentry
政府から提供される、各国のデータを含む警 Global Sentry
戒リストとトランザクションとの照合を試み Global Sentry Address Check
ます。
Global Sentry ID Number
Check
Global Sentry Name Check
Global Sentry Other Data
Check
Location Intelligence モ さまざまな地理空間データベースと照合して Closest Site
ジュール
Point In Polygon と半径分析を実行します。 Find Nearest
Point In Polygon
Query Spatial Data
Read Spatial Data
ユーザ ガイド
1081
モジュール、コンポーネント、データベース
モジュール
説明
コンポーネント
Spatial Calculator
Spatial Union
SAP モジュール
SAP Generate Match Key
Spectrum™ Technology Platform と SAP
Customer Relationship Management モジュー SAP Generate Match Score
ル アプリケーションとの連携を有効にしま
SAP Generate Search Key
す。
SAP Generate Search Key
Constant
SAP Generate Search Key
Metaphone
SAP Generate Search Key
Substring
SAP Validate Address With
Candidates
Siebel モジュール
Spectrum™ Technology Platform と Siebel ア Siebel Generate Match Key
プリケーションとの連携を有効にします。 Siebel Generate Match Score
Siebel Generate Search Key
Siebel Business Name
Standardization
Siebel Standardize Name
Siebel Geocode US Address
With Candidates
Siebel Geocode US Address
With No Candidates
Siebel Get Global Candidate
Addresses
Siebel Validate Address With
Candidates
Siebel Validate Address With
No Candidates
Universal Addressing モ 郵便当局の規格に従って、住所の正規化とバ Get Candidate Addresses
ジュール
リデーションを実行します。
Get City State Province
Get Postal Codes
Validate Address
Validate Address AUS
Validate Address Global
1082
Spectrum™ Technology Platform 8.0.0
付録 A : モジュール表
モジュール
説明
Universal Name モ
ジュール
個人名、企業名、住所、およびその他多くの Name Parser
語や略語をパースします。
Name Variant Finder
ユーザ ガイド
コンポーネント
1083
各国の ISO コードとモジュー
ル サポート
このセクションの構成
• 各国の ISO コードとモジュール サポート . . . . . . . . . . . .1086
B
各国の ISO コードとモジュール サポート
各国の ISO コードとモジュール サポート
次の表に、各国の ISO コードと、各国の住所作成、ジオコーディング、およびルーティングをサポー
トするモジュールを示します。
10
1086
ISO 国名 (英語)
ISO
Fly UP