...

第4節 照合 [詳細版] - 地域がん登録全国協議会

by user

on
Category: Documents
7

views

Report

Comments

Transcript

第4節 照合 [詳細版] - 地域がん登録全国協議会
2007.07.27 版
照 合 Record Linkage
照 合 の問 題 を考 える前 に、重 複 届 出 、重 複
人 に属 する各 記 録 を集 めて、その記 録 が、既 に
腫 瘍 (多 重 がん)、及 び重 複 登 録 の、基 礎 概 念
登 録 されている腫 瘍 に関 するものなのか(重 複
を理 解 しておくことが重 要 である。
届 出 )、あるいは新 発 生 の原 発 腫 瘍 に関 するも
のなのかを決 定 することである。
1.
複 数 の報 告
地 域 がん登 録 に集 まる情 報 の例 とその登 録
の流 れを図 1 に示 した。患 者 が未 登 録 と判 明
(1)
重複届出
すれば、新 規 患 者 登 録 が行 われ、新 たに個 人
識 別 番 号 が付 与 される。既 登 録 であり、もし記
一 人 のがん患 者 における一 つの腫 瘍 に関 して
録 が、既 登 録 の腫 瘍 と異 なった原 発 腫 瘍 (多
登 録 室 が受 け取 った複 数 の報 告 を指 す。もしも
重 がん)に関 するものであれば、その腫 瘍 の情
ある患 者 が ある病 院 で がんと 診 断 され、治 療 の
報 を別 のレコードとして追 加 登 録 する。また、既
ために別 の病 院 に紹 介 される場 合 、両 病 院 とも、
登 録 であり、腫 瘍 も既 に登 録 されている場 合 で
その患 者 をがん登 録 に届 け出 ることがよくある。
も(重 複 届 出 )、新 たな記 録 が追 加 情 報 (住 所
登 録 室 は、これらの報 告 を重 複 届 出 と認 識 し、
や姓 の変 更 、詳 細 部 位 や組 織 型 の詳 細 など)
集 計 前 に情 報 を集 約 する必 要 がある。
を含 んでいる可 能 性 があるので追 加 登 録 する。
登 録 室 では、患 者 を管 理 する個 人 識 別 番 号 と、
(2)
重 複 腫 瘍 (多 重 がん)
登 録 室 に集 められた個 々の記 録 を区 別 するシ
リア ル 番 号 の 二 種 類 で 記 録 を 管 理 す る 必 要 が
がん登 録 は、がん患 者 数 というよりも、原 発 性
ある。
悪 性 腫 瘍 の数 を数 えるものである。従 って、一
3.
人 の患 者 が複 数 の原 発 性 悪 性 腫 瘍 に罹 患 し
照 合 の指 標
た場 合 、その各 々について独 立 して登 録 しなけ
ればならない。地 域 がん登 録 中 央 登 録 室 は、
世 界 には、社 会 保 険 番 号 等 の個 人 同 定 番
原 発 性 悪 性 腫 瘍 の過 剰 及 び過 小 登 録 を避 け
号 が国 民 一 人 一 人 に付 与 されているところがあ
るために、多 重 がんの定 義 を十 分 に理 解 して
るが、そのような番 号 を持 たない国 において患
作 業 する必 要 がある。
者 が既 登 録 かどうかを確 認 する基 本 は、新 規
患 者 の姓 名 と登 録 室 が作 成 管 理 する個 人 識
(3)
別 指 標 データベースとの照 合 である。しかし、通
重複登録
常 、姓 名 のみでは不 十 分 である。非 常 にありふ
重 複 登 録 は、がん登 録 が一 人 の同 じ患 者 を別
れた姓 名 、記 載 間 違 い、婚 姻 、離 婚 、養 子 によ
人 として登 録 したり、一 つの同 じ腫 瘍 を誤 って
る改 姓 、中 国 系 や韓 国 系 の本 名 と日 本 名 、及
重 複 腫 瘍 として登 録 することによって生 じる。
び本 人 の希 望 による通 称 などがその原 因 である。
姓 名 に加 えて、生 年 月 日 を照 合 に用 いると識
2.
照 合 とは
別 力 が増 加 する。その他 、性 別 、住 所 、死 亡 年
月 日 などが、照 合 の精 度 を上 げるために用 いら
地 域 がん登 録 における照 合 の目 的 は、同 一
れる。仮 にこれらの指 標 が全 て合 致 していない
1
2007.07.27 版
場 合 でも、記 載 間 違 い、婚 姻 状 況 、転 居 等 を
名 、カタ仮 名 などの組 み合 わせで、戸 籍 上 の表
考 慮 した結 果 、同 一 人 物 と識 別 できる場 合 が
記 と異 なる記 載 がされている場 合 が日 常 的 に
ある 。 そ の た め 、 こ れ ら の 照 合 指 標 は 履 歴 で 管
存 在 す る 。 例 えば 、 廣 島 ・ 広 島 、 久 子 ・ ひ さ 子 ・
理 され、照 合 の際 に常 に同 一 人 物 の候 補 とし
ヒサ子 は、照 合 の際 に同 一 人 物 の候 補 として
て挙 がることが望 ましい。また、日 本 人 の姓 名 の
挙 がることが望 ましい。
場 合 、同 音 異 字 の漢 字 、旧 字 、略 字 、ひら仮
新 規 情 報 (資 料 源 番 号 の 付 与 )
・
届 出 、採 録
・
死亡票
・
遡 り調 査 回 答
Yes
Yes
既 登 録 患 者 か?
既登録腫瘍
があるか?
No
No
重複届出
新規登録
新規登録
(既 登 録 腫 瘍 に
(重 複 腫 瘍 )
データ追 加 )
(新 規 患 者 番 号
の付 与 )
図 1 地 域 がん登 録 室 における情 報 の照 合 の基 本 的 手 順
4.
照 合 の実 際
ピュータデータベースシステムを用 いた照 合 の
実 際 を記 述 する。
基 本 的 な照 合 作 業 は、①個 人 識 別 指 標 を、
味 木 らは、コンピュータによる同 一 人 物 候 補
新 しい 情 報 と 既 登 録 情 報 で 比 較 し 、 同 一 人 物
リス トの 作 成 に つい て 、 わが 国 の 地 域 が ん 登 録
の可 能 性 のある組 み合 わせを作 る作 業 (同 一
で用 いられてきた漢 字 姓 名 、生 年 月 日 、性 別 、
人 物 候 補 リストの作 成 )、②①で作 成 された同
住 所 らの個 人 同 定 指 標 の組 み合 わせを分 類 し、
一 人 物 候 補 リストについて、他 の指 標 を参 考 に
同 一 人 物 候 補 リストに挙 がる数 とその作 成 に要
しながら、同 一 人 物 か別 人 かを判 定 する作 業
する時 間 を計 測 し、精 度 ・効 率 のよい個 人 識 別
(判 定 作 業 )、の二 段 階 から成 る。
指 標 の組 み合 わせを検 討 した(表 1)。コンピュ
従 来 、照 合 は、台 帳 という紙 の個 人 識 別 指
ータによる漢 字 処 理 に制 約 の多 かった時 代 、
標 データベースを用 いて、手 作 業 で行 われてき
個 人 識 別 指 標 としてカナ表 記 姓 名 を用 いてき
たが、今 日 のがん罹 患 数 とコンピュータデータ
た場 合 もあるが、漢 字 表 記 の方 が個 人 を識 別
ベースシステムの導 入 状 況 を考 えると、全 て手
する能 力 が高 いため、今 日 ではこれを用 いる。
作 業 の照 合 は現 実 的 ではない。ここでは、コン
同 一 人 物 候 補 リストに挙 がる数 が少 なすぎる
2
2007.07.27 版
と同 一 人 物 が別 人 として処 理 されている可 能 性
能 性 が低 い)、かつ照 合 効 率 がよい(同 一 人 物
が高 くなり、多 すぎるとその後 の手 作 業 による同
候 補 の数 が少 ない)方 法 は、C,D,E 方 式 であ
一 人 物 判 定 作 業 に時 間 がかかったり、見 落 と
ると言 える。例 として、標 準 データベースシステ
す 可 能 性 が 高 くなる 。 表 から 、 日 本 におい て 照
ムと宮 城 県 地 域 がん登 録 における照 合 方 式 を
合 精 度 がよい(同 一 人 物 を別 人 と判 定 する可
提 示 する。
表 1 照 合 方 式 による照 合 の精 度 と効 率 の比 較
照合方式
同一人物候補
同一人物
同一人物
リスト作成に
候補ペア
ペアの見落と
要する時間*
出現数
し数(%)
A.生年月日が一致、あるいは姓名が一致
2
23,662
4 (0.1)
B.生年月日が一致した者のうち、他の指標の一致状況を
2
B-1-1. 3 指 標 の う ち 1 指 標 以 上 一 致
14,144
80 (2.7)
B-1-2. 3 指 標 の う ち 2 指 標 以 上 一 致
3,571
87 (3.0)
B-2-1. 4 指 標 の う ち 1 指 標 以 上 一 致
14,157
80 (2.7)
B-2-2. 4 指 標 の う ち 2 指 標 以 上 一 致
3,640
81 (2.8)
B-2-3. 4 指 標 の う ち 3 指 標 以 上 一 致
3,242
100 (3.4)
C-1. 他 の 3 指 標 の う ち 1 指 標 以 上 一 致
14,589
4 (0.1)
C-2. 他 の 3 指 標 の う ち 2 指 標 以 上 一 致
3,680
11 (0.4)
4,942
18 (0.6)
28
3,825
5 (0.2)
8
3,327
35 (1.2)
E-1. 氏 名 と し て カ ナ コ ー ド を 使 用
3,371
0 (0.0)
E-2. 氏 名 と し て 姓 の 第 1 漢 字 を 使 用
3,325
0 (0.0)
E-3. 氏 名 と し て 姓 名 の 第 1 + 3 漢 字 を 使 用
2,957
4 (0.1)
E-4. 姓 名 の 全 漢 字 を 使 用 ( 伏 せ 字 は 同 じ と み な す )
2,950
7 (0.2)
E-5, 姓 名 の 全 漢 字 を 使 用 ( 伏 せ 字 は 異 な る と み な す )
2,950
7 (0.2)
B-1. 他 指 標 と し て 、 性 , 住 所 , 姓 名 の 3 指 標 を 利 用
B-2 他 指 標 と し て 、 性 , 住 所 , 姓 , 名 の 4 指 標 を 利 用
C.B方式を姓名(+他指標)の一致リストで補足
4
D.複数指標のうち、一致する項目数が一定値以上
D-1. 生 年 西 暦 , 生 月 , 姓 , 名 の 4 指 標 を 利 用
4
D-1. 4 指 標 の う ち 3 指 標 以 上 一 致
D-2 元 号 , 年 , 月 , 日 , 性 , 住 所 , 姓 , 名 の 8 指 標 を 利 用
D-2-1. 8 指 標 の う ち 6 指 標 以 上 一
D-2-2. 8 指 標 の う ち 7 指 標 以 上 一 致
E . 大 阪 府 が ん 登 録 の 方 式 **
4
住所:市区町村単位
大 阪 府 が ん 登 録 に 、 平 成 4 年 4 月 ~ 平 成 5 年 3 月 の 一 年 間 に 届 け ら れ た 登 録 票 ( 24,648件 、 う ち 同 一 人
物 と 判 定 し た ペ ア 数 2,912件 ) の 資 料 を 用 い て 検 討 し た 。
*
生年月日一致リストを作成するために必要な時間を1とした場合
* * 生 年 月 日 、 カ ナ コ ー ド ( 氏 名 第 1 漢 字 に 対 す る カ ナ コ ー ド )、 住 所 ( 市 区 町 村 + 通 字 丁 )、 性 別 、 照 合 用
部位の一致状況の組み合わせが一定のパターンを満たす場合
3
2007.07.27 版
例 1 地 域 がん登 録 標 準 データベースシステム
山 形 市 大 字 青 柳 1800の1と山 形 市 青 柳 180
0-1はコンピュータで は別 の 住 所 として 認 識 さ
地 域 がん登 録 標 準 データベースシステムで
れ、住 所 履 歴 の一 つとして登 録 されてしまうのを
は、表 の D-1 の変 形 を採 用 している。概 略 を示
防 ぐためである。
すと、①個 人 識 別 指 標 として漢 字 姓 、漢 字 名 、
上 記 のような入 力 条 件 を前 提 として入 力 され
西 暦 生 年 月 の 3 指 標 を用 いて同 一 人 物 候 補 リ
たデータについて、基 本 データベースに対 して
ストを抽 出 、②性 別 、住 所 、死 亡 年 月 日 、届 出
姓 名 の検 索 を行 う前 に以 下 の置 換 処 理 を行 う
医 療 機 関 コード、原 発 腫 瘍 部 位 コード、組 織 コ
(表 2)。漢 字 には、「広 ・廣 」「斉 ・斎 」などのよう
ード 等 の 判 定 の 補 助 指 標 を 含 むリ ストを 作 成 、
に異 字 体 が存 在 するものがあるため、これらの
③実 務 者 は②で作 成 されたリストをもとに判 定
漢 字 を新 字 ・旧 字 にも変 換 する仕 組 みを置 換
作 業 を行 う、となる。
処 理 という。各 端 末 に持 たせた置 換 用 のテキス
標 準 データベースは、記 載 間 違 いなどを考
トファイルにより、検 索 する姓 名 の各 文 字 を全 て
慮 し、一 度 同 一 人 物 として処 理 した個 人 の漢
の組 み合 わせで置 き換 える。また、ひらがなやカ
字 姓 名 、性 別 、生 年 月 日 、住 所 等 個 人 識 別 指
タカナが含 まれていれば、表 2 に記 した方 法 で
標 を、資 料 源 の情 報 とともに履 歴 で保 存 する機
組 合 せを作 る。置 換 変 換 数 (置 換 の種 類 )の上
能 を持 つ。同 一 人 物 候 補 リストにはこれらの履
限 が姓 、名 、それぞれ 200 個 に設 定 してあるが、
歴 情 報 も併 記 される。
ユキ 子 など の あり ふれ たカタ 仮 名 名 の 場 合 、 置
入 力 時 の条 件 は、漢 字 姓 名 、住 所 などのテ
換 変 換 数 が 200 以 上 になり機 械 照 合 処 理 が中
キスト型 で登 録 される日 本 語 一 般 について、JIS
止 されることが稀 に生 じる。このような事 例 は、
第 二 水 準 までの文 字 を用 いて入 力 すること、カ
入 力 時 に一 時 的 にゆき子 や幸 子 などを充 てる
タカナ・数 字 ・記 号 も含 めて全 角 で入 力 すること
ことで解 決 する。表 3 に示 す4段 階 の検 索 条 件
である。第 三 水 準 以 上 の文 字 は●と処 理 する
で一 致 した候 補 者 を抽 出 し(同 一 人 物 候 補 リス
か、登 録 室 で第 二 水 準 までの代 替 え文 字 を 決
ト)、最 終 的 に補 助 指 標 を併 記 したリストが作 成
めるなどで対 応 する。住 所 は、“字 ”の挿 入 や番
される(図 2)。実 務 者 は、このリストを目 視 確 認
地 の入 力 方 法 を統 一 しておくことが望 ましい。
して同 一 人 物 を判 定 する。
表 2 異字体置換処理方法
変 換 条 件
変 換 内 容
1文字目がひらがな
全てカタカナに変換
1文字目がカタカナ
全てひらがなに変換
名の三文字目が"こ"・"コ"
"子"に変換
名の三文字目が"子"
一文字目がひらがななら"こ"に、カタカナなら"コ"に変換
名の二文字目が"ネ"・"ね"
"子"に変換
名の二文字目が"子"
一文字目がひらがななら"ね"に、カタカナなら"ネ"に変換
置換例) ひさ子 → ①ヒサ子 → ②ひさこ → ③ヒサコ
タネ → ①たね → ②タ子 → ③た子
たね → ①タネ →②た子 → ③タ子
4
2007.07.27 版
表 3 照 合 処 理 の検 索 条 件 と分 類
一致項目
一致タイプ
姓
名
生年月
一致タイプ 1(完全一致)
〇
〇
〇
一致タイプ 2(その他の一致)
〇
〇
一致タイプ 3(その他の一致)
〇
一致タイプ 4(その他の一致)
〇
〇
〇
姓が異なるが、名と生年
月日が一致。医療機関
と部位コードが一致。
→ 同一人物と判定
姓と生年月日履歴の一
つが一致。名、住所詳
細が完全一致ではな
い。部位コードは一致。
→ 同一人物と判定
名が異なるが、姓と姓年
月日が一致。住所と部
位コードが一致。
→ 同一人物と判定
図 2 同 一 人 物 候 補 リスト。判 定 処 理 用 リスト。
5
2007.07.27 版
例 2 宮 城 県 地 域 がん登 録 における方 法
基 づき目 視 確 認 にて判 定 作 業 を行 なう。表 示
された情 報 で同 一 人 物 か否 かの判 定 がつかな
宮 城 県 地 域 がん登 録 では、照 合 の際 、生
い場 合 には、候 補 者 の原 発 腫 瘍 部 位 コード、
年 月 日 の①元 号 、②年 、③月 、④日 、⑤性 別 、
組 織 コード、届 出 医 療 機 関 などの腫 瘍 情 報 を
⑥診 断 時 住 所 (市 区 町 村 単 位 )、⑦姓 (漢 字 )、
確 認 の上 最 終 的 な判 定 を実 施 する。なお照 合
⑧名 ( 漢 字 ) の8項 目 を 指 標 と して 用 いている 。
に用 いる指 標 のうち、診 断 時 住 所 は宮 城 県 居
これらの指 標 に基 づいて6項 目 以 上 一 致 する
住 者 については総 務 省 が定 めた全 国 地 方 公
者 が同 一 人 物 候 補 群 として抽 出 され、一 致 項
共 団 体 コードの市 区 町 村 コードを入 力 し、用 い
目 数 が多 い候 補 者 から順 に表 示 される(表 1 中
ている。また生 年 月 日 に関 しては本 方 法 では元
の D-2-1 に類 似 した方 法 )。その際 、番 地 まで
号 による表 記 を用 いているため、明 治 45 年 と大
の診 断 時 住 所 ならびに現 住 所 、最 終 生 存 確 認
正 元 年 、大 正 15 年 と昭 和 元 年 のように同 一 年
日 、死 亡 年 月 日 等 も表 示 されるとともに、これら
が2つの元 号 にまたがる年 については元 号 、 年
の指 標 に関 してこれまでに複 数 の情 報 がある者
の表 記 を予 め一 方 に統 一 しておくことが望 まし
は予 備 欄 に入 力 されたそれらの情 報 もあわせて
いと考 えられる。
表 示 される。実 務 者 は表 示 された照 合 結 果 に
6
Fly UP