Comments
Description
Transcript
CROにおけるSASプログラマの育成教育
CROにおけるSASプログラマの育成教育 2003年11月28日(金) 第57回 関西SASユーザー会 株式会社ACRONET 臨床開発センター DM・統計解析部 竹田 眞 1 1.会社概要・業務紹介 名称:㈱CRCソリューションズ 今年6月 までは 業種:情報処理サービス 概要:1958年設立/東証1部/伊藤忠宇宙・情報・マル チメディアカンパニー 2003年7月/医薬情報・C RO部門が独立・分社化 「株式会社ACRONET」 大阪オフィス:大阪市中央区久太郎町4-1-3伊藤忠ビル8F 2 CROにおけるSASプログラマの育成 対象レベルの確認 ①パソコン未経験者 ②プログラミング未経験者 ③SAS未経験者 ④SAS実務未経験者 3 CROにおけるSASプログラマの育成 対象レベルの確認 ①パソコン未経験者 )パソコンを使ったことがない、もしくは初心者。 ⇒ 対応 市販の入門書で学習 パソコン教室で学習 目標レベル 電源のON・OFF マウス操作 ファイルのコピ−、移動、削除等 かな漢字変換 4 CROにおけるSASプログラマの育成 対象レベルの確認 ②プログラミング未経験者 )パソコンを使えるが、プログラムは作ったことがない。 ⇒ 対応 社内情報処理研修 基本情報処理技術者試験用テキストを利用 目標レベル ソートのアルゴリズム・フローチャートが 理解できる。 Input、Output、If文、変数属性(数値型、 文字型)が理解できる。 5 CROにおけるSASプログラマの育成 対象レベルの確認 ③SAS未経験者 )簡単なプログラムは作ったことがあるが、SASの経験はない。 ⇒ 対応 SAS社トレーニングコース 市販のテキストを利用 6 CROにおけるSASプログラマの育成 初心者向けSAS社トレーニングコース例 コ ース名 日数 税抜価格 「S AS プ ロ グ ラ ミ ン グ Ba sic I」コ ース 2日 間 90,000円 「S AS プ ロ グ ラ ミ ン グ Ba sic II」コ ース 2日 間 90,000円 「実 践 デー タハ ン ドリ ン グ 」コ ース 1日 間 45,000円 「マク ロ 言 語 入 門 」コ ース 1日 間 45,000円 「S AS に よ る デ ータ解 析 入 門 」コ ー ス 2日 間 90,000円 「 医 薬 向 け S AS に よ る データ解 析 入 門 」 コ ー ス 2日 間 90,000円 「統 計 概 論 」コ ー ス 1日 間 45,000円 「臨 床 デー タマネ ジメ ン ト」コ ー ス 2日 間 90,000円 「集 計 解 析 表 作 成 」コ ース 2日 間 90,000円 7 CROにおけるSASプログラマの育成 お薦めテキスト 東京大学出版会 「SASによるデータ解析入門[第2版]」 竹内啓監修 市川伸一・大橋靖雄・岸本淳司・浜田知 久馬著(税込み¥3,570) 8 CROにおけるSASプログラマの育成 目標レベル SAS Window(PGM,LOG,OUTPUT)を理 解する。 DATA STEP、プロシジャSTEPの概 念、文法を理解する。 欠損値の概念を理解する。 9 CROにおけるSASプログラマの育成 目標レベル DATA STEP SET,MERGEの違いを理解する。 IF文で簡単な条件の取捨選択ができる SASの記法を覚える 10 CROにおけるSASプログラマの育成 目標レベル プロシジャSTEP BASEプロダクトのプロシジャ内、よく使わ れるもの名称と機能を覚える SORT,FREQ,MEANS,UNIVARIATE等 11 CROにおけるSASプログラマの育成 ACRONET(旧CRC)における新人研修 ①全社研修 ②CRO部門研修 ③DM・統計解析チーム研修 12 CROにおけるSASプログラマの育成 ACRONET(旧CRC)における新人研修 ①全社研修(4月∼5月) ・企業人研修 ・マナー研修 ・PMLとリテラシー ・コンピュータの基礎知識 ・UNIX基礎技術入門 <目標> 社会人の一般常識、 ・システム設計入門 コンピュータ、 ・C言語入門 プログラミングの基礎を習得 ・ネットワーク/データベース入門 ・アルゴリズム/フローチャート入門 13 CROにおけるSASプログラマの育成 ACRONET(旧CRC)における新人研修 ②CRO部門研修(6月) ・ 医薬品開発に対する理解 ・ 医薬品の基礎 ・ CRO業務に対する理解 <目標> 医薬品開発に関する用語 や仕組み、CRO業界で必 要な基礎知識を習得 ・ 法令・規則に対する理解 ・ 医学の基礎 14 CROにおけるSASプログラマの育成 ACRONET(旧CRC)における新人研修 ③DM・統計解析チーム研修(6月∼) ・SAS社トレーニングコース ・OJTによる個別指導 <目標> SAS/DATA STEP、プロシ ジャの使い方、DM・統計業務 の概要を習得 ・月例チーム勉強会(DM・統計) 15 CROにおけるSASプログラマの育成 ACRONET(旧CRC)における新人研修 コンピュータ、 プログラミング 社会人 の一般常識 医薬品開発 、 CRO業務 SAS 初級 16 CROにおけるSASプログラマの育成 対象レベルの確認 ④ SAS実務未経験者 )SASは使ったことあるが、実務経験はない。 ⇒ 対応 従来はOJTによる個別指導 17 CROにおけるSASプログラマの育成 問題点 実務には関してはOJT中心のため、その 時の作業状況により、担当業務が異なる。 担当業務が一定でないため、スキルに偏り が生じる。 18 CROにおけるSASプログラマの育成 模擬解析演習 あらかじめ用意されたデータ、仕様書を元 に解析データの作成から解析結果を作成する。 模擬解析演習を通じてさまざまなSASプログラ ミング技術やプロシジャ、関数の使い方を体 験し、その使い方を習得することを目標とす る。 19 CROにおけるSASプログラマの育成 模擬解析演習 演習内容 ①入力データから解析用データへの変換 ②症例一覧表 ③頻度集計表(例数、%) ④基礎統計量表(例数、平均、標準偏差、最小値、最大値) ⑤グラフ(散布図・経時的推移) ⑥検定(χ2検定、t検定、Wilcoxon検定) 20 CROにおけるSASプログラマの育成 模擬解析演習 演習において与えられる教材 ①入力データ(SASデータセット) ②入力データ変数定義書 ③解析用データ定義書 ④統計解析計画書(図表レイアウトを含む) ⑤解析プログラム仕様書 ⑥プログラムサンプル 21 CROにおけるSASプログラマの育成 入力データ変数定義書 TYP E :形 式 [1:数 値 、 2:文 字 、 3:日 付 ] データセ ッ ト名 テ ゙ータ セットラ ヘ ゙ル No. BAC K 患者背景 変数名 ラベル 1 P ATNO 症例番号 2 K EY K EY TYP E L ENG TH 1 F ORM AT 説明 2 3 $3. 群 2 1 $K EY. 3 BIRTHD 生年月日 1 8 YYM M DD10. 4 RES D 登録日 1 8 YYM M DD10. 5 S EX 性別 2 1 $S EX . 6 HEIG HT 身 長 (cm ) 1 8 5.1 7 W EIG HT 体 重 (kg) 1 8 5.1 8 G AP YN 合併症有無 2 1 $UM U. N:無 ,Y:有 9 HEIYN 併用薬有無 2 1 $UM U. N:無 ,Y:有 A:Act iv e,P :P la cebo M :男 性 ,F :女 性 22 CROにおけるSASプログラマの育成 入力データ 23 CROにおけるSASプログラマの育成 解析用データ定義書 TYP E :形 式 [1:数 値 、 2:文 字 、 3:日 付 ] テ ゙ータセッ ト 名 B ASE テ ゙ータセッ ト ラ No. ベル 患者情報 変数名 ラベ ル K EY TYPE 1 2 3 $3. 説明 L ENG T H FO R M AT オ リ ジナ ル 変 数 1 PAT N O 症例番号 2 GU N 群 1 8 8. 1 : Ac t i ve , 2 : P l ac e bo 3 AGE1 年齢(実数) 1 8 8. R ES Dと BIR T HDよ り 算 出 BAC K . BIR T HD, R ES D 4 AGE2 年 齢 ( カテ ゴリ) 1 8 8. 1:65歳未満,2:65歳以上 5 GEN D ER 性別 1 8 8. 1:男性,2:女性 BAC K . S EX 6 GAP_ Y N 合併症有無 1 8 8. 1:無,2:有 BAC K . G AP Y N 7 H EI _ Y N 併用薬有無 1 8 8. 1:無,2:有 BAC K . HEIY N 8 BMI B MI(kg/ ㎡) 1 8 5 .1 BAC K . P AT NO BAC K . K EY BM I= R O UND( W EIG HT / ( BAC K . HEIG HT , W EIG HT HEIG HT / 1 0 0 )* * 2 , 0 . 1 ) 24 CROにおけるSASプログラマの育成 解析用データ 25 CROにおけるSASプログラマの育成 図表レイアウト 患者背景 項 目 Active群 Placebo群 解析対象例 XX XX 平均値±標準偏差 XX.X ± XX.X XX.X ± XX.X 最小値−最大値 XX - XX XX - XX t= X.XXXX 中央値 XX.X XX.X p= X.XXXX 65歳未満 XX(XX.X%) XX(XX.X%) Fisher's Exact 65歳以上 XX(XX.X%) XX(XX.X%) p= 男性 XX(XX.X%) XX(XX.X%) Fisher's Exact 女性 XX(XX.X%) XX(XX.X%) p= 無 XX(XX.X%) XX(XX.X%) Fisher's Exact 有 XX(XX.X%) XX(XX.X%) p= 無 XX(XX.X%) XX(XX.X%) Fisher's Exact 有 XX(XX.X%) XX(XX.X%) p= 平均値±標準偏差 XX.XX ± XX.XX XX.XX ± XX.XX 最小値−最大値 XX.X - XX.X XX.X - XX.X t= X.XXXX 中央値 XX.XX XX.XX p= X.XXXX 年齢 性別 合併症 併用薬 BMI(kg/㎡) 検定 Student t検定 X.XXXX X.XXXX X.XXXX X.XXXX Student t検定 26 CROにおけるSASプログラマの育成 解析プログラム仕様書① 患者背景 項 目 Active群 Placebo群 解析対象例 1 16 平均値±標準偏差 2 17 Student t検定 最小値−最大値 3 18 t= 中央値 4 19 p= 65歳未満 5 20 Fisher's Exact 65歳以上 6 21 p= 男性 7 22 Fisher's Exact 女性 8 23 p= 無 9 24 Fisher's Exact 有 10 25 p= 無 11 26 Fisher's Exact 有 12 27 p= 平均値±標準偏差 13 28 Student t検定 最小値−最大値 14 29 t= 中央値 15 30 p= 年齢 性別 合併症 併用薬 BMI(kg/㎡) 検定 31 32 33 34 35 36 27 CROにおけるSASプログラマの育成 解析プログラム仕様書② 1. 統 計 解 析 用 デ ー タ 名 BASE.SD2 2. 出 力 定 義 出力番 号 1 GU N = 1 2 GU N = 1 3 GU N = 1 4 GU N = 1 5 GU N = 1 6 GU N = 1 7 GU N = 1 8 GU N = 1 9 GU N = 1 10 GU N = 1 11 GU N = 1 12 GU N = 1 13 GU N = 1 14 GU N = 1 15 GU N = 1 1 6 - 3 0 GU N = 2 出力定義 の 症 例 数 をカウ ン ト して 出 力 & AGE1 の 平 均 値 ,標 準 偏 差 を出 力 & AGE1 の 最 小 値 ,最 大 値 を出 力 & AGE1 の 中 央 値 を出 力 & AGE2 = 1 の 症 例 数 と% を算 出 して 出 力 & AGE2 = 2 の 症 例 数 と% を算 出 して 出 力 & GEN D ER= 1 の 症 例 数 と% を算 出 して 出 力 & GEN D ER= 2 の 症 例 数 と% を算 出 して 出 力 & GAP_ Y N = 1 の 症 例 数 と% を算 出 して 出 力 & GAP_ Y N = 2 の 症 例 数 と% を算 出 して 出 力 & H EI _ Y N = 1 の 症 例 数 と% を算 出 して 出 力 & H EI _ Y N = 2 の 症 例 数 と% を算 出 して 出 力 & B M I の 平 均 値 ,標 準 偏 差 を出 力 & B M I の 最 小 値 ,最 大 値 を出 力 & B M I の 中 央 値 を出 力 として 1 - 2 0 と同 様 の 処 理 を行 う 変数名 GU N AGE1 AGE2 GEN D ER GAP_ Y N H EI _ Y N B MI ラ ベ ル 名 群 年齢(実数) 年 齢 ( カテ ゴ リ) 性別 合併症有無 併用薬有無 B MI(kg/ ㎡) 使 用 フ ゚ロ シジャ U N I VARI AT E ( N 数 をプロシ ジャで 出力 し、 % は D AT AS T EP 内で算出す る) 28 CROにおけるSASプログラマの育成 解析プログラム仕様書③ 出力番 号 31 32 33 34 35 36 出力定義 PRO C T T ES T ;C L AS S GU N ;VAR AGE1 ;RU N ; に よ り T 値 とP値 を出 力 する ( Equ al) PRO C FREQ ;T AB LE GU N * AGE2 / EX AC T ; O U T PU T O U T = * * * EX AC T ;RU N ; に よ り P値 ( P_ EX AC T 2 ) を出 力 する PRO C FREQ ;T AB LE GU N * GEN D ER/ EX AC T ; O U T PU T O U T = * * * EX AC T ;RU N ; に よ り P値 ( P_ EX AC T 2 ) を出 力 する PRO C FREQ ;T AB LE GU N * GAP_ Y N / EX AC T ; O U T PU T O U T = * * * EX AC T ;RU N ; に よ り P値 ( P_ EX AC T 2 ) を出 力 する PRO C FREQ ;T AB LE GU N * H EI _ Y N / EX AC T ; O U T PU T O U T = * * * EX AC T ;RU N ; に よ り P値 ( P_ EX AC T 2 ) を出 力 する PRO C T T ES T ;C L AS S GU N ;VAR B M I ;RU N ; に よ り T 値 とP値 を出 力 する ( Equ al) 変数名 ラ ベ ル 名 使 用 フ ゚ ロ シ シ ゙ャ GU N AGE1 GU N AGE2 群 年齢(実数) 群 年 齢 ( カテ ゴリ) T T ES T GU N GEN D ER 群 性別 FREQ GU N GAP_ Y N 群 合併症有無 FREQ GU N H EI _ Y N 群 併用薬有無 FREQ GU N AGE1 群 B MI(kg/㎡) T T ES T FREQ 29 CROにおけるSASプログラマの育成 解析結果 患者背景 項 目 Active群 Placebo群 解析対象例 12 12 平均値±標準偏差 61.8 ± 15.2 55.2 ± 10.5 最小値−最大値 31 - 82 41 - 71 t= 1.2496 中央値 62.5 52.5 p= 0.2246 65歳未満 7(58.3%) 8(66.7%) Fisher's Exact 65歳以上 5(41.7%) 4(33.3%) p= 男性 4(33.3%) 8(66.7%) Fisher's Exact 女性 8(66.7%) 4(33.3%) p= 無 4(33.3%) 7(58.3%) Fisher's Exact 有 8(66.7%) 5(41.7%) p= 無 6(50.0%) 4(33.3%) Fisher's Exact 有 6(50.0%) 8(66.7%) p= 平均値±標準偏差 23.44 ± 2.10 22.37 ± 3.52 最小値−最大値 19.1 - 26.4 16.3 - 27.7 t= 0.9081 中央値 23.5 23.05 p= 0.3737 年齢 性別 合併症 併用薬 BMI(kg/㎡) 検定 Student t検定 1.0000 0.2203 0.4136 0.6802 Student t検定 30 CROにおけるSASプログラマの育成 ①データ変換 ②データ確認 ③結果出力 入力データ マスタ解析用 解析結果 マスタ解析 ↓ データとの の 結果との 解析用データ 比較 出力 比較 ③ マスタ 解析結果 解析結果 マスタ 解析用データ 解析用データ 入力データ コンペア ② コンペア ① ④結果確認 31 CROにおけるSASプログラマの育成 模擬解析演習 まとめ ①期待するメリット ・SASプログラマの早期育成 ・OJTトレーナの負担軽減 ②今後の展望 ・様々な試験デザインの演習 ・データマネージメントを含めた演習 32