日本語プレースメントテストにおける聴解テスト項目の

by user

on 28 марта 2017

Category: Documents

>> Downloads: 1

views

Report

Comments

Description

Download 日本語プレースメントテストにおける聴解テスト項目の

Transcript

日本語プレースメントテストにおける聴解テスト項目の

日本語プレースメントテストにおける聴解テスト項目の分析
An Analysis of the Japanese Listening Placement Test
渡部倫子（広島大学）
Tomoko WATANABE（Hiroshima University）
要　旨
本稿では、1 ）日本語プレースメントテストにおける聴解テスト項目は受験者の能力を適切に測ってい
るか、2 ）日本語プレースメントテストによるクラス分けは聴解テスト項目と文法テスト項目にどの程度
影響されるのかを解明し、その結果からプレースメントテストの改訂点を論じた。被験者は岡山大学で日
本語を学んでいる留学生 405 名である。古典的テスト理論による分析の結果、聴解テスト項目、文法テス
ト項目共に、高い信頼性係数が得られた。また、聴解テストと文法テストによってクラス分け結果を十分
に予測できることが分かった。一方で、より適切なクラス編成のためには、聴解テスト項目に弁別力が高
く項目容易度が低い項目を加え、全体的な容易度を下げる必要があるという課題が見つかった。
［キーワード：プレースメントテスト、日本語、聴解、古典的テスト理論］
Abstract
In this paper, I propose points of revision in the Japanese language placement test based on the following
points,
1) The efficiency of listening test items to evaluate the candidates’ ability,
2) How listening test items and grammar test items influence the classification of candidates based on the
placement test.
The participants in this study are 405 international students studying Japanese language at Okayama
University. Classical test analysis was utilized to analyze the data. The results show that both listening test
items and grammar test items have a high reliability coefficient. When the result of dividing classes was
predicted, it was found that listening test items and grammar test items were significant predictors. However
we need to add in listening test items which are high in item discrimination and low in item facility and to make
the overall test a little more difficult.
［Key words: Placement test, Japanese language, Listening, Classical Test Theory］
れる。TOEFL や日本語能力試験のような習熟度テスト
1 ．研究の目的
（Proficiency test）をプレースメントテストに用いる場合
言語テストは、その目的から集団基準準拠テストと目
と、言語プログラムの特色を反映したプレースメントテ
標規準準拠テストに分けられる。前者は受験者の総合的
ストを開発する場合である。日本国内の大学の日本語プ
な習熟度を測定することが目的であり、各受験者のテス
ログラムでは、習熟度テストの成績を参照しつつも、後
トスコアは受験者全体のスコアと相対的に解釈される。
者のプレースメントテストを実施していることが報告さ
一方、目標規準準拠テストは、明瞭な学習事項を各受験
れている（ 2．先行研究を参照）。習熟度テストは多様な
者がどの程度習得できたかを測定することが目的であ
受験者集団の幅広い言語能力を測ることを目的としてい
る。そのため、テストスコアは他の受験者と比較される
るため、言語プログラムのプレースメントテストとして
ことなく絶対的に判断される（Brown，2005）。集団基準
使用しても、分布が偏りクラス分けが適切に行えない可
準拠テストの一つであるプレースメントテストは、習熟
能性があるためであろう。しかし、教育機関独自に開発
度別のクラス編成を行い、より充実した教育を提供する
したプレースメントテストの場合、その妥当性と信頼性
ことを目的としている。Wall, Clapham & Alderson（1994）
が十分に検討されていない場合がある。また、日本語プ
によると、既存のプレースメントテストは二つに大別さ
レースメントテストの具体的な実施方法や改善方法は、
̶ 125 ̶
かったものの、聴解テスト項目の信頼性係数は高く、聴
まだ十分周知されているとはいえない。
そこで本稿では、岡山大学日本語プログラムで開発さ
解テスト項目とその他のテスト項目に高い相関があるこ
れたプレースメントテストを古典的テスト理論（Classical
とを明らかにした。聴解テストは、短い会話を聞き、会
Test Theory）に基づいて分析し、その結果から改訂点を
話の内容に合った答えを選択肢から選ぶタイプ 1（24 問）
論じることを目的とする。古典的テスト理論は 1920 年
と、ひとまとまりの長いモノローグを聞き、内容に合っ
代に登場した集団準拠のテスト理論であり、正答数と
た文を選ぶタイプ 2（ 6 問）から構成されている。奥野・
その合計点を標準化することでテストを測定する。な
丸山・四方田（2008）は横浜国立大学留学生センターの
お、古典的テスト理論にはない利点を持つことが指摘さ
プレースメントテスト（文法・聴解、読解、漢字・語彙）
れているラッシュモデルによる分析は次稿に譲ることに
を分析し、聴解テスト項目は各科目と弱い相関があるこ
（1）
する
と、その他の科目間には強い相関があることを報告して
。
いる。なお、聴解テスト項目の具体的な内容は公開され
ていない。三枝（1986）は筑波大学留学生センターのプ
2 ．先行研究
レースメントテスト（聴解、文字、語彙、文法、読解）
日本国内の大学において、プレースメントテストに聴
を分析し、聴解と文法は正答率が高く、高得点に偏った
解テスト項目を採用している日本語教育機関は少なくな
分布であること、全体的に正規分布していないこと、聴
い。宮内・平田・小山（2007）は関西外国語大学留学生
解とその他テスト項目との相関係数は高かったものの、
別科のプレースメントテスト用リスニング項目の新旧を
聴解テストの信頼性係数だけが .90 に満たないことを明
それぞれ分析し、一つ一つの項目の改善をはかっている。
らかにした。聴解テスト項目は、テープの声と同じ単語
旧リスニング項目の分析から、問題数が少ないため信頼
もしくは文を選ぶもの（10 問）、テープの 4 つの会話文
性係数が低いこと、レベル 1（ゼロ初級）∼ 6（上級）の
から最も適当なものを選ぶもの（ 5 問）、テープを聞いて
うち、4 と 5 を識別するための難しい問題が足りないこ
該当する絵を選ぶもの（ 5 問）、会話を聞いて、その内容
と、比較的長いダイアログを聞いてその内容に当てはま
と一致する文を選ぶもの（15 問）、長文を聞いて質問に
る正解を選ぶ形式は、項目弁別力が低いこと、「テスト
答えるもの（10 問）から成る。小森（2011）は九州大学
項目に依存せず受験者の能力値を算出できるモデル」に
留学生センターのプレースメントテスト項目（文法、聴
適合しないテスト項目があること、リスニング項目の基
解、読解、漢字）を分析し、同大学の日本語コースのク
準点を機械的に適応すると、文法テスト得点よりも低い
ラス分けを予測するテスト項目がなんであるかを検討し
レベルにプレースされる傾向があることが分かった。こ
ている。重回帰分析の結果、文法と聴解を説明変数とす
れらを改善し、問題数を増やした新リスニング項目では、
る予測モデルが求められ、この 2 科目で日本語コースの
若干の改善がみられたものの、依然としてリスニングテ
レベルの 77％を説明できるとしている。中でも文法は
ストの基準点を機械的に適応してレベルを識別するには
もっとも有力なレベル分けの指標であり、初級において
限界があると結んでいる。新リスニング項目は 2 つのセ
は文法のみを説明変数とするモデルが求められた（R2 =
クションからなり、セクション I は短い会話から簡単な
.88）。聴解テスト項目は旧日本語能力試験を踏襲してお
情報を把握する多肢選択問題（ 2 つの会話、各 7 問）、セ
り、選択肢が絵や文字で提示される項目と選択肢が音声
クション II は会話の一部である質問文に対して適切な返
のみで提示される問題で構成されている（全 21 問）。
答を選択する問題（ 6 問）の計 20 問である。桜田（1993）
は金沢大学留学生センターのプレースメントテストの聴
以上の先行研究から、国内の大学が報告している聴解
テスト項目の形式は様々であることが分かる。また、聴
解テスト項目を分析している。聴解テストはミニマルペ
解テスト項目とその他のテスト項目の関係については、
アの聞き分け（45 問）、ディクテーション（15 問）、短
文法テスト項目よりも相関係数が低い傾向があるよう
い会話から簡単な情報を把握する多肢選択問題（問題数
だ。あくまでも文法テスト結果を基準にクラス分けをし、
は非公開）からなる。それぞれの結果から、聴解テスト
聴解テスト結果は参考資料にしているケースもあるた
得点が必ずしも日本語能力に比例しているとは限らず、
め、聴解テスト項目はこれからも改訂作業を繰り返す必
プレースメントテストとして適切とは言えないと結んで
要があることが分かる。
いる。
本稿で分析をする岡山大学日本語プログラムのプレー
また、プレースメントテストにおける聴解テスト項目
スメントテストでは、2007 年度までは文法、作文、聴解、
とその他の項目（文法、語彙、読解など）の関係を検討
会話等のテストのうち、複数の種類のテストを実施して
した研究もある。今村（2001）は一橋大学留学生センター
きたが、2008 年度からは文法と聴解のテストが実施され
のプレースメントテスト（漢字語彙、聴解、文法）を分
ている。このうち、文法テストは 2005 年と 2009 年前期
析し、聴解テスト項目は全体的にレベルの識別力が低
に改訂されたが（坂野，2009）、その後の見直しは行われ
̶ 126 ̶
日本語プレースメントテストにおける聴解テスト項目の分析
ていない。また、聴解テストは 2008 年以降、一度も改
1 問-第 40 問）の合計点が 0-18 点なら初級 1、19-31 点な
訂されていないという問題があった。そこで、渡部（2011）
ら初級 2 と判定される。32 点以上なら、文法テストの第
では、2010 年と 2011 年に実施されたプレースメントテ
40 問以降を受験することができる。そして、聴解テスト
スト（文法テスト項目と聴解テスト項目）を分析し、テ
+ 文法テストのセクション 1 とセクション 2（第 1 問-第
スト項目の信頼性が高いこと、聴解テストと文法テスト
80 問）の合計点が 32-57 点なら中級入門、58-69 点なら
の得点が正の相関関係であることを明らかにした。一方、
中級 1、70-82 点なら中級 2、83 点以上なら上級と判定さ
改訂すべき点として、テスト全体の項目容易度を下げる
れる。
こと、聴解テスト改訂のための再分析の必要性が示され
た。
本研究における受験者は岡山大学に在籍する留学生
で、2008 年から 2011 年までの間にプレースメントテス
以上の改訂の経緯をふまえ、本稿では 1 ）聴解テスト
トを受けた者 405 名である。分析には R を用いる。R は
項目は受験者の能力を適切に測っているか、2 ）プレー
統計計算とグラフィックスのための言語・環境である。
スメントテストによるクラス分けは聴解テスト項目と文
データ操作、計算、そしてグラフィックス表示のため
法テスト項目にどの程度影響されるのか、を研究課題と
のソフト機能の統合されたまとまりともいえる。多くの
する。
ユーザーは R を統計システムだと考えているが、開発者
は「R は環境であり、その中で統計的手法が実装されて
いる」と考えている（RjpWiki，2004）。無料でダウンロー
3 ．調査方法
ドできる R を利用することで、効率的に且つ経済的にテ
調査の目的は、2008 年から 2011 年に岡山大学日本語
プログラムで実施されたプレースメントテストにおける
スト結果を処理する方法を提案する。なお、本研究で用
いた R のバージョンは 2.14.0 である。
聴解テスト項目を分析し、前節で述べた 2 つの研究課題
を解明し今後の改訂の参考とすることである。岡山大学
日本語プログラムは、岡山大学の留学生（主に研究生、
4 ．結果と考察
大学院生、交換留学生）を対象としている。日本語既習
プレースメントテスト結果の要約とテスト項目の内的
者に対しては、各学期開始前にプレースメントテストを
一貫性（クロンバックの α 係数）を表 1 に示す（2）。この
実施している。初級 1、初級 2、中級入門、中級 1、中級
表から、プレースメントテストの信頼性が高いことが明
2、上級の 6 レベルがあり、それぞれ、週 4 回（1 回 90 分）
らかになった。
開講されている。
プレースメントテストはオンライン化されており、
表 1 記述統計量と内的一貫性による信頼性の推定（n = 405）
聴解テスト、文法テストの順に実施される（坂野他，
平均値
標準偏差
α 係数
2010）。聴解テストは、旧日本語能力試験 2 級、3 級、4
聴解テスト（15 問）
9.01
3.71
0.83
級の過去の問題から、各 5 問、計 15 問が採用されている。
文法テスト（80 問）
46.69
17.95
0.96
聴解テストの開始前に例題を行い、ヘッドフォンの音声
総合得点（95 問）
55.70
20.27
0.96
や解答方法の確認を行う。その後、15 問のテストとなる
が、問題は 1 回流すのみで、途中で止めることはできない。
次に、聴解テスト項目（以下、L1 ∼ L15）の良し悪し
テスト終了後、「解答終了」のボタンを押すと、次の文
を判断するために、項目容易度と項目弁別力（項目弁別
法テストの説明画面に移動する。問題は音声による多肢
指数、点双列相関係数）を算出した（表 2）。項目容易度
選択問題で、回答は 4 つの選択肢からなる。
は「（その項目に正答した人数）÷（受験した人数）」で
文法テストは、全 80 問である。大きく 2 つのセクショ
算出され、最適な範囲は .30 ∼ .70 であるといわれている。
ンに分けられており、セクション 1（第 1 問-第 40 問）
項目弁別指数（UL 指数）は、得点の上位 27％の正答率
の終了後、自動採点が行われ、セクション 1 及び聴解テ
と下位 27％の正答率の差である。項目弁別指数は、.40
ストの合計点が一定以上あれば、次のセクション 2（第
以上がとてもよい項目、.30 から .39 がよい項目であるが
41 問-第 80 問）に進む。点数が足りなければ、これで終
改良が必要かもしれない項目、.20 から .29 は改良が必要
了となる。文法テストの問題については、旧日本語能力
な項目、.19 以下はよくない項目で削除するか作り直す
試験 2 級、3 級、4 級の問題から選んだもの、旧日本語
ことが必要な項目とされている（Brown，2005：p.75）。
能力試験の問題から語彙等を部分的に変えたもの、岡山
図 1 は得点の上位 45 人群（high，27％）の正答率と下位
大学で独自に作成したものがある。
群 45 人（low，27％）の正答率の差を視覚化したもので
クラス分けは聴解テストと文法テストの総合点によっ
ある。もう一つ、項目弁別力を示すものとして点双列相
て行われる。聴解テスト+ 文法テストのセクション 1（第
関係数がある。これは、テストの各項目がテストの総合
̶ 127 ̶
表 2 聴解テストの項目容易度、項目弁別指数、点双列相関係数
L1
L2
L3
L4
L5
L6
L7
L8
L9
L10
L11
L12
L13
L14
L15
0.88
0.29
0.68
0.85
0.86
0.61
0.60
0.74
0.57
0.58
0.72
0.29
0.57
0.44
0.28
0.40
0.42
0.73
0.46
0.38
0.81
0.82
0.41
0.74
0.78
0.63
0.71
0.76
0.80
0.38
点双列相関係数
0.49
0.36
0.61
0.56
0.46
0.66
0.69
0.42
0.61
0.64
0.58
0.57
0.62
0.59
0.34
0.8
1.0
項目容易度
項目弁別指数
0.0
0.2
0.4
UL
0.6
high
low
2
185
4
6
8
10
12
14
item
図 1 聴解テストの項目弁別指数
得点とどの程度関連があるかを示す。一般的には、.00
すべて正規分布に近いことから、クラス分けが適切に行
∼± .20 をほとんど相関がない（.00 は無相関）、± .20 ∼
えるプレースメントテストであると言える。だたし、各
± .40 を低い（弱い）相関がある、± .40 ∼± .70 をかな
テストはやや右寄りの分布になっている。より適切なク
り（比較的強い）相関がある、± .70 ∼± 1.00 を高い（強
ラス編成のために、項目弁別力が高く項目容易度が低い
い）相関がある（＋ 1.00 は完全な正の相関、− 1.00 は完
項目を加え、全体的な容易度を下げる必要がある。また、
全な負の相関）と解釈する。
聴解テスト、文法テスト、総合得点、クラス分け結果
表 2 と図 1 から、聴解テストの項目容易度は、L1、
の 4 つの変数間の関係を解明するため、図 2 中の右上に
L4、L5、L8、L11 が最適な範囲よりも高く、L2、L12、
相関係数を、左下に散布図を示した。各図の x 軸と y 軸
L15 がやや低いことが分かった。項目容易度が高すぎる
には棒グラフに記載されている変数名（SumL、SumG、
項目が多いという問題点が明らかになった。項目弁別指
Sum、Level）が対応している。例えば、0.56 は文法テス
数は、L5、L15 が基準値の .40 を下回っていた。点双列
トと聴解テストの相関係数を示している。また、左下左
相関係数からは、テストの総合得点と L2、L15 には低
端の散布図の x 軸は聴解テスト（SumL）、y 軸はクラス
い相関があり、その他の項目には全て比較的強い相関が
分け結果（Level）である。図 2 から、文法テストと総合
あることが明らかになった。以上の項目（L1、L2、L4、
得点、文法テストとクラス分け結果に強い線形的相関が
L5、L8、L11、L12、L15）は改良を検討すべきである。
次に、得点ごとの人数の分布を視覚化するため、聴解
テスト（SumL）、文法テスト（SumG）
、総合得点（Sum）、
クラス分け結果（Level）の 4 つの変数間の関係を図 2 に
示した（3）。図 2 の Level 上方の 1 − 6 は、初級 1、初級 2、
あり、先行研究と同様に、聴解テストとその他の変数間
にも比較的高い正の相関が認められた（今村，2001；三枝，
1986）。
そこで、小森（2011）と同様に重回帰分析を用いて、
聴解テスト、文法テストのそれぞれの得点を用いてクラ
中級入門、中級 1、中級 2、上級レベルに対応している。
ス分け結果を予測することにした。まず、ステップワイ
まず、図 2 中の棒グラフ（度数分布）に注目してほしい。
ズ法による重回帰分析を用いて変数選択をした（4）。
̶ 128 ̶
日本語プレースメントテストにおける聴解テスト項目の分析
図 2 散布図行列
表 3 日本語レベルを従属変数とした重回帰分析の結果
変数
偏回帰係数
（B）
標準誤差
（SEB）
標準偏回帰係数
（β）
p値
聴解テスト
0.08
0.01
0.22
13.44*
文法テスト
0.06
0.00
0.83
50.85*
切片
0.25
0.05
-0.03
4.90*
*p<.001
AIC の基準によるステップワイズ法を採用した重回帰
クラス分け結果= 1.56+0.24×聴解テスト（R2 = .46, p<.001）
分析の結果、聴解テストと文法テストの両者を説明変数
クラス分け結果= 0.52+0.07×文法テスト（R2 = .90, p<.001）
として使った式が最適であることが分かった。以上の重
回帰分析の結果を表 3 にまとめた（5）。
以上の分析結果から、聴解テストと文法テストはと
聴解テストと文法テストを用いた回帰式は次のように
なった。
もにクラス分け結果に有意な影響を及ぼしており、両テ
ストを併用した式がクラス分けには最適であることが分
クラス分け結果= 0.25+0.08×聴解テスト+0.06×文法テスト
かった。聴解テストと文法テストを説明変数とする予測
モデルの予測力は、小森（2011）の 77％を上回る 93％で
2
この回帰式の当てはまりの良さを示す決定係数は R
あり、極めて高い。また、図 2 の左下左端、聴解テスト
=.93 であった（p<.001）。このことは、聴解テストと文
（SumL）とクラス分け結果（Level）の分布をみると、初級
法テストによるクラス分け結果の予測力がきわめて高い
2 から中級 2 までの各レベル内には、様々な聴解力の受
ことを意味する。
験者が存在しており、その特徴は文法テストよりも顕著
最後に、念のため聴解テストと文法テストそれぞれを
である。聴解テストのみではクラス分け結果の予測力が
説明変数とし、単回帰分析を行った。回帰式は次のよう
低いことからも、岡山大学で実施されている日本語プロ
になった。
グラムのプレースメントテストにおいては、聴解テスト
と文法テストを併用したほうがいいと結論付けられる。
̶ 129 ̶
込み、pairs.panels 関数を用いる。
5 ．まとめと今後の課題
（4）
R を用いてステップワイズ法による変数選択をする際は、
パッケージ MASS を読み込み、関数 step を用いる。関数
本研究の目的は、岡山大学で実施されている日本語プ
step は、AIC（Akaike’s Information Criterion）を基準に最
ログラムのプレースメントテストにおいて、1 ）聴解テ
適な回帰式を選択することが出来る。最初にすべての説明
スト項目は受験者の能力を適切に測っているか、2 ）プ
変数候補を使った式を推定し、AIC が上がるようにひとつ
レースメントテストによるクラス分けは聴解テスト項目
ずつ変数を抜いて行く。どれを抜いても AIC が下がるな
と文法テスト項目にどの程度影響されるのか、を解明し、
ら、そこでストップする。R を用いてステップワイズ法に
その結果からプレースメントテストの改訂点を論じるこ
よる変数選択する場合の＜コマンド例 1 ＞を以下に示す。
とであった。1 ）については、岡山大学で実施されてい
1 行目でパッケージ MASS を読み込んだのち、ptest とい
る日本語プログラムのプレースメントテストの結果、聴
う名前のデータセットを指定する。2 行目はクラス分け結
解テスト項目、文法テスト項目共に、高い信頼性係数が
果を従属変数に聴解テストと文法テストを説明変数とした
得られた。2 ）については、聴解テストと文法テストは
重回帰分析を行い、その結果を Jlevel.lm という箱の中に
ともにクラス分け結果に有意な影響を及ぼしており、聴
入れることを意味する。さらに 3 行目で変数選択のため
解テストと文法テストを説明変数とする予測モデルの予
のステップワイズ法による分析を行い、その結果を result.
測力が極めて高いことが分かった。しかし、より適切な
stepwise という箱に入れる。ステップワイズ法による分析
クラス編成のためには、聴解テスト項目に弁別力が高く
項目容易度が低い項目を加え、全体的な容易度を下げる
必要があるという課題も明らかになった。
ただし、本稿で採用した古典的テスト理論には、受験
者の集団によって個々の評価が左右されるという限界が
ある。次稿では、この限界を超える理論であるラッシュ
結果の詳細は 4 行目のコマンドで表示される。
＜コマンド例 1 ＞
>library
（MASS）
>Jlevel.lm<-lm
（Level ~ . , data = ptest）
>result.stepwise<-step（Jlebel.lm）
>summary（result.stepwise）
また、＜コマンド例 1 ＞で求められた回帰式の当てはまり
モデルによる分析を行う。その際、機能していない錯乱
の良さがどの程度であるかは、回帰分析の要約情報から読
肢を持つ項目がないかについても検討する。また、学習
者特性（漢字圏学習者か非漢字圏学習者か）や解答形式
の漢字要因がテストに与える影響についても分析する。
み取れる。
＜コマンド例 2 ＞
> summary（Jlevel.lm）
種類の異なるテスト理論に基づいてプレースメントテス
（5）
R の関数 lm では標準偏回帰係数は求められない。その
トを分析し、テスト得点を左右する様々な要因を考慮す
ため、＜コマンド例 3 ＞のように、データセットを関数
ることで、より適切に受験者能力を測ることができるテ
scale を使って標準化したうえで、関数 lm を用いるとよい。
スト項目に改訂する。日本語教育の現場において、より
＜コマンド例 3 ＞
良いテストの作成は大変重要な課題である。今後も、教
> ds<-data.frame（scale（ptest））
育機関独自に開発したプレースメントテストの検討を通
して得られた知見を共有し、日本語プログラムの特色を
最大限考慮したテスト開発の一助としたい。
> lm
（Level ~ . , ds）
謝辞
貴重なデータを提供してくださった岡山大学言語教育セン
ターに心から御礼申し上げる。
注
（ 1 ）ラッシュモデルはテスト項目に難易度パラメータを付加す
ることによって、どのような異なったテストを用いても、
どんな受験者集団に実施しても、受験者の能力とテスト項
目の性質（難易度、精度など）を示すことができるという
利点がある。日本語プレースメントテストをラッシュモデ
ルで分析した研究は、坂野（2006，2009）、宮内・平田・
小山（2007）がある。
（2）
テスト項目の具体的な分析方法を紹介する。R で基礎
統計量を算出する場合、パッケージ psych を読み込み、
describe 関数を用いる。パッケージとは R 言語のプログラ
ムを配布用の形式に保存したものである。内的一貫性（ク
ロンバックの α 係数）は alpha 関数を用いる。コマンド例
は渡部（2011）を参照のこと。
（ 3 ） R で散布図行列を出力する場合、パッケージ psych を読み
引用文献
青木繁伸（2009）『R による統計解析』オーム社 .
青山眞子・廣利正代・野口裕之（2003）「日本語能力試験の因子
分析的検討」『日本語国際センター紀要』第 13 号，pp.19-28.
今村和宏（2001）
「プレースメントテスト改良のための統計分析」
『一橋大学留学生センター紀要』第 4 号，pp.19-37.
奥野由紀子・丸山千歌・四方田千恵（2008）「プレイスメント・
テストと学部中級日本語クラスに関する報告」『横浜国立大学
留学生センター教育研究論集』15，pp.75-92.
小森和子（2011）「プレースメントテストのオンライン化の試み
と問題項目の分析評価」『九州大学留学生センター紀要』19，
pp. 89-106.
三枝令子（1986）「プレースメント・テストの統計的処理の試み」
̶ 130 ̶
日本語プレースメントテストにおける聴解テスト項目の分析
『筑波大学留学生教育センター日本語教育論集』第 2 号，pp.
171-192.
論集特集：小山揚子教授退職記念』16，pp.15-35.
渡部倫子（2011）「R を利用した日本語プレースメントテストの
桜田千采（1993）「プレイスメントテストと聴解力」『金沢大学
留学生教育センター紀要』2，pp.51-57.
分析−古典的テスト理論による分析−」『広島大学日本語教育
研究』第 21 号，広島大学大学院教育学研究科／教育学部日本
靜哲人（2007）『基礎から深く理解するラッシュモデリング項
目応答理論とは似て非なる測定のパラダイム』関西大学出版
部.
語教育学講座，pp.25-32.
Brown, J. D.（2005）Testing in language programs: A comprehensive
guide to English language assessment（New ed.）. New York:
坂野永理（2006）「Rasch モデルによる漢字プレースメントテス
トの改良」『日本テスト学会誌』2（1），pp.91-100.
McGraw Hill.
Rasch, G.（1960/80）Probabilistic models for some intelligence and
坂野永理（2009）「日本語コース文法プレースメントテストの
attainment tests.（Copenhagen, Danish Institute for Educational
分析」『大学教育研究紀要』第 5 号，岡山大学国際センター，
Research.）Expanded edition with foreword and afterword by B. J.
pp.33-42.
Wright.（1980）. Chicago: The University of Chicago Press.
坂野永理・渡部倫子・大久保理恵（2010）「オンライン日本語プ
レースメントテストの開発」『大学教育研究紀要』第 6 号，岡
山大学国際センター，pp.107-117.
RjpWiki（2004）
「What is R?（R とは？）
」< http://www.okada.jp.org/
RWiki/?RjpWiki>（2012 年 10 月 15 日閲覧）.
Wall, D., Clapham, C., & Alderson, J. C.（1994）. “Evaluating a
宮内俊慈・平田裕・小山揚子（2007）「プレースメント用リスニ
placement test”. Language Testing, 11（3），321-344.
ングテスト改善報告」『関西外国語大学留学生別科日本語教育
̶ 131 ̶