【量的調査】信頼性と妥当性

社会調査のアンケートや心理検査では、信頼性と妥当性が担保されていなければなりません。今回の内容は難しければスルーしてもOKです。信頼性と妥当性の違いだけは押さえておきましょう。

スポンサーリンク

信頼性

信頼性とは、検査結果の一貫性のことで、再現性、等価性、内的整合性の3点で評価されます。

再現性(安定性)

再現性とは、同一対象に同じ検査を繰り返しても同じ測定値が得られる程度のことです。

再現性を試験するには、同一人物に時間をおいて同一検査を行い、2回の結果を相関係数で評価する「再検査法(再テスト法)」があります。

再検査法は、時間を置いて検査をするので被験者の状態が変わってしまっている可能性があります。

等価性

等価性とは、同じような他の検査との関係性の程度のことです。

等価性は、似たような2種類の検査の測定値間の相関係数を評価する「並行検査法」によって推定できます。

内的整合性

内的整合性は、その検査の尺度内の項目が、同じ内容を測定しているかのことです。

内的整合性が高いということは、各質問にバラつきがないことを表します。

内的整合性を検証するには、ある尺度に関する複数の質問を2群に分けて相関係数を算出して評価する「折半法」、可能なすべての組み合わせについて相関係数を算出して平均する「クロンバックのα係数」があります。現在では信頼性の評価として「クロンバックのα係数」を用いるのが主流です。

カリスマくん
カリスマくん

クロンバック(Cronbach,L.J.)はアメリカの心理学者だよ。

<クロンバックのα係数>
・0~1の値をとる
・値が1に近いほど信頼性が高い
・検査項目の数が多いほど高い値をとる

妥当性

妥当性とは、目的の内容を測定できている程度のことです。

内容的妥当性

ある検査の項目が、測定しようとしている領域に適切か否か

基準関連妥当性

別の外的基準とどの程度関連があるか

構成概念妥当性

測定しようとしている概念をどのくらい測定できているか

信頼性と妥当性

ここまで見てきて、信頼性よりも妥当性がまずは重要ということがわかりますね。妥当性が担保されていないと、どれだけ信頼性が高くても的外れですから。

信頼性と妥当性は、よくダーツに例えられます。信頼性が高いとはバラツキが少ないということなので、ダーツの矢が同じところに刺さるイメージです。ただし、的の真ん中でなくても、端っこでもバラついていなければ信頼性は高いということになります。対して、妥当性とは、ダーツの的の真ん中に矢が刺さることです。

カリスマくん
カリスマくん

つまり、信頼性が高くても妥当性が高いとは限らないということだね。

信頼性と妥当性

過去問

第31回 問題86

測定と尺度に関する次の記述のうち、最も適切なものを1つ選びなさい。
1 測定とは、一定の規則や基準を用いて、調べたい対象の経験的な特性に数値や記号を与える手続である。
2 信頼性とは、測定したい概念をどのくらい正確に測定できているか、という測定の適切性のことをいう。
3 妥当性とは、同じ調査をもう一度行ったときに同じ結果になる安定性のことをいう。
4 社会調査の測定では、信頼性と妥当性のどちらかが満たされていればよい。
5 名義尺度、順序尺度、間隔尺度、比例尺度という四つの尺度水準のうち、大小関係を測定することができるのは、名義尺度である。

1 測定とは、一定の規則や基準を用いて、調べたい対象の経験的な特性に数値や記号を与える手続である。
正しいです。

2 信頼性とは、測定したい概念をどのくらい正確に測定できているか、という測定の適切性のことをいう。
誤りです。これは信頼性ではなく妥当性のことです。

3 妥当性とは、同じ調査をもう一度行ったときに同じ結果になる安定性のことをいう。
誤りです。これは妥当性ではなく信頼性のことです。

4 社会調査の測定では、信頼性と妥当性のどちらかが満たされていればよい。
誤りです。どちらも満たされていなければなりません。

5 名義尺度、順序尺度、間隔尺度、比例尺度という四つの尺度水準のうち、大小関係を測定することができるのは、名義尺度である。
誤りです。名義尺度は大小関係を測定することはできません。

第22回 問題78

尺度を用いた測定の信頼性に関する次の記述のうち,正しいものを1つ選びなさい。
1 信頼性が高ければ、測定したい事柄を適切に測定できているといってよい。 
2 信頼性を検討する手法の一つである折半法とは、調査対象者を半分ずつに分けて、それぞれに同一の測定を行う方法のことである
3 再検査法で信頼性を検討する場合、1回目の検査と2回目の検査の間隔が広ければ広いほど、時間的安定性が高くて望ましい。
4 クロンバックのα係数は、複数の測定項目間に内的整合性があるかどうかを調べるためのものである。
5 同一の対象者集団に対して正反対の結果が出ると想定される2つの測定を行い、負の相関の強さを確認する方法のことを、平行検査法という。

1 信頼性が高ければ、測定したい事柄を適切に測定できているといってよい。
誤りです。これは信頼性ではなく妥当性が高い場合です。

2 信頼性を検討する手法の一つである折半法とは、調査対象者を半分ずつに分けて、それぞれに同一の測定を行う方法のことである。
誤りです。折半法は調査で得られたデータを2つに分けてあたかも調査を2回行ったようにみなしてデータを分析するもので、調査対象者の負担を軽くすることができます。

3 再検査法で信頼性を検討する場合、1回目の検査と2回目の検査の間隔が広ければ広いほど、時間的安定性が高くて望ましい。
誤りです。時間間隔が長ければ長いほど調査対象者の状態が変わってしまっている可能性があります。

4 クロンバックのα係数は、複数の測定項目間に内的整合性があるかどうかを調べるためのものである。
正しいです。

5 同一の対象者集団に対して正反対の結果が出ると想定される2つの測定を行い、負の相関の強さを確認する方法のことを、平行検査法という。
誤りです。並行検査法は似たタイプの検査を同時に行うことです。

次の記事

よくここまでたどり着きました。

次からは最後のカテゴリーとなる「医学概論」に入っていきます。

まずは「国際生活機能分類ICF」からです。

「ICF(国際生活機能分類)」の覚え方
ICF(国際生活機能分類)は捉えどころがなく、何を覚えればよいのかわかりませんよね。ここではICFを理解し覚える手順を伝授します。

コメント

タイトルとURLをコピーしました