DiscoverQTnetモーニングビジネススクール因果推論:傾向スコアマッチング
因果推論:傾向スコアマッチング

因果推論:傾向スコアマッチング

Update: 2023-08-31
Share

Description

今回も「因果推論を行うための手法」についてお話します。
「因果推論」とは、ある物事の原因と結果の関係を特定していくことを意味します。例えば、「資格を取ると年収アップに繋がるか」といったことを確かめていく方法です。「因果推論」の基本は、似たもの同士のグループを2つ用意して、一方のグループには検証したい物事をやってもらい、もう一方のグループは比較のために何もせず、両者の結果の違いを見ていくことにあります。これまでも「ランダム化比較試験」「差の差分析」「回帰不連続デザイン」をご紹介してきました。それぞれ色々違いはありますが、「似たもの同士のグループを比較する」という点では共通していました。今回紹介するのは「傾向スコアマッチング」という手法です。これまでと違う形で似たもの同士のグループをつくってその結果を比較する調査デザインとなっています。

では、「資格取得」と「年収」の因果関係をいかに検証するか考えてみようと思います。
例えば、簿記検定1級を既に持っている人と持っていない人を探してきて単純に年収を比較すると、「選択バイアス」と呼ばれる問題を起こしてしまう可能性があります。「選択バイアス」とは、元々その調査対象を選んだ時点で、ある種の偏りが発生してしまうということです。例えば、「簿記検定1級」のような難関資格の場合、元々これを持っている方の能力が高い方であったり、或いはキャリアをとても重視している方であったりする可能性があります。そうすると、そういう方々は能力の高さやキャリア志向の高さの故に、簿記検定があってもなくても実は年収が高くなる可能性があります。一方で、簿記検定を今の段階で持っていない方は、キャリアよりもプライベートを重視する方で、仕事もあまり年収の高くない職種かもしれません。ということで、今現在資格を持っているか否かということで調査対象者を選択すると、資格を持っていること以外の要因が入りこんでしまう可能性があるわけです。このような効果のことを「選択バイアス」と呼びます。その他の様々な要因が入りこんでしまい、検証内容がある種歪んでしまうわけです。

そこでそうした「選択バイアス」の影響を受けずに検証するためには、能力もキャリア志向も同程度の人達を選び、その中でビジネス資格を取得している方とそうでない方のグループをつくって比較をする必要があります。これが今回ご紹介しようとしている「傾向スコアマッチング」という手法です。ここでいう「傾向」とは、調査対象である人達・物事がある状態になる確率や、あることをする確率と捉えてください。資格取得の例で言うと、「学歴の高さ」「従事する業界」「職務の内容」によって簿記検定を受けてみようと思う、或いは簿記検定を受ける傾向の高さということになります。「傾向スコアマッチング」では、そうした学歴、職務内容、年齢といった要因を「共変量」と呼びますが、こういったものを集計して一つのスコアにまとめ上げます。このスコアが高い方は簿記資格を取得する確率が高く、低ければ資格を取る確率も低いだろうと予測するわけです。このスコアはあくまで資格をとる傾向をあらわす確率にすぎないため、実際にはスコアが高くてもわざわざ資格を取らないという方もいれば、スコアが低くても頑張って資格をとるという方もいらっしゃいます。だからこそ比較が可能になってくるわけです。

その後、傾向スコアを計算して、その点数の高い人達を集めてきます。そうするとその中には、資格取得の有無以外の点ではよく似た特徴を持つ、「資格を取った人」と「取っていない人」の2つのグループが出来上がります。その上で、片方のグループの年収が顕著に高ければ、確かに資格を取ることが年収アップに繋がるということがわかるわけです。同様の比較は、傾向スコアの低い人達でも可能です。「傾向スコアが低くて実際に簿記資格を持っていない人」と、「傾向スコアは低いけれども頑張って簿記資格を取られている方」の2つのグループの間で年収に違いがあるとすれば、資格を取ることが年収アップに繋がるということが確認出来るわけです。こうすることによって、資格の有無以外の条件を制御して「選択バイアス」を排除した比較が可能になります。

では、今日のまとめです。
「傾向スコアマッチング法」とは、年収や売上、生産性といった検証したい事柄に影響を与える因子(これを「共変量」と呼ぶ)を用いて、調査対象の中から特徴のよく似た2つのグループを作り出し、ある施策が結果に与える影響を比較するという手法です。共変量が複数ある場合でも、一つの傾向スコアにまとめて似たもの同士のグループを作ることが出来る点に「傾向スコアマッチング」の強みがあると言えます。
Comments 
In Channel
loading
00:00
00:00
x

0.5x

0.8x

1.0x

1.25x

1.5x

2.0x

3.0x

Sleep Timer

Off

End of Episode

5 Minutes

10 Minutes

15 Minutes

30 Minutes

45 Minutes

60 Minutes

120 Minutes

因果推論:傾向スコアマッチング

因果推論:傾向スコアマッチング