Yaleで、遊んで学ぶ日々。
Yaleで、遊んで学ぶ日々。
囲碁、ときどきプログラミング、ところにより経済。
×
[PR]上記の広告は3ヶ月以上新規記事投稿のないブログに表示されています。新しい記事を書く事で広告が消えます。
計量経済学ではよくidentificationが問題になる。identificationというのは要するに、「僕はこれが正しいモデルだと思う」という主張をしたい時に、「でも実はこうかもしれない」という可能性をきちんと否定できるか、という問題だ。多くの場合に、経済学では完全なモデルの記述ではなくある重要なパラメータ(つまりモデルの1部分)のみを問題にするので、そういう場合はidentificationはそのパラメータの範囲で議論され、「僕はパラメータはこの値だと思う」という主張を「実は違う値かもしれない」という反論からきちんと守ることができるか、という問題になる。
どう主張を守るというと、それはデータだ。もし、パラメータの値が異なるときにデータの分布が異なるならば、無限に多くのデータを採取すればデータの分布からパラメータの値を逆算することができるので、「ほら、こっちの値だったでしょ」と言うことができる。これがもし、パラメータの値が違うのにデータの分布は変わらないのであれば、2つのパラメータは永遠に区別ができない(データに差が出ないので)。identification不可能というケースだ。このように、パラメータのidentificationは、データの分布との間の1対1関係により保持される。
見方を変えれば、identificationは要するに言い逃れの可否に関する問題だ。そこで、友人がよく約束の時間に遅れてくるときに、この人に寝坊の癖があるかどうかを特定できるか考えてみる。
「約束に遅れたな。寝坊したんだろう」
「電車が止まったんだ。寝坊はしてないよ」
寝坊でも電車の遅延場合でも同様に遅刻というデータが観測されるので、identificationできない。つまり、「この友人には寝坊の癖がある」というモデルと「この友人はよく止まる路線を利用している」というモデルは同じデータの分布を導くので、区別ができない。しかし
「今iPhoneで検索したところ、電車の遅延の事実がないことが分かった」
電車の遅延情報についてもデータとして得られるなら、電車が遅れて遅刻したのか寝坊で遅刻したのかを区別することができる。逆に、電車の遅延というデータを考慮にいれないと、パラメータの推計ができない。重要なデータが不足しているためにidentificationが不可能になることを、omitted variable biasという。
「約束に遅れたな。寝坊したんだろう。電車の遅れではないことは分かっているんだ」
「違うんだ。隣にいた妊婦が急に苦しみ出したので病院へ連れて行ったんだ。この前の遅刻は大きな荷物を抱えたおばあさんを送っていったせいだし、その前は迷子のお母さんを探していたんだ」
妊婦、おばあさん、迷子などの証言は得られないとすると、彼の主張を完全に否定することはできない。「この友人には寝坊の癖がある」というモデルは「この友人はよく困っている人に遭遇し、かこの友人はそういう人を放っておけない」というモデルから区別することができない(そんな人いる? 例えば一般に名探偵という類の人物は行く先々で事件に遭遇する傾向があるらしい)。これはidentification不可能なケースだ。
しかし現実にはそんな言い訳は通らない。
「そんなことが都合よく何度も起こるわけないだろう」
これをBayesian inferenceという。
どう主張を守るというと、それはデータだ。もし、パラメータの値が異なるときにデータの分布が異なるならば、無限に多くのデータを採取すればデータの分布からパラメータの値を逆算することができるので、「ほら、こっちの値だったでしょ」と言うことができる。これがもし、パラメータの値が違うのにデータの分布は変わらないのであれば、2つのパラメータは永遠に区別ができない(データに差が出ないので)。identification不可能というケースだ。このように、パラメータのidentificationは、データの分布との間の1対1関係により保持される。
見方を変えれば、identificationは要するに言い逃れの可否に関する問題だ。そこで、友人がよく約束の時間に遅れてくるときに、この人に寝坊の癖があるかどうかを特定できるか考えてみる。
「約束に遅れたな。寝坊したんだろう」
「電車が止まったんだ。寝坊はしてないよ」
寝坊でも電車の遅延場合でも同様に遅刻というデータが観測されるので、identificationできない。つまり、「この友人には寝坊の癖がある」というモデルと「この友人はよく止まる路線を利用している」というモデルは同じデータの分布を導くので、区別ができない。しかし
「今iPhoneで検索したところ、電車の遅延の事実がないことが分かった」
電車の遅延情報についてもデータとして得られるなら、電車が遅れて遅刻したのか寝坊で遅刻したのかを区別することができる。逆に、電車の遅延というデータを考慮にいれないと、パラメータの推計ができない。重要なデータが不足しているためにidentificationが不可能になることを、omitted variable biasという。
「約束に遅れたな。寝坊したんだろう。電車の遅れではないことは分かっているんだ」
「違うんだ。隣にいた妊婦が急に苦しみ出したので病院へ連れて行ったんだ。この前の遅刻は大きな荷物を抱えたおばあさんを送っていったせいだし、その前は迷子のお母さんを探していたんだ」
妊婦、おばあさん、迷子などの証言は得られないとすると、彼の主張を完全に否定することはできない。「この友人には寝坊の癖がある」というモデルは「この友人はよく困っている人に遭遇し、かこの友人はそういう人を放っておけない」というモデルから区別することができない(そんな人いる? 例えば一般に名探偵という類の人物は行く先々で事件に遭遇する傾向があるらしい)。これはidentification不可能なケースだ。
しかし現実にはそんな言い訳は通らない。
「そんなことが都合よく何度も起こるわけないだろう」
これをBayesian inferenceという。
PR
Calender
01 | 2025/02 | 03 |
S | M | T | W | T | F | S |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
Search in This Blog
Latest Comments
[03/30 川内のばば山田]
[03/30 川内のばば山田]
[08/06 Aterarie]
[07/05 Agazoger]
[07/01 Thomaskina]
Latest Posts
(11/16)
(04/28)
(04/16)
(04/11)
(04/05)
Latest Trackbacks
Category
Access Analysis