忍者ブログ
Yaleで、遊んで学ぶ日々。

Yaleで、遊んで学ぶ日々。

囲碁、ときどきプログラミング、ところにより経済。
[105]  [104]  [103]  [102]  [101]  [100]  [99]  [98]  [97]  [96]  [95
×

[PR]上記の広告は3ヶ月以上新規記事投稿のないブログに表示されています。新しい記事を書く事で広告が消えます。

政治経済学のterm paperで使おうと思って日本の選挙のデータをザ・選挙というページからがっつりデータを落とした。Web-scraping作業だ。このページ、国政選挙に関しては8~9割、特に戦後についてはほぼ100%をカバーしている有難いwebsiteだが、半年くらいで閲覧できなくなるらしい。いずれ有用になるかもしれないので、ここで公開されているデータは一通り保存してしまうことにした。時間が空いたら全てデータにして一通りdata cleaningを施して、もし元ページの管理者の許可が下りたら公開しようと思う。秋ぐらいになるかなぁ。

今日は当面使いそうな衆・参議員選挙の結果をデータにまとめたのだけど、ところどころで(小さいながら)誤りが発見された。公式のデータじゃないわけだしある程度は仕方ないので(別に公式だって間違っている可能性はある)、ここからちまちまdata cleaningをする予定。ちなみに今日発見した誤りは、第37回衆議院選挙の秋田2区結果にある。定員4名のはずが3人までしか当選のマークがついていない。この場合いくつかの可能性が考えられる。
(1) 定員は実は3名。
(2) 実は4位の笹山さんも当選。
(3) 実は特別な理由があって実は5位以下の誰かが当選。
(4) その他、僕の想像の及ばない理由。

さて、正解は......



(2) 実は4位の笹山さんも当選。でした。
この候補者のwikipediaによると、彼は1980年から86年まで3期連続で当選しているらしい。問題になっているのは1983年の選挙なので、彼は当選していることになる。

「定数」という部分も必ずしも正しくなく、たとえば同じ選挙の千葉1区を見ると、定数1と書いてあるのに4人当選している。したがって、今回は当てはまらなかったようだが、(1)は現実に起こりうる。

(3) はありえんと思うかもしれないが、実は過去に例がある。1947年の第1回参議院選挙の全国区の結果を見てみると、膳桂之助という候補者は得票数では当選しているはずなのに当選マークがついていない。これも先の笹山さんと同じ間違いかと思ってwikipediaしてみると、なんと「26万票以上を集め当選圏内に入ったが、連合国軍最高司令官総司令部の公職追放の憂き目に遭い、当選を返上した」らしい。なんやねん、それ。

他にはどんな誤りが見つかるか、それはこれからのdata cleaningのお楽しみだ。てゆうか19日のプレゼン間に合うんだろうか。

PR
この記事にコメントする
お名前:
タイトル:
文字色:
メールアドレス:
URL:
コメント:
パスワード:   Vodafone絵文字 i-mode絵文字 Ezweb絵文字
この記事へのトラックバック
この記事にトラックバックする:
Calender
03 2024/04 05
S M T W T F S
1 2 3 4 5 6
7 8 9 10 11 12 13
14 15 16 17 18 19 20
21 22 23 24 25 26 27
28 29 30
Search in This Blog
Latest Comments
[03/30 川内のばば山田]
[03/30 川内のばば山田]
[08/06 Aterarie]
[07/05 Agazoger]
[07/01 Thomaskina]
Oldest Posts
Latest Trackbacks
フリーエリア

Barcode
Access Analysis
Powerd by NINJAブログ / Designed by SUSH
Copyright © Yaleで、遊んで学ぶ日々。 All Rights Reserved.
忍者ブログ [PR]