[[中谷ゼミ トップページへ戻る>../]]

* 中谷ゼミ 2011年度のページ [#o4d99e89]
- 2011年度 参加者
-- 修士2年  2名
-- 学部4年目 6名
-- 学部3年目 3名

- 時間 毎週火曜日 午後2時45分から
- 場所 農学部 共同実験棟 共308

** 2011年度後期 [#c1735ae9]
- 内容
-- 農業経済に関する学術論文の結果を再現します。
- 対象とする論文(論文のPDFファイルにリンクしています)
-- [[高山太輔・中谷朋昭(2011)「中山間地域等直接支払制度による耕作放棄の抑制効果―北海道の水田・畑作地帯を対象として―」、農業情報研究、第20巻、pp.19-25。:https://www.jstage.jst.go.jp/article/air/20/1/20_1_19/_article/-char/ja/]]
- 結果再現に必要なこと
-- 耕作放棄問題に関する理解
--- 既存研究・文献の収集と読解
-- 中山間地域等直接支払制度の理解
--- 農水省や自治体からの公表資料入手
-- 統計データの理解
--- 農業センサスについて
-- 分析手法の理解
--- 差分の差推定法と回帰分析
--- 分析用ソフトウェアの利用法
-- データ(CSV形式。学内からのみダウンロード可)
--- [[全道のデータ>http://www.agr.hokudai.ac.jp/agecon/pwiki2/index.php?plugin=attach&pcmd=open&file=hokkaido_all.csv&refer=%A5%C0%A5%A6%A5%F3%A5%ED%A1%BC%A5%C9%CD%D1%2F%C3%E6%C3%AB%A5%BC%A5%DF]]
--- [[上川・空知のデータ>http://www.agr.hokudai.ac.jp/agecon/pwiki2/index.php?plugin=attach&pcmd=open&file=kamikawa_sorati.csv&refer=%A5%C0%A5%A6%A5%F3%A5%ED%A1%BC%A5%C9%CD%D1%2F%C3%E6%C3%AB%A5%BC%A5%DF]]

- 論文再現が無事に終了したので、各自がおすすめの本を紹介する茶話会を開催しました。
#ref(sawa.jpg,left,50%)

** 2011年度前期 [#u331ba7d]
- 教科書
-- 前園宜彦(2010)[[詳解演習 確率統計:http://www.saiensu.co.jp/?page=book_details&ISBN=ISBN978-4-7819-1265-3&YEAR=2010]],サイエンス社,ISBN 978-4-7819-1265-3,定価1,890円~
をやる可能性が濃厚です.
--- 上記書籍には正誤表があります.ここから[[ダウンロード(PDF形式):http://www.saiensu.co.jp/book_support/978-4-7819-1265-3/correct.pdf]]してください.
//-- [[倉田博史:http://www.geocities.jp/h_kurata_statistics/]]・[[星野崇宏:http://www2.soec.nagoya-u.ac.jp/~hoshino/index.html]](2009):[[入門統計解析:http://www.saiensu.co.jp/?page=book_details&ISBN=978-4-88384-140-0&YEAR=2009]],新世社,ISBN 978-4-88384-140-0,定価2,625円

-- 本年度前期は,問題演習を中心にします.

--- 「事前に問題を解いておき,ゼミ時間中に(私を含め)''無作為抽出''で選ばれた人がその解説をする」という方式でいきます.

- 問題を解くには,フリーの統計解析ソフトRを利用しましょう.
-- 例えば,第5章問題6.4は,下記のプログラムで解くことができます.
 # データの入力
  x <- c(94, 88, 81, 111, 88, 91, 123, 97, 115, 111, 75)
  y <- c(71, 83, 72, 80, 66, 81, 68, 70, 72, 89)
 # サンプルサイズの設定
  m <- length(x)
  n <- length(y)
 # ウェルチの検定統計量
  t0 <- (mean(x) - mean(y))/sqrt(var(x)/m + var(y)/n)
 # 自由度
  d <-  (var(x)/m + var(y)/n)^2/(((var(x)/m)^2)/(m-1) + (var(y)/n)^2/(n-1))
 # t分布の右側5%点の計算
  qt(0.05, df = d, lower.tail = FALSE)

-- Rの組み込み関数t.stat()を使っても同じ結果が得られます(2012.1.8追記)。
 # ウェルチの検定
  t.stat(x, y)
 # xとyの等分散性を仮定するなら、オプションでvar.equal = TRUEとします。
  t.stat(x, y, var.equal = TRUE)

*** 無作為抽出について [#h99bbb26]
- 解答者決定の無作為抽出が''本当に無作為に行われているのか''疑問があるようですので,以下のRプログラムでシミュレーション実験をしてみました.
 nsim <- 10000000
 number <- numeric(nsim)
 a <- 1:12
 for(i in 1:nsim){
    number[i] <- sample(a, size = 1, replace = T)
 }
 hist(number, breaks = seq(0, 12, by = 1), freq = F)
#ref(number.jpg,center,50%)
-- sample(...)は,抽出数が一つなので,"replace = T"があってもなくても結果は変わりません.
-- 1千万回のシミュレーション実験では,1から12までの番号の出現割合は,上の図のように''8%とほぼ均一''になりました.ちなみに,1/12 = 0.0833です.

-- というか,上のプログラムは異常に非効率的でした.forループを回さずに,
 nsim <- 10000000
 a <- 1:12
 number <- sample(a, size = nsim, replace = T)
とすれば,実行時間が劇的に改善されます.

-- ちなみに,シミュレーションの回数を50回 (nsim <- 50) にすると
#ref(number50.jpg,center,50%)
となって,かなりのバラツキがあります.
-- 少ない試行回数(抽選回数)で,出る目の回数を均等化することは,無作為抽出ではありません.つまり,「それぞれの目が出る回数を均等化する」という''作為を働かせる''ことになるので,無作為ではなくなってしまいます.


トップ   編集 差分 バックアップ 添付 複製 名前変更 リロード   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS