[[中谷ゼミ トップページへ戻る>../]] * 中谷ゼミ 2011年度のページ [#o4d99e89] - 2011年度 参加者 -- 修士2年 2名 -- 学部4年目 6名 -- 学部3年目 3名 - 時間 毎週火曜日 午後2時45分から - 場所 農学部 共同実験棟 共308 ** 2011年度後期 [#c1735ae9] - 内容 -- 農業経済に関する学術論文の結果を再現します。 - 対象とする論文(論文のPDFファイルにリンクしています) -- [[高山太輔・中谷朋昭(2011)「中山間地域等直接支払制度による耕作放棄の抑制効果―北海道の水田・畑作地帯を対象として―」、農業情報研究、第20巻、pp.19-25。:https://www.jstage.jst.go.jp/article/air/20/1/20_1_19/_article/-char/ja/]] - 結果再現に必要なこと -- 耕作放棄問題に関する理解 --- 既存研究・文献の収集と読解 -- 中山間地域等直接支払制度の理解 --- 農水省や自治体からの公表資料入手 -- 統計データの理解 --- 農業センサスについて -- 分析手法の理解 --- 差分の差推定法と回帰分析 --- 分析用ソフトウェアの利用法 -- データ(CSV形式。学内からのみダウンロード可) --- [[全道のデータ>http://www.agr.hokudai.ac.jp/agecon/pwiki2/index.php?plugin=attach&pcmd=open&file=hokkaido_all.csv&refer=%A5%C0%A5%A6%A5%F3%A5%ED%A1%BC%A5%C9%CD%D1%2F%C3%E6%C3%AB%A5%BC%A5%DF]] --- [[上川・空知のデータ>http://www.agr.hokudai.ac.jp/agecon/pwiki2/index.php?plugin=attach&pcmd=open&file=kamikawa_sorati.csv&refer=%A5%C0%A5%A6%A5%F3%A5%ED%A1%BC%A5%C9%CD%D1%2F%C3%E6%C3%AB%A5%BC%A5%DF]] - 論文再現が無事に終了したので、各自がおすすめの本を紹介する茶話会を開催しました。 #ref(sawa.jpg,left,50%) ** 2011年度前期 [#u331ba7d] - 教科書 -- 前園宜彦(2010)[[詳解演習 確率統計:http://www.saiensu.co.jp/?page=book_details&ISBN=ISBN978-4-7819-1265-3&YEAR=2010]],サイエンス社,ISBN 978-4-7819-1265-3,定価1,890円~ をやる可能性が濃厚です. --- 上記書籍には正誤表があります.ここから[[ダウンロード(PDF形式):http://www.saiensu.co.jp/book_support/978-4-7819-1265-3/correct.pdf]]してください. //-- [[倉田博史:http://www.geocities.jp/h_kurata_statistics/]]・[[星野崇宏:http://www2.soec.nagoya-u.ac.jp/~hoshino/index.html]](2009):[[入門統計解析:http://www.saiensu.co.jp/?page=book_details&ISBN=978-4-88384-140-0&YEAR=2009]],新世社,ISBN 978-4-88384-140-0,定価2,625円 -- 本年度前期は,問題演習を中心にします. --- 「事前に問題を解いておき,ゼミ時間中に(私を含め)''無作為抽出''で選ばれた人がその解説をする」という方式でいきます. - 問題を解くには,フリーの統計解析ソフトRを利用しましょう. -- 例えば,第5章問題6.4は,下記のプログラムで解くことができます. # データの入力 x <- c(94, 88, 81, 111, 88, 91, 123, 97, 115, 111, 75) y <- c(71, 83, 72, 80, 66, 81, 68, 70, 72, 89) # サンプルサイズの設定 m <- length(x) n <- length(y) # ウェルチの検定統計量 t0 <- (mean(x) - mean(y))/sqrt(var(x)/m + var(y)/n) # 自由度 d <- (var(x)/m + var(y)/n)^2/(((var(x)/m)^2)/(m-1) + (var(y)/n)^2/(n-1)) # t分布の右側5%点の計算 qt(0.05, df = d, lower.tail = FALSE) -- Rの組み込み関数t.stat()を使っても同じ結果が得られます(2012.1.8追記)。 # ウェルチの検定 t.stat(x, y) # xとyの等分散性を仮定するなら、オプションでvar.equal = TRUEとします。 t.stat(x, y, var.equal = TRUE) *** 無作為抽出について [#h99bbb26] - 解答者決定の無作為抽出が''本当に無作為に行われているのか''疑問があるようですので,以下のRプログラムでシミュレーション実験をしてみました. nsim <- 10000000 number <- numeric(nsim) a <- 1:12 for(i in 1:nsim){ number[i] <- sample(a, size = 1, replace = T) } hist(number, breaks = seq(0, 12, by = 1), freq = F) #ref(number.jpg,center,50%) -- sample(...)は,抽出数が一つなので,"replace = T"があってもなくても結果は変わりません. -- 1千万回のシミュレーション実験では,1から12までの番号の出現割合は,上の図のように''8%とほぼ均一''になりました.ちなみに,1/12 = 0.0833です. -- というか,上のプログラムは異常に非効率的でした.forループを回さずに, nsim <- 10000000 a <- 1:12 number <- sample(a, size = nsim, replace = T) とすれば,実行時間が劇的に改善されます. -- ちなみに,シミュレーションの回数を50回 (nsim <- 50) にすると #ref(number50.jpg,center,50%) となって,かなりのバラツキがあります. -- 少ない試行回数(抽選回数)で,出る目の回数を均等化することは,無作為抽出ではありません.つまり,「それぞれの目が出る回数を均等化する」という''作為を働かせる''ことになるので,無作為ではなくなってしまいます.