忍者ブログ
eightblog

eightblog

ブログ
[507]  [506]  [505]  [504]  [503]  [502]  [501]  [500]  [499]  [498]  [497
×

[PR]上記の広告は3ヶ月以上新規記事投稿のないブログに表示されています。新しい記事を書く事で広告が消えます。

本日学校行く気満々で起きてきたんですが、
お家ごとでトラブルがありなんなりーのでちょっと待てと。
行くのが遅れると。

んで、おうちで待機している間にもはや恒例の腹痛が以下略。

しかしそれが一向に収まらない!
げんなりですよ、起き上がれない!

そんなでご飯も食べれず今に至るわけですけどー。
イラスト描く気力もなくて、いつぞやのデュエルくん再利用してるわけですけどー。

ただ使いまわしってのも申し訳ないから、はちさん作業そのままの大きさなんだぞ☆
クリックすればいいじゃない、550×550ですが、重いですが、なんせ作業サイズまんまですから。
一応圧縮したんだぞ、画質落としてな!
基本日記絵は600×600で描いてます、それを300×300~200×200にまで縮小してるってわけですねぇ、はい。
んで縮小した後になんか違うと考えて、また更に加工すんので前回の完成版と見比べると色々違う部分があるかもしれない。

あ、あとえーおーゆーラジオのわくよし不沈艦のやつ、最初何気に流れてるの忍者メタルだったんですね、稼働前だし微妙に音とか違うから気付かなかった!



そんで折角家に引きこもってるんだから、これを機にいい加減宿題進めようじゃあないの。
非常にめんどくさい、だがしかし1つ今週末締め切りだったなうはは!
まぁその1つはすぐに済むので良いでしょう。

折角だから1部解説しながらやってみましょうか。
まぁ個人的な復習も兼ねて。


THE☆統計学です!
自身苦手と考えていたんですが、周囲がそれ以上に苦手としているので何故か講師に回る始末。
今回はt検定のテストです。

t検定とはなんぞや?
≫t検定とは、2つの標本間の差を調べる検定です。

そんな学の高いかたっくるしい言い方じゃわからんってね。
まぁ此処にいる皆さんにわかりやすいように言いますと…

五段の人と六段の人(2つの標本)の間に、卑弥呼SPNをやった時に実力の差がみられるのか。
ということですか、わかりません←

そんなんスコア2でも違えば差があるやん!
とか思いがちですが、その差が統計的に意味があるのかというあれでして。

スコア2の差なんてたまたまやし!
いつもはもっと上やし!
こんなんで実力の差とか言われてもこまるし!


そんな、負け惜しみ。
じゃあそれは本当に負け惜しみなのか!
統計的に調べようじゃあありませんか。

ここで無作為に適当に、六段の人10人、五段の人も10人。
そらもう適当に集めます。

本来なら六段・五段の人全員にやってもらいたいところですが、それっていったい何人やのん、まず今にも段位受けて七段に行っちゃう人もいるじゃない。
というわけで、五段と六段それぞれの全体(それを母集団という)から無作為適当に一部をとってきます(これを標本という)


そんな標本どもにちゃっちゃと卑弥呼SPNをやってもらった結果、こんな結果が出ました。
五段 980 1002 850 921 889 1020 815 801 840 923
六段 1062 980 992 1059 962 812 921 892 951 1052
非常に適当に打ちこみました。

t検定自体はエクセルさんが勝手にやってくれるので良いんです。
エクセル2003:ツール→アドイン→分析ツール→OK→もう一度ツール→分析ツール(表示内に増えているはず)
エクセル2007:メニュー→Excelのオプション→アドイン→分析ツール→データ(タブ)→データ分析
その分析ツールで勝手にやってくれますが。

やつは「あぁたどの分析したいのよ」と聞いてきます。
t検定!
・一対の標本による平均の検定
・等分散を仮定した2標本による検定
・分散が等しくないと仮定した2標本による検定
3つあるし!!
まぁわかりませんよね。


此処でポイント。
まず3つの検定を見る限り、違いになるのは「一対の標本×2標本」「等分散×分散が等しくない」ですよね。

まず「一対×2標本」
t検定って2標本の間の差の検定じゃないの?一対ってなんなの?
それはつまり「対応」というやつです。

まぁ結論から言いますと、今回は2つの標本による検定なんですが…
今回は「六段」「五段」の2つの標本があります。

今回の検定が、
六段の人が卑弥呼のSPNとSPHをした場合、SPNとSPHの間に差はあるのか。』という実験ならば。
1回目の実験(SPN)と2回目の実験(SPH)、同じ人間がやっています。

もしくは今回と同じ実験で、五段と六段の間の差でも…
段位達成率 40% 45% 50% 55% 65% 70% 75% 80% 85% 90%
五段 980 1002 850 921 889 1020 815 801 840 923
六段 1062 980 992 1059 962 812 921 892 951 1052
などと、五段と六段、それぞれの段位達成率が同じ人でやっていく等、2つの標本の間に共通点がある場合、一対の標本となります。

つまりは共通点、それさえ見つかれば「一対の標本」となります。
対です対です。


次は「等分散×分散が等しくない」
分散はまたエクセルさんが出してくれます。
var・varp等の関数使ってね!
今回のデータでの分散は
五段:6139.21
六段:6393.12
元の数値がでかいのでべらぼうです。

約254くらいの差が見られますね。
でもそれって統計的に意味のある差なのか!
もしかしてちょっとした(ry
たまたまの(ry

というわけで、F検定します。
t検定の前にFやんなきゃいけないの!
というわけで、先に出した分析ツールで「F検定:2標本をつかった分散の検定」をしましょう!

エクセルさん使ったことのある方はお分かりでしょうか。
分散の関数のときサラリと流しましたが、インターネットの範囲選択と同じで、ドラッグすれば範囲を決定できるんですね。

というわけで、ドラッグしながら変数1と2にそれぞれの標本のデータを入れちゃいましょう。

あぁ。忘れていました、これはF検定の特徴なのですが。
今回六段の分散のほうが大きいですね。
なので、変数1には六段のデータから入れてください。

F検定の変数1には、分散の高いほうを入力します
それなりの理由があるけど大したことないし、それは個人で御調べくださればと。


んでどうだ!
F-検定: 2 標本を使った分散の検定  
  六段 五段
平均 968.3 904.1
分散 6393.122 6139.211
観測数 10 10
自由度 9 9
観測された分散比 1.041359  
P(F<=f) 片側 0.476426  
F 境界値 片側 3.178893  
なんのこっちゃら。
 
   
ちなみにこの観測された分散比が「1」に満たない場合、変数1に分散が低いほうが来ていることとなります。
なので変数1と2を入れ替えてやりなおしてね!

検定にて注目すべしは此処!
観測された分散比
F境界値片側

これ本当は境界値片側でなく「両側」をみるんですが、
はちはこのF検定での両側にする方法がわかりません!←
だ、誰か教えてください…

まぁ筋戻して!

観測された分散比がF境界値より低ければ、今回分散に差はないとされます。
低いね!低いね!分散に差はないね!!
逆なら差があるんだよ!

というわけで今回差はなし!!

結果→等分散(分散に差がないこと)を仮定した2標本(対応・共通点のない変数)による検定
ですね。


あぁ長かった!
というわけでついにあれです、五段と六段に差があるかどうかみてみようじゃぁないか!

検定方法はF検定のときと同じです。
今回は変数1変数2どちらでも構いません。

結果!
t-検定: 等分散を仮定した2標本による検定
  五段 六段
平均 904.1 968.3
分散 6139.2111 6393.122
観測数 10 10
プールされた分散 6266.1667  
仮説平均との差異 0  
自由度 18  
t  -1.813506  
P(T<=t) 片側 0.0432312  
t 境界値 片側 1.7340636  
P(T<=t) 両側 0.0864624  
t 境界値 両側 2.100922  

あい!
見る部分はt境界値両側

あれ、境界は片側じゃないの?
説明してほしいですか、これ地味に大事かなんかなんですが…
えっと、片側検定というのは、プラスの方向で差があるのか、マイナスで方向に差があるのかのプラス・マイナス片一方なんですね。
両側検定はプラス・マイナス両方で差があるかを調べます。

所謂六段が五段よりスコアが高いと決まっている!だからどれだけ差があるか調べなさい!っていうなら片側で良いのです。
が、今回差があるかを調べます、その差は六段のほうが高くても、五段のほうが高くても、それはおかしくないのです、だってどっちも差だもの。


因みに、両側片側でなんで境界値が違うのかといいますと。
有意水準というのがありまして、基本これ0.05%なんですが…
(F検定やt検定のときに、ラベルの下に「α=0.05」とあります、これが有意水準です。たまに条件で変わるので、その時は%ぶんに入力しなおしてくださいね。)

片側だと片方だけに0.05%分の位置に境界線がはられるんですが、
両側だと半分こに分けて0.05%分の位置に境界線がはられます。
つまり、0.05%の水準も、両側になれば0.025%ずつに分けられるので、その値がかわるわけです。


まぁそんでだ。
今回tのところがマイナスになっていますが、それはぶっちゃけ気にしなくって良いです。
結果はt<境界値、五段と六段に差がないということになります。

が!

この先ほど話した有意水準を0.1%にまで引き上げてください。
そのとき境界値が1.73にまで下がり、t値のほうが大きくなります。
これを有意傾向と言います。

0.05%ではあからさまに差がある、つまりは「有意差あり」ということになりますが、
0.1%の水準では、あっこれ微妙に差がありそうなんじゃね?くらいの「有意傾向」という形になるのです。

だから分かった終わったで済まさないでね!



はちさんの簡単なt検定講座はこれくらいでいいかしら…
実際やりながら見て頂いたほうがわかりやすいと思います。
先が気になる、此処がわからないという頑張り屋さんは質問して頂ければ追記しますよー。

そうこう長く打ってるとこんな時間だよ!
あとレポート…出来そうならやりに来ます。
PR
カレンダー
10 2024/11 12
S M T W T F S
1 2
3 4 5 6 7 8 9
10 11 12 13 14 15 16
17 18 19 20 21 22 23
24 25 26 27 28 29 30
フリーエリア
最新コメント
[03/16 しほ]
最新トラックバック
プロフィール
HN:
はちはし 八雲
性別:
非公開
バーコード
ブログ内検索
カウンター
Powerd by NINJAブログ / Designed by SUSH
Copyright © eightblog All Rights Reserved.
忍者ブログ [PR]