今日は、医学統計が専門の先生による統計の講義がありました。
たくさんの参加者があり、みんな関心が高い話題だと実感しました。
必要だし、関心が高いけど、あの難しい式の数々を見せられると
「参りました〜」
となってしまって、頭に入らないんです。
理系クラスだけど、理系が苦手だったわけで。
今回の講義は、とってもわかりやすくて、臨床研究に入る前準備の重要性とその方法がよくわかりました。
いや、わかったつもり、か。
たくさんの参加者があり、みんな関心が高い話題だと実感しました。
必要だし、関心が高いけど、あの難しい式の数々を見せられると
「参りました〜」
となってしまって、頭に入らないんです。
理系クラスだけど、理系が苦手だったわけで。
今回の講義は、とってもわかりやすくて、臨床研究に入る前準備の重要性とその方法がよくわかりました。
いや、わかったつもり、か。
今回は、サンプルサイズの決め方。
どのくらいのサンプルがあれば、有意差が出るかを、研究を始める前に(草案を作っているときに)考えることが重要。
その方法の話。
必要なサンプルサイズの決定には
1:帰無仮説(AとBは一緒ぐらいという仮説)と対立仮説(AとBは一緒ぐらいではないという仮説=”帰無仮説は違う”という仮説)の設定
2:連続データならt検定。2値データならχ2乗検定
3:効果量(effect size)の設定
が重要
専門家じゃないので、優しい言葉に変換して、ブログに掲載することができない。
しかたないので、好き勝手に復習してみます。
多少の知識の固定になるでしょう。
Type 1 error (第1種の過誤=誤検出)とType 2 error (第2種の過誤=検出失敗)、そして検出力の関係が少しわかった。
真の状態とは、実際はわからないけど、神様は知っていること。
"1.96"という数字は時々見かけますが、これと関係があるわけですね。意味はわかりませんが。雰囲気はわかりました。
このサンプルサイズの計算が鬼門です。
講義後に質問がいくつかありました。
過去の研究から、μと標準偏差(SD)を”適当に”代入して、算出する。
ここがポイントですが、いろいろな報告で、数値が大きく違うので(特に標準偏差)違いが出るところです。
でもあんまり考えすぎたり、とらわれすぎても進まないから、まぁ代入してみるって感じでしょうか。
こんな票があるので、計算せずともだいたいわかります。
2値データの場合は、連続データよりも標準偏差が不要な分、代入が簡単。
2値データにも票があるので、計算は不要。
勘違いしがちなのは、予想通りの罹患率だからといって、p値がぎりぎり(0.05)になるわけではなく、もっとしっかり有意差が出るということ。
それは検出力(1−β)80%のおかげ。
深く理解しないで書くと、こんなふんわりとした感じになりました。
今回は自分のための内容でした。
とにかく、勉強になったのは間違いないです。
次回も参加しなければ。
コメント
コメントを投稿