記録の力 / The power of Recording

Taking notes, reviewing them to improve productivity is fun. Will see how I can improve myself by recording all sorts of things.

統計学と数学

 

やる必要がある高校数学の分野としては以下のよう。

 

 

その他、本来は一次関数・二次関数、三角関数、ベクトル、行列あたりは必要だろうが、統計検定2級合格までは上記に限定して高校数学レベルをやる。費やす時間は合計で50-60時間程度か。

 

いずれにせよ高校数学は統計検定後に勉強予定なので(数学検定準1級程度は取得しておきたい)、無駄にはならないはず。

 

 

ちょうど今日から4連休なので、上記分野について40時間程度は確保可能。やっていこう。

 

 

2021.7.25

  • 確率

条件付き確率が理解できていない。公式は理解し、計算もできるが、問題を読んですぐに何を求めるべきか混乱する。

 

数Aで条件付き確率を読んだのがまだ昨日なので、しっかり①概念復習→②練習問題→③間違えたところを他の本やyoutubeで復習→④この繰り返し、をやる。

 

「やっぱり数学向いてないや」と言ってすぐに諦めないこと。

 

微分積分の勉強も昨日から始め、概念と計算はある程度できるようになった。が、こちらも焦らず、まずは来週一週間でしっかり体に叩き込む。

 

 

2021.7.27

 

  • 確率

相変わらず条件付き確率がよくわからない。変形したものが「ベイズの定理」なので、結局条件付き確率なのだろうけど、数学や統計の問題でどうやって利用するのかがよくわからない。本質を理解していないから。

 

ただ、今日分かったことは、そもそも条件付き確率の公式もあやふやに覚えていたこと、ベン図で書けば、Aが起こった前提でのBと、Bが起こった前提でのAというのは、「公式としては入れ替えても同じだが、出る結果は(状況によって)違う」という点に気付いたこと。

 

そんな当たり前のことも、与えられた公式、与えられた事例、与えられた解説だけだと分からない。

 

そういう意味では何度も繰り返すことで学びがたくさんあるということで、楽しみたい(本心としては分からないからやめようかな、という心境でもある)。

 

しばらく日記として自分が思った数学勉強について記載を継続する。

 

2021.7.28

 

  • 統計関連

統計の時間で、離散型・連続型確率分布やら、いろいろな分布(正規分布、標準正規分布、二項分布、ポアソン分布等)を復習。マンガで分かる~で理解していたつもりなので、割とラクに入ってくるが、やはり完全には理解できていないので何度も復習あるのみ。

 

  • 確率

夜、条件付き確率を再復習。分かったのは、①条件付き確率の最初の公式を覚えただけ、②確率の乗法定理すら覚えていなかった、③問題に使う際、場合分けの重要性に気付いていなかった、という点。やはり結構飛ばして本を読んでいるので、公式レベルで頭に入っていない。ゆっくり着実に理解し、使えるようにしていく必要あり。

 

統計の時間で積分の計算問題が出てきた。すでに計算方法を忘れかけている。まだやっていない「面積の計算」は数学として練習が必要。

 

 

2021.7.29

 

  • 統計関連

 連続型確率分布においてはある一点での確率はゼロになり、確率密度関数は相対的な出やすさを表すもの→だからある区間(a→b)までのf(a)-f(b)間の面積が確率そのものを表す。今までは、単になんとなく面積を出す必要があるのだな、と思っていたけど、面積を出すことが確率を出すことなのだと初めて知った。

 

  • 確率

条件付き確率は、できなかった問題をひたすら復習すること。何度もやっているとなんとなくやろうとしていることが分かってくるような気もする。(B|A)と(A⋀

なんと積分の計算方法を忘れていた。特に定数項の積分。脳に入っていないので、継続して練習すること。

 

2021.7.31

 

  • 統計関連

t分布を使った母平均の推定とか計算不可能と思っていたけど、手を動かしながらやることで意外に問題は解けそう。

 

さらに実務では手計算でやる必要はなくexcelでできるので、「計算ができないから統計を諦める」という発想にはならないようにしよう。

 

 

2021.8.1

 

【統計関連】

  • 「母平均の差」の推定、

これは何を目的にしているのか全く意味不明だったが、googleで調べて「新薬投与前と投与後の解熱効果(解熱前後のサンプルにおける体温差の平均)」の例があった。なるほど、「標本におけるデータの差」そのものが意味を持つ場合、当該意味のある差が、母集団においても妥当するのか、を調べるわけか。

 

なんとなく分かったような、ぼんやりしている。

 

  • 式の意味と暗記

母平均の推定(既知、未知)、母比率の推定、母平均の差の推定ともに式の意味を理解した後は、式を暗記して問題が出たら答えればよい。式の理解は、Youtubeによる丁寧な解説が豊富であり、繰り返せば十分可能。

 

 

2021.8.2

 

【統計関連】

 

  • 推定の対象

標本から母集団を推定する。対象は、母平均、母比率、母平均の差、等。

 

標準偏差は個々のデータのバラツキであり、標準誤差は標本平均のバラツキ、すなわち、「標本平均の標準偏差」という違い。母集団が(μ, σ2)であり、そこからサンプル数nの標本をとった場合、当該標本平均は、N(μ、σ2/n)の分布に従う。そして、この場合に、標準正規分布を使うために「標準化」を行う。

 

  • 母平均の推定

 

①母分散既知(標本平均、母分散、標準正規分布

 ➁母分散未知(標本平均、不偏分散+t分布) 

➂母平均の推定において、母集団が正規分布に従わない場合の処理

 

  • 標準化の意義→色んな場面で応用?