Please enable JavaScript.
Coggle requires JavaScript to display documents.
Pythonで理解する統計解析の基礎 (回帰分析 (点推定 (最小二乗法 (作り方 (X = np.array([np.ones_like(x),…
Pythonで理解する統計解析の基礎
回帰分析
-
-
-
-
-
-
-
-
点推定
-
-
-
最小二乗法
-
作り方
X = np.array([np.ones_like(x), x]).T
beta0_hat, beta1_hat = np.linalg.lstsq(X, y)[0]
y_hat = beta0_hat + beta1_hat * x
eps_hat = y - y_hat
-
-
モデルの妥当性
-
-
尖度
-
作り方
stats.kurtosis(eps_hat, fisher=False)
-
統計的仮説検定
-
-
-
-
正規分布の母平均の検定(母分散既知)
正規分布の母分散の検定
正規分布の母平均の検定(母分散未知 )
2標本問題
-
2標本の代表値に差があるか
-
-
対応のあるt検定 :<3:
-
求め方
t, p = stats.ttest_1samp(training_rel["二つのデータの差"], 0)
t, p = stats.ttest_rel(training_rel["データ1"], training_rel["データ2"])
-
対応のないt検定 :forbidden:
-
マンホイットニーのU検定
-
u, p = stats.mannwhitneyu(training_ind["A"], training_ind["B"], alternative="two-sided")
カイ二乗検定
クロス集計
ad_cross = pd.crosstab(ad_df["広告"], ad_df["購入"]) :<3:
-
-
求め方
chi2, p, dof, ef = stats.chi2_contingency(ad_cross, correction=False)
chi2, p, dof :recycle:
-
-
独立同一分布
-
-
再生性
ある
正規分布
正規分布の和も正規分布に従う
ポアソン分布
ポアソン分布の和もポアソン分布に従う
-
標本平均の分布
標本平均の期待値と分散
-
-
-
-
1次元のデータ
データの特徴を掴む
データの要約
-
-
-
標準偏差
np.sqrt(np.var(scores, ddof=0))
-
範囲
-
四分位範囲
25%,50%, 75%
scores_Q1 = np.percentile(scores, 25)
scores_Q2 = np.percentile(scores, 50)
scores_Q3 = np.percentile(scores, 75)
-
視覚化 :smiley:
-
各階級の度数
freq, _ = np.histogram(english_scores, bins = 10, range=(0, 100))
-
-
-
2次元のデータ
共分散
作り方
np.cov(en_scores, ma_scores, ddof=0)
関係を図るデータ単位が異なる
標準偏差で割る
-
作り方
np.cov(en_scores, ma_scores, ddof = 0)[0, 1]/(np.std(en_scores) * np.std(ma_scores))
np.corrcoef(en_scores, ma_scores)
-
-
-
連続型確率変数
おまじない
from scipy import integrate
import warnings
warnings.filterwarnings('ignore', category = integrate.IntegrationWarning)
1次元の確率型確率変数
確率密度関数
or
密度関数
-
作り方
rv = stats.norm(p_mean, np.sqrt(p_var))
作り方
integrate.quad(f, 0.4, 0.6)
確率の性質
-
1の証明
integrate.quad(f, -np.inf, np.inf)[0]
累積分布関数
作り方
integrate.quad(f, -np.inf, x)[0]
指標
期待値
分散
2次元の連続型確率変数
同時確率密度関数
-
-
離散型確率変数
1次元の離散型確率変数
確率質量関数
or
確率関数
確率変数Xがxkという値をとる確率を関数化
-
-
確率の性質
-
-
累積分布関数
-
1次元の離散型確率変数の指標
期待値
分散
確率変数から期待値を引いて2乗し、確率を掛けたものを合計する
-
代表的な離散型確率分布
-
種類
ベルヌーイ分布
-
-
例
-
サイコロの6が出るかどうか
-
-
-
幾何分布 :star:
ベルヌーイ試行を繰り返して最初に成功するまでの
試行回数に従う分布
例
コイン
コインを表が出るまで投げる回数
サイコロ
サイコロを6が出るまで投げる回数
-
まとめ
ポアソン分布
-
-
まとめ
-