Please enable JavaScript.
Coggle requires JavaScript to display documents.
卒論 (やったこと, プログラムの実行環境について, 機械学習について, データについて, 出来れば、個人の消費支出と、肥満率のデータを使いたい,…
卒論
やったこと
それをやった根拠
それをやったらどうなるのか
今後やること
つらつら書いていく
プログラムの実行環境について
コラボラトリー
アナコンダ
vsコード
その他いろいろ
機械学習について
回帰
重回帰分析
最小二乗法
リッジ回帰
ロッソ回帰
分類
データについて
GIGO
パンダスの本表紙の裏、ⅲページ目
どんなデータが役に立つのか
実例を学ぶこと
出来れば、個人の消費支出と、肥満率のデータを使いたい
しかしプライバシーの問題や、
家計調査は集計データである。
pythonについて
公式ドキュメント
読んでしっかり理解
ライブラリについて
パンダス、matplotlib、ナンパイ、サイパイ
バージョンを記しておくこと
コードについて
head()から説明を加えていく。
時系列データがあれば
トレンドの変化と組み合わせて考えることができる
モデルについて
モデルの評価については決定係数を用いた。他にもある。
AICでステップワイズ終わったら、予測をしてみる。p値で見るのか、AICでみるのか
これは一概には決めきれないということで
長くしすぎない。一文一義になってないところは直す。
データサイエンス的な分析と、医学的な分析を組み合わせれば、より有用な知見が得られる?
ホールドアウト法の説明ちゃんとする
何日に閲覧したか最後に書く
参考文献をなにに使用したのか最後書く
個人のデータ、つまり個票データの方がうまくいきそう
4月は23時間20分卒論やった。
どんなデータセットがあるのか書く
回帰係数が小さいことから、ラッソ回帰、リッジ回帰は採用しなくてもいいと考えられる。