データサイエンス学習曲線(Learning Curve)で過学習、学習不足を検証 機械学習では学習データ数によって学習不足だったり過学習を起こしていないか?という心配が出てきます。それを検証するのがLearning Curveです。Learning Curveはサンプル数を変えながら学習データと検証データの正解率の推移を計算し、それらの比較からモデルが適切かどうかを検証します。 2020.05.12データサイエンス
データサイエンスKaggleのTitanic課題をGridSearchCV+RandomForestClassifierで挑戦 前回はRandomForestClassifierでTitanic課題に挑戦しましたが、その前に行ったDecisionTreeClassifierよりも悪い結果となってしまいました。通常はRandomForestClassifierのほう... 2020.05.03データサイエンス
データサイエンス機械学習初心者がKaggleのTitanic課題でモデルを作る 機械学習の挑戦者が集まるKaggle 機械学習初心者だったら、「Pythonでモデリングの勉強はして機械学習を実際にやってみたいけど、データがない」と悩んだことはありませんか? そんなあなたにおすすめしたいのがKaggleです。... 2020.04.24データサイエンス