データ分析 信頼区間を可視化してその「本当の意味」を確かめてみた。 2022年5月28日 tosondodo ドドテクノ 統計で信頼区間と言えば、誤った解釈をされがちなものとして有名です。 標本の平均の95%の信頼区間を求めた場合、母集団の平均がその区間内 …
機械学習 重要度は信用できるか?Permutation Feature Importance(PFI)を試してみた。 2022年5月23日 tosondodo ドドテクノ 「性能が良いのはわかった。でも理由が知りたい。」 機械学習においてモデルの説明性が求められる事は多いです。 「何故かわからないけ …
機械学習 【説明可能性】PyCarat+SHAPで特徴量の寄与度を可視化してみた。 2022年5月21日 tosondodo ドドテクノ 説明可能なAIというような言葉が出てきてから、もう数年が経過しているかと思います。 実際、顧客に「予測の精度が良い」という結果だけ見せ …
機械学習 機械学習のアンチパターン。過去にやらかした反省を込めて書きます。 2022年5月17日 tosondodo ドドテクノ 私は、以前勤めていた会社でSEをやっていましたが、大人の事情で、突如、データ分析の仕事をする事になりました。 当然、右も左もわからない …
機械学習 PyCaratのcompare_modelsで任意のモデルを使う方法 2022年4月21日 tosondodo ドドテクノ 前回の記事で、PyCaratを使用して、MNISTの評価を行いました。 この時、compare_modelsを使用して、自動でいくつか …
機械学習 PyCaratでMNISTを評価してみた。 2022年4月18日 tosondodo ドドテクノ PyCaratという非常に便利な機械学習のためのライブラリがあることを最近知りました。 以前、MNISTを様々なモデルで評価するという事をやってみましたが、同じように複数モデ …
データ分析 【SIRモデル】実データを学習して未来の感染状況を予測してみた。 2020年5月20日 tosondodo ドドテクノ 以下の記事で、SIRモデルをpythonで実装してみました。 https://dodotechno.com/python-sir-mo …
データ分析 Pythonのstatsmodelsを利用した時系列分析事始め 2020年5月1日 tosondodo ドドテクノ Pythonのstatsmodelsというパッケージを使うとサクッと時系列データから、自己相関、トレンド、季節性などを抽出することができます …
データ分析 一部で話題のSIRモデルをPythonで実装してみました。 2020年4月20日 tosondodo ドドテクノ SIRモデルは感染症の流行を記述するための古典的な数理モデルです。 古典的ではありますが、新型コロナについてクラスター対策班がシミュレ …
機械学習 python でロジスティック回帰をスクラッチで実装してみた。 2020年4月16日 tosondodo ドドテクノ いわゆる「AI」を期待しているお客様に対して、ロジスティック回帰を使いますとか言おうものならば「それのどこがAIだ!」と言われる可能性があり …