データ分析 【n-1で割る】不偏分散の期待値は本当に母分散と一致するか。 2022年6月8日 tosondodo ドドテクノ 母集団から標本(\(X_1,\cdots,X_n\))を取得したとき、その平均の期待値は、母平均(\(\mu\))に一致します。 \b …
データ分析 中心極限定理の検証。標本の平均は本当に正規分布に従うのか? 2022年5月31日 tosondodo ドドテクノ 統計学の有名な定理として、中心極限定理というものがあります。 標本(サンプルサイズ\(n\))を母集団(平均\( \mu\)、分散\( …
データ分析 信頼区間を可視化してその「本当の意味」を確かめてみた。 2022年5月28日 tosondodo ドドテクノ 統計で信頼区間と言えば、誤った解釈をされがちなものとして有名です。 標本の平均の95%の信頼区間を求めた場合、母集団の平均がその区間内 …
データ分析 【SIRモデル】実データを学習して未来の感染状況を予測してみた。 2020年5月20日 tosondodo ドドテクノ 以下の記事で、SIRモデルをpythonで実装してみました。 https://dodotechno.com/python-sir-mo …
データ分析 Pythonのstatsmodelsを利用した時系列分析事始め 2020年5月1日 tosondodo ドドテクノ Pythonのstatsmodelsというパッケージを使うとサクッと時系列データから、自己相関、トレンド、季節性などを抽出することができます …
データ分析 一部で話題のSIRモデルをPythonで実装してみました。 2020年4月20日 tosondodo ドドテクノ SIRモデルは感染症の流行を記述するための古典的な数理モデルです。 古典的ではありますが、新型コロナについてクラスター対策班がシミュレ …
データ分析 コロナ感染数を元にPlotlyでインタラクティブなグラフを作成してみました。 2020年4月8日 tosondodo ドドテクノ 以下の記事で、4/4までの感染者数のデータをMatplotlibで可視化しました。 https://dodotechno.com/co …
データ分析 コロナ感染者数をPython+Matplotlibで可視化してみました。(4/4現在) 2020年4月4日 tosondodo ドドテクノ 現時点で、収束の兆しが見えていないコロナですが、ジョンズ・ホプキンズ大学では、日々の感染者数についての情報を以下のリンク先で公開しています。 …
データ分析 Word Cloudでアーティストの歌詞の頻出語を可視化してみた。 2020年3月27日 tosondodo ドドテクノ 私が作ったWEBアプリ(Synchro Song)ではアーティスト毎のページに歌詞の頻出語を可視化したWord Cloudにより生成した図を …