科学の箱

科学・IT・登山の話題

機械学習

ウェブ分析をハンズオンで学ぶ

投稿日:2018年3月6日 更新日:

ウェブ分析の本を読んでもあまりあたまに入ってこない。実際に手を動かさないと、身につかないわけである。

ということでハンズオンで実践して見ることにした。ハンズオンで実践するに当たり必要なのはデータとツールである。

データは自前のサーバーがあれば便利であるが、もしない場合にはオープンデータがいくつか利用できる。

こちらのサイトはデータは少ないがいろいろなオープンデータがまとまっている。

Traces available in the Internet Traffic Archive

次にツールである。ツールはオンラインとデスクトップアプリケーション分けられる。オンラインとしてはGoolge Analyticsが有名であるが残念ながら有料である。デスクトップアプリケーションではApache Log Viewerが無料である。しかし実際にレポートを利用とするとunlockするために15USDが必要であることが分かった。

自前でサーバーを立ててAWStatを利用すれば無料でもできるが少々手間がかかる。

ハンズオンまでの道のりは長い。

 

メタ情報

inarticle



メタ情報

inarticle



-機械学習

執筆者:


comment

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

関連記事

no image

モンベルダウンジャケットについて売れ筋商品を分析してみる。

幾何平均が値付けに利用されているという話を聞いたので実際の商品を例にして分析してみる。 調査の目的 適切なダウンジャケットを選ぶことで冬季にあるいは夏季の3000m級の高山で気持ちよく過ご巣ことができ …

no image

SIGNATE お弁当の需要予測-2

データの内容を確認する。 期間を調べる d_train[‘datetime’].min() ‘ ‘2013-11-18’ d_train[‘datetime’].max() ‘ ‘2014-9-9’ …

no image

データ分析の基本と業務

開発生産性は調和平均で計算する。 安全性の在庫の計算には正規分布を利用できる。 標準偏差=5であることを利用すると何が言えるか。 Z=1.96で95%をカバーする。 よって 5 x 1.96でほぼ10 …

no image

SVMでグリッドサーチ

IrisデータについてSVMで分類をしてみた。さて、今回はSVMモデルのパラメータをいじってみてより精度が高いモデルを作ってみる。 すべての学習モデルはハイパーパラメータと呼ばれる学習モデルに影響を与 …

no image

仕事で始める機械学習 – 3.学習結果を評価しよう – 指標

主な指標 モデル構築後に確認する主な指標は4つある。 正解率 適合率 再現率 F値 正解率 $$ 正解率 = \frac{TP + TN}{TP+FP+TN+FN} $$ 正解率は全データ数に対する正 …

2018年3月
« 2月   4月 »
 1234
567891011
12131415161718
19202122232425
262728293031  

side bar top



アーカイブ

カテゴリー