科学の箱

科学・IT・登山の話題

機械学習

ウェブ分析をハンズオンで学ぶ

投稿日:2018年3月6日 更新日:

ウェブ分析の本を読んでもあまりあたまに入ってこない。実際に手を動かさないと、身につかないわけである。

ということでハンズオンで実践して見ることにした。ハンズオンで実践するに当たり必要なのはデータとツールである。

データは自前のサーバーがあれば便利であるが、もしない場合にはオープンデータがいくつか利用できる。

こちらのサイトはデータは少ないがいろいろなオープンデータがまとまっている。

Traces available in the Internet Traffic Archive

次にツールである。ツールはオンラインとデスクトップアプリケーション分けられる。オンラインとしてはGoolge Analyticsが有名であるが残念ながら有料である。デスクトップアプリケーションではApache Log Viewerが無料である。しかし実際にレポートを利用とするとunlockするために15USDが必要であることが分かった。

自前でサーバーを立ててAWStatを利用すれば無料でもできるが少々手間がかかる。

ハンズオンまでの道のりは長い。

 

メタ情報

inarticle



メタ情報

inarticle



-機械学習

執筆者:


comment

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

関連記事

no image

Pythonではじめる機械学習 – Chap04

4.4 Binning, Discretization, Linear Models, and Trees ビン化のメリット 決定木でビン化するメリットはあまりない 決定木はモデルの中で一つの特徴につ …

no image

Mahout in Action/chap2

2.1 レコメンドには2種類ある。 collaborative filtering contents based filtering collaborative filteringではコンテンツの内容 …

no image

前向き研究と後ろ向き研究

前向き研究と後ろ向き研究は疫学における用語である。 前向き研究で使われる研究手法にはコホートや無作為比較対照研究、ロジスティック分析がある。これらの研究ではサンプルをリスクファクター(危険要因)のある …

no image

数値項目の分析テンプレート

数値フィールド1 数値フィールド1 rate – 1 rate – 2 データ型 算術平均 中央値 分散 トップ3 ボトム3 足切 時系列分析 層別候補 ヒストグラム カウント …

no image

R Dataset – AirPassengers

データの説明 1949~1960年における月別飛行機搭乗者数 フォーマット このデータは時系列データであることがわかる。 > str(AirPassengers)  Time-Series [1 …

2018年3月
« 2月   4月 »
 1234
567891011
12131415161718
19202122232425
262728293031  

side bar top



アーカイブ

カテゴリー