科学の箱

科学・IT・登山の話題

機械学習

SIGNATE お弁当の需要予測-2

投稿日:2018年5月12日 更新日:

データの内容を確認する。

期間を調べる


d_train['datetime'].min()
'
'2013-11-18'

d_train['datetime'].max()
'
'2014-9-9'

カテゴリデータについて値を確認する


d_train['week'].unique()
'
array(['月', '火', '水', '木', '金'], dtype=object)

d_train['name'].unique()
'
array(['厚切りイカフライ', '手作りヒレカツ', '白身魚唐揚げ野菜あん', '若鶏ピリ辛焼', 'ビッグメンチカツ', '鶏の唐揚', '豚のスタミナ炒め', 'ボローニャ風カツ', 'ハンバーグ', 'タルタルinソーセージカツ', 'マーボ豆腐', '厚揚げ豚生姜炒め', 'クリームチーズ入りメンチ', '鶏のカッシュナッツ炒め', '手作りロースカツ', 'ハンバーグデミソース', 

d_train['weather'].unique()
'
array(['快晴', '曇', '晴れ', '薄曇', '雨', '雪', '雷電'], dtype=object)

連続データについて時系列でプロットする

plt.plot(d_train['y'])
もしくは

d_train['y'].plot()


d_train['temperature'].plot()

データの分布を確認する

売上の分布を調べる

plt.hist(d_train['y'], bins=50)

温度の分布を調べる
 
plt.hist(d_train['temperature'], bins=50)
曜日別の分布を調べる
plt.hist(d_train['week'])

 

天気別の分布を確認する


plt.hist(d_train['weather'])

メタ情報

inarticle



メタ情報

inarticle



-機械学習
-

執筆者:


comment

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

関連記事

no image

irisをナイーブベイズで分類

ナイーブベイズの概要 ナイーブベイズは教師ありの分類アルゴリズムの一つである。 計算アルゴリズムとしてはベイズ定理を用いている。 機械学習における特徴としてはいかがある 実装が簡単であり、複雑なハイパ …

no image

クラスタリング

Rによるクラスタ分析の実行 県別の持家率と自家用車普及率からクラスタ分析を実行し似た県を探してみる。。 データソース 持家と自家用車普及率のデータは下記から取得する 持家普及率のデータはこちらから取得 …

no image

線形回帰とリッジ回帰とラッソ回帰の違い

用語 線形回帰 データから平均二乗誤差を最低にするパラメータΘを求めて、直線で回帰すること $$ y = Θ_0 + Θ_1 \times x $$ コスト関数 損失関数とも呼ばれる。実際のデータと予 …

no image

スパムメールの判別に使うベイズ定理についてまとめる

分類問題 スパムメールを判別するような問題は一般的に「分類問題」として機械学習では取り扱う。分類問題とはいまある「物」や「発生した事柄」を確率的に分類する。この「確率的」という言葉がみそであり、固定さ …

no image

conjoint分析の資料

マニュアル conjointパッケージ caFactorialDesign Rでconjointパッケージを利用した例 Rでコンジョイント分析 Rでコンジョイント分析 |極めて個人的なメモ コンジョイ …

2018年5月
« 4月   6月 »
 123456
78910111213
14151617181920
21222324252627
28293031  

side bar top



アーカイブ

カテゴリー