科学の箱

科学・IT・登山の話題

機械学習 統計

ラテン方格

投稿日:2014年5月28日 更新日:

ラテン方格は1~nまでの数字についてn x nの正方行列に一回だけ現れるように並べたものである。ラテン方格を利用して実験の割り付けを行う実験計画法がラテン方格法である。

ラテン方格法と似た実験計画法には乱塊法がある。

3要因3水準の実験について考える。ラテン方格法を利用しない場合には各要因から1水準ずつ組み合わせて実験を行うために 3 x3x3 = 27回の実験が行われる。しかしラテン方格を利用すると9回で済む。

ラテン方格を利用した分析方法の手順について考えてみる。ラテン方格を利用する目的は変数間のモデルを構築することである。ラテン方格で利用できる要因数および水準数は決まっているために調査の前にこれを決定する。

事前調査をしておおよその仮説を立てる。”Yという変数がX1, X2, X3,,,と関連する”というのがスタートの仮設となる。このときモデルは数量化I類を利用して回帰分析を実施するので線形がわかりやすい。

スタートとなるモデルを構築できたらラテン方格にあてはまるように要因と水準を決定する。このときカテゴリの操作的定義をすることで分類するが、質的変数であればなぜその分類にするか、量的変数であれば層で分割する閾値の理由について説明できるようにしておく。

ここまでで利用するラテン方格および仮説となるモデルが決定しているので、ラテン方格に要因と水準を割り付ける。

割り付けたラテン方格にもとづきアンケートを作成もしくは実験計画を立てる。調査・実験はこのラテン方格に基づいて進める。途中で組み合わせに問題があることがわかっても割付を変えると回帰分析に必要となるデータが集まらないので、実験は当初の計画通りに進めることになる。モデル構築と割付は慎重に進める。

結果が得られたら以下の項目について検証して正しいデータが得られていることを確認する。

  • すべての割り当てについて調査が完了している
  • 割り当ての結果は正しい手順で得られている。
  • 明らかにおかしい値はない(Null値や大幅なはずれ値など)

正しいデータが得られていることが確認できたら符号化してデータ分析で利用できるようにする。ここでは数量化1類を利用して質的変数の水準を個別の変数に展開する。調査項目としては要因に対する水準という形式であったがこのままでは回帰分析に導入できない。水準ごとの変数を導入して0/1で値を設定することで質的変数の回帰分析を実行できるようになる。

符号化が完了したら、線形回帰分析を実行する。非線形やログの利用もできるがまずは単純なモデルを利用することを心がける。相関係数が極端に低いあるいは利用できる変数が少なくなる場合に非線形の利用を考える。

回帰分析の結果を決定係数から評価する。すべての変数を利用した回帰式を得た後にもっとも小さなtレンジ値をもつ変数について削除してから回帰式を再度計算する。この回帰式と先に得られている回帰式の決定係数を比較する。決定係数が大きくなれば、再度tレンジ値が最小である要因を削除して同じ動作を繰り返す。これを決定係数が最大になるまで繰り返す。

決定係数が最大となるモデルが取得できたら各要因についてカテゴリカルスコアを比較する。カテゴリカルスコアは変数の係数である。この係数が大きければ要因に対する影響が大きいことを意味する。小さいスコアであれば要因に対する影響が少ないので、モデルに基づいてアクションを考えるときに無視できる。

要因のモデルに対する影響および水準の要因に対する影響が予測と異なるときにはその背景についてさらに調査を進める。

構築したモデルについては属性によって層別化して回帰式に明らかな違いがないかを検証する。層により回帰式に違いが出れば、その属性により働きかけるアクションをカスタマイズする。

ラテン方格では対応できない場合には実験計画法における直交表を利用する。直交表を利用すると交互作用についても分析できる。

またラテン方格や直交表を利用した調査方法としてコンジョイントマーケティングがある。コンジョイントメーケティングは実験計画法のラテン方格や直交表を利用して効率よく顧客の好みを探る調査方法である。実験計画法によりアンケート項目を決定することで、少ない質問数で、幅広い項目について顧客の好みを評価できる。

 

 

メタ情報

inarticle



メタ情報

inarticle



-機械学習, 統計

執筆者:


comment

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

関連記事

no image

条件付きでレコードを取得する

データフレームでは条件付きでレコードを取得できる。 以下のようなフォーマットのデータフレームを考える id name height vector1 <- c(1, 2, 3, 4, 5) vec …

no image

Pythonではじめる機械学習 – Chap05 – Model Evaluation and Improvement

Chapter 5. Model Evaluation and Improvement 学習モデルの評価 定量的なモデルの評価は教師付きモデルが主になる。 教師なしモデルは定性的なアプローチで評価する …

no image

Statistical Reasoning for Public Health

Module up to 3 SES – 社会経済的地位 Cognitive function – 認知機能 The authors used the graphic alon …

no image

モンベルダウンジャケットについて売れ筋商品を分析してみる。

幾何平均が値付けに利用されているという話を聞いたので実際の商品を例にして分析してみる。 調査の目的 適切なダウンジャケットを選ぶことで冬季にあるいは夏季の3000m級の高山で気持ちよく過ご巣ことができ …

no image

仕事で始める機械学習 – 4章 システムに機械学習を組み込む

機械学習アーキテクチャ 学習方法としては3つのパターンがある バッチ処理で一括学習 バッチ処理で逐次学習 リアルタイムで逐次学習 学習と予測パターンの提供方法としては4つのパターンがある バッチ学習- …

2014年5月
« 4月   6月 »
 1234
567891011
12131415161718
19202122232425
262728293031  

side bar top



アーカイブ

カテゴリー