ONDrecords【WEBまわりの事をやっております】WEBデザイン・通販システム・予約システムなどが出来ます!

統計学とエクセル

仮説を立てて検証する

闇雲にデータを分析する事は、時間と労力の浪費になるので
「仮説 → 検証」で分析を進めよう。

仮説を立てるための切り口に
マーケティングの4P(Product・Price・Place・Promotion)および
3C(Customer・Company・Competitor)を思考の参考にする。

他とも比較が可能になる単位にデータを修正する。
例)一人当たりの販売額(総販売額/人口)や1kmいないの住宅数など比較出来る形に変換

ピラミッド型で物事を考えよう!

問題の原因を細かく、分野ごとに掘り下げやすくなるのです。
例えばこんなの

平均値を基準に、目標数値を割り出す

平均は、普通に計算する方法と、「中央値」という値を比較して使おう。
平均の計算は、外れ値で大きくズレる可能性があるので、中央値と比較するクセをつけよう。余りズレていないなら、平均値と総数で大まかな全体数がイメージ出来る。

※中央値とは、最小値と最大値から、ちょうど真ん中に位置するデータの値の事です。

例) 販売平均 × (市場規模 × シェア率) = 売り上げ目安

リスク(標準偏差)を計算しよう

リスクは、標準偏差(平均からどのくらい離れているか?)を計算すると予測できる。
標準偏差とは、(値-平均)の2乗の合計を総数で割った後、ルートしたもの。
標準偏差の数値は、平均からプラスマイナスしたその値の中に2/3のデータが入っているという意味。値が大きいという事は、それだけ平均から離れている。つまり、リスク(ばらつき)があるという事。

ヒストグラムでデータのばらつきを確認する

エクセルでのヒストグラムの作り方は、まず、データ表とは別に、データ区間の一覧を作る。

表示させたいセルを選択後、数式の挿入で、
=FREQUENCY(データの最初:データの最後,区間の最初:区間の最後)
を入力して、「shift」「command」「return」を同時に押す。

注意点としては、吐き出すFREQUENCYの表は、データ区間よりも一つ大きい範囲にしておく事。

「挿入」→「グラフ」で、グラフも簡単につくれる。

エクセルの関数早見表

用途 関数
平均 =AVEREGE(A1:A10)
中央値 =MEDIAN(A1:A10)
標準偏差 =STDEV(A1:A10)
標準偏差 =STDEVP(A1:A10)
母集団が決まっているときはこちら
相関係数 =CORREL(A1:A10,B1:B10) ※「Aの列」と「Bの列」の相関を求める
「0.7〜1」あるいは「-0.7〜-1」が強い相関があると言える。

Copyright © 2013 ONDrecords. All rights reserved.