この動画ではMicrosoft Excelを使った散布図の作成における異常値の除去について解説します。
この例では「1日あたりのパソコンの利用時間(分)」の異常値として「3000」という値を持つ行を異常値と判断して除去しています。1日は24時間で1440分までしか有りません。3000という値はとり得ない値ですので異常値と判断できます。本来であればアンケートフォームを作成する段階で1440を超える数値が入らないように設定しておくと良いでしょう。次に「平均キータイプ数 (回/秒)」についても「0.0001」という値を持つ行を異常値として判断して除去しています。実は、この数値はタイピングゲームで測定した数値なのですが、このゲームの制限時間を60秒で行っていたので、1回入力しただけで0.0167異常となるはずです。したがって測定し得ない数値であり入力間違いであると判断できます。 81秒 再生