跳远队这个月有个新教练,队员的表现也进步了。
小关跳远了 0.15m,小吕和小赵的成绩也增加了 0.06m。
小黄的结果是个 "离群值"……我们试试不用他的结果看看。
但这公平吗?我们可以随便不用我们不喜欢的数据吗?
那怎办?
你需要想想: "为什么那个数值跟其他的数值有那么大的差异?"
调差发现小黄当天不舒服,并不是教练的错。
所以在这个例子里把小黄的数据拿走是适当的。
如果我们拿走离群值,我们便改变了数据,数据不再是"纯净"的了,所以我们不可以在没有好理由的情况下随便拿走离群值!
如果我们真的拿走离群值,我们需要提供说明及解释。
上面我们看到离群值对 平均值有影响,那么 中位数 或 众数呢?
所以离群值对平均的影响最大,但对中位数和众数就没有太大的影响。
提示:如果有离群值,用中位数或众数。