中位数、平均值、众数
中位数 median
1.中位数,数据从小到大排序,中间位置的那个数字。奇数,+1除以2;偶数,则用除以2,除以2然后+1,这两项的和,再除以2求个平均
2.不容易受到数据两端的异常值影响,不受组距影响;在直方图上,左右面积大概相等的位置点。比如5出现10次,然后6 7 8 9 9 9 9 ,这样5的这条方块就比较高,中位数偏5这边。比毕竟555555555567899999,中位数就落在5里面了
3.在直方图里,中位数是排序后中间的数,所以看直方图的频率,也就是直方图的高度,左右两边高度相加,相等的地方就是中位数的取值
平均值 mean
平均值,就加起来除以个数了。容易受到异常值的影响。不受到组距影响。直方图里面和中位数,一样不容易看出来;若直方图里面的极限值、异常值比较多,对它的影响比较大。比如上面的中位数的例子,9比较多,平均值会偏向9这边
众数 mode
1.在一堆数据中,多次重复出现的数据。比如:122222343866,这里面众数就是2咯。在直方图里面,众数表示出现的次数最多了,频率最高的,往往就是直方条最高那个。
2.众数在一组数据中,可能有多个众数,比如12+10个3+45678+10个9,在这种数据中,3、9都是众数;众数受到组距影响,比如123456这种横坐标,和2 4 6这种排下去的横坐标;众数还可能不存在