上回说到t检验:(生物信息学)R语言与统计学入门(一)——t 检验_Lijingxian教你学生信的博客-CSDN博客t检验,亦称student t检验(Student's t test),比较两个平均数的差异是否显著。https://lijingxian19961016./article/details/123553352?spm=1001..3001.5502
在正态总体的假定下, 两样本的均值检验通常用t检验。
在零假设成立时服从自由度为n1+n2-2的t分布,和单样本情况一样,t检验并不稳健。在不知总体分布时,使用t检验可能有风险,因此考虑Wilcoxon秩和检验法。
我们算差异表达基因是就是考虑用的此法。
此检验法是用来检验两个样本的位置参数关系. 与单样本的Wilcoxon符号,检验一样, 它也充分利用了样本中秩的信息。
说的太多也不明白,反正就是两组比较考虑位置关系的时候就用秩和检验法。
比图,比较糖尿病鼠和正常老鼠的体重,运行下面代码:
diabetes<-c(42,44,38,52,48,46,34,44,38)normal<-c(34,43,35,33,34,26,30,31,31,27,28,27,30,37,32)wilcox.test(diabetes,normal,exact = FALSE, correct=FALSE)
结果如下:
结论是:
因为P值小于0.05,故拒绝原假设,认为两组的体重显著不同。
什么使用用t检验什么时候用wilcox检验呢?
在数据呈严重偏态分布或有离群值的时候,可不要用t检验。它可能检验不出很明显的均数差异。
我们可以用shapiro.test函数检验一下上面数据的正态性:
shapiro.test(diabetes)shapiro.test(normal)
可以看到他们P值没有意义,也就是他们是服从正态分布的,那么这种数据也是可以用于t检验的。