200字范文,内容丰富有趣,生活中的好帮手!
200字范文 > t检验的p值对照表_第十讲 R-两独立样本t检验

t检验的p值对照表_第十讲 R-两独立样本t检验

时间:2019-02-25 00:55:20

相关推荐

t检验的p值对照表_第十讲 R-两独立样本t检验

两独立样本t检验用于比较的平均两个独立的组是否存在差异。

例如,假设我们测量了100个人的体重:50名女性(A组)和50名男性(B组)。我们想知道女性的平均体重(mA)与男性(mB)。

在这种情况下,我们有两组不相关(即独立或不成对)的样本。因此,可以使用两独立样本t检验来评估均值是否不同。

注意,仅当数据呈正态分布时,才可以使用两独立样本t检验。可以使用Shapiro-Wilk test进行检查。(请参看第六讲。)同时,需要满足两组数据方差相等,即假设两组数据来自同一个大样本人群。这可以使用F-test进行检验。

1. 研究问题和统计假设

典型的研究问题是:

A组均值(mA)是否等于B组均值(mB)?A组均值(mA)是否小于B组均值(mB)?A组均值(mA)是否大于B组均值(mB)?

在统计数据中,我们可以定义相应的无效假设(H0) 如下:

H0:mA = mBH0:mA ≤ mBH0:mA ≥ mB

相应的备择假设(H1)如下:

H1:mA ≠ mB (不同)H1:mA > mB(大于)H1:mA < mB(小于)

注意:

假设1)称为双向检验假设2)和3)称为单向检验

2. 两独立样本t检验的公式

2.1 当两组方差相等(方差齐性)时,可以使用student-t检验方法比较两组差异:

其中,

mA和mB分别是A、B两组样本均值nA和nB分别是A、B两组样本量s2是样本的标准差,可以由以下公式计算获得

我们可以为自由度(df)计算与t检验统计量(| t |),通过查询t分布表格对比其在df=nA+nB-2处的P值。

2.2当两组方差不相等(方差不齐)时,可以使用校正的student-t检验方法,即Welch t检验比较两组差异:

其中,

SA和SB 分别是两组A和B的标准差。与经典的student-t检验不同,Welch t检验公式涉及两组的方差(SA2和SB2)进行比较。而不能将其直接合并为S2。其自由度的计算公式如下:

我们可以为自由度(df)计算与t检验统计量(| t |),通过查询t分布表格获取P值。

注意,Welch t检验被认为是一种相对保守安全的检验方法。通常,除非组大小和标准差都非常不同,否则经典的student-t检验和Welch t检验的结果非常相似。

如何解释结果?

如果p值低于或等于显着性水平0.05,我们可以拒绝无效假设并接受备择假设。换句话说,我们得出结论,两组样本代表的总体均值间有显着差异。

3. 用R完成两独立样本t检验

可以使用R函数t.test()计算两独立样本t检验:

t.test(x, y, alternative = "two.sided", var.equal = FALSE)

x,y:数值向量

alternative:备择假设。允许值为“two.sided”(默认),也可以根据需要设置为“greater”或“less”之一。var.equal:一个逻辑变量,指示是否将两个方差视为相等。如果为TRUE,则使用合并的方差估计方差,否则使用Welch检验。

3.1 将数据导入R

在这里,我们将使用一个示例数据集,其中包含18个人(9名女性和9名男性)的体重:

women_weight <- c(69.9, 64.2, 73.3, 61.8, 63.4, 65.6, 48.4, 58.8, 68.5)men_weight <- c(67.8, 60, 63.4, 76, 89.4, 72.3, 67.3, 61.3, 61.4) # 建立一个数据框my_data <- data.frame( group = rep(c("Woman", "Man"), each = 9),weight = c(women_weight, men_weight))

我们想知道,女性的体重是否与男子的体重不同?

3.2 检查数据

# 打印所有数据print(my_data)group weight1 Woman 69.92 Woman 64.23 Woman 73.34 Woman 61.85 Woman 63.46 Woman 65.67 Woman 48.48 Woman 58.89 Woman 68.510 Man 67.811 Man 60.012 Man 63.413 Man 76.014 Man 89.415 Man 72.316 Man 67.317 Man 61.318 Man 61.4

按性别计算统计信息(平均值和标准差)。可以使用dplyr软件包。

安装及导入dplyr软件包

install.packages("dplyr")library(dplyr)

按性别group计算统计信息:

group_by(my_data, group) %>%summarise(count = n(),mean = mean(weight, na.rm = TRUE),sd = sd(weight, na.rm = TRUE))# A tibble: 2 x 4group count mean sd<fct> <int> <dbl> <dbl>1 Man 9 68.8 9.422 Woman9 63.8 7.24

2.3 使用箱形图可视化数据

(请参看第五讲 R-数据描述性统计分析作图)

2.4 初步检验两独立样本t检验的检验假设

(请参看第六讲 R-数据正态分布检验)

假设1:两个样本是否独立?

是的,因为来自男性和女性的样本无关。

假设2:两组中每组的数据是否服从正态分布?

使用Shapiro-Wilk正态性检验

我们将使用with()和shapiro.test()的函数来为每组样本计算Shapiro-Wilk测试。

# Shapiro-Wilk normality test for Men's weights

with(my_data, shapiro.test(weight[group == "Man"]))# p = 0.089

# Shapiro-Wilk normality test for Women's weights

with(my_data, shapiro.test(weight[group == "Woman"])) # p = 0.52

输出结果中,两个p值大于显着性水平0.05,说明两组数据的分布与正态分布没有显着差异。数据分部符合正态分布的假设检验成立。

请注意,如果数据不是正态分布的,建议使用非参数两样本Wilcoxon秩检验。(后面的推送会介绍)

假设3:这两个总体是否符合方差齐性?

我们将使用F检验来检验方差齐性。可以使用var.test()函数执行以下操作:

res.ftest <- var.test(weight ~ group, data = my_data)res.ftestF test to compare two variancesdata: weight by groupF = 1.6918, num df = 8, denom df = 8, p-value = 0.4735alternative hypothesis: true ratio of variances is not equal to 195 percent confidence interval:0.3816132 7.5001461sample estimates:ratio of variances 1.69179

F检验为p = 0.4735 。它大于显着性水平alpha = 0.05。因此,两组数据的方差之间没有显著差异。因此我们认为男女两组方差相等(方差齐性)。

由于以上3个假设成立,因此,我们可以使用student-t检验。

2.5计算两独立样本t检验

问题:男女体重之间有显着差异吗?

res <- t.test(weight ~ group, data = my_data, var.equal = TRUE)resTwo Sample t-testdata: weight by groupt = 1.2629, df = 16, p-value = 0.2247alternative hypothesis: true difference in means is not equal to 095 percent confidence interval:-3.392909 13.392909sample estimates:mean in group Man mean in group Woman 68.76667 63.76667

在上面的结果中:

t是t检验统计值(t = 1.2629),df是自由度(df = 16),p值是t检验的显着性水平(p值= 0.2247)。http://conf.int是平均值在95%时的置信区间(http://conf.int = [-3.3929, 13.3929]);样本估计值是样本的平均值(平均值= 68.7666,63.7666)。

注意:

如果要检验男性的体重是否小于女性的体重,请输入以下内容:

t.test(weight ~ group, data = my_data,var.equal = TRUE, alternative = "less")

或者,如果您想测试男性的体重是否大于女性的体重,请输入

t.test(weight ~ group, data = my_data,var.equal = TRUE, alternative = "greater")

2.6 结果解释

检验的p值为0.2247,大于显着性水平alpha = 0.05。我们可以得出结论,男性的平均体重与女性的平均体重没有显著不同。

2.7 获得t.test()函数的返回值

(请参看第八讲 R-单样本t检验)

如果您觉得我说的还有点意思,请点赞让我感到您的支持,您的支持是我写作最大的动力~ijournal:高颜值的期刊检索网站,助您快速找到理想目标期刊(weixin小程序也上线了哦)投必得:全专业中英文论文润色编辑助力您的论文快速发表,点击了解业务详情

专栏传送门:

投必得科研软件安装使用手册;投必得:SCI期刊介绍与选择;投必得,教你写论文;投必得统计分析大讲堂;投必得科研生活解忧杂货店

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。