南京信息工程大学《应用回归分析》2023-2024学年第一学期期末试卷.doc
学校________________班级____________姓名____________考场____________准考证号
学校________________班级____________姓名____________考场____________准考证号
…………密…………封…………线…………内…………不…………要…………答…………题…………
第PAGE1页,共NUMPAGES3页
南京信息工程大学
《应用回归分析》2023-2024学年第一学期期末试卷
题号
一
二
三
总分
得分
一、单选题(本大题共20个小题,每小题2分,共40分.在每小题给出的四个选项中,只有一项是符合题目要求的.)
1、对于一个含有分类变量和连续变量的数据集,要分析分类变量对连续变量的影响,以下哪种方法较为合适?()
A.方差分析
B.协方差分析
C.判别分析
D.逻辑回归
2、某市场调查公司为研究消费者对某新产品的接受程度,随机抽取了500名消费者进行调查。结果显示,有300名消费者表示愿意尝试该产品。以90%的置信水平估计愿意尝试该产品的消费者比例的置信区间为()
A.(0.55,0.65)
B.(0.56,0.64)
C.(0.57,0.63)
D.(0.58,0.62)
3、为比较不同班级学生的考试成绩,计算了每个班级的平均分和标准差。如果一个班级的平均分较高,标准差较小,说明这个班级的成绩情况如何?()
A.整体水平高且差异小
B.整体水平高但差异大
C.整体水平低但差异小
D.整体水平低且差异大
4、对于一个右偏分布的数据,以下哪个统计量更能代表数据的集中趋势?()
A.均值
B.中位数
C.众数
D.无法确定
5、在研究某地区的经济发展与环境污染的关系时,发现随着经济的增长,环境污染先加重后减轻。这种关系被称为?()
A.正相关
B.负相关
C.非线性相关
D.不相关
6、在研究身高与体重的关系时,收集了50个人的数据。通过计算得到身高与体重的相关系数为0.7,决定系数为0.49。这意味着()
A.身高可以解释体重49%的变异
B.体重可以解释身高49%的变异
C.身高与体重的关系不显著
D.身高与体重没有关系
7、已知两个变量X和Y的相关系数为0.8。现对X和Y分别进行标准化处理,得到变量Z和W,则Z和W的相关系数为()
A.0
B.0.8
C.1
D.无法确定
8、已知一组数据的偏态系数为-0.5,说明数据的分布是?()
A.左偏
B.右偏
C.对称
D.无法确定
9、已知一个样本的均值为20,标准差为4,另一个样本的均值为30,标准差为6。哪个样本的离散程度更大?()
A.第一个样本
B.第二个样本
C.两个样本离散程度相同
D.无法比较
10、某企业生产的产品重量服从正态分布,均值为500g,标准差为20g。现从生产线上随机抽取25个产品,其平均重量在490g至510g之间的概率为()
A.0.6826
B.0.9544
C.0.9973
D.1
11、在对某公司员工的工资进行调查时,发现工资数据存在严重的右偏。为了更准确地描述数据的集中趋势,应该使用以下哪个指标?
A.算术平均数
B.中位数
C.众数
D.几何平均数
12、已知随机变量X服从自由度为10的t分布,计算P(X1.812)的值是?
A.0.05
B.0.025
C.0.01
D.0.1
13、为了研究教育程度与收入之间的关系,收集了大量样本数据。绘制散点图后发现,随着教育程度的提高,收入呈现出非线性的增长趋势。此时适合采用哪种回归模型?
A.线性回归
B.二次多项式回归
C.对数线性回归
D.以上都不合适
14、对于一个时间序列数据,如果存在季节性变动,应采用哪种方法进行预测?()
A.简单移动平均法
B.指数平滑法
C.季节指数法
D.自回归模型
15、为比较两个总体的离散程度,以下哪个统计量最为合适?()
A.方差
B.标准差
C.变异系数
D.极差
16、在一次抽样调查中,样本容量为200,计算得到样本均值为50,样本标准差为10。若要估计总体均值的95%置信区间,应该使用哪种方法?()
A.Z分布
B.t分布
C.F分布
D.卡方分布
17、在对两个总体均值进行比较时,已知两个总体方差相等。从两个总体中分别抽取样本量为10和15的样本,计算得到两个样本的均值分别为20和25,样本方差分别为4和5。则两个总体均值之差的95%置信区间为()
A.(-7.26,1.26)
B.(-6.32,2.32)
C.(-5.18,3.18)
D.(-4.56,4.56)
18、某地区的气温在一年中呈现周期性变化,为了研究其规律,收集了过去5年每月的平均气温数据。适合用于分析这种时间序列数据的方法