华东理工大学《数据分析与方法》2023-2024学年第一学期期末试卷.doc
站名:
站名:年级专业:姓名:学号:
凡年级专业、姓名、学号错写、漏写或字迹不清者,成绩按零分记。
…………密………………封………………线…………
第PAGE1页,共NUMPAGES1页
华东理工大学
《数据分析与方法》2023-2024学年第一学期期末试卷
题号
一
二
三
四
总分
得分
一、单选题(本大题共30个小题,每小题1分,共30分.在每小题给出的四个选项中,只有一项是符合题目要求的.)
1、在对两个变量进行相关分析时,得到的相关系数为0,说明这两个变量之间是什么关系?()
A.完全线性相关B.非线性相关C.不相关D.无法确定
2、为了解某城市居民的收入分布情况,随机抽取了一定数量的居民进行调查。如果要绘制收入的频率分布直方图,组距应该如何确定?()
A.随意确定B.根据数据的极差和样本量确定C.越大越好D.越小越好
3、在一个数据集中,变量A和变量B的协方差为正,说明它们之间存在怎样的关系?()
A.正相关B.负相关C.无关D.不确定
4、在进行统计建模时,如果数据存在严重的共线性问题,以下哪种方法可以用于解决?()
A.主成分回归
B.偏最小二乘回归
C.逐步回归
D.以上都是
5、某市场调研公司对消费者的品牌忠诚度进行调查,结果用1-10分表示。若要分析不同性别消费者的品牌忠诚度是否有显著差异,应采用以下哪种参数检验方法?()
A.独立样本t检验
B.配对样本t检验
C.单因素方差分析
D.双因素方差分析
6、在对一批产品进行质量检验时,规定不合格率不能超过5%。随机抽取100个产品进行检验,发现有8个不合格。在显著性水平为0.05下,这批产品是否合格?()
A.合格B.不合格C.无法确定D.需要重新抽样
7、某地区的气温在一年中呈现周期性变化,为了研究其规律,收集了过去5年每月的平均气温数据。适合用于分析这种时间序列数据的方法是?()
A.回归分析
B.方差分析
C.指数平滑法
D.聚类分析
8、为研究某种药物的疗效,将患者随机分为实验组和对照组。实验组使用药物,对照组使用安慰剂。经过一段时间后,测量两组患者的症状改善情况。这种研究方法属于?()
A.观察性研究B.实验性研究C.案例分析D.以上都不是
9、要研究多个变量之间的关系,同时考虑变量之间的交互作用,以下哪种统计模型比较合适?()
A.多元线性回归B.方差分析C.协方差分析D.以上都不合适
10、为研究某种新型药物的疗效,对100名患者进行临床试验。其中50名患者服用新药,另外50名患者服用安慰剂。经过一段时间治疗后,服用新药组的平均康复时间为15天,标准差为3天;服用安慰剂组的平均康复时间为20天,标准差为4天。请问两组康复时间的差异是否显著?()
A.显著B.不显著C.无法确定D.以上都不对
11、在进行聚类分析时,如果数据的量纲不同,会对聚类结果产生什么影响?()
A.没有影响
B.可能导致错误的聚类
C.使聚类结果更准确
D.只影响聚类的速度
12、为分析股票价格的波动特征,计算了其收益率的自相关系数。如果自相关系数显著不为零,说明什么?()
A.存在趋势B.存在季节性C.存在自相关D.数据异常
13、为比较不同班级学生的考试成绩,计算了每个班级的平均分和标准差。如果一个班级的平均分较高,标准差较小,说明这个班级的成绩情况如何?()
A.整体水平高且差异小B.整体水平高但差异大C.整体水平低但差异小D.整体水平低且差异大
14、已知一组数据的偏态系数为0,峰度系数为3,说明数据的分布情况如何?()
A.接近正态分布B.左偏态C.右偏态D.无法确定
15、在一项关于消费者对某品牌满意度的调查中,共发放问卷1000份,回收有效问卷800份。其中表示非常满意的有200人,满意的有400人,不满意的有150人,非常不满意的有50人。计算消费者满意度的众数为()
A.满意B.非常满意C.不满意D.非常不满意
16、在研究身高与体重的关系时,收集了50个人的数据。通过计算得到身高与体重的相关系数为0.7,决定系数为0.49。这意味着()
A.身高可以解释体重49%的变异B.体重可以解释身高49%的