嘉兴南洋职业技术学院《医学统计学与SPSS软件应用》2023-2024学年第一学期期末试卷.doc
自觉遵守考场纪律如考试作弊此答卷无效密
自觉遵守考场纪律如考试作弊此答卷无效
密
封
线
第PAGE1页,共NUMPAGES3页
嘉兴南洋职业技术学院《医学统计学与SPSS软件应用》
2023-2024学年第一学期期末试卷
院(系)_______班级_______学号_______姓名_______
题号
一
二
三
四
总分
得分
一、单选题(本大题共15个小题,每小题2分,共30分.在每小题给出的四个选项中,只有一项是符合题目要求的.)
1、已知变量X和Y的相关系数为0.8,对X和Y分别进行标准化处理后,它们的相关系数是多少?()
A.0.8
B.0
C.1
D.无法确定
2、在进行统计建模时,如果数据存在严重的共线性问题,以下哪种方法可以用于解决?()
A.主成分回归
B.偏最小二乘回归
C.逐步回归
D.以上都是
3、在一个有1000个数据的样本中,计算得到众数为50,均值为60,中位数为55。这组数据的分布可能是怎样的?()
A.左偏态B.右偏态C.正态分布D.均匀分布
4、某地区的气温在一年中呈现周期性变化,1月平均气温为5℃,7月平均气温为25℃。如果用正弦曲线来拟合气温的季节性变化,那么其振幅约为()
A.10℃B.15℃C.20℃D.5℃
5、为研究不同地区的经济发展水平,收集了各地区的GDP、人均收入等数据。若要对这些地区进行分类,可采用哪种统计方法?()
A.判别分析
B.聚类分析
C.主成分分析
D.因子分析
6、对一组数据进行分组,组距为5,第一组下限为10。如果数据中最小的值为8,那么应该将其归入哪一组?()
A.第一组B.第二组C.第三组D.不归入任何组
7、某工厂生产的零件尺寸服从正态分布,现从生产线上随机抽取100个零件进行检测,发现有10个零件的尺寸不符合标准。若要估计该生产线生产的零件不合格率的95%置信区间,应使用的方法是()
A.正态近似法B.精确计算法C.中心极限定理D.以上都不对
8、某工厂生产的灯泡寿命服从正态分布,平均寿命为1500小时,标准差为200小时。从该工厂生产的灯泡中随机抽取100个,那么这100个灯泡的平均寿命在1450小时到1550小时之间的概率约为()
A.0.6826B.0.9544C.0.9974D.0.3413
9、在一项医学研究中,比较了两种治疗方法对患者康复时间的影响。如果康复时间的数据不服从正态分布,应选用哪种非参数检验方法?()
A.威尔科克森秩和检验
B.曼-惠特尼U检验
C.克鲁斯卡尔-沃利斯H检验
D.以上都可以
10、为研究某种疾病的发病率与年龄、性别、生活习惯等因素的关系,收集了大量数据。这属于哪种类型的数据分析?()
A.单因素分析B.多因素分析C.相关分析D.回归分析
11、某研究人员想比较三种不同治疗方法对某种疾病的疗效,将患者随机分为三组进行治疗。治疗一段时间后,测量患者的康复情况。应选用哪种统计方法来分析治疗方法的效果?()
A.单因素方差分析
B.双因素方差分析
C.多因素方差分析
D.重复测量方差分析
12、在对一组数据进行统计分析时,发现其中一个数据明显偏离其他数据。在这种情况下,以下哪种处理方法比较恰当?()
A.直接删除该数据B.保留该数据,不做特殊处理C.检查数据收集过程,若无误则保留D.用平均值替代该数据
13、在一个班级中,学生的数学成绩和语文成绩的相关系数为0.6。如果数学成绩提高10分,语文成绩大约会提高多少?()
A.6分B.4分C.无法确定D.以上都不对
14、在进行假设检验时,如果得到的检验统计量的值落在拒绝域内,说明什么?()
A.原假设成立B.备择假设成立C.无法判断D.检验有误
15、某城市的交通流量在一天内不同时间段有明显差异。为了描述这种差异,将一天分为24个小时段,计算每个时段的交通流量均值。这种数据属于?()
A.截面数据
B.时间序列数据
C.面板数据
D.混合数据
二、简答题(本大题共3个小题,共15分)
1、(本题5分)在进行数据挖掘时,如何避免过拟合和欠拟合问题?请说明可以采用的技术和方法,并举例说明如何在实际模型中进行调整和优化。
2、(本题5分)详细论述在回归分析中如何诊断异方差性,分析异方差性对回归结果的影响和相应的处理方法。
3、(本题5分)在进行统计分组时,应遵循哪些原则?举例说明如何根据研究目的和数据特点