广州卫生职业技术学院《数据分析》2023-2024学年第一学期期末试卷.doc
站名:
站名:年级专业:姓名:学号:
凡年级专业、姓名、学号错写、漏写或字迹不清者,成绩按零分记。
…………密………………封………………线…………
第PAGE1页,共NUMPAGES1页
广州卫生职业技术学院
《数据分析》2023-2024学年第一学期期末试卷
题号
一
二
三
四
总分
得分
一、单选题(本大题共15个小题,每小题2分,共30分.在每小题给出的四个选项中,只有一项是符合题目要求的.)
1、在一个二项分布中,试验次数n=100,成功的概率p=0.3。计算成功次数的方差是?()
A.21
B.30
C.70
D.7
2、某超市记录了每天的销售额,要预测未来一周的销售额,使用了移动平均法。如果选择移动期数为5,那么预测值会受到哪些数据的影响?()
A.最近5天的销售额
B.最近5周的销售额
C.最近5个月的销售额
D.以上都不对
3、在对两个变量进行回归分析时,得到回归方程Y=3-0.5X。当X增加1个单位时,Y会()
A.增加0.5个单位B.减少0.5个单位C.增加3个单位D.减少3个单位
4、在进行多元回归分析时,如果某个自变量的VIF值(方差膨胀因子)较大,说明什么?()
A.存在多重共线性B.不存在多重共线性C.自变量对因变量影响大D.自变量对因变量影响小
5、为分析股票价格的波动特征,计算了其收益率的自相关系数。如果自相关系数显著不为零,说明什么?()
A.存在趋势B.存在季节性C.存在自相关D.数据异常
6、在进行统计分析时,如果数据存在缺失值,以下哪种处理方法不太合适?()
A.直接删除含缺失值的观测
B.用均值或中位数填充
C.用随机值填充
D.基于模型的插补
7、某地区的房价数据呈现右偏态分布,若要对其进行描述性统计,以下哪个指标不太适合用来反映数据的集中趋势?()
A.均值B.中位数C.众数D.以上都适合
8、为研究某种药物的疗效,将患者随机分为实验组和对照组,实验组服用该药物,对照组服用安慰剂。经过一段时间治疗后,对两组患者的症状进行评估。若要比较两组患者症状改善情况是否有差异,应采用的非参数检验方法是()
A.符号检验B.秩和检验C.游程检验D.以上都可以
9、在进行假设检验时,如果计算得到的p值小于设定的显著性水平,那么应该做出怎样的决策?()
A.拒绝原假设
B.接受原假设
C.无法确定
D.重新进行检验
10、已知某数据的四分位数间距为20,下四分位数为30,那么上四分位数约为多少?()
A.40B.50C.60D.70
11、某地区的房价近年来持续上涨,为了研究房价与房屋面积、地理位置等因素的关系。收集了500套房屋的相关数据,若要建立房价的预测模型,以下哪种统计方法最为合适?()
A.线性回归
B.逻辑回归
C.聚类分析
D.判别分析
12、某公司为了了解员工对新福利政策的满意度,对1000名员工进行问卷调查。问卷采用5级评分制(1表示非常不满意,5表示非常满意)。在进行数据统计分析时,应首先考虑使用以下哪种描述性统计量?()
A.均值
B.中位数
C.众数
D.标准差
13、某市场调查公司对消费者的购物偏好进行调查,随机抽取了500名消费者,其中300人表示更倾向于线上购物,200人倾向于线下购物。若要估计全体消费者中倾向于线上购物的比例的95%置信区间,应采用哪种方法?()
A.正态近似法B.精确方法C.以上都可以D.以上都不行
14、某市场调查公司为研究消费者对某新产品的接受程度,随机抽取了500名消费者进行调查。结果显示,有300名消费者表示愿意尝试该产品。以90%的置信水平估计愿意尝试该产品的消费者比例的置信区间为()
A.(0.55,0.65)B.(0.56,0.64)C.(0.57,0.63)D.(0.58,0.62)
15、某工厂生产的零件长度服从正态分布,均值为10cm,标准差为0.2cm。从生产线上随机抽取一个零件,其长度在9.6cm到10.4cm之间的概率是多少?()
A.0.6826B.0.9544C.0.9974D.0.3413
二、简答题(本大题共3个小题,共15分)
1、(本题5分)对于一个时间序列