大数据挖掘技术练习习题库(2024年第1部分).pdf
大数据挖掘技术练习习题库(2024年第1部分)
(该部分共500题)
1.[单选题]数据预处理目前常用的异常数据识别方法包括业务判别法、()、箱线图判别法、统计判别法
A)聚类判别法;
B)回归判别法
C)抽样判别法
答案:A
解析:
2.[单选题]在无线网络覆盖指标体系中,4G用户4G占网时长占比的指标定义是?
A)4G活跃用户群产生的4G上网流量/(4G活跃用户群产生的移动互联网上网总流量)
B)4G活跃用户群的4G网络驻留时长/(4G活跃用户群在移动互联网的总驻留时长)
C)4G活跃用户群的2G+3G网络驻留时长/(4G活跃用户群在移动互联网的总驻留时长)
答案:B
解析:
3.[单选题]非参数检验是针对()分布情况做的假设。
A)总体
B)局部
C)个体
答案:A
解析:
4.[单选题]净现值、内部收益率、获利指数指标之间的数量关系()NPV0
A)当PI1,时,IRRiNPV0
B)当PI1,时,IRRiNPV0
C)当PI1时,IRRi,NPV0、当DPI1IRRi,时,
答案:B
解析:
5.[单选题]NB指标中,电力抄表响应成功率是指:
A)电力抄表业务HTTPGET请求成功/请求次数,如果是非HTTP业务,可以统计时间段内电力抄表用户TCP建链的成功比例
。
B)电力抄表业务HTTPPUT请求成功/请求次数,如果是非HTTP业务,可以统计时间段内电力抄表用户TCP建链的成功比例
。
C)电力抄表业务HTTPGET请求成功/请求次数,如果是非HTTP业务,可以统计时间段内电力抄表用户UDP建链的成功比例
。
D)电力抄表业务HTTPPUT请求成功/请求次数,如果是非HTTP业务,可以统计时间段内电力抄表用户UDP建链的成功比例
。
答案:A
解析:
6.[单选题]为了比较利用不同分类算法构建的分类模型的性能,可以利用图形进行比较,常用的图形包括()。
A)条形图
B)ROC曲线
C)饼图
1/79
D)直方图
答案:B
解析:
7.[单选题]Hive通常被称作()。
A)数据地图
B)数据能力
C)数据仓库
D)数据应用
答案:C
解析:
8.[单选题]OLAP包括以下()基本操作功能。
I.上卷Ⅱ切片Ⅲ.转轴Ⅳ.切块
A)I、Ⅱ和Ⅲ
B)I、Ⅱ和Ⅳ
C)Ⅱ、Ⅲ和Ⅳ
D)都是
答案:D
解析:
9.[单选题]LTE中,对于频分双工(FDD)的操作,定义了4中随机接入的前导格式,其中格式3的Tcp()μs
A)203.13
B)406.26
C)101.3
D)684.38
答案:D
解析:
10.[单选题]模型把数据学习的太彻底,以至于把噪声数据的特征也学习到了,这样就会导致在后期测试的时候不能够
很好地识别数据,模型泛化能力太差,这是()的原因
A)欠拟合
B)泛化误差
C)过拟合
D)经验误差
答案:C
解析:
11.[单选题]以下关于前馈神经网络的叙述中正确的是()
A)前馈神经网络只能有3层
B)前馈神经网络中存在反馈
C)前馈神经网络中每一层只接受来自前一层单元的输入
D)以上都是正确的
答案:C
解析:
12.[单选题]下列关于人工智能叙述不正确的有()
A)人工智能是科学技术发展趋势
B)人工智能有力的促进了社会发展
C)AI没有真的到来
D)人工智能技术与其他科学技术相结合极大提高应用技术的智能化水平
2/79
答案:C
解析:
13.[单选题]已知事件A的概率P(A)=0.6,U为必然事件,则P(A+U)=1,P(AU