第4章习题与参考答案.docx
人工智能基础-第4章习题与参考答案
一、填空题
(1)在pandas中,使用loc选择器可以根据标签进行索引,而使用选择器可以根据位置进行索引。
参考答案:iloc
解析:在pandas中,iloc专门用于基于整数位置(从0开始的索引)来选择数据,与loc基于标签选择数据相对应。
(2)pandas中,用于对DataFrame进行排序的方法是。
参考答案:sort_values()
解析:sort_values()方法可以根据指定的列或索引对DataFrame进行排序,默认是升序,通过设置参数可以实现降序等其他排序方式。
(3)pandas中,用于将多个DataFrame按照共同的列进行合并的方法是。
参考答案:merge()
解析:merge()方法可以根据共同的列或索引将多个DataFrame进行合并,类似于数据库中的表连接操作。
(4)pandas中,用于对DataFrame进行分组聚合的方法是。
参考答案:groupby()
解析:groupby()方法用于按照指定的列对DataFrame进行分组,然后可以对每个组进行聚合操作,如求和、平均值等。
(5)返回一个数据框df的前4行,可以使用的命令是。
参考答案:head(4)
解析:head()方法用于返回数据框的前n行,默认是前5行,传入参数4则返回前4行。
二、选择题
(1)下列不是pandas中的基本数据结构的是()。
A.Series B.DataFrame C.Panel D.Array
参考答案:D
解析:pandas的基本数据结构有Series、DataFrame和Panel(在较新的版本中已不常用),Array是NumPy中的数据结构,不是pandas的。
(2)()可以在pandas中创建一个Series对象。
A.pd.Series([1,2,3]) B.pd.DataFrame([1,2,3])
C.pd.Index([1,2,3]) D.pd.Panel([1,2,3])
参考答案:A
解析:pd.Series()用于创建Series对象,pd.DataFrame()用于创建数据框,pd.Index()用于创建索引对象,pd.Panel()用于创建Panel对象。
(3)在pandas中,()可以用来删除数据框中的缺失值。
A.replace() B.fillna() C.dropna() D.interpolate()
参考答案:C
解析:dropna()函数用于删除包含缺失值的行或列,replace()用于替换值,fillna()用于填充缺失值,interpolate()用于插值。
(4):在pandas中,要获取多列数据,需要将列名放在一个列表中作为索引,即df[[列名1,列名2,列名3]]。
(5):inner连接方式是取两张表的交集,只返回两张表中连接键都匹配的行;left连接返回左表的所有行和右表匹配的行,right连接返回右表的所有行和左表匹配的行,outer连接返回两张表的所有行,匹配的合并,不匹配的用NaN填充。
(4)变量df是一个Dataframe类型的数据,通过直接索引获取其多列元素,可使用的命令是()。
A.df[[列名1,列名2,列名3]] B.df[列名1,列名2,列名3]
C.df[[列名1:列名2:列名3]] D.df[[列名1,列名2,列名3]]
参考答案:A
解析:在pandas中,要获取多列数据,需要将列名放在一个列表中作为索引,即df[[列名1,列名2,列名3]]。
(5)两张表进行连接,要获取它们交集的部分,应该使用()连接方式。
A.left B.inner C.right D.outer
参考答案:B
解析:inner连接方式是取两张表的交集,只返回两张表中连接键都匹配的行;left连接返回左表的所有行和右表匹配的行,right连接返回右表的所有行和左表匹配的行,outer连接返回两张表的所有行,匹配的合并,不匹配的用NaN填充。