光环大数据培训 高效使用 Python 可视化工具 Matplotlib _光环大数据培训精选.pdf
文本预览下载声明
光环大数据--大数据培训知名品牌
光环大数据培训 高效使用 Python 可视化工具 Matplotlib _光环大数据培训
光环大数据大数据培训机构,Matplotlib 是Python 中最常用的可视化工具
之一,可以非常方便地创建海量类型的2D 图表和一些基本的3D 图表。本文主要
介绍了在学习Matplotlib 时面临的一些挑战,为什么要使用Matplotlib,并推
荐了一个学习使用Matplotlib 的步骤。
对于新手来说,进入Python 可视化领域有时可能会令人感到沮丧。Python
有很多不同的可视化工具,选择一个正确的工具有时是一种挑战。 例如,即使
两年过去了,这篇《Overview of Python Visualization Tools》是引导人们到
这个网站的顶级帖子之一。 在那篇文章中,我对matplotlib 留下了一些阴影,
并在分析过程中不再使用。然而,在使用诸如pandas,scikit-learn,seaborn
和其他数据科学技术栈的python 工具后,觉得丢弃matplotlib 有点过早了。说
实话,之前我不太了解matplotlib,也不知道如何在工作流程中有效地使用。
现在我花时间学习了其中的一些工具,以及如何使用 matplotlib,已经开
始将 matplotlib 看作是不可或缺的工具了。这篇文章将展示我是如何使用
matplotlib 的,并为刚入门的用户或者没时间学习matplotlib 的用户提供一些
建议。我坚信matplotlib 是python 数据科学技术栈的重要组成部分,希望本文
能帮助大家了解如何将matplotlib 用于自己的可视化。
为什么对matplotlib 都是负面评价?
在我看来,新用户学习matplotlib 之所以会面临一定的挑战,主要有以下
几个原因。
首先,matplotlib 有两种接口。第一种是基于MATLAB 并使用基于状态的接
口。第二种是面向对象的接口。为什么是这两种接口不在本文讨论的范围之内,
但是知道有两种方法在使用matplotlib 进行绘图时非常重要。
两种接口引起混淆的原因在于,在 stack overflow 社区和谷歌搜索可以获
得大量信息的情况下,新用户对那些看起来有些相似但不一样的问题,面对多个
光环大数据
光环大数据--大数据培训知名品牌
解决方案会感到困惑。从我自己的经历说起。回顾一下我的旧代码,一堆
matplotlib 代码的混合——这对我来说非常混乱(即使是我写的)。
matplotlib 的新用户应该学习使用面向对象的接口。
matplotlib 的另一个历史性挑战是,一些默认风格选项相当没有吸引力。在
R 语言世界里,可以用 ggplot 生成一些相当酷的绘图,相比之下,matplotlib
的选项看起来有点丑。令人欣慰的是matplotlib 2.0 具有更美观的样式,以及
非常便捷对可视化的内容进行主题化的能力。
使用matplotlib 我认为第三个挑战是,当绘制某些东西时,应该单纯使用
matplotlib 还是使用建立在其之上的类似pandas 或者seaborn 这样的工具,你
会感到困惑。任何时候都可以有多种方式来做事,对于新手或不常用matplotlib
的用户来讲,遵循正确的路径是具有挑战性的。将这种困惑与两种不同的API 联
系起来,是解决问题的秘诀。
为什么坚持要用matplotlib?
尽管有这些问题,但是我庆幸有 matplotlib,因为它非常强大。这个库允
许创建几乎任何你可以想象的可视化。此外,围绕着它还有一个丰富的 python
工具生态系统,许多更先进的可视化工具用 matplotlib 作为基础库。如果在
python 数据科学栈中进行任何工作,都将需要对如何使用matplotlib 有一个基
本的了解。这是本文的其余部分的重点——介绍一种有效使用matplotlib 的基
本方法。
基本前提
如果你除了本文之外没有任何基础,建议用以下几个步骤学习如何使用
matplotlib:
学习基本的matplotlib 术
显示全部