Matplotlib是一个盛行的Python/ target=_blank class=infotextkey>Python库,能够很简单地用于创立数据可视化。可是,设置数据、参数、图形和绘图在每次履行新项目时都或许变得十分紊乱和繁琐。并且由于运用不同,咱们不知道挑选哪一个图例,比方直方图,饼状图,曲线图等等。这里有一个很棒的思想导图,能够协助您为作业挑选正确的可视化作用:
咱们关于这张思想导图中的首要图例做一些解说:
散点图十分合适显现两个变量之间的联系,由于您能够直接看到数据的原始散布。您还能够经过如下图所示的对组进行色彩编码来检查不同数据组的这种联系。
想要可视化三个变量之间的联系吗?!彻底没有贰言只需运用另一个参数(如点巨细)对第三个变量进行编码,如下面的第二个图所示,咱们把这个图叫做冒泡图。
散点图函数举例:
当你能清楚地看到一个变量与另一个变量之间改变很大时,最好运用线图。让咱们看看下面的图来阐明。咱们能够清楚地看到,一切专业的百分比随时刻改变很大。用散点图来制造这些图会十分凌乱,很难真实了解和看到发生了什么。直线图十分合适这种状况,由于它基本上能够快速总结两个变量(百分比和时刻)的协方差。相同,咱们也能够经过色彩编码来运用分组。
线图代码举例:
直方图关于检查(或真实发现)数据点的散布很有用。看看下面的柱状图,咱们制造了频率和智商的柱状图。咱们能够清楚地看到向中心的浓度和中值是什么。咱们也能够看到它遵从一个高斯散布。运用条形图(而不是散点图)能够让咱们清楚地看到每个箱子频率之间的相对差异。运用箱子(离散化)真的协助咱们看到“更大的画面”,假如咱们运用一切没有离散箱子的数据点,在可视化中或许会有许多噪音,使咱们很难看到究竟发生了什么。
假定咱们要比较数据中两个变量的散布。有人或许会以为,你有必要制造两个独立的直方图,把它们放在一同比较。可是,实践上有一个更好的办法:咱们能够用不同的透明度掩盖直方图。看看下面的图。均匀散布的透明度设为0。5这样咱们就能看到它的背面。这答应运用直接检查同一图上的两个散布。
直方图代码举例:
当您企图将类别很少(或许少于10个)的分类数据可视化时,条形图是最有用的。假如咱们有太多的类别,那么图中的条形图就会十分紊乱,很难了解。它们十分合适分类数据,由于您能够依据条形图的巨细;分类也很简单区分和色彩编码。咱们将看到三种不同类型的条形图:惯例的、分组的和堆叠的:
惯例的条形图代码举例:
分组图代码举例:
堆叠图代码举例: