加入收藏 | 设为首页 | 会员中心 | 我要投稿 辽源站长网 (https://www.0437zz.com/)- 云专线、云连接、智能数据、边缘计算、数据安全!
当前位置: 首页 > 教程 > 正文

这5种数据可视化方式是数据科学家标配!

发布时间:2018-04-18 17:35:11 所属栏目:教程 来源:李佳惠
导读:【编译】数据可视化是数据科学家工作的重要组成部分。在项目的早期阶段,你通常会进行探索性数据分析(EDA)以获取对数据的一些洞察。创建可视化确实有助于使事情更清晰易懂,特别是对于大型高维数据集。在你的项目结束时,能够以清晰、简洁和引人注目的方式

  我们之前查看了直方图,这些直方图非常适合可视化变量的分布。但是如果我们需要更多的信息呢?也许我们想要更清楚地看待标准偏差?也许中位数与平均值有很大差异,因此我们有很多异常值怎么办?如果存在如此歪斜,并且许多值都集中在一方怎么办?

  这就是箱形图出现的地方。箱形图给我们提供了上述所有信息。实线框的底部和顶部总是第一和第三四分位数(即数据的25%和75%),并且框内的带总是第二四分位数(中值)。箱须图(即末端具有条纹的虚线)从框中延伸以显示数据的范围。

  由于箱形图是为每个组、变量都绘制了,因此很容易设置。 x_data是组/变量的列表。 Matplotlib函数boxplot()为y_data的每列或每个向量的序列y_data生成一个箱形图;因此x_data中的每个值都对应于y_data中的列/向量。所有我们所要设定的是情节的美学。  

这5种数据可视化的方式是数据科学家的标配!
▲箱型实例

这5种数据可视化的方式是数据科学家的标配!

这5种数据可视化的方式是数据科学家的标配!

  结论

  使用Matplotlib有5个快速简单的数据可视化。将事物抽象成函数总是会让你的代码更易于阅读和使用!希望这篇文章能够帮助到你!

(编辑:辽源站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

推荐文章
    热点阅读