加入收藏 | 设为首页 | 会员中心 | 我要投稿 辽源站长网 (https://www.0437zz.com/)- 云专线、云连接、智能数据、边缘计算、数据安全!
当前位置: 首页 > 运营中心 > 交互 > 正文

如何用Python在笔记本电脑上分析100GB数据(下)

发布时间:2019-12-16 01:34:03 所属栏目:交互 来源:站长网
导读:副标题#e# 前文回顾:如何用Python在笔记本电脑上分析100GB数据(上) 发动引擎! 在本文的前一部分中,我们简要介绍了trip_distance列,在从异常值中清除它的同时,我们保留了所有小于100英里的行程值。这仍然是一个相当大的临界值,尤其是考虑到Yellow Ta

看上面的图表,我们可以发现一个类似的模式,显示小费百分比作为一周中的一天和一天中的时间的函数。从这两个图中,数据表明,用卡支付的乘客往往比用现金支付的乘客小费更多。为了弄清这是否真的是这样,我想请你试着去弄清楚,因为现在你已经掌握了知识、工具和数据!你也可以看看这个Jupyter notebook来获得一些额外的提示。

我们到达了你的目的地

我希望这篇文章是对Vaex的一个有用的介绍,它将帮助您缓解您可能面临的一些“不舒服的数据”问题,至少在涉及表格数据集时是这样。如果您对本文中使用的数据集感兴趣,可以直接从S3使用Vaex。请参阅完整的Jupyter notebook,以了解如何做到这一点。

有了Vaex,你可以在短短几秒钟内浏览超过10亿行数据,计算各种统计数据、聚合信息,并生成信息图表,而这一切都是在你自己的笔记本电脑上完成的。它是免费和开源的,我希望你会给它一个机会!

数据科学快乐!

原文链接:https://towardsdatascience.com/how-to-analyse-100s-of-gbs-of-data-on-your-laptop-with-python-f83363dda94

 

(编辑:辽源站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

推荐文章
    热点阅读