加入收藏 | 设为首页 | 会员中心 | 我要投稿 辽源站长网 (https://www.0437zz.com/)- 云专线、云连接、智能数据、边缘计算、数据安全!
当前位置: 首页 > 运营中心 > 建站资源 > 经验 > 正文

怎样成为知乎大V?爬取张佳玮138w+关注者:数据可视化

发布时间:2017-12-21 08:09:55 所属栏目:经验 来源:鸟哥笔记
导读:副标题#e# 一、前言 作为简书上第一篇文章,先介绍下小背景,即为什么爬知乎第一大V张公子的138w+关注者信息? 其实之前也写过不少小爬虫,按照网上各种教程实例去练手,“不可避免”的爬过妹子图、爬过豆瓣Top250 电影等等;也基于自身的想法,在浙大 120

6、认证信息

原本只知道博士可以提供信息得到认证,知乎也会给予其回答更好的显示途径,使其更容易成长为大V,以此作为对高学历人群、优质用户的奖励。

此次抓取的100+关注4.1w+条数据中有 208 条认证信息。除却各种专业的博士、博士后外,还有 37 家公司、机构, 9 条医师, 11 条教授/讲师/研究员, 13 条CFA、CPA持证人或工程师、建筑师,以及副总裁、创始人、记者、律师、WCG2005- 2006 魔兽争霸项目世界冠军、职业自行车手、主持人、作家等等。看来还是有不少可以后续去了解下优质用户的。

怎样成为知乎大V?爬取张佳玮138w+关注者:数据可视化

7、优秀回答者

除了认证信息外,优秀回答者这是鉴别某用户是否为优质用户,是否值得关注的一个重要指标。包含张佳玮在内,共有 468 位优秀回答者,涉及 257 个话题,共出现 768 人次优秀回答者标签。

怎样成为知乎大V?爬取张佳玮138w+关注者:数据可视化

涉及的 257 话题词云

而所有优秀回答者贡献的回答和知乎收录回答情况如下:

怎样成为知乎大V?爬取张佳玮138w+关注者:数据可视化

最右上角的便是张佳玮的贡献情况,令人望尘莫及。也有不少用户贡献了上千个回答,可以说是非常高产。但大部分用户回答数<1000,收录数<50。因此对此区域放大,可见:

怎样成为知乎大V?爬取张佳玮138w+关注者:数据可视化

有不少数据收录回答为0,因为还不知道知乎优秀回答者的评判标准,所以此处还需进一步了解。另外这些数据点,对应的加上一些大V名字可能显示起来能好,但一直在摸索,还不得要领。

三、小结

本项目是个人第一次百万级数据的爬取,当然由于爬取效率方面需要改进,所以详细用户信息选择性的只爬了100+关注人数共4.1w+的id。另外也是第一次数据可视化,从完全不懂Echarts的各种参数,硬刚配置项,到勉强获得了上述还算能看的一些数据图,不少地方还需进一步学习、改进,以求获得更合乎要求的、理想的、自定义的可视化图。

另外,除却上述数据外,还有点赞数、感谢数、收藏数、关注数和被关注数、签名、个人简介等等数据并未处理,但基本想要获取的图都得到了,算是完成了此项目,也学到了很多东西。

作者:Deserts_X  中国统计网(ID:cntongji) 

(编辑:辽源站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

推荐文章
    热点阅读