加入收藏 | 设为首页 | 会员中心 | 我要投稿 辽源站长网 (https://www.0437zz.com/)- 云专线、云连接、智能数据、边缘计算、数据安全!
当前位置: 首页 > 大数据 > 正文

结构化数据 vs. 非结构化数据

发布时间:2018-04-19 12:35:39 所属栏目:大数据 来源:站长网
导读:结构化数据 vs. 非结构化数据:结构化数据由明确定义的数据类型组成,其模式可以使其易于搜索。而非结构化数据通常由不容易搜索的数据组成,其中包括音频、视频和社交媒体发布等格式。 结构化数据 vs. 非结构化数据非结构化数据与结构化数据并不表示两者之

几年前,使用关键字和关键短语的分析人员可以搜索非结构化数据,并对数据涉及的内容有一个清晰的概念。电子发现是这种方法的主要例子。但是,非结构化数据的增长速度非常快,以至于用户不仅需要采用计算工作的分析,而且还要自动从他们的活动和用户决策中学习。自然语言处理(NLP)、模式感知和分类以及文本挖掘算法都是常见的例子,文档相关性分析、情感分析和过滤器驱动的网页收集也是常见的例子。

使用机器学习智能进行非结构化数据分析可使组织:

1.分析数字通信的合规性。违反合规性将会使企业损失数百万美元的费用、诉讼和业务损失。模式识别和电子邮件线程分析软件可以搜索海量的电子邮件和聊天数据,以防潜在的不合规情况。最近的一个例子就是大众汽车公司可能通过使用分析来监控可疑消息的通信,从而避免了巨额罚款和声誉损失。

2.跟踪社交媒体中的大量客户对话。文本分析和情绪分析可让分析师检查营销活动的积极和负面结果,甚至识别在线威胁。这种级别的分析是一种更为复杂的简单关键字的搜索,它只能报告基本知识,例如海报在新广告系列中提及企业名称的频率。新的分析还包括以下场景:提及的是积极还是负面?海报是否有更好的宣传作用?用户对行政公告的反应是什么?例如汽车行业大量参与社交媒体的分析,因为购车者往往会转向其他海报来衡量他们的购车体验。分析师使用文本挖掘和情感分析相结合的方式来跟踪Twitter和Facebook上与自动相关的用户帖子。

3.获得新的营销情报。机器学习分析工具可快速处理大量文档以分析客户行为。一家重要的杂志发行商可以将文本挖掘应用到数以万计的文章中,并通过主要分论题的流行度来分析每个单独的出版物情况。然后,他们将分析扩展到所有内容属性,以查看哪些整体主题受到客户的主要关注。该分析将所有出版物的数十万条内容进行分析,并以分段形式交叉引用热门主题的结果。其结果是丰富的内容,哪些话题对不同的顾客最感兴趣,哪些营销信息与他们产生了最强烈的共鸣。

在电子数据展示中,数据科学家使用关键字搜索非结构化数据并获得有关数据的合理构想。

无论企业的业务具体是什么,其目标都是挖掘业务价值,无论数据是结构化的还是非结构化的。这两种类型的数据都可能具有很高的价值,而较新的工具可以汇总、查询、分析和利用所有数据类型,以便在整个企业数据范围内获得更加深入的业务洞察力。

(编辑:辽源站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

推荐文章
    热点阅读