百度吴甜首度解读“AI新基建” 剧透深度学习开发者峰会五月再临！

发布时间：2020-04-13 21:43:17 所属栏目：动态来源：站长网

导读：副标题#e# 新基建持续升温，人工智能作为其中的重要一环，正在高速发展。4月7日，36氪超级沙龙直播栏目举办新基建专场，百度集团副总裁、深度学习技术及应用国家工程实验室副主任吴甜以智能时代的AI基础设施建设与应用为题，结合百度在人工智能领域的技术成

真实在场景当中应用的时候，往往还需要端到端配套的开发套件，让整个开发过程更加便捷、便利，并且能够复用以前做好的各种各样的积累。飞桨在语义理解、目标检测、图像分割、点击率预估四大场景都有配套的套件，可以非常便捷的使用。

在深度学习各个方向上，飞桨平台上也提供了相应的工具组件，从平台层使用的时候提供了服务平台。这样一个全方位的、全功能的平台，其实是针对在众多应用过程当中不断发现的应用难题和挑战建设起来的。飞桨平台在开发的过程中，提供了便捷的框架，在训练过程当中提供了超大规模深度学习模型训练技术，在部署上也是针对多端、多平台全面部署的高性能的推理引擎，还有开源模型库，综合提供出来供产业使用。

介绍了算力、开发框架和平台，再看几大AI算法方向上目前为止最新的进展。

首先看一看语音识别方向，语音识别在AI算法当中是发展历史比较悠久，目前也是可用性非常高的技术，当然它也还持续有技术上的突破。百度上线了首个基于流式注意力的语音识别线上服务，这也是在国际上首次实现在线语音识别中大规模使用注意力模型。这个技术使用以后，在语音输入法场景下相对准确率有50%的提升，在音箱这类产品准确率提升到20%。随着端侧智能设备不断广泛使用，离线语音识别在无网、弱网状态有越来越多的需求，百度语音技术团队通过系统性优化，解决了语言模型裁减性能损失问题，使离线模型有非常高的识别率。

百度吴甜首度解读“AI新基建” 剧透深度学习开发者峰会五月再临！

语音合成方面，如果合成出来的声音偏重于机械感，缺少情感，听者在长时间听的情况下会产生疲惫，所以音色模拟、情感模拟等，都会是语音合成技术需要突破的挑战。百度推出的语音合成技术，可以用20句话制作专属的定制语音，将声音当中的音色、风格、情感等要素映射到不同的子空间，使用的时候不同要素进行任意的组合。在百度地图上已经推出了全球首个地图语音定制功能，只需要录制20句话就可以做成一个个人专属的语音包。

视觉理解方面，这些年在OCR物体检测、视频理解、目标跟踪等业界领先的图像视频技术，百度多次在国内外顶级赛事中取得佳绩，并且在机械制造、金融、医疗、教育等领域得到非常广泛的使用。

虚拟形象合成方面，在对大量语音、视觉以及文本的理解能力达到了非常好的水平之后，AI算法也在推进做虚拟形象合成，尽可能形成更加自然、更像真人、更加具有丰富情感的虚拟形象。百度虚拟形象合成技术其实结合了多模态识别和理解，语音识别、视频理解等等，再加上面部、肢体、嘴形的生成能力，还有语音合成TTS的技术，实现了业界首个可以进行量产视频的真人形象的虚拟主播，在多个场景当中应用，央视和百度合作打造过AI虚拟主持人小灵，在央视去年的五四晚会亮相；澎湃新闻和百度打造了第一个虚拟真人形象的主播，用在早晚新闻栏目上；浦发****和百度合作打造了业界首个金融数字人，有情感有专业的****知识，能够提升****的客服体验。

语音、视觉等技术在人工智能技术中属于感知层技术，类比于人的感知能力。人还有非常强的认知能力，对人工智能而言，认知能力主要体现在自然语言处理、知识图谱等语言和知识类技术上。百度构建了超大规模多元异构知识图谱，包括实体图谱、事件图谱、行业图谱、关注点图谱、POI图谱，这些图谱都会根据需求场景需要，不断扩充和延展。

举一个例子，基于知识图谱视频语义理解，从视觉视角上提取特征，通过语音识别对视频当中人物的对话、言论等等进行语音的识别和提取特征，还可以对视频标题以及周边文本进行文本理解。这些基础理解之后，再结合知识图谱中的视频理解子图，在知识图谱中进行计算和推理，对刚刚产生的理解的标签、理解的特征进行补全、关联等等一系列操作，最终用在产品上，将会对整个视频内容有更深度的理解。这是用感知技术和认知技术进行多模态融合的典型例子。

AI技术如果能够完全、充分理解人的语言，将会是迈向通用人工智能技术非常重要的突破。这方面百度也持续有新的突破。百度推出的ERNIE是持续学习的语义理解框架，可以进行增强的语义理解。比如我们想让AI算法理解实体，我们会用百科的内容、网页内容进行实体识别任务的构造，然后由预训练模型进行学习，再对场景上进行针对性的fine-tuning，这样可以得到实体学习更强的语义理解模型。再复杂一点的任务，比如构建因果关系的识别任务，也是通过技术方式，构造大量因果的知识，然后由大的预训练模型进行学习，再进行任务上的调优学习。百度ERNIE模型已经学习了13亿以上的知识，在NLP任务上全面刷新了任务效果，目前在共计16个中英文效果上超过了BERT、XLNet，取得了SOTA效果。这张图展示出来的就是不断加以新的知识，让ERNIE在持续学习过程中，推动自然语言推断、自动问答、文本相似度、情感分析任务上等等有持续不断的效果提升。

百度吴甜首度解读“AI新基建” 剧透深度学习开发者峰会五月再临！

以上是AI技术方向最新的进展概览，百度大脑也打造了完整的AI安全体系，从基础开源技术矩阵到开放行业解决方案，到与学术界、企业、政府、机构等开放协作，整个技术产品已经覆盖到了云管端，以及大数据、云计算一系列风险问题，这样的安全体系也是为AI技术产业应用有一个保驾护航的作用，可以推动AI时代安全生态的建设，让大家在使用AI技术开展各种各样应用创新的时候，没有安全的后顾之忧。

刚刚以百度工作为例，详细说明了AI新基建当中最基础的技术平台现在的状态，新基建不仅仅是技术平台，所以接下来进入今天要分享的第二部分，AI应用价值的创造。

二、AI应用价值

（编辑：辽源站长网）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!

4/10

首页

尾页