加入收藏 | 设为首页 | 会员中心 | 我要投稿 辽源站长网 (https://www.0437zz.com/)- 云专线、云连接、智能数据、边缘计算、数据安全!
当前位置: 首页 > 运营中心 > 建站资源 > 经验 > 正文

NLP模型超越人类水平?你可能碰到了大忽悠

发布时间:2019-09-10 19:09:16 所属栏目:经验 来源:thegradient 编译:张睿毅、武帅、钱天培 一个军方
导读:大数据文摘出品 来源:thegradient 编译:张睿毅、武帅、钱天培 一个军方训练的神经网络声称可以分类图像中的坦克,但实际上,它只是学会了识别不同的亮度,因为一种类型的坦克仅出现在明亮的图片中,而另一种类型仅出现在较暗的图片中。 一个游戏AI在学会

这也应该成为执行数据集消除任务的常见做法,例如:

  • 仅提供不完整的输入(如前文所述):这将验证是否需要完整输。如果不需要,则说明数据集包含着一些可以采取捷径的线索。
  • 打乱输入:这可以验证单词(或句子)顺序的重要性。 如果分数没有太大变化,那说明模型并没有理解输入的顺序信息。
  • 分配随机标签:如果10%的实例被随机重新标记,性能会下降多少呢?所有实例重新标记呢?如果分数没有太大变化,那么模型可能没有学到任何有趣的东西。
  • 随机替换内容词:如果所有名词短语或动词短语都被随机名词短语和动词替换,性能会下降多少?如果不多,则数据集可能提供了预料之外的非内容提示,例如句子长度或功能词的分布。

(编辑:辽源站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

推荐文章
    热点阅读