加入收藏 | 设为首页 | 会员中心 | 我要投稿辽源站长网（https://www.0437zz.com/）- 云专线、云连接、智能数据、边缘计算、数据安全!

当前位置：首页 > 运营中心 > 建站资源 > 经验 > 正文

NLP模型超越人类水平？你可能碰到了大忽悠

发布时间：2019-09-10 19:09:16 所属栏目：经验来源：thegradient 编译：张睿毅、武帅、钱天培一个军方

导读：大数据文摘出品来源：thegradient 编译：张睿毅、武帅、钱天培一个军方训练的神经网络声称可以分类图像中的坦克，但实际上，它只是学会了识别不同的亮度，因为一种类型的坦克仅出现在明亮的图片中，而另一种类型仅出现在较暗的图片中。一个游戏AI在学会

这也应该成为执行数据集消除任务的常见做法，例如：

仅提供不完整的输入(如前文所述)：这将验证是否需要完整输。如果不需要，则说明数据集包含着一些可以采取捷径的线索。
打乱输入：这可以验证单词(或句子)顺序的重要性。如果分数没有太大变化，那说明模型并没有理解输入的顺序信息。
分配随机标签：如果10%的实例被随机重新标记，性能会下降多少呢?所有实例重新标记呢?如果分数没有太大变化，那么模型可能没有学到任何有趣的东西。
随机替换内容词：如果所有名词短语或动词短语都被随机名词短语和动词替换，性能会下降多少?如果不多，则数据集可能提供了预料之外的非内容提示，例如句子长度或功能词的分布。

（编辑：辽源站长网）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!

2

相关内容

推荐文章

站长推荐

热点阅读