失眠网,内容丰富有趣,生活中的好帮手!
失眠网 > 百度发起机器阅读理解竞赛 提供中文数据集 获胜团队奖10万

百度发起机器阅读理解竞赛 提供中文数据集 获胜团队奖10万

时间:2024-04-27 10:35:08

相关推荐

百度发起机器阅读理解竞赛 提供中文数据集 获胜团队奖10万

允中 发自 SSJQ

量子位 报道 | 公众号 QbitAI

机器阅读理解(中文版)技术竞赛,现在可以报名了。

3月1日,由百度、中国中文信息学会(CIPS)、中国计算机学会(CCF)联手举办的“机器阅读理解技术竞赛”正式开启报名通道。

本次竞赛,百度将提供面向真实应用场景迄今为止规模最大的中文阅读理解数据集DuReader。

目前,世界机器阅读理解领域经典赛事多集中在英文领域,比如由斯坦福大学发起的SQuAD挑战赛以及微软的MS MARCO机器阅读理解测试。

所以此次百度提供数据集并主办竞赛,无疑对中国AI从业者是件好事。

而且从数据集、任务和评判方面,也有参考意义。

数据集

DuReader中,包含了来自百度搜索的30万个真实问题,每个问题对应5个候选文档文本,以及人工撰写的优质答案。

同时,数据集还标注了问题类型、实体和观点等丰富信息。数据集将划分为28万的训练集,1万开发集和1万测试集。该数据集中包含了去年11月百度首批发布的DuReader数据集中的20万问题数据,参赛者可自由下载用于训练和测试。本次竞赛报名团队还将获得新增的10万问题数据集。

任务

本次竞赛的任务是对于给定问题q及其对应的文本形式的候选文档集合D=d1, d2, …, dn,要求参评阅读理解系统自动对问题及候选文档进行分析,输出能够满足问题的文本答案a。

为了便于参赛选手快速了解竞赛任务,竞赛还提供了两个开源的阅读理解基线系统,并采用ROUGH-L和BLEU作为评价指标,以ROUGH-L为主评价指标。

针对是非及实体类型问题,对ROUGE-L和BLEU4评价指标进行了微调,适当增加了正确识别是非答案类型及匹配实体的得分奖励,一定程度上弥补传统ROUGE-L和BLEU4指标对是非和实体类型问题评价不敏感的问题。

报名要求及奖励

竞赛官网及报名通道已正式开启,任何团队和个人都可以报名参加,获胜团队还将分享总额近10万人民币的奖金。

最后,如果从事AI相关研究的你已经心动,下面是传送门:

报名地址及赛事详情:.cn/

加入社群

量子位AI社群13群开始招募啦,欢迎对AI感兴趣的同学,加小助手微信qbitbot5入群;

此外,量子位专业细分群(自动驾驶、CV、NLP、机器学习等)正在招募,面向正在从事相关领域的工程师及研究人员。

进群请加小助手微信号qbitbot5,并务必备注相应群的关键词~通过审核后我们将邀请进群。(专业群审核较严,敬请谅解)

诚挚招聘

量子位正在招募编辑/记者,工作地点在北京中关村。期待有才气、有热情的同学加入我们!相关细节,请在量子位公众号(QbitAI)对话界面,回复“招聘”两个字。

量子位QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态

如果觉得《百度发起机器阅读理解竞赛 提供中文数据集 获胜团队奖10万》对你有帮助,请点赞、收藏,并留下你的观点哦!

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。