核心能力
团队拥有优秀的基于NLP认知智能的文本校对技术,以及海量的文本资源数据和规则
基于NLP的核心AI能力
团队拥有基于成熟的NLP(自然语言处理)的文本纠错技术,在各个校对领域均拥有优秀表现。自2018年至今参与国际评测 CGED(中文语法检错评测),在 语病识别、语病类型、语病定位、语病修改 等能力测评得分名列前茅、并荣获了“2018对话型机器阅读理解挑战赛CoQA”“2018机器阅读理解领域权威评测SQuAD 2.0”“2021多步推理机器阅读理解挑战赛HotpotQA”等八项国际顶级赛事冠军。
海量的文本资源数据和规则
团队构建了海量文本资源,参考了GB/T 15834-2011《标点符号用法》、GB/T 15835-2011《出版物上数字用法》、GF 1001-2001《第一批异形词整理表》、GF 0013-2009《现代常用独体字规范》、GB 3100-93《国际单位制及其应用》《图书编校质量差错认定细则》《新华成语词典》《唐诗鉴赏辞典》和《党政机关公文处理工作条例》等权威的校对规范。
团队核心技术荣誉
2021年多步推理阅读理解评测HotpotQA冠军
2021年5月21日,团队在由卡内基梅隆大学(CMU)、斯坦福大学和蒙特利尔大学联合发起的多步推理阅读理解评测HotpotQA全维基赛道中荣登榜首。
2020年中文语法检错评测CGED冠军
2020年,团队在国际评测“中文语法检错评测-CGED 2020”中取得四项核心评选指标中两项冠军、一项第二名、一项第三名。本届评测包括搜狗、网易有道、社科院等31支参赛队伍。
2019年多步推理阅读理解评测HotpotQA冠军
2019年10月18日,团队在由卡内基梅隆大学(CMU)、斯坦福大学和蒙特利尔大学联合发起的多步推理阅读理解评测HotpotQA中荣登榜首,全面刷新所有评测指标,其中综合模糊准确率(Joint F1)指标达到72.73。
2019年机器阅读理解评测SQuAD冠军
2019年3月20日,团队在由斯坦福大学发起的国际权威机器阅读理解评测SQuAD 2.0(Stanford Question Answering Dataset)中荣登榜首,所有指标均超过人类平均水平并且创下该评测的新纪录,再次展现了团队在机器阅读理解领域的核心技术国际领先地位,也是人工智能技术在机器阅读理解领域的一项重要里程碑。
2019年对话型阅读理解评测QuAC冠军
2019年3月14日,团队在由艾伦人工智能研究院(AI2)、斯坦福大学和华盛顿大学联合发起的对话型阅读理解评测QuAC中凭借所研发的ConvBERT模型荣获冠军,全面刷新了所有评价指标,其中F1(模糊准确率)达到68.0,进一步拉近了机器与人类在该任务上的水平差距。
2018年对话型机器阅读理解挑战赛CoQA冠军
2018年12月12日,团队在由斯坦福大学发起的对话型机器阅读理解挑战赛CoQA中,凭借所研发的D-AoA + BERT模型,全面刷新所有评价指标,以总成绩80.2%位列该挑战赛榜首,同时也是首个总成绩超过80%的系统,与人类在该数据上的平均水平差距进一步缩小。
2018年机器阅读理解评测SQuAD冠军
2018年11月16日,团队在由斯坦福大学发起的机器阅读理解领域权威评测SQuAD 2.0(Stanford Question Answering Dataset)中荣登榜首,这也是科大讯飞在2018年获得的第十个世界冠军。
2018年中文语法检错评测CGED冠军
2018年,团队在国际评测“中文语法检错评测-CGED 2018”第一名,对 中文作文中的语法错误进行自动识别,参赛团队包括社科院、阿里达摩院、北京大学等一流科研机构和公司。