科技计划:
成果形式:新技术、其他
合作方式:技术转让、技术入股、其他
参与活动:
专利情况:
未申请专利
成果简介
综合介绍
通过依托大规模的知识图谱和语义关系分析,深度学习等核心技术,建立一个融合多源知识的统一问答理论表示体系和问答知识标注规范。同时,自动构造较大规模的问答对和问答知识库,并在此基础上,提出一套支持常识问答和机器阅读理解的系统。
创新要点
该系统由两个子系统组成:
a)基于问题复述识别的FAQ问答系统:(1) 该系统基于粗排-精排的问题匹配架构,根据用户问题从数据库中匹配最相关的问答对。主要涉及ES检索,基于预训练模型的问题复述识别(QQ匹配)
b) 基于文章检索-答案抽取的问答系统:(1) 例行爬取大量冬奥会相关新闻,用ElasticSearch索引。(2) 部署机器阅读理解(MRC)模型,该模型在DuReader+冬奥标注样本构成的数据集上训练。(3) 以用户问题为query,从冬奥新闻库中稀疏检索相关文章,通过MRC模型加粗答案。(4)采用chatango的第三方服务,用户可以在聊天室和志愿者进行实时沟通。
技术指标
1、问答可接受率1*:98.8%;
2、问答对资源库:构建了DuReader-Robust 和东奥FAQ两个数据集,用于不同的任务。
3、查询响应时间:用户输出查询文字后获取推荐答案所需的时间,响应时间越短,则用户体验感越佳。该系统支持多并发提问,10并发响应速度低于0.05秒。
其他说明
完成人信息
姓名:对接成功后可查看
所在部门:对接成功后可查看
职务:对接成功后可查看
职称:对接成功后可查看
手机:对接成功后可查看
E-mail:对接成功后可查看
电话:对接成功后可查看
传真:对接成功后可查看
邮编:对接成功后可查看
通讯地址:对接成功后可查看
联系人信息
姓名:对接成功后可查看
所在部门:对接成功后可查看
职务:对接成功后可查看
职称:对接成功后可查看
手机:对接成功后可查看
E-mail:对接成功后可查看
电话:对接成功后可查看
传真:对接成功后可查看
邮编:对接成功后可查看
通讯地址:对接成功后可查看