云知声:最新自然语言处理算法已在医疗业务率先应用
原标题:云知声:最新自然语言处理算法已在医疗业务率先应用
近日,自然语言处理领域国际顶级会议 ACL 2020 (Association for Computational Linguistics)论文接收结果公布。云知声-中科院自动化所“语言与知识计算联合实验室”共有3篇论文被收录,分别在医疗对话的自动信息抽取、国际疾病分类(ICD)自动编码,以及 ICD 自动编码可解释性等领域取得突破。云知声指出,这些最新的自然语言处理算法将为后续研究提供极具价值的经验和方向。目前,已在云知声医疗业务率先应用。
电子病历应用领域方面,据云知声介绍,电子病历已经成为现代医疗的重要组成部分,但是目前书写电子病历费时费力,已经成为医生的沉重负担。通过面向医患对话文本的信息抽取系统,可从对话中抽取出症状、检查、手术、一般信息及其相应的状态。这些抽取出的信息将有助于医生书写病历,或者更进一步地应用于病历的自动生成。
临床医学决策方面,据云知声介绍,为了缓解人工编码耗时、费力、容易出错的问题,很多工作开始研究利用机器进行自动的 ICD 编码。研究团队通过结合中文的语言特点,提出了一种基于空洞卷积和N-gram语言模型的ICD自动编码方法,利用空洞卷积捕获非严格匹配的语义片段证据,利用 N-gram 捕获严格匹配的语义片段证据,进而二者联合使用,共同提升预测结果的可解释性。可解释的结果对临床医学决策具有重要意义。
医疗领域方面,云知声-中科院自动化所语言与知识计算联合实验室基于自然语言处理技术构建的医疗知识图谱已储备约 50万医学概念,超过169万医学术语库和398万医学关系库,涵盖了绝大部分药品、疾病、科室与检查,规模达国际领先水准,并在语音病历,病历生成、病历质控、辅助诊断系统等具体应用。