云知声获CHIP2019临床术语标准化任务评测冠军

2019-11-26 11:54      未来科技范 张影


  【未来科技范 报道】日前,在由中国中文信息学会(CIPS)主办的中国健康信息处理会议(CHIP2019)临床术语标准化任务比赛中,云知声AI Labs认知医疗团队以较大分差击败阿里巴巴、中科院自动化所下属企业、北京协和医学院、中国医学科学院医学信息研究所等19支参赛队伍,摘得比赛桂冠。

  中国健康信息处理会议(CHIP)是中国健康信息处理领域的国际领先会议,致力促进医疗健康文本、图形、图像和生物序列等信息处理技术的发展。2018年起,CHIP增加中文临床医疗信息处理方面的评测任务,今年比赛任务包括临床术语标准化任务、平安医疗科技疾病问答迁移学习比赛、临床试验筛选标准短文本分类。

  

11_副本.jpg

  临床术语标准化任务是医学统计中不可或缺的一项任务。临床上,关于同一种诊断、手术、药品、检查、化验、症状等往往会有成百上千种不同的写法。标准化(归一)要解决的问题就是为临床上各种不同说法找到对应的标准说法。临床术语标准化是智慧医疗中的基础问题,是连接病历和知识图谱的桥梁,有了完善的术语标准化系统,知识图谱才能在智慧医疗中“活”起来。同时术语标准化也是众多医疗管理活动中的重要一环,包括进行疾病统计、病历质控、医保控费等等。

  本次评测任务主要目标是针对中文电子病历中挖掘出的真实手术实体进行语义标准化。给定一手术原词,要求给出其对应的手术标准词。所有手术原词均来自于真实医疗数据,并以《ICD9-2017协和临床版》 手术词表为标准进行了标注。

  本任务的主要难点在于标准词多,且相似度高;而且标准答案的数量不固定,有些需要将分隔符分割的多个手术原词合并成一个标准词,有些一个手术原词需要给出多个标准词;zero-shot(零样本)和few-shot(小样本)问题严重,有很多标准词没有出现在训练集中或者出现次数很少。

  面对这些问题,云知声AI Labs认知医疗团队凭借对BERT原理的深刻理解和多次成功使用,提出一套基于BERT蕴含分数排序的临床术语标准化系统。结合任务的数据特点,创造性地利用BERT预测标准名称的数量,通过合理巧妙的构造负样本利用BERT对候选标准词进行打分,并结合手术名称中的部位和术式的相似度进行重排序,最终在盲测集上取得0.94825的成绩,排名第一。

  

22_副本.jpg

  云知声方面人士介绍称,在医疗认知领域,云知声有多年的技术积累及丰富的场景应用经验。此次参与比赛的系统具备扩展性强的特点,不仅能够解决手术术语标准化问题,还能够直接迁移到诊断等标准化问题。同时,在参与CHIP2019的任务评测外,云知声认知医疗团队还将该方案进行工程化,在不降低准确率的前提下提高运行速度,将其应用到医院病历质控中对手术编码的错误检查中,可大幅提升病案首页的质量。

  

33.jpg

  CHIP2019相关人士表示,此次获得比赛第一名,充分说明云知声在医疗认知领域已处于业界领先水平,也反映出云知声AI Labs认知团队良好的深度学习理解和应用能力,能够将深度学习用于解决行业中的关键问题。

  据悉,云知声是国内首家医疗云落地的语音人工智能企业。2016年其携手北京协和医院推出智能语音录入系统,识别精准度达95%以上。今年,在医疗AI战略发布会上,云知声重磅推出包括病历质控系统、智能问诊、智能随访等多个系统方案,将其自身在语音识别、自然语言理解、自然语言处理等感知与认知方面的技术优势工程化落地到医院诊疗服务的场景中,进一步推动行业的智能化升级。

相关阅读