更多精彩 >

云知声三篇论文被NLP国际顶会——ACL2020收录

2020-04-14 10:42:05   来源:投资家网  作者: 

摘要:日前,自然语言处理领域国际顶级会议ACL2020(AssociationforComputationalLinguistics)论文接收结果公布。

日前,自然语言处理领域国际顶级会议 ACL 2020 (Association for Computational Linguistics)论文接收结果公布。大会共收到 3429 篇投稿论文,投稿数量创下新高。作为计算语言学和自然语言处理领域最重要的顶级国际会议,ACL 录取论文代表了自然语言处理领域在过去一年最新和最高的科技水平以及未来发展潮流。


本届大会,云知声-中科院自动化所“语言与知识计算联合实验室”共有3篇论文被收录,分别在医疗对话的自动信息抽取、国际疾病分类(ICD)自动编码,以及 ICD 自动编码可解释性等领域取得突破。这些最新的自然语言处理算法将为后续研究提供极具价值的经验和方向,已在云知声医疗业务率先应用。


一种面向医学对话的医学信息提取器


MIE: A Medical Information Extractor towards Medical Dialogues


如今,电子病历已经成为现代医疗的重要组成部分,但是目前书写电子病历费时费力,已经成为医生的沉重负担。如果能够从医疗对话中自动地抽取医学信息,将极大缓解医生书写病历的压力。


本文提出一个面向医患对话文本的信息抽取系统,它可以从对话中抽取出症状、检查、手术、一般信息及其相应的状态。这些抽取出的信息将有助于医生书写病历,或者更进一步地应用于病历的自动生成。研究团队收集并标注了1120段在线问诊的医患对话作为数据集,采用滑动窗口形式进行标注,和序列标注相比,减缓了标注难度。在此基础上,针对医疗问诊对话文本的特点和难点,提出一种基于深度匹配的神经网络模型,能够考虑到对话的多轮结构,利用注意力机制捕捉对话中不同轮次之间的交互信息,从而完善医学信息的抽取。


image.png

图1:典型的医学对话窗口和相应的带注释的标签


HyperCore:基于双曲空间和共现图表示的 ICD 自动编码


HyperCore: Hyperbolic and Co-graph Representation for Automatic ICD


Coding


国际疾病分类(International Classification of Dieases,ICD)是由世界卫生组织发起的,针对各种疾病做出的国际通用的统一分类方法,这种方法赋予每种疾病一个独特的编码。ICD 编码的普及和应用能够极大促进世界范围内疾病的信息共享和临床研究,并对健康状况研究、保险索赔、发病率和死亡率统计产生积极的影响。


长期以来,ICD 编码一直由专业编码员人工完成。人工编码耗时费力,而且非常容易出错,同时不断更新 ICD 代码版本会导致代码数量大幅度增加,对编码人员的要求越来越高。数据显示,在美国每年因为编码错误以及用于提升编码质量的相关成本超过250亿美元。


为了缓解人工编码的问题,一些工作开始尝试利用机器自动完成 ICD 编码任务。但是现有的方法独立地预测每个编码,而忽略了编码的两个重要特征——层级性和共现性。


在本文中,研究团队提出了使用双曲空间和共现图卷积神经网络针对性地建模上述两种性质。具体来说,提出了一种双曲线表示方法来利用编码的层次结构。此外,提出了一种共现图卷积网络来利用编码的共现性。在国际公开数据集上的实验取得了最好的效果。


image.png

图2:自动ICD编码任务的示例


Clinical-Coder:面向中文临床记录的 ICD-10 自动编码


Clinical-Coder: Assigning Interpretable ICD-10 Codes to Chinese Clinical Notes


国际疾病分类(ICD)作为世卫组织成员国在卫生统计中共同采用的对疾病进行编码的标准分类方法,是目前国际上通用的疾病分类方法。目前广泛使用的国际疾病分类第十次修订版(简称 ICD-10)的编码数量达到了72,184个,是以前版本(ICD-9)的五倍多。


为了缓解人工编码耗时、费力、容易出错的问题,很多工作开始研究利用机器进行自动的 ICD 编码。这些方法虽然取得了很大的成功,但仍然面临着预测结果可解释性问题的严峻挑战,可解释的结果对临床医学决策具有重要意义。


针对此问题,并结合中文的语言特点,研究团队提出了一种基于空洞卷积和N-gram语言模型的ICD自动编码方法,利用空洞卷积捕获非严格匹配的语义片段证据,利用 N-gram 捕获严格匹配的语义片段证据,进而二者联合使用,共同提升预测结果的可解释性。实验结果显示,该方法不仅能在中文数据集上取得显著的效果,在国际公开的英文数据集上也有不错的效果。


image.png

图3:两种语义片段证据类型-非严格匹配和严格匹配


值得一提的是,在医疗领域,云知声-中科院自动化所语言与知识计算联合实验室基于自然语言处理技术构建的医疗知识图谱已储备约 50万医学概念,超过 169 万医学术语库和 398 万医学关系库,涵盖了绝大部分药品、疾病、科室与检查,规模达国际领先水准,并在语音病历,病历生成、病历质控、辅助诊断系统等具体应用中发挥了重要支撑作用。


关于 ACL :ACL 是自然语言处理领域顶级国际学术会议,由计算语言学学会(Association for Computational Linguistics)主办,每年举办一次。其接收的论文覆盖了语言模型、句法分析、语义分析、篇章分析等计算语言学基础研究以及信息抽取、问答系统、对话生成、机器翻译、自动文摘、情感分析、社会计算等自然语言处理应用研究等众多方向。第 58 届 ACL 年会 ACL 2020 原定于 7 月 5 日-10 日在美国华盛顿西雅图举行,因疫情影响今年将改为在线会议。


猜你喜欢

再获资本市场认可!云知声荣膺格隆汇“金格奖”年度卓越创新力IPO

上市公司云知声

12月22日,格隆汇“金格奖”年度卓越公司评选结果公布,云知声(股票代码:09678.HK)凭借上市...

2025-12-31

实力认证!云知声山海·知医大模型入选MedAIBench优秀国产医疗大模型榜单

上市公司云知声

12月20日,国家人工智能应用中试基地(医疗)·浙江正式发布《MedAIBench测评榜(优秀国产医...

2025-12-22

云知声山海医疗大模型问鼎MedBench4.0三项榜首,以“三冠王”战绩树立医疗AI新标杆

上市公司云知声

12月16日,中文医疗大模型权威评测平台MedBench4.0发布最新评测结果。

2025-12-22

刚刚,云知声发布了医疗领域专家大模型“山海·知医大模型5.0”:真正走向严肃临床!

上市公司云知声

刚刚,云知声正式推出医疗领域专家级大模型全新力作——“山海・知医大模型5.0”。

2025-12-22

云知声(9678.HK)2025年中期业绩:营收同比增加20.2%,大模型收入飙涨457%

上市公司云知声

8月28日,云知声(9678.HK)发布截至2025年6月30日止六个月的中期业绩公告。

2025-08-29

原创

金融活水润滑县——民生银行北京分行“银行+保险+期货”模式助农增收

金融科技民生银行

日前,由中国民生银行北京分行联合国投期货、中国太平洋产险河南分公司在河南滑县开展的“银行+保险+期货...

2026-02-12

2026送礼新思路:一篇看懂如何选出有效的“骨胶原钙”

大消费送礼

你还在为过年走亲访友挑选骨骼营养品犯难吗?春节前夕,不少人的购物车里,除了年货又多了一份沉甸甸的心意...

2026-02-12

普源精电2025年营收增长16% 阵列测控跃升新核心动能

上市公司普源精电

2月12日,普源精电(688337)发布2025年度业绩快报,公告显示,公司全年实现营业总收入9.0...

2026-02-12

今年春节送礼换赛道:这篇健康好物清单直接抄作业

大消费健康好物

还在为春节送礼而纠结?春节的脚步越来越近,挑选年礼的焦虑也悄悄爬上心头。

2026-02-12

春节购金热潮来袭,30克熊猫金币成热门选择

大消费熊猫金币

随着2026年农历马年春节临近,国内黄金消费市场迎来传统旺季,多地金店人流涌动,购金热潮持续升温。

2026-02-12

原创

年入10亿,“门锁一哥”要IPO

鹿客科技

谁说卖锁的不赚钱?

2026-02-12

星际荣耀完成50.37亿元D++轮融资

星际荣耀

2026年2月9日,星际荣耀航天科技集团股份有限公司(以下简称“星际荣耀”)完成D++轮融资,融资金...

2026-02-12

现代汽车科技创益加速中心赋能初创企业,让五慢症儿童才华照进现实

创新创业现代汽车科技创益加速中心

当商业力量与公益初心温柔相拥,便能绽放出照亮人心的温暖光芒。

2026-02-12

2026 年炒股软件排名与评测推荐:哪款最适合你?

金融科技炒股软件

面对市场上琳琅满目的炒股软件,投资者最直接的问题就是:炒股到底用什么软件?答案并非唯一,关键在于匹配...

2026-02-12

投资家网(www.investorscn.com)是国内领先的资本与产业创新综合服务平台。为活跃于中国市场的VC/PE、上市公司、创业企业、地方政府等提供专业的第三方信息服务,包括行业媒体、智库服务、会议服务及生态服务。长按右侧二维码添加"投资哥"可与小编深入交流,并可加入微信群参与官方活动,赶快行动吧。

第四届中国研究生金融科技创新大赛在南京收官

第四届中国研究生金融科技创新大赛在南京收官

12月28日,第四届中国研究生金融科技创新大赛在南京落幕。

京杭对话:杭州,凭什么吸引北京创新企业?

京杭对话:杭州,凭什么吸引北京创新企业?

从一张精准的产业蓝图,到一个敏捷的创新操作系统,再到一片丰沃的赋能土壤,杭州的生产性服务业正在这条路...

第19届中国投资年会·有限合伙人峰会在沪成功举办

第19届中国投资年会·有限合伙人峰会在沪成功举办

11月27日,由投中信息和投中网主办的第19届中国投资年会·有限合伙人峰会在上海举办。

“京杭聚势,共启新篇”:招商新路径,奏响区域协同发展强音

“京杭聚势,共启新篇”:招商新路径,奏响区域协同发展强音

在区域经济协同发展的大背景下,京杭两地的经济协作正以一种全新的姿态加速推进。

第19届中国投资年会·有限合伙人峰会即将在沪启幕

第19届中国投资年会·有限合伙人峰会即将在沪启幕

作为中国股权投资领域备受瞩目的年度盛会,第19届中国投资年会·有限合伙人峰会定于2025年11月26...