近98%的自动化精准匹配率!
微软Azure为全球医药数据处理加速度!

"借助微软云服务的AI能力和实验室原型验证的落地实力,与微软实验室的合作拓展了我们对医药数据挖掘的深度。" —医药魔方相关负责人

长期以来,药物开发成本高、耗时长,生物制药企业的研发效率低下,一直是医药行业根深蒂固的痛点。但是,近年来随着人工智能(AI)与医药领域的融合,AI被发现可以帮助医药企业优化开发流程,大幅度降低研发成本。据LEK对制药行业高管的调查显示,人工智能将在未来5到10年内成为药企运营模式中的标准配置。如今,全球领先的十大药企已纷纷与人工智能公司建立合作,渴望优先抓住AI技术的发展所带来的市场机遇

医药魔方是国内领先的医药垂直行业一站式药品数据服务平台,为医药企业和投资机构提供专业数据、媒体资讯和咨询服务。医药魔方会对全球海量医药相关数据进行实时采集、标准化清洗、结构化转换,并串联整合,同时结合自然语言处理(NLP)和机器学习等人工智能技术,逐步搭建了从数据监测、数据挖掘到数据应用的敏捷大数据体系。

在入驻微软人工智能和物联网实验室期间,我们利用Azure表单识别器(Azure Form Recognizer)和Azure针对医疗的文本分析(Azure Text analytics for Health)功能帮助医药魔方实现了超高准确度的财年报药品销售数据抽取标准化存储(简称SSS),以及超高匹配度的世界临床试验适应症识别&词典匹配(简称WORD),帮助医药魔方拓展了对医药数据挖掘的深度。

赋能医药魔方

痛点

医药魔方与实验室的合作项目中,有两个主要的技术难点——财年报药品销售数据抽取标准化存储(简称SSS)和世界临床试验适应症识别&词典匹配(简称WORD)。SSS项目可被解释为,从各上市公司的药企财报中提取中文和英文的销售数据表格并按照预定义的表格形式进行标准化存储。WORD项目可被解释为,从临床实验入排标准中识别出与适应症词典里的词条具有同义词或者上下位词关系的适应症,以快速进行匹配,从而快速进行后续的数据清洗和分析处理。

解决方案

1. SSS项目中, 实验室工程师采用Azure表单识别器(Azure Form Recognizer),对PDF格式文件进行OCR文字识别,抽取出全文以及表格数据,该接口测试的报告准确率达到90%以上,解决了医药魔方数据团队的一大部分工作量,有效缩减了在该项目上花费的大量时间和人力成本。

Why Azure Form Recognizer?

简单文本提取

自定义结果

灵活的部署

内置的安全性

Azure表单识别器(Azure Form Recognizer) 是一个基于云的 Azure 应用 AI 服务,它使用机器学习模型从文档中提取键值对、文本和表。表单识别器分析表单和文档,提取文本和数据,将字段关系映射为键值对,并返回结构化 JSON 输出。 它可以快速获取根据特定内容定制的准确结果,无需进行繁琐的手动干预,也不需要具备丰富的数据科学专业知识。 使用表单识别器自动处理应用程序和工作流中的数据,增强数据驱动的策略,并丰富文档搜索功能。

2. WORD项目中,实验室工程师基于Azure针对医疗的文本分析(Azure Text analytics for Health)服务,为医药魔方团队实现了这一功能的自动化精准匹配。在实验室样本数据模型测试中,达到了97.7%的匹配度。

(Azure针对医疗的文本分析|命名实体识别)

Why Azure Text Analytics for Health?

处理非结构化医疗数据

对重要概念进行标识和分类

自动操作工作流

Azure针对医疗的文本分析(Azure Text Analytics for Health)是适用于语言的 Azure 认知服务所提供的其中一项功能,这是云端中机器学习和 AI 演算法的集合,用于开发涉及书面语言的智慧型应用程式。健康情况的文字分析会从非结构化文字撷取并标记相关医学资讯的容器化服务,像是医师笔记、出院摘要、临床文件及电子健康记录。

人工智能在医药领域的不可或缺性日益显著,且将持续、深入地为医药企业带来变革,加速智慧医疗的进程,帮助医药企业领跑未来。微软人工智能和物联网实验室也将在2022年大力赋能医药企业。我们将基于微软的AI技术,提供定制化的AI及IoT解决方案,帮助更多医药企业加速实现数字化转型。 我们期待与更多的医药企业加入我们,体验微软前沿的AI及IoT技术。用微软前沿的科技助医药行业一臂之力,给遭受病痛的患者带去更多的光亮。

AI和IoT格局正在快速变化。

即刻申请入驻微软人工智能和物联网实验室,我们的微软技术专家会与您的团队一起加速构建创新解决方案。