科创中国●保定云
首页
需求大厅
成果大厅
科技服务团
专家人才
品牌活动
技术转移
科技普及
科创视野
关于我们
数据中心

一种药品说明书文本命名实体识别建模方法

  • 发布时间: 2025-03-06
预算 双方协商
基本信息
成果方:西南交通大学
合作方式:技术转让
成果类型:发明专利,
行业领域
电子信息技术
成果描述

本发明公开了一种药品说明书文本命名实体识别建模方法,包括步骤:使用BERT模型将药品说明书文本语句序列向量化,得到带有上下文信息及文本语义信息的特征向量;使用双向长短期记忆网络BiLSTM从特征向量中学习到药品说明书文本的上下文信息,得到隐藏向量;使用全连接层FC将隐层向量进行降维,得到标签特征向量;利用条件随机场CRF对标签特征向量进行解码,得到语句序列最终的输出序列。本发明还对BERT模型为微调进行了微调。本发明通过BERT‑BiLSTM‑CRF模型构建药品说明书文本中命名实体向量的识别模型,实现了针对多源药品说明书的命名实体识别。对BERT模型进行微调,提升了BERT‑BiLSTM‑CRF模型在药品说明书文本命名实体识别任务上的效果,使得通过模型处理得到的数据更具有可靠性。

应用范围

命名实体识别(Named Entity Recognition,NER)是信息抽取中重要的基础任务,旨在抽取非结构化文本中的命名实体(文本中具有特定意义的实体),抽取结果中包含命名实体在文本中的位置以及其所属的实体类别。NER任务的应用范围十分广泛,除了在知识图谱的构建上,还在语义角色标注、自动问答和机器翻译等任务上有着重要影响。

为缓解我国医疗产业监管的压力,构建大规模医疗知识图谱十分有必要。其中构建知识图谱的数据来源于网络药品说明书、文献药品说明书等不同方面,现今的命名实体识别技术在这类具有领域特点的多源数据之上表现并不突出。


前景分析

相对于现有技术,本发明的有益效果在于:

1、通过BERT‑BiLSTM‑CRF模型构建药品说明书文本中命名实体向量的识别模型,实现了针对多源药品说明书的命名实体识别,减少了药品说明书文本命名实体识别的人力成本,为大规模医学知识图谱的建立提供基础。

2、通过使用药品说明书文本数据在命名实体识别任务上对BERT模型进行微调,提升了BERT‑BiLSTM‑CRF模型在药品说明书文本命名实体识别任务上的效果,使得通过模型处理得到的数据更具有可靠性。


联系方式

  • 联系人:

    李天瑞

  • 联系电话:

    19932581850

  • 通讯地址:

    四川省成都市高新区西部园区西南交通大学

请填写以下信息

  • *

    联系人:

  • *

    手机号:

  • *

    单位名称:

  •  备注:

  • 取消 确定