首页 / 院系成果 / 成果详情页

序列标注模型中的字粒度特征提取方案研究——以CCKS2017:Task2临床病历命名实体识别任务为例  期刊论文  

  • 编号:
    77e0e440-96f6-4661-a47d-c396c241f823
  • 作者:
    孙安;于英香;罗永刚; 王祺;
  • 地址:
    上海大学图书情报档案系;河南科技大学图书馆;上海健康医学院医疗器械学院;华东理工大学计算机科学与技术系;
  • 语种:
    中文
  • 期刊:
    图书情报工作 ISSN:0252-3116 2018 年 62 卷 11 期 (103 - 111) ; 2018/6/5 0:00:00
  • 收录:
  • 关键词:
  • 摘要:

    [目的 /意义]针对中文语言表达特点,提出一种含分词标签的字粒度词语特征提取方法,有效提升了中文临床病历命名实体识别任务的F_1值,同时该方法可以为其他中文序列标注模型所借鉴。[方法 /过程]选取汉语词语的词性标注、关键词权值、依存句法分析三个特征,构筑字粒度序列标注模型的临床病历训练文本,语料来源CCKS2017:Task2。在不同特征组合方式下,采用条件随机场算法验证两种字粒度词语特征提取方案Method1与Method2。[结果 /结论]在四种不同词语特征组合下,Method2相对于Method1在临床病历命名实体识别任务中性能均有所提升,四折交叉测试中F_1值平均提升了0. 23%。实...

  • 推荐引用方式
    GB/T 7714:
    孙安,于英香,罗永刚, 等. 序列标注模型中的字粒度特征提取方案研究——以CCKS2017:Task2临床病历命名实体识别任务为例 [J].图书情报工作,2018,62(11):103-111.
  • APA:
    孙安,于英香,罗永刚,王祺.(2018).序列标注模型中的字粒度特征提取方案研究——以CCKS2017:Task2临床病历命名实体识别任务为例 .图书情报工作,62(11):103-111.
  • MLA:
    孙安, et al. "序列标注模型中的字粒度特征提取方案研究——以CCKS2017:Task2临床病历命名实体识别任务为例" .图书情报工作 62,11(2018):103-111.
浏览次数:11 下载次数:0
浏览次数:11
下载次数:0
打印次数:0
浏览器支持: Google Chrome   火狐   360浏览器极速模式(8.0+极速模式) 
返回顶部