nlp-keypoints
  • 前言
  • 中文NER掠影
    • overview
    • LatticeLSTM
    • WC-LSTM
    • SoftLexicon
    • FLAT
    • LEBERT
    • 中文NER总结
  • Embedding知识板块
    • Word2Vec
    • Transformer
    • Bert
    • XLNet
    • Albert
    • Roberta
  • ML/DL基础板块
    • 特征工程
    • 初始化
    • 激活函数
    • 正则化
    • Dropout
    • 损失函数
    • 优化方法
    • Attention
    • CNN
    • LSTM
    • CRF
    • Jieba分词原理
    • 其他统计学习
  • 知识图谱板块
    • Brat标注
    • NER
    • NRE
    • 远程监督
    • 事件图谱/事理图谱
  • 文本分类知识板块
    • FastText
    • TextCNN
    • DPCNN
  • 相似匹配板块
    • Ranking Loss
    • 匹配模型
  • 树模型知识板块
    • 决策树考点
    • Bagging vs Boosting
    • GBDT考点
    • Xgboost
  • 面试复盘整理
    • MM科技
    • V哥面的知识图谱
    • HS
    • HSJY
    • HM医疗
    • 平安科技
    • M科技
由 GitBook 提供支持
在本页
  • 1:中文NER任务的特点
  • 2:近些年的中文NER的经典佳作

这有帮助吗?

  1. 中文NER掠影

overview

命名实体识别任务(NER)是几乎所有NLP应用场景下的最核心任务之一,覆盖到:会话系统、智能客服、知识图谱、细粒度情感分析、事件抽取。

1:中文NER任务的特点

  • 中文无分词边界,分词存在误差

    与英文NER相比,中文NER通常采取基于字符的方式。究其缘由,由于中文分词存在误差,所以基于字符的NER系统通常好于基于词汇(经过分词)的方法。

  • 字粒度信息缺乏语义信息

    虽然字粒度通常好于基于词汇的的方法,但是,从中文的角度,使用字符的NER是没有使用到词汇信息的,不成词的单字没有严格的语义含义,而NER任务又是对于实体边界非常敏感的任务。

在基于字符的NER系统中引入词汇信息,是近年来NER的研究重点。这种引入词汇的方法一般称为"词汇增强",即引入词汇信息可以增强NER性能。

2:近些年的中文NER的经典佳作

这里整理了共计6篇的经典paper,按照会议的录用时间,顺序排序如下:

  • Lattice LSTM: Chinese NER Using Lattice LSTM(ACL 2018)

  • WC-LSTM: An Encoding Strategy Based Word-Character LSTM for Chinese NER Lattice LSTM(NAACL 2019)

  • Simple-Lexicon: Simplify the Usage of Lexicon in Chinese NER(ACL 2020)

  • FLAT: Chinese NER Using Flat-Lattice Transformer(ACL 2020)

  • Porous Lattice Transformer Encoder for Chinese NER(ACL 2020)

  • LEBERT: Lexicon Enhanced Chinese Sequence Labelling Using BERT Adapter(ACL2021)

PS:我排除了一些Graph NetWork有关的paper(主要是感觉模型略微有一些花哨,我又不是很涉略图神经网络)后面有精力想拓展的可以再进行展开:

  • CGN: Leverage Lexical Knowledge for Chinese Named Entity Recognition via Collaborative Graph Network( EMNLP2019)

  • LGN: A Lexicon-Based Graph Neural Network for Chinese NER(EMNLP2019)

  • Multi-digraph: A Neural Multi-digraph Model for Chinese NER with Gazetteers(ACL2019)

上一页前言下一页LatticeLSTM

最后更新于2年前

这有帮助吗?