方面级情感分析(一)-程序员宅基地

技术标签: 深度学习  自然语言处理  方面级情感分析  神经网络  

方面级情感分析
任务定义
方面级情感分析(Aspect-based sentiment analysis, ABSA)主要包括方面词抽取和方面级情感分类。
ABSA任务需要识别出给定目标中特定方面的情感极性,通常分为两个子任务:方面类型情感分析和方面词项情感分析。
传统方面级情感分析:
在ABSA任务上,早期的工作主要基于人工特征工程,通过人工设计、特征选择,如情感词典、依赖信息等,再利用最大熵、支持向量机等传统分类器进行情感分类。
(1)如Hu[1]提出通过给定的情感种子词语,利用WordNet词典,来查找种子词语的同义词和反义词。
(2)Wagner[2]利用SVM,在人工设计抽取的多种特征上进行方面级情感分类。虽然均取得了不错的性能,但是模型泛化能力差、人工成本高等缺点也逐渐暴露出来。
基于深度学习的情感分析
近些年由于神经网络的兴起,尤其是注意力和记忆力机制成功应用于各类自然语言处理任务,基于深度学习的情感分析方法能够取得最优的效果。该方法最大的优势就是不依赖人工定义特征,神经网络可以自行学习文本中蕴含的情感信息。
现有的基于深度学习的ABSA方法主要分为五类:基于递归神经网络(Recursive Neural Network,RecNN)、基于循环神经网络(Recurrent Neural Network,RNN)、基于注意力循环神经网络(Attention-based RNN)、基于卷积神经网络(Convolutional Neural Network,CNN)和基于记忆力神经网络(Memory Network)的方面级情感分析。

基于递归神经网络的方面级情感分析
(1)Socher[3]提出了RecNN模型,该模型通过语法结构解析树自下而上地递归获得组合单词,因此捕获的语义关系更加细粒度,同时可以运用于更长的短语或句子,该方法在电影评论数据集上达到了79%的情感分析准确率。
(2)基于树结构的递归神经网络(Tree-based RecNN)被引入到ABSA任务上。Dong[4]提出了自适应递归神经网络(AdaRNN)解决基于目标词语的Twitter情感分析,利用依赖解析树寻找在语法上跟目标词有关联的词语,通过自底向上的递归计算获取目标词语的向量表示。实验表明,AdaRNN的分类性能优于传统的机器学习方法以及基本的递归神经网络方法。
基于循环神经网络的方面级情感分析
RNN具有优秀的序列学习能力,目前ABSA任务中的先进方法大多数都是基于循环神经网络进行建模。在此类研究中,模型可以继续细分为三类:循环神经网络、双向循环神经网络、分层循环神经网络。Tang[5]提出基于目标依赖的长短期记忆神经网络(TD-LSTM)和基于目标关联的长短期记忆神经网络(TC-LSTM),实验表明TC-LSTM相比TD-LSTM,可以学习目标词语跟上下文的相互关系,在情感分类准确率上有所提升。Zhang[6]利用门控神经网络结构,通过Bi-RNN对句子中的句法和语义以及方面词与周围上下文词之间的相互作用进行建模。Ruder[7]提出HRNN模型,使用分层双向长短期记忆神经网络学习句内和句间的关系。
基于注意力循环神经网络的方面级情感分析
近年来,注意力机制(Attention Mechanism)在机器翻译、问答系统等自然语言处理任务上取得成功。针对ABSA任务,很多基于注意力循环神经网络的变体不断被提出。注意力机制核心目标在于从众多信息中选择对当前任务目标更为关键的信息,利用注意力机制得到文本中关于某个方面类别的描述表示,将不同的方面类别信息区分开来,从而进行更加准确的情感极性判别,这和方面级情感分析的目标不谋而合。
目前,基于注意力循环神经网络可以分为两类:基本注意力循环神经网络和交互注意力循环神经网络。为了提升方面级情感分析的效果,研究者们在基本注意力神经网络模型上做了大量的工作。
(1)例如,Wang[8]最早将注意力机制引入该任务,提出了一种使用目标嵌入的基于注意力的 LSTM 模型,该工作在LSTM网络基础上为每个目标设置一个注意力向量,强制模型去注意句子中的重要部分,以响应特定的对象。
其后,许多工作在此基础上结合任务的特点对于注意力机制进行了改进,很多基于交互式或迭代式注意力机制被应用于ABSA任务上。
(2)例如,Ma[9]提出了一种交互式注意网络(Interactive attention networks,IAN),使用两个注意力网络来交互式地检测目标描述的重要单词和整个上下文的重要单词。
基于卷积神经网络的方面级情感分析
CNN[10]通过卷积操作和池化操作从原始数据中提取出高级的特征,在计算机视觉领域的有效性已经得到诸多验证。
(1)Huang[11]利用参数化的过滤器门控结构将方面词信息合并到CNN中。
(2)Fan[12]提出了一种卷积记忆网络,该网络融合了注意机制,可以同时捕捉句子中的单词和多单词表达。
(3)Li[13]采用了一种接近策略,利用单词和方面词语之间的位置相关性来缩放卷积层的输入。实验表明,在方面级情感分析任务上,各种卷积神经网络变体的分类性能优于传统的机器学习方法以及基本的卷积神经网络方法。
基于记忆力神经网络的方面级情感分析
Tang[14]将深度记忆网络思想应用到方面级情感分析任务中,通过记忆网络存储给定方面的上下文信息,同时利用注意力机制捕捉该属性与上下文关联的重要程度。
Chen[15]提出了一种基于记忆网络的递归注意机制(RAM),来提取被长距离分隔的情感信息。
Liu[16]针对ASC任务,提出一种基于语境的注意机制,该机制明确考虑到特定方面词与其上下文词语之间的关系。该模型由句子层面的内容注意机制和语境注意机制两部分组成。其中,句子层面的内容注意机制能够从全局的角度捕捉到,整个句子针对方面词语的重要信息,克服了在深层记忆网络模型存在的短视问题。
数据集
SemEval-2014
未来研究方向
(1)低资源情感分析。针对低资源语言,目前缺乏大量且权威的标注数据集,特别是短文本的情感分析数据集。如何训练具有高准确率的无监督或半监督方法,使用上大量的无标签情感数据是情感分析的后续研究方向之一。
(2)跨领域情感分析。由于语言的多样性与复杂性,不同领域间的情感表达差别较大。特别是当领域差异过大时,如在商品评论领域训练的情感分析模型应用到新闻领域上,情感分析的效率和性能会出现下降。
(3)多语言情感分析。现有工作主要针对单一语言,而在单一语言中的情感分析的资源与成果,无法泛化到多语言的环境中,在解决情感分析任务的基本问题外,还需要考虑机器翻译、多语言文本处理等工作,这都对多语言情感分析提出了新的需求。
SVM->
在这里插入图片描述

参考文献
基于深度学习的方面级情感分析综述
待读的三篇ACL2021论文
https://blog.csdn.net/qq_27590277/article/details/119988607

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/weixin_43888922/article/details/120246884

智能推荐

机器学习模型评分总结(sklearn)_model.score-程序员宅基地

文章浏览阅读1.5w次,点赞10次,收藏129次。文章目录目录模型评估评价指标1.分类评价指标acc、recall、F1、混淆矩阵、分类综合报告1.准确率方式一:accuracy_score方式二:metrics2.召回率3.F1分数4.混淆矩阵5.分类报告6.kappa scoreROC1.ROC计算2.ROC曲线3.具体实例2.回归评价指标3.聚类评价指标1.Adjusted Rand index 调整兰德系数2.Mutual Informa..._model.score

Apache虚拟主机配置mod_jk_apache mod_jk 虚拟-程序员宅基地

文章浏览阅读344次。因工作需要,在Apache上使用,重新学习配置mod_jk1. 分别安装Apache和Tomcat:2. 编辑httpd-vhosts.conf: LoadModule jk_module modules/mod_jk.so #加载mod_jk模块 JkWorkersFile conf/workers.properties #添加worker信息 JkLogFil_apache mod_jk 虚拟

Android ConstraintLayout2.0 过度动画MotionLayout MotionScene3_android onoffsetchanged-程序员宅基地

文章浏览阅读335次。待老夫kotlin大成,扩展:MotionLayout 与 CoordinatorLayout,DrawerLayout,ViewPager 的 交互众所周知,MotionLayout 的 动画是有完成度的 即Progress ,他在0-1之间变化,一.CoordinatorLayout 与AppBarLayout 交互时,其实就是监听 offsetliner 这个 偏移量的变化 同样..._android onoffsetchanged

【转】多核处理器的工作原理及优缺点_多核处理器怎么工作-程序员宅基地

文章浏览阅读8.3k次,点赞3次,收藏19次。【转】多核处理器的工作原理及优缺点《处理器关于多核概念与区别 多核处理器工作原理及优缺点》原文传送门  摘要:目前关于处理器的单核、双核和多核已经得到了普遍的运用,今天我们主要说说关于多核处理器的一些相关概念,它的工作与那里以及优缺点而展开的分析。1、多核处理器  多核处理器是指在一枚处理器中集成两个或多个完整的计算引擎(内核),此时处理器能支持系统总线上的多个处理器,由总..._多核处理器怎么工作

个人小结---eclipse/myeclipse配置lombok_eclispe每次运行个新项目都需要重新配置lombok吗-程序员宅基地

文章浏览阅读306次。1. eclipse配置lombok 拷贝lombok.jar到eclipse.ini同级文件夹下,编辑eclipse.ini文件,添加: -javaagent:lombok.jar2. myeclipse配置lombok myeclipse像eclipse配置后,定义对象后,直接访问方法,可能会出现飘红的报错。 如果出现报错,可按照以下方式解决。 ..._eclispe每次运行个新项目都需要重新配置lombok吗

【最新实用版】Python批量将pdf文本提取并存储到txt文件中_python批量读取文字并批量保存-程序员宅基地

文章浏览阅读1.2w次,点赞31次,收藏126次。#注意:笔者在2021/11/11当天调试过这个代码是可用的,由于pdfminer版本的更新,网络上大多数的语法没有更新,我也是找了好久的文章才修正了我的代码,仅供学习参考。1、把pdf文件移动到本代码文件的同一个目录下,笔者是在pycharm里面运行的项目,下图中的x1文件夹存储了我需要转换成文本文件的所有pdf文件。然后要在此目录下创建一个存放转换后的txt文件的文件夹,如图中的txt文件夹。2、编写代码 (1)导入所需库# coding:utf-8import ..._python批量读取文字并批量保存

随便推点

Scala:访问修饰符、运算符和循环_scala ===运算符-程序员宅基地

文章浏览阅读1.4k次。http://blog.csdn.net/pipisorry/article/details/52902234Scala 访问修饰符Scala 访问修饰符基本和Java的一样,分别有:private,protected,public。如果没有指定访问修饰符符,默认情况下,Scala对象的访问级别都是 public。Scala 中的 private 限定符,比 Java 更严格,在嵌套类情况下,外层_scala ===运算符

MySQL导出ER图为图片或PDF_数据库怎么导出er图-程序员宅基地

文章浏览阅读2.6k次,点赞7次,收藏19次。ER图导出为PDF或图片格式_数据库怎么导出er图

oracle触发器修改同一张表,oracle触发器中对同一张表进行更新再查询时,需加自制事务...-程序员宅基地

文章浏览阅读655次。CREATE OR REPLACE TRIGGER Trg_ReimFactBEFORE UPDATEON BP_OrderFOR EACH ROWDECLAREPRAGMA AUTONOMOUS_TRANSACTION;--自制事务fc varchar2(255);BEGINIF ( :NEW.orderstate = 2AND :NEW.TransState = 1 ) THENBEG..._oracle触发器更新同一张表

debounce与throttle区别及其应用场景_throttle和debounce应用在哪些场景-程序员宅基地

文章浏览阅读513次。目录概念debouncethrottle实现debouncethrottle应用场景debouncethrottle场景举例debouncethrottle概念debounce字面理解是“防抖”,何谓“防抖”,就是连续操作结束后再执行,以网页滚动为例,debounce要等到用户停止滚动后才执行,将连续多次执行合并为一次执行。throttle字面理解是“节流”,何谓“节流”,就是确保一段时..._throttle和debounce应用在哪些场景

java操作mongdb【超详细】_java 操作mongodb-程序员宅基地

文章浏览阅读526次。regex() $regex 正则表达式用于模式匹配,基本上是用于文档中的发现字符串 (下面有例子)注意:若未加 @Field("名称") ,则识别mongdb集合中的key名为实体类属性名。也可以对数组进行索引,如果被索引的列是数组时,MongoDB会索引这个数组中的每一个元素。也可以对整个Document进行索引,排序是预定义的按插入BSON数据的先后升序排列。save: 若新增数据的主键已经存在,则会对当前已经存在的数据进行修改操作。_java 操作mongodb

github push 推送代码失败. 使用ssh rsa key. remote: Support for password authentication was removed._git push remote: support for password authenticati-程序员宅基地

文章浏览阅读1k次。今天push代码到github仓库时出现这个报错TACKCHEN-MB0:tc-image tackchen$ git pushremote: Support for password authentication was removed on August 13, 2021. Please use a personal access token instead.remote: Please see https://github.blog/2020-12-15-token-authentication_git push remote: support for password authentication was removed on august 1