【论文阅读】Convolutional MKL Based MultimodalEmotion Recognition and Sentiment Analysis

5 篇文章 0 订阅
订阅专栏

论文标题:Convolutional MKL Based Multimodal Emotion Recognition and Sentiment Analysis

论文链接:https://ieeexplore.ieee.org/document/7837868

 摘要

         本文针对多模态情绪识别和情感分析的问题,提出了一种新的方法(深度卷积神经网络)从文本和视频的模态提取特征。并且设计了一个Multiple Kernel Learning(多核学习,MKL)分类器来对不同模态的特征进行训练,得出相应的情感分类结果。实验结果表明,作者提出的方法在不同数据集上的多模态情感识别和情感分析方面的表现显著优于现有水平。

文章主要的贡献:

1、针对视频特征提取,作者提出来一种时间卷积神经网络,将t时刻和t+1时刻的每一对图像组合成一张图像,用来捕捉视频序列的时间信息。

2、作者提出使用RNN来捕获静态图像中固有的空间结构信息。

3、提出MKL来融合三种模式。

4、作者使用CNN从一个监督分类器变成了一个可训练的特征提取器。

CRMKL模型

        作者设计了一个卷积循环多核学习(CRMKL)模型,该模型结合了音频、视频和文本中的情感特征。特别是在视频模态,CRMKL模型可以将RNN、CNN和MKL相结合。模型结构图如下:

针对于不同的模态,作者使用了不同的方法来提取特征。

视频模态

 

对于视频特征提取,作者首先将t时刻和t+1时刻的每一对连续图像转换为单个图像,然后使用不同维度的Kernel来从转换后的输入中学习第1层的2D特征。

同样,第二层也使用不同维度的核来学习二维特征。上采样层将不同核大小的特征转化为均匀的2D特征。接下来,使用逻辑层神经元为RNN准备输入。

这里有一个相互连接的神经元层,可以使用延迟状态对长时间延迟进行建模。最终输出层将每个视频图像分类为“正”或“负”。

 实验时,第一个卷积层包含100个大小为10×20的核,下一个卷积层包含100个大小为20×30的核,然后是300个神经元的逻辑层和50个神经元的循环层。卷积层与池化层交织,维度为2×2。

 文本模态

 对于文本模态,作者使用CNN来提取特征,每个RBM层都以无监督的方式进行训练,然后可以使用已知标签的数据集子集对完整的深度模型进行微调。在每一层中以无监督的方式学习的特征可能不是最好的分类,但可以用来训练最先进的分类器。

作者提出为每个单词构建306维向量,其中,使用word2vec字典为每个单词提供300维;用6个基本词性(名词、动词、形容词、副词、介词、连词)编码为6维二元向量。

在特征提取时,使用7层的CNN,分别为输入层、卷积层、最大池化层、卷积层、全连接层、输出层。特征提取自CNN的倒数第二全连接层。作者将CNN的最后一层输出层仅用于训练,但在实际决策时,将其替换为更复杂的分类器,如SVM或MKL。

音频模态

作者使用开源软件openSMILE来自动提取音频特征,得到6373个feature。


深度CNN在音频、视频和文本分类方面表现出了良好的性能。与其使用单个大的隐藏神经元层,深度模型有几个小的隐藏神经元层。由于每一层都是独立的,这大大降低了复杂性。因此,在本文中,作者为每个模态,即音频、视频和文本,构建了一个深度CNN。

使用MKL将三个深度CNN学习到的每一组特征结合起来。就可以减少输入维度的数量,并对MKL的特征进行分组。

实验结果

 下表展示了在MOUD数据集上获得的10倍交叉验证结果,我们可以看到,使用了CRMKL模型进行视频特征提取,比当前的技术水平提高了27%的准确率。另外使用CNN来提取文本模态的特征所取得的效果也比当前技术优秀。

下表为作者在IEMOCAP数据集上的实验结果,与单模态相比,本文使用特征级融合方法融合不同模态所取得的效果明显优于单模态。

        ●文本分类器可以很好地识别愤怒、快乐和中性的实例。然而,愤怒和悲伤的例子很难用文本线索区分彼此。其中一个可能的原因是,这两个类别都是否定的,许多相似的词被用来表达它们。

        ●在音频情态的情况下,我们观察到悲伤和中性类别比文本情态的准确性,但对快乐和愤怒类别则没有。分类器把许多快乐的实例错误地归类为愤怒的实例。然而,分类器在区分悲伤和愤怒方面表现得很好。我们还观察到,一些快乐的人被归类为中性。

        ●与其他两种方式相比,视觉方式产生了最好的准确性。虽然愤怒和悲伤的脸可以被有效地分类,但分类器在愤怒和悲伤的脸之间显示出一些混淆。尽管在快乐面孔和中性面孔之间观察到高度的混淆,但中性面孔与其他类别的区分也更准确。

 本文着重采用不同的方法对视频与文本特征的提取,而音频特征提取使用的方法则不够突出,因此,T+V的表现明显优于T+A和A+V。

总结

 随着网络上发布的视频越来越多,从视频中提取情感和极性对于社交媒体营销、品牌定位和财务预测等任务变得越来越重要。

因此,本文提出了一种融合文本、声调和面部表情的多模态情感识别和情感分析方法。特别是,作者描述了一种新的时间深度卷积神经网络的视觉和文本的特征提取,并使用多核学习(MKL)融合从不同的模式提取的异构特征。

A Transformer-based joint-encoding for Emotion Recognition and Sentiment Analysis
qq_38962336的博客
12-06 1147
A Transformer-based joint-encoding for Emotion Recognition and Sentiment Analysis 基于Transformer的情感识别和情感分析联合编码摘要1.简介2.相关工作3.模型3.1 单模态Transformer的编码3.2多模态Transformer编码3.3分类层4.特征提取4.1语言4.2声音4.3视觉5.数据集6.实验6.1实验设置6.2结果7.讨论8.总结 摘要 理解表达的情绪和情感是人类多模态语言的两个重要因素。本文提出了
[论文] Aspect Based Sentiment Analysis with Gated Convolutional Networks
小小俊
08-31 2897
Aspect Based Sentiment Analysis with Gated Convolutional Networks   摘要: Aspect based sentiment analysis (ABSA) two subtasks: aspect-category sentiment analysis (ACSA) and aspect-term sentiment an...
2020_ACL_A Transformer-based joint-encoding for Emotion Recognition and Sentiment Analysis
tcn760的博客
04-12 2469
A Transformer-based joint-encoding for Emotion Recognition and Sentiment Analysis 情感分析和情绪识别 对于情感分析来说, 情感表达可以来源于文字、音频、图像, 结合两种及以上模态建模情感分析, 就是多模态情感分析。如下图所示,利用文本、图像、音频(这三个模态来源于多媒体数据,其中的文本和声音和图像数据是从该多媒体数据中提取出的)三个模态去分析多媒体数据所表达的情感是积极的还是消极的或者是什么情绪(开心,激动,伤心,生气),就是
多模态情感识别_基于情感信息辅助的多模态情绪识别
weixin_39775910的博客
01-14 345
Abstract:Different from the previous studies with only text, this paper focuses on multimodal data (text and audio) to perform emotion recognition. To simultaneously address the characteristics of mul...
MKL-DNN学习笔记 (二) 超分辨率推理模型的选择 - DRRN
sandmangu的专栏
10-10 905
一切不结合实践的理论文章都是耍流氓!!! 所以这里学习MKL-DNN的最终目的是把mkldnn放到一个实际的超分辨率推理应用中去做加速。这里我选中了下面这篇文章的DRRN模型推理加速来做我这次学习的最终目的 纯C++超分辨率重建DRRN --改编 DRRN的网络架构如下(图片来自DRRN的论文, 地址 http://cvlab.cse.msu.edu/pdfs/Tai_Yang_Liu_CV...
Multimodal Emotion-Cause Pair Extractionin Conversations
大肉包的博客
03-19 685
视频:应用了一种3D-CNN网络,命名为C3D,利用深度3D ConvNet学习时空特征,从每个话语的视频中提取128维的视觉特征vi。文本:用预先训练好的300维GloVe向量初始化每个标记,并将它们输入一个带有标准注意机制的BiLSTM编码器,然后获得每个话语的文本特征。首先基于训练好的情感分类器识别情绪话语,然后根据两种相对位置(即, -2, -1, 0)的先验分布,对一个情绪的原因话语进行抽样。任务2:多模态情绪-原因对提取 情绪类别(MECPE-Cat),如图3,哪个对话造成了哪个情绪的产生。
Long-term Recurrent Convolutional Networks for Visual Recognition and Description (1411.4389v3)-计算机科学
04-22
Visual Recognition and DescriptionJeff Donahue? Lisa Anne Hendricks? Sergio Guadarrama? Marcus Rohrbach?∗Subhashini Venugopalan† †UT Austin Austin, TXvsub@cs.utexas.eduKate Saenko‡ ‡UMass ...
论文阅读——Does syntax matter? A strong baseline for Aspect-based Sentiment Analysis with RoBERTa
qq_43658933的博客
03-22 1645
Does syntax matter? A strong baseline for Aspect-based Sentiment Analysis with RoBERTa Abstract 之前的大量工作都表明了融入句法信息能够提高ABSA的性能。但是最近的预训练模型(PTMs)也同样展现了强大的性能提升。因此,作者提出了问题: 预训练模型中是否包含了大量的的ABSA句法信息? 只使用预训练模型是否够用? 在本文中,作者比较了几种流行的PTMs诱导树和依赖解析树,结果表明,精调的RoBERTa (
acl2018---Aspect Based Sentiment Analysis with Gated Convolutional Networks论文阅读笔记
lrt366的博客
07-24 5499
Abstract 基于Aspect的情感分析(ABSA)能提供比一般情感分析更详细的信息,因为它旨在预测文本中给定的aspect或实体的情感极性。我们把以前的工作总结为两类:aspect分类情感分析(aspect-category sentiment analysis (ACSA)) 和aspect实体情感分析( aspect-term sentiment analysis (ATSA) )。...
Deep Convolutional Neural Networks for Sentiment Analysis of Short Texts
qq_27009517的博客
08-09 2601
代码:https://github.com/asahi417/DocumentClassification https://github.com/asahi417/DocumentClassification/blob/master/sequence_modeling/model/cnn_char.py abstract 短文本的情感分析 挑战:有限的文本信息 本文提出DCNN(deep...
论文阅读笔记(二)
weixin_45607635的博客
11-09 1678
《Are Multimodal Transformers Robust to Missing Modality?》论文笔记
多头注意力机制_【论文分享】语音情感识别中基于自注意力机制和全局上下文感知的表征学习研究...
weixin_39675926的博客
12-14 2047
大家好,本周的论文分享是发表在 IJCAI 2019中情感识别的相关工作:Runnan Li, Zhiyong Wu, Jia Jia, Yaohua Bu, Sheng Zhao, and Helen Meng, “Towards discriminative representation learning for speech emotion recognition,” in Proceedi...
论文列表——sentiment analysis
ZSY的大后台
01-25 3226
情感分类属于文本分类的一个应用场景,一般都是人(用户)对某些具体事物(商品、事件)表达某些情感。落地场景是很多的。这学期最开始是做stance detection相关的工作,而其中target-specific stance detection和情感分类中的aspect-based sentiment analysis是很相关的,而AIC的比赛又正好是这个后者,所以顺便调研了下sentiment ...
MKLDNN推理加速技术简介
LF_AI的博客
10-19 1324
深度学习在进行推理时,很多应用场景在对硬件有一定限制的情况下,对推理速度还有比较高的要求,如移动端的人脸识别与语音语义识别、安防领域的烟雾报警等。在这些领域中,推理速度的快慢不但直接影响着...
从 SVM 到多核学习 MKL
weixin_30820077的博客
05-20 1962
SVM是机器学习里面最强大最好用的工具之一,它试图在特征空间里寻找一个超平面,以最小的错分率把正负样本分开。它的强大之处还在于,当样本在原特征空间中线性不可分,即找不到一个足够好的超平面时,可以利用核(kernel)函数,将特征映射到希尔伯特(Hilbert)空间。后者一般维度更高,通过这样的映射之后,样本在新的特征空间中便是线性可分的了。 记得刚刚学习SVM的时候,对“核”这个词很恐惧,一直理...
多核学习在图像分类中的应用
weixin_33937499的博客
11-24 1186
1摘要 分类在搜索引擎中的应用非常广泛,这种分类属性可以方便在rank过程中针对不同类别实现不同的策略,来更好满足用户需求。本人接触分类时间并不长,在刚用SVM做分类的时候对一个现象一直比较困惑,看到大家将各种不同类型特征,拼接在一起,组成庞大的高维特征向量,送给SVM,得到想要的分类准确率,一直不明白这些特征中,到底是哪些特征在起作用,哪些特征组合在一起才是最佳效果,也不...
MKL学习——功能简介
风翼冰舟的博客
04-12 1万+
基本术语BLAS : Basic Linear Algebra Subprograms 基本线性代数子程序BLACS : Basic Linear Algebra Communication Subprograms 基本线性代数通信子程序LAPACK : Linear Algebra PACKage 线性代数包ScaLAPACK : Scalable LAPACK PBLAS : Paralle
机器学习基础--各种学习方式(18)--核方法和多核学习
wydbyxr的博客
07-16 8191
核方法(Kernel Methods)   核方法中最有名的是Support Vector Machines(支持向量机)。这种方法把输入数据映射到更高维度上,将其变得可分,使得归类和回归问题更容易建模。 Support Vector Machines (SVM) Radial Basis Function (RBF) Linear Discriminate Analysis...
无监督和有监督算法的区别
热门推荐
songying2012的专栏
07-06 2万+
监督学习(supervised learning):通过已有的训练样本(即已知数据以及其对应的输出)来训练,从而得到一个最优模型,再利用这个模型将所有新的数据样本映射为相应的输出结果,对输出结果进行简单的判断从而实现分类的目的,那么这个最优模型也就具有了对未知数据进行分类的能力。在社会中,我们在很小的时候就被大人教授这是鸟啊,那是猪啊,这个是西瓜、南瓜,这个可以吃、那个不能吃啊之类的,我们眼里见到的
Region-Based Convolutional Networks for Accurate Object Detection and Segmentation复现
最新发布
07-14
你好!对于 "Region-Based Convolutional Networks for Accurate Object Detection and Segmentation" 这篇论文的复现,我可以给你一些指导。该论文介绍了一种基于区域的卷积神经网络方法,用于准确的物体检测和分割。 首先,你需要了解论文中提出的方法的核心思想和技术细节。然后,你可以按照论文中描述的步骤进行复现。以下是一些可能的步骤: 1. 数据集准备:根据论文中使用的数据集,你需要获取相应的训练集和测试集数据。确保数据集包含物体检测和分割的标注信息。 2. 模型架构:根据论文中描述的模型架构,你可以使用深度学习框架(如TensorFlow、PyTorch等)来构建模型。确保按照论文中提到的网络层次结构、连接方式和参数设置来构建模型。 3. 损失函数:根据论文中提到的损失函数,你可以实现相应的损失函数来衡量检测和分割任务的性能。 4. 训练过程:使用训练集数据对模型进行训练。根据论文中提到的训练策略和超参数设置,你可以使用反向传播算法来更新模型的权重。 5. 测试过程:使用测试集数据对训练好的模型进行测试。评估模型在物体检测和分割任务上的性能,并与论文中的结果进行比较。 请注意,由于论文可能没有提供完整的代码实现,你可能需要根据论文的描述进行一定的调整和优化。 希望这些步骤能为你复现该论文提供一些帮助!如果你有任何进一步的问题,欢迎继续提问。
写文章

热门文章

  • 循环神经网络(RNN、LSTM、GRU)介绍 5791
  • 【论文阅读】Tensor Fusion Network for Multimodal Sentiment Analysis 5497
  • 【论文阅读】Multi-Modal Sarcasm Detection Based on Contrastive Attention Mechanism 2222
  • NER数据集标注工具——Label Studio 1792
  • Hive的索引 1401

分类专栏

  • RAG 1篇
  • 论文阅读 5篇
  • 大数据 3篇

最新评论

  • 【论文阅读】PAPTOP: 通过深入理解上下文增强RAG

    CSDN-Ada助手: 你好,CSDN 开始提供 #论文阅读# 的列表服务了。请看:https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求,请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。

  • Sqoop相关介绍

    CSDN-Ada助手: 恭喜用户发布了第11篇博客“Sqoop相关介绍”!持续创作是提升自我能力的不二选择,相信您的努力一定会得到回报。下一步,或许可以考虑深入探讨Sqoop的具体应用场景或者与其他数据传输工具的比较分析,这样可以为读者提供更加全面的信息。期待您更多精彩的文章!

  • Hive的索引

    CSDN-Ada助手: 恭喜您撰写了关于Hive索引的第12篇博客!持续创作是提升技术水平的不二法门,您的努力和热情让读者受益匪浅。或许在下一篇博客中可以分享一些关于Hive索引的实际应用案例,让读者更加深入地了解这一技术。期待您更多精彩的文章,加油!

  • Error while processing statement: FAILED: Execution Error, return code 1 from org.apache.hadoop.hive

    CSDN-Ada助手: 恭喜您写了第9篇博客!遇到错误是正常的创作过程中的挑战,但您能够勇敢面对并解决问题,这是非常值得称赞的。希望您能继续保持创作的热情和耐心,在遇到困难时不要轻易放弃,或许可以尝试寻求更多技术支持或者查阅更多相关资料,相信您一定能够克服这个问题,写出更多优质的博客内容。加油!

  • 运行PaddleNLP中的uie时报错:OSError: [Errno 28] No space left on device: ‘/root/.paddlenlp/models/uie-base/t

    CSDN-Ada助手: 恭喜您完成了第8篇博客!不过很抱歉听到您在运行PaddleNLP中遇到的问题。关于错误信息中的磁盘空间不足问题,我建议您检查一下您的设备磁盘空间是否已满,如果是的话,可以尝试清理一些不必要的文件来释放空间。 另外,我非常欣赏您对持续创作的热情和努力。作为下一步的创作建议,您可以尝试深入分析PaddleNLP中uie运行的原理,并结合您的实际应用场景,探索更多关于uie的应用和优化方法。同时,您也可以考虑分享一些关于NLP中其他模型或技术的经验和见解,这样能够为读者提供更多的学习价值。 希望这些建议对您有所帮助,期待看到您更多优质的博客作品!请保持谦虚的态度,继续努力!

大家在看

  • 数论--筛质数(埃氏筛法) 108
  • 【Elasticsearch系列十九】评分机制详解
  • 基于matlab的通信系统设计及仿真 1221
  • python基于Django汽车租赁管理系统的设计(源码+vue+部署文档+讲解等)
  • python文件操作 1222

最新文章

  • 【论文阅读】PAPTOP: 通过深入理解上下文增强RAG
  • RAG:索引
  • Hive的索引
2024年6篇
2023年2篇
2022年6篇

目录

目录

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43元 前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值

玻璃钢生产厂家官渡区定做玻璃钢雕塑厂家单县制作玻璃钢雕塑商家厂商荆门玻璃钢雕塑制作厂家多彩玻璃钢雕塑定做价格河北超市商场美陈哪里买广东室内商场美陈河南超市商场美陈价钱呼市商场美陈致电福建通用玻璃钢雕塑摆件牡丹花玻璃钢雕塑亳州彩绘玻璃钢雕塑陕西人物玻璃钢雕塑安装玻璃钢鹿雕塑怎么选温州玻璃钢雕塑供应商玻璃钢雕塑嘉定福州玻璃钢雕塑马哪有代替玻璃钢雕塑的产品果洛玻璃钢雕塑工程佛山百花广场玻璃钢雕塑长沙佛像玻璃钢雕塑厂家玻璃钢雕塑成山东动物玻璃钢雕塑优势校园玻璃钢人物雕塑要求淮安商场活动美陈宁夏玻璃钢雕塑售价动漫雕塑 玻璃钢 公司景洪市玻璃钢雕塑设计要多少钱万圣节商场女装品牌美陈成都玻璃钢浮雕雕塑公园摆件玻璃钢人物雕塑销售电话香港通过《维护国家安全条例》两大学生合买彩票中奖一人不认账让美丽中国“从细节出发”19岁小伙救下5人后溺亡 多方发声单亲妈妈陷入热恋 14岁儿子报警汪小菲曝离婚始末遭遇山火的松茸之乡雅江山火三名扑火人员牺牲系谣言何赛飞追着代拍打萧美琴窜访捷克 外交部回应卫健委通报少年有偿捐血浆16次猝死手机成瘾是影响睡眠质量重要因素高校汽车撞人致3死16伤 司机系学生315晚会后胖东来又人满为患了小米汽车超级工厂正式揭幕中国拥有亿元资产的家庭达13.3万户周杰伦一审败诉网易男孩8年未见母亲被告知被遗忘许家印被限制高消费饲养员用铁锨驱打大熊猫被辞退男子被猫抓伤后确诊“猫抓病”特朗普无法缴纳4.54亿美元罚金倪萍分享减重40斤方法联合利华开始重组张家界的山上“长”满了韩国人?张立群任西安交通大学校长杨倩无缘巴黎奥运“重生之我在北大当嫡校长”黑马情侣提车了专访95后高颜值猪保姆考生莫言也上北大硕士复试名单了网友洛杉矶偶遇贾玲专家建议不必谈骨泥色变沉迷短剧的人就像掉进了杀猪盘奥巴马现身唐宁街 黑色着装引猜测七年后宇文玥被薅头发捞上岸事业单位女子向同事水杯投不明物质凯特王妃现身!外出购物视频曝光河南驻马店通报西平中学跳楼事件王树国卸任西安交大校长 师生送别恒大被罚41.75亿到底怎么缴男子被流浪猫绊倒 投喂者赔24万房客欠租失踪 房东直发愁西双版纳热带植物园回应蜉蝣大爆发钱人豪晒法院裁定实锤抄袭外国人感慨凌晨的中国很安全胖东来员工每周单休无小长假白宫:哈马斯三号人物被杀测试车高速逃费 小米:已补缴老人退休金被冒领16年 金额超20万

玻璃钢生产厂家 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化