情感分析

情感分析,第1张

1,我觉得你操之过急。第一次见面就说关系能不能改变啊,放手之类的,女人嫁老公也是要挑选的,第一次谁敢就凭你的一腔热血就跟了你啊~还有放手这类电视剧语言以后就不要使用了,怪矫情的,没准她正拿着你的短信笑话你呢

2,作为一个男人,大气才是你的唯一标准。钱不是衡量你是否优秀的准则,我很喜欢一个词就是陋室王侯,30岁的你也说投资失败,证明你也个有能力的人,有经历的人,我希望你不要在钱上过于纠结,该付的就付的,女人看你的钱也很正常,谁不想嫁个有钱人呢~你要理解

3,对于女人要看淡。天涯何处无芳草,你的那个她也就25,6岁吧,如果更老你大可放心,女人不比男人,年龄越大越尴尬,你想他都这么大了,还没和对象,还要相亲,不是看不起别人,就是别人看不起他吗,这样的眼长上天的要他干嘛;如果更小,你也就随意处处,按照你的描述,她是个很在意钱财的人,你想这么小出来相亲,不为爱不问情,就看钱,目的这么明确,她若真心跟你也就算了,她还就直接拒绝了你,以后跟了你,你也有的苦吃,长痛不如短痛,不如现在就看淡的好。

4,至于那句谢谢你,我想他是有点感动了,但这不能说明什么的,一时的感动和一生的相伴能对等吗?

5关于继续追求,看了上面的话,你还是喜欢她的话,我认为你们可以从朋友做起,你也别发什么短信,我们可以做盆友吗之类的,你就有空约他出来吃个饭,大伙出来玩时叫下她什么,以朋友的方式关怀下之类,显得绅士有礼,关怀细致就可以了,就是日久生情战略,应为你们一见钟情基本不可能了,你要是可以感动她,让她觉的你可以托付基本还可以的吧。但是要多久时间,就不知到了,你年龄也不小了,你看这办,是在不行,就放弃吧。

嗯,就这样,祝你爱情顺利!

微博言论往往带有强烈的情感色彩,对微博言论的情感分析是获取用户观点态度的重要方法。许多学者都是将研究的重点集中在句子词性、情感符号以及情感语料库等方面,然而用户自身的情感倾向性并没有受到足够的重视,因此,提出了一种新的微博情感分类方法,其通过建模用户自身的情感标志得分来帮助识别语句的情感特征,具体地讲,将带有情感信息的微博语句词向量序列输入到长短期记忆网络(LSTM),并将LSTM输出的特征表示与用户情感得分进行结合作为全连接层的输入,并通过Softmax层实现了对微博文本的情感极性分类。实验表明,提出的方法UA-LSTM在情感分类任务上的表现超过的所有基准方法,并且比最优的基准方法MF-CNN在F1值上提升了34%,达到091。

关键词: 情感分析, 长短期记忆网络, 用户情感倾向

Abstract:

Micro-blog's speech often has strong sentimental color, and the sentiment analysis of Micro-blog's speech is an important way to get users' opinions and attitudes Many researchers conduct research via focusing on the parts of speech (POS), emotion symbol and emotion corpus This paper proposes a novel method for Micro-blog sentiment analysis, which aims to identify the sentiment features of a text by modeling user sentiment tendency Specifically, we construct a sentiment information embedded word embedding sequence, and input it into a long short term memory (LSTM) model to get a sentiment embedded output representation Then we merge both the user sentiment tendency score and the output representation of LSTM, and use it as the input of a fully connected layer which is followed by a softmax layer to get the final sentiment classification result The experiment shows that the performance of our proposed method UA-LSTM is better than all the baseline methods on the sentimental classification task, and it achieves the F1-score up to 091, with an improvement of 34% over the best baseline method MF-CNN

由于语料缺乏,前期若使用到情感分析,建议暂时使用SnowNLP(此模块主要使用淘宝评论语料)做情感挖掘,但不仅仅为单纯调用,需要优化,下面是一些实践思考:

可在此基础上优化,比如文本需要特别处理,除了平常的去停用词外,还可以需要对输入的文本结合词性等进行处理。

下面是一些常识:

一)无情感的词语(如去停用词,去掉语气词,无词性标签的词语)

二)对于文本过长,则可以考虑提取关键词或抽取文本摘要后再提取关键词

对于后者实践结果差异明显:

以"发布了头条文章: 《5分钟11亿!京东双11场景化产品消费增长明显》 5分钟11亿!京东双11场景化产品消费增长明显 "为例子, 显然该文本为“积极”文本。

1)s = SnowNLP("发布了头条文章:《5分钟11亿!京东双11场景化产品消费增长明显》 5分钟11亿!京东双11场景化产品消费增长明显")

得分为05,明显不符合

2)s = SnowNLP(“ ”join(jiebaanalysetextrank("发布了头条文章:《5分钟11亿!京东双11场景化产品消费增长明显》 5分钟11亿!京东双11场景化产品消费增长明显")))

而对于文本特别长的,则可以先抽取摘要,再对摘要提取关键词。

这主要由于此SnowNLP主要用贝叶斯机器学习方法进行训练文本,机器学习在语料覆盖上不够,特征上工程处理不当会减分,也没考虑语义等。

为何要考虑语义层面:

以“ 苏宁易购,是谁给你们下架OV的勇气” 中的“ 下架”其实才是中心词(为表达愤怒的文本),但“ 勇气 ”为下架的宾语(其为积极的文本),此句应该结果小于05,但实际为088,去掉“苏宁易购”则为06>

欢迎分享,转载请注明来源:浪漫分享网

原文地址:https://hunlipic.com/qinggan/3976994.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2023-08-19
下一篇2023-08-19

发表评论

登录后才能评论

评论列表(0条)

    保存