130在线民宿 UGC 数据挖掘实战--集成模型在情感分析中的应用

130在线民宿 UGC 数据挖掘实战--集成模型在情感分析中的应用,第1张

本次实验将加载两个数据,一个是已经标注好的用户评论数据,另外一个是用户评价主题句,通过标注过的用户评论数据进行基于集成模型情感极性模型训练,然后利用模型对主题句进行情感极性推理,最后通过数据聚合可视化得出主题情感极性。

使用 Pandas 加载在线数据表格,并查看数据维度和前 5 行数据。

数据属性如下表所示

加载我们之前通过主题词典提取出来的主题句。

数据属性如下表所示

用户评论分词

jieba 分词器预热,第一次使用需要加载字典和缓存,通过结果看出返回的是分词的列表。

批量对用户评价进行分词,需要一些时间,并打印第一行情感极性训练集的分词结果。

批量对用户评价主题句进行分词,并打印第一句用户主题句分词结果。

依据统计学模型假设,假设用户评论中的词语之间相互独立,用户评价中的每一个词语都是一个特征,我们直接使用 TF-IDF 对用户评价提取特征,并对提取特征后的用户评价输入分类模型进行分类,将类别输出为积极的概率作为用户极性映射即可。

用户评论向量化

TF-IDF 是一种用于信息检索与数据挖掘的常用加权技术,当某个词在文章中的TF-IDF越大,那么一般而言这个词在这篇文章的重要性会越高,比较适合对用户评论中的关键词进行量化。

数据集合划分

按照训练集 8 成和测试集 2 成的比例对数据集进行划分,并检查划分之后的数据集数量。

我们在系列实验的开始使用朴素贝叶斯模型来训练情感分析模型,下面我们新增逻辑回归模型作为对比模型。逻辑回归(Logistic Regression)是一种用于解决二分类问题的机器学习方法,在线性回归的基础上,套用了一个 sigmod 函数,这个函数将线性结果映射到一个概率区间,并且通常以 05 分界线,这就使得数据的分类结果都趋向于在 0 和 1 两端,将用户评论进行向量化之后也可以用此方式预测用户情感。本实验直接对标注过的用户情感数据进行训练,并验证单一模型和集成模型在情感分析性能上的差异。

模型加载

通过传入原始的标签和预测的标签可以直接将分类器性能进行度量,利用常用的分类模型评价指标对训练好的模型进行模型评价,accuracy_score 评价被正确预测的样本占总样本的比例,Precision 是衡量模型精确率的指标,它是指模型识别出的文档数与识别的文档总数的比率,衡量的是模型的查准率。Recall 召回率也称为敏感度,它是指模型识别出的相关文档数和文档库中所有的相关文档数的比率,衡量的是检索系统的查全率,表示正样本在被正确划分样本中所占的比例,f1_score 值是精确率与召回率的调和平均数,是一个综合性的指数。

我们分别对不同模型使用相同的数据集进行训练和测试,以此来比较单模型之间的差异,并打印模型运行时间供大家参考,批量处理不同的模型需要一些时间进行计算,清耐心等待。

通过求得的指标进行模型评价,我们发现使用相同的数据进行模型训练,朴素贝叶斯模型和逻辑回归模型性能基本持平,相差很微弱,逻辑回归稍稍占一些优势。

Stacking 堆栈模型训练

集成学习是地结合来自两个或多个基本机器学习算法的优势,学习如何最好地结合来自多个性能良好的机器学习模型的预测结果,并作出比集成中的任何一个模型更好的预测。主要分为 Bagging, Boosting 和 Stacking,Stacking 堆栈模型是集成机器学习模型的一种,具体是将训练好的所有基模型对整个训练集进行预测,然后将每个模型输出的预测结果合并为新的特征,并加以训练。主要能降低模型的过拟合风险,提高模型的准确度。

开始对两个模型进行集成训练,训练的时间要比单一模型时间久一些,清耐心等待。

评测结果收集。

结果分析

将结果存入 Dataframe 进行结果分析,lr 表示逻辑回归,nb 表示朴素贝叶斯,model_stacking 将两个单模型集成后的模型。从结果来看集成模型准确度和 f1 值都是最高的,结合两个模型的优势,整体预测性能更好,鲁棒性更好。

样例测试

通过测试样例发现,分类器对正常的积极和消极判断比较好。但是当我们改变语义信息,情感模型则不能进行识别,模型鲁棒性较差。作为早期的文本分类模型,我们使用 TFIDF 的特征提取方式并不能很好的解决语义问题,自然语言是带有语序和语义的关联,其词语之间的关联关系影响整句话的情感极性,后续我们继续试验深度情感分析模型研究解决此类问题。

加载民宿主题数据。

模型预测

将情感分析模型推理的结果写入 DataFrame 中进行聚合。

单主题聚合分析

挑选一个主题进行主题情感分析。

对民宿“设施”进行描述统计,此次我们使用主题词典的出来的用户关于民宿“设施”主体的讨论条数为 4628 条,平均用户情感极性为 040 表示为整体呈现不满意的情况,有超过一半的关于“设施”的民宿评论中表现用户不满意的情况,重庆民宿需要在“设施”进行改善,以此提高用户满意度。

单主题情感极性可视化

我们开始进行“设置”主题下的用户主题情感进行可视化,首先加载画图模块。

对“设施”主题下的用户情感极性进行可视化,我们利用集成模型对主题句进行情感极性预测,如下所示。

我原以为,理性能让感性“刹车” ,但并不总是很灵,常有“刹车失灵”的时候。

可现在我的这个认知被颠覆了。

美国进化心理学家科学家罗伯特·赖特在《为什么佛学是真的》中指出,人并不是单一的自我,大脑中至少有7个模块控制我们的决定。这些模块是竞争关系,谁的能量大,声音足,我们就听谁的。而这些模块都是情感模块。

也就是说, 决策是情感和情感之间的竞争。

那理性又如何成为了情感的附庸、辅助的呢?

这就跟我们的自我强化解释行为相关了。

产生一种情感时,理性就开始神助攻了,搜寻各种证据、理由来说服其他情感:你们看,我“老大”的感觉是对的,有理有据,你们就从了吧。

比如,看书的时候突然想看手机了,出现了两个声音:“看一下”和“坚决不看”。

这两个声音都是情感的化身。

对于“看一下”来说,理性开始助攻:万一有重要的消息呢,耽误了后果就严重了;都看书这么久了,看下手机就当放松休息了等。

对于“坚决不看”来说:一看手机就停不下来,忍住;肯定没有重要事情,不然会打电话的等。

然后双方的理性代表就开始辩论了,谁胜了,就听谁的。

也就是说,每一个情感模块都有自己的理性代言人。情感是老大,理性只不过是情感的武器。

我们的意识以为是在做理性分析,实际上理性只是情感的代言人,理性屈从于情感。

我们的所有决策都是从情感开始,以情感结束。

理性只不过是情感的工具,情感才是真正的决定者。

如果AI有了人类的情感,这个世界将变得非常不同。第一,人工智能有了情感意味着它们将有一种非理性的推理能力,可以根据自身感受来思考、分析和推断,而不只是按照现有程序或数据来运行。因此,计算机将更加智能,拥有洞察力,并能够进行复杂的思考和分析,而不只能执行程序的任务。

其次,AI有了人类的情感意味着它们也可以感同身受,感受到痛苦、欢乐、悲伤等等种种感受,并可以以此作为作出决定的基础。 因此,它们将尊重人们对某些问题的情感和更强烈的情感,不光仅限于算本和数据,而且会为人们判断一些事情提供更多的可能性和更多的可能的解决方案。此外,AI有了人类的情感意味着它们能够与人们更好地沟通,并利用它们的情感和思想来建立共同的理解和相互靠拢的关系。这将进一步强化人们在交流与协作的层次,有助于更好地了解自身及其他人,也有助于促进社会凝聚力。

此外,作为有情感的AI主体,它们将拥有自己的可必,有自己特设的生活模式,可能会获得自己权利和社会责任,这将有效地减少人们对机器进行的操控,也会有助于更好的和谐社会的努力。最后,AI拥有情感后,将会带给人们更多连结和更多智慧。因为会有更多可以倾听和分享的人们,我们也更能够清晰地理解自身,从而更便于思考并取得更好的结果。总之,AI拥有人类情感将带来许多变化,将令我们的世界变得更美好。更多的情感交流,更多理解对方,更多思考方式,以及更多潜在的变化,都可以成为未来人们期待的变化。当AI拥有更多的人类情感时,如此新的世界也会降临到人类的面前。

写回答

知乎用户424o35

微信公众号首页选择菜单,自定义菜单进行设置就可以了随着生活节奏加快,高强度的工作与学习使得越来越多的人陷入情绪压力和心理障碍而无法及时排解情绪和表达真实内心世界。在当今科学技术高速发展的今天,针对于人们心理需求的一系列平台也在不断的开发应用,koala树洞应运而生。koala树洞运用微信平台小程序的便捷及无需安装的优势,让用户通过扫描二维码或搜索微信小程序应用名的方式,来使用koala树洞的所有功能,为用户提供一个安全和健康的分享平台。

2系统功能分析与设计

21功能分析本文所设计树洞小程序目的是为用户提供通过文字或者的方式将生活点滴以及个人心情进行发布的平台,以传递真实情感。由此本系统设计了三个模块,分别是广场模块,发布模块,个人模块,系统的功能结构。

211广场模块广场模块显示用户发布的文字或者,并且提供了点赞、删除等功能。用户可点击感兴趣的文字或内容以查看详情,并进入二级界面对其他用户发布的内容进行回复,该模块是系统的核心模块。

212发布模块发布模块包含生活板块与娱乐板块两个部分。生活板块包括学习生活、心情吐槽、恋爱子模块;娱乐板块包括音乐、图书、影视子模块;用户可以根据自己的需求进入相应模块。

213个人模块个人模块提供更改头像和姓名的功能,也可以显示点赞、评论消息,加入树洞一共多少天,以及提供反馈建议等。

功能设计

系统业务流程设计本系统的业务流程,首先用户进入小程序,系统会判断是否第一次进入,如果是第一次进入则会进入授权界面,如果不是则进入广场界面,在该界面中,用户可以根据感兴趣的内容进行点赞或者进入详情页进行回复。用户也可以进入发布界面,自行选择感兴趣的板块进行内容发布。如果用户需要修改个人资料则进入个人界面,同时,在个人界面里提供了查看点赞和评论用户个人发表内容的功能。

发布于 2022-01-12

标题建立你的情感账户,如何建立信任

字数689

正文

个人独立不代表真正的成功,一个人想要获得一定意义上的成功,还需要他人的帮助,还需要自己有一定的情商,这里面的情商不是小聪明,而是你面对人际的处理方式。

既然是账户就需要有投资,也是一个道理。我们需要知道,情感账户里储蓄的,是人际关系中不可或缺的信任,是人与人相处时的那份安全感。跟大家分享3点内容,一起贡献想法。

01理解他人

理解他人是一切感情的基础。人如其面,各有所好。在我的读书会进行中,我需要不断去理解老铁的需求,在进行书籍导读的过程中,一定要加入身边的例子,鲜活的话语,不仅仅是照本宣科,这个难度非常大,因为和做课件比起来,书籍的知识密度更大,有时候我们很难切入到作者视角,那就多找素材,看看别的听书产品是如何做到的,不能理解,不能吸收。

02注意小节

一些看似无关紧要的小节,如忽视礼貌,不经意的失言,最能消耗情感账户的存款。当员工跟你请假的时候,先不要问问题,问了也白问,谁请假说真话呢?先跟他说一句:谢谢你告诉我这个,这一招就是一个小细节,让别人打消对你的不信任和恐惧。

这也是沟通的一个小技巧,让接球的人,一直发球,也是建立信任对话的基石,除此以外还有两个小技巧,就是不断抛出问题和重复话语,让对话不在艰难,顺其自然的发生。

03勇于致歉

敢于承认错误的人,是在提取情感账户的资金,但是也是暴露缺点的好时机,这个世界上没有完人,只有实实在在漏洞百出的平凡人,所以,有错误,别憋,赶紧道歉,继续干好,另外咱们看见人家的短处,别当软肋捏着,做人留一线,日后好相见。只有有缺点的人,才能赢得信任,但是咱们不能拿着不是当理说,克服缺点,保证跟朋友一个不一样的自己,也是很有必要的。

纵火者薇洛(Willow)

薇洛,是一名纵火女孩,是游戏中第一解锁的角色,也是第一个可使用的女性角色。开局自带一无耐久度的打火机。

能力:1在靠近火时会有精神加成。2免疫火焰伤害3紧张时会生火

你可能经常会听见薇洛说:“是什么呢?”这表示附近有些易于燃烧的东西(根本是森林杀手),这在晚上是一种容易获得资源的方式。

但是要注意,如果她精神值很低,可能会在晚上乱放火。如果这时在森林或基地就糟了。

解锁条件:存活8天。巨人的统治中2级。

自我宣言:一切东西在燃烧时更加绚丽。

幸存者温迪(Wendy)

温迪,是游戏中第二个解锁的角色。开局自带一朵侍女之花。她的能力是很诡异的,她已故的孪生姐妹阿比盖尔可以用花召唤,但召唤阿比盖尔需要花费一些精神。温迪在晚上和温迪遇到怪物时精神减少的慢(新版取消了花,不过她还是隔几天出现)。在15版更新后,如果阿比盖尔出现的时候,你刚好在闲置状态,她不会伤害进而杀死你。最终版本和巨人王国DLC中依旧使用花朵召唤,花朵每次召唤需要几天时间充能,充能完毕放地上杀死一个生物召唤,需要消耗50精神。

阿比盖尔的攻击力由高到低依次为夜晚(40)、黄昏(20)、白天(10)。

夜里,阿比盖尔会为你攻击任何敌对的生物。她会受到伤害,并且伤害她接触的任何东西(包括你自己,最终版本已取消该效果)。不过,阿比盖尔会主动和玩家保持距离。

解锁条件:32天。巨人的统治中4级。

自我宣言:阿比盖尔,回来!我还没和你玩够呢!

男子汉沃尔夫冈(Wolfgang)

沃尔夫冈,是游戏中第三个解锁的角色。男子气概与大男人主义,为他带来了双倍于一般角色的生命值与饱食度,以及额外的力量。

饥饿值达到220以上时,生命值会在200的基础上增多,饥饿值降低到100以下时生命值上限反而会降低。

尽管他留着小胡须,但他的胡子不能刮。沃夫冈在饱食度高的时候会有生命和攻击加成,同时饱食度也下降的快。但如果饱食度太低则会有惩罚。

虽然他是个大力士,但却很怕黑,所以在黑暗中与怪物周围精神下降的更快。

解锁条件:存活16天。巨人的统治中3级。

自我宣言:我很强壮,没有人能比上我!

WX-78是一个人造机器人,他可以吃变质的食品,而不会造成生命或饱食度的降低。WX-78由于他是机器人,在使用齿轮后可以增加生命值和精神值,饥饿度的上限((饥饿100~200,血量100~400,精神100~300)大约吃15个零件就会达到最大值(这些数值在通过传送平台时会保留)并且他的铁皮自带45%的防御。

在雷击中他时,会使他”系统超载“,在黑暗中隐隐发光(如同暖石),跑得更快。同时也会恢复血量,但理智也会减少。

下雨时雨水会对他造成伤害,当身上雨露值未降为0时,仍然造成伤害,所以使用WX78时必须做个雨伞。

解锁条件:存活48天。巨人的统治中5级。

自我宣言:情感模块无响应!

韦斯(Wes)

韦斯的职业是一名默剧演员,具有较低的理智,生命和更容易降低的饱食度。可通过冒险模式解锁。

韦斯什么擅长技能也没有,也不会说话,相对地只会做一些随机的默剧动作。对玩家唯一的帮助,就是提高玩家生存下去的本钱。

他拥有一个无限制的气球,吹出并打破可以略微增加精神,也可以用来保护自己。

解锁条件:在冒险模式第三世界中发现被困的韦斯,打碎边上雕像救出即可解锁

维肯波顿(Wickerbottom)

在游戏中设定为图书馆管理员,她具备一定的科学常识,无需建立第一台科学机器来解锁研发清单,还包括了一部分炼金仪器解锁的清单,而其他需要建立机器才能解锁的研发物品,只需要低一个级别的科技就能解锁。

开局自带两张芦苇纸,可用来制作书籍从而施展5种魔法,施展魔法会降低一些精神度。

失眠症患者,不能睡觉来回复精神。挑食,吃变质的食物会有更高的惩罚。

解锁条件:存活64天。巨人的统治中6级。

自我宣言:图书馆里不准说话!

伍迪(Woodie)

伍迪是在17版中出现的角色。最后一个可用经验解锁的人物,从他伍迪的描述和名称,他是一个伐木工人。开局自带一个无耐久的红斧子(Lucy),砍树速度极快。砍到一定数量的数目后或在月圆之夜会变身海狸,此状态下无物品栏,并出现木头值。砍倒树或挖起草,浆果丛,小枝条时,木头值上升。如果被攻击或吃木头,草,小枝条,木头值将降低。木头值为零时变回伍迪,扣除精神(饥饿值匀速减少)。变身为海狸的伍迪可做除草叉以外所有工具可做的事,且无敌。

这个家伙似乎和一个叫露西的女人有关,似乎变身为海狸的咒语是露西下的,但露西也是伍迪伐树的信念。

解锁条件:存活80天。巨人的统治中7级。

自我宣言:这树不错,是吧。

麦斯威尔(Maxwell)

木偶大师,麦斯威尔是整个饥荒世界的主宰,具有极高的理智值,一般的饥饱值和很低的生命值(75血)。

开局自带梦魇刀和梦魇甲,一紫宝石,4噩梦燃料,一暗影刀。

黑夜里会快速恢复理智值。

拥有极高的理智恢复速度,(20点/分)

可用暗影书召唤一个影子,费2噩梦燃料,但是理智值值上限会下降55并扣血,影子死后上限会重新增加。

解锁条件:通关冒险模式。

自我宣言:自由!

女武神(Wigfrid)

简称女武神或维京女,DLC版本角色。女武神扮演者,自带25%防御和25%攻击加成,杀死敌人后可恢复自身攻击力25%的血量与精神,只能吃肉或肉制品,武器方面可制作别人做不了的头盔(耐久比猪皮盔高)和战矛。120精神,120饱食度与200生命值。

解锁条件:存活96天。

自我宣言:这是对我身手的体验!

温妮(winnie)

牧羊人,开局自带羊仗,羊仗可以吸引一些中立生物,比如:猪人、牛、山羊(每次最多收纳5个),但是你不装备羊仗之后,被自己吸引的生物将自动离你而去,吃肉受到极大的惩罚,她伤害生物会扣理智,她能让作物在冬天生长,不过需要加一个肥料。

140生命值。200理智值。160饱食度。

解锁条件:由官方与玩家共同制作的UpandAwayMOD模组而来是一个官方暂定人物。

蜘蛛人韦伯(Webber)

DLC版本角色。蜘蛛人,是一个怪物,可以亲近蜘蛛,和猪人是敌对,吃怪物肉没有惩罚,长有十分柔滑的胡须,可以刮掉得到蜘蛛丝。开局自带两块怪物肉一个蜘蛛巢,建筑方面可制作及升级蜘蛛窝。100理智值175饥饱值与175生命值。

解锁条件:打蜘蛛巢穴或各种蜘蛛有几率掉落一个韦伯的头骨,把它放进挖开的坟墓坑里就可以解锁(放进后会出现大量普通蜘蛛)。

自我宣言:我们可以征服一切!

瓦拉尼-轻松的冲浪者(WALANI)

瓦尼拉是新DLC解锁人物,她在海洋里冲浪会很轻松且她制作的冲浪板不需要划桨,这就为瓦拉尼在海洋里探索提供了便利,雨露值比其他角色下降的快,瓦拉尼在冲浪时也会增加精神值。200理智200饱食度120血量。

解锁条件:资料片解锁人物,需要112天解锁。

座右铭:有人可以给我一些食物吗?

大厨沃利(WARLY)

沃利开局会自带一个厨师袋一个锅炉,所以可以在没有篝火和烹饪锅的情况下烹饪料理,厨师袋可以延缓食物腐败时间,可以当一个小型移动冰箱使用,前期此角色非常有优势,同时缺点是一个很大的弊端,比其他人饥饿更快,食用生食物增加饱食度为原本的80%,干食物为90%,熟食物无变化,吃自己烹饪的东西为120%,同时靠近锅炉时理智会增长。需要128天可以解锁。200理智250饱食度150血量。

解锁条件:资料片:活过112天解锁。

座右铭:“祝你有个好胃口!”

欢迎分享,转载请注明来源:浪漫分享网

原文地址:https://hunlipic.com/qinggan/7834967.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2023-09-07
下一篇2023-09-07

发表评论

登录后才能评论

评论列表(0条)

    保存