求每幅图带有一句人生哲理或情感哲理的话的漫画书---------三Q------

求每幅图带有一句人生哲理或情感哲理的话的漫画书---------三Q------,第1张

有一些哲理漫画,如下!

张砚钧哲理漫画

张砚钧哲理漫画

张砚钧哲理漫画

张砚钧哲理漫画

张砚钧哲理漫画

人工智能产品的定义较为广泛,智能硬件、机器人、芯片、语音助手等都可以叫做人工智能产品。本文讨论的人工智能产品主要是指在互联网产品中运用人工智能技术。

互联网产品主要着手与解决用户的痛点,对于C端产品来说,痛点就是指的个人想解决而无法解决的问题,如个人想要美化自己的照片,但是他不会复杂的PS软件,于是美图秀秀就可以解决这个痛点。从KANO模型中,就是满足用户的基本需求与期望需求。

人工智能产品(在互联网产品中运用人工智能技术)则是要满足用户的兴奋需求。如将情感分析运用到电商的产品评论中,用户则可以通过可视化的数据展示来大致对产品有个全面、直观的了解,而不再需要自己一页一页的翻看评论内容。

互联网产品主要关注点在于用户需求、流程设计、交互设计、商业模式等。着眼于用户需求,设计满足用户需求的产品,通过合理的流程设计、交互设计达到产品目标,进而实现商业目标。典型的思路是发现用户需求——>设计满足用户需求的产品——>迭代完善、产品运营——>商业变现。

人工智能产品关注点在于模型的构建,它不再是对于布局、交互的推敲,而是通过选择合适的数据,构建合适的模型,最终呈现出来的是好的效果。什么是好的效果呢?这就需要引入评测指标。互联网的评测指标有我们熟知的留存率、转化率、日活跃等,那么人工智能的产品主要是通过一些统计指标来描述,以情感分析为例,把情感分析看成一个分类问题,则可以使用P、R、A、F值来描述。

1)查准率(Precision):P值,衡量某类分类中识别正确的比例,如情感分析中,有10条被分类为“正向”,其中8条是分类正确的(由人工审核),那么P=8/10=80%

2)查全率(Recall):R值,又叫查全率,又叫召回度,指的是某类被被正确分类的比例,同样以情感分析为例,100条数据中有10条是正向的,机器分类后,这10条中有7条被分类为正向,则R=7/10=70%

3)F值,因为P值和R值通常是两个相互矛盾的指标,即一个越高另一个越低,F则是两者综合考虑的指标,不考虑调节P、R权重的情况下,F=2PR/(P+R)

4)精确度(Accuracy):这个最好理解,就是被准确分类的比例,也就是正确率。如100条数据,90条是被正确分类的,则A=90/100=90%。

以上指标越高,说明模型效果越好。

我们从上面内容可以知道,人工智能产品设计关注:数据——>模型——>效果评估。

现在我们以情感分析为例子说明产品设计的过程。

1)数据:

数据的选择对最终模型的结果有直接影响,情感分析,根据不同的目的,选择的数据也不同。如将情感分析运用于**票房预测,则一些更新及时、内容丰富的数据源,如微博,是比较好的选择。如果是应用于商品的评价,如电子产品,很多评测内容是无法在短短几句话内描述清楚的,这时候微博不是个好的选择,选择论坛上更新较慢、但是详细的内容就比较适合。

如果能在产品的早期就有引入人工智能的打算,则可以在产品中事先做好数据采集。

2)模型:

在选择模型中,产品需要了解不同的模型的优缺点,进而选择更加合适的模型。在情感分析中,NB、SVM、N-gram都是常用的模型,其中SVM效果最好(这是已有的结论),如果是其他的智能产品,可能需要算法团队进行实验,给出测试数据,进而选择合适的模型。

3)效果评估:

效果评估在上文中已经描述得比较清楚,具体指标不再赘述。

4)产品呈现:

最后这一步,是将结果展示给用户。在情感分析中,我们可以选择雷达图、词云、情感趋势图来展示结果。取决于产品属性,如电商产品评论挖掘,可以使用词云;

如舆论分析,可以使用情感趋势图。

人工智能产品的设计要关注:数据、模型、评判、呈现。

在微信中,"emo"是 "emoji" 的简称,用于描述表情符号,其中 "emoji" 是一个日语词汇,最初指的是带有情感表达的图标和符号,现在已成为一种广泛使用的符号文字。"emo" 是一种快速方式,通常用于快速表达情感,强调语句或添加一些幽默或表情。 在微信心情或状态栏,emo 往往也用于描述用户当前的情感或状态。通过选择不同的面部表情或符号,用户可以表达自己的情感或状态,同时与好友或关注者分享自己的状态或感受。

许多人都还不知道,在情感领域里,有各种闷声发大财的玩法:

塔罗、占卜、挽回等等,

月入十几万、年入上千万的比比皆是!!!

玩法十分的简单:

用放大一方委屈和扎心文案,可以瞬间说到判断力浅薄的人心里去,

而这一类人是金字塔的底部,人口比例最大。

用简单的方法,挣更多的钱,

下面就带着大家,专注如何3分钟制作一个抖音情感视频,月入5000+,好了,还是废话少说,想赚钱的就继续往下看吧。

内容输出方式

情感类短视频是各大短视频平台创作数量最多的领域之一,在情感的共鸣下,账号极容易获得粉丝的认同,也容易迅速走红。其内容输出方式也十分的简单:

1、真人出镜类

真人出镜,在抖音上最常见的表达方式就是情感教学,以过来人的身份,或站在对方的角度,分析一段感情中他的心态,在配上一些精心打造的金句,往往视频很容易受到热捧。

这一类视频主要以真人视频展示,以打造个人IP为主,粉丝的粘度比较高。素材直接通过百度寻找即可,找情感类的垂直网站,很轻松解决音频解说的那部分,按找来的资料自己读一遍就可以拍出来了,是不是很简单?

对于出镜的主人公,基本上没有什么要求,不一定非要多漂亮或帅气,看起来干净清爽就可以了,但要保持一定的风格,这样才更有辨识度,更有利于打造个人IP。

2、混剪类

主要是进行二次深加工为主,包括、视频,素材也是来源于网络。比如可以找情感综艺节目,剪辑其中经典片段,音频解说部分可以用原音,但要换个场景做出来,背景图可以是风景,也可以是情感,去各大网站找一些,但要注意版权问题。

3、情侣聊天类账号

这种制作最简单,利用两个微信自己对话,或也可以下载软件对话,生成就可以了,内容直接用同行文案,或自己去网上找一些能引起共鸣的文案,都可以。

做情感账号一定要切中用户的痛点,只有这样才能与用户达成共鸣,让用户给你主动点赞、关注、转发。

引流与变现

情感号属于泛娱乐类账号,粉丝群体都是泛粉,这类情感号变现方式比较简单粗暴,往往一个热门视频就很容易给人个号带来巨大的精准粉丝流量。

1、引流转化

这个是获取用户非常好的方法,可以通过主页简介、主页背景图、评论区引导留个人微信号等方式,将抖音上获取的公域流量,引流转化成私域流量,再通过输出干货等方式提高朋友圈价值,打造朋友圈,卖情感课程,课程可以直接去某宝购买。

2、接广告任务

直接在推广平台上接任务赚钱,在作品下添加带有小程序链接的文章,吸引用户点击,用户付费使用小程序内的产品就可以获得佣金,按流量和转化率赚钱。一般的推广任务都是接一些星座、测试、算命的小程序推广。

3、情感咨询

通过付费咨询帮助客户解决情感问题,可以按时间的长短收费,语音、视频方式都可以,按你最擅长的方式进行,只要能更好地帮助粉丝解决情感疑惑即可,不会解答也可以去某宝找情感咨询师,或同行,对接服务,你做流量,他们做服务,达到双赢。

4、直播带货

直播带货兴起后,“带货”也成为情感类博主的一个赚钱选项,而销售相关领域书籍、或情感类的小产品,如情侣对戒等等成为首选。

5、做培训收徒

这也是不错的变现方法,可以教别人做抖音情感号,提供教程变现,服务对接课程等等。

小结

现实中很多人都会遇到各种情感问题,因此这一块是永远都不会缺少客户的,而你要做的,就是听话照做,只要坚持去操作,效果都不会太差,情感类的视频制作简单,易上手,就算是新手朋友,也很容易学会,3分钟即可制作一个视频,每天多制作一些视频,这样爆的几率会更大,只要有了爆款,粉丝上涨的速度是很快的,有了粉丝就是个傻子也能变现!!!以上就是今天的分享,希望对你有所帮助。

也许是因为我在视觉设计上没有太多经验,我发现平常在与视觉设计师讨论设计方案时,我们常常讨论的是:“我觉得这样布局很奇怪”、“我觉得A不太好看”、“这个地方给我带来了某种XXX的感觉”、“这样显示会不会给用户带来某种误解”……

不难发现, 大多数时候我们讨论的是一种捉摸不透的“感觉” 。视觉设计固然需要美感和源于直觉的创造力,但是 作为一个“设计”领域,它需要有更多理性的思考 。为什么应该是这样?这对用户的情绪和行为带来了怎样的影响?我们需要一些研究结果和经验法则作为参考,知其所以然才能做出好的设计。

为网站、APP或产品设计一个漂亮的用户界面需要技能、天赋和灵感的特殊组合。

但是用户界面的设计不是漂亮就行。它应该帮助用户去做他们需要做的事情。

为了创造出不但有吸引力,而且能够服务于用户体验的设计,你需要清楚地认识到你的设计决策是如何帮助或者阻碍你的用户的。

我们在UserTesting执行和分析过数十万个可用性研究,从中看过了很多有效的(以及不那么有效的)视觉设计决策。现在我们想分享一下我们从这些研究中学到的东西。

你将会学到如何做出对用户友好的设计决策,并且为你的公司带来最好的结果。

在设计师的工具箱中,颜色是最有力的工具之一。

你可以使用颜色去影响用户的情感,吸引他们的注意力,把他们置入适于购物的情绪体验中。颜色同时也是客户对一个品牌认知的主要因素之一。

由于可能的颜色组合是无限的,很难去决定哪种颜色会对你的网站或应用产生最大影响。去测试所有的颜色是不可能的,但是我们总结了关于颜色如何影响用户的态度和行为的一些技巧和趋势。

基础颜色理论的原理是雕琢用户体验的一个重要起点。

互补色可以用来吸引观看者的注意力并且创造活力,而类似色可以用来在设计中创造协调感和一致感。考虑一下在主页或者主屏幕上你可以如何使用互补或类似的配色方案,去为用户奠定基调并且让用户进入能够促使他们采取你期望的行为的心态中去。

当你在文本中使用颜色时,记住把两种低对比度的颜色放在一起会使它们非常难以阅读(不管它们是互补色还是类似色)。

在手机屏幕上尤其如此,因为用户更可能在户外或者明亮的地方使用手机以致屏幕比较刺眼。

(译注:原文描述了他们做的一个关于颜色偏好的性别差异的研究,但由于样本只有50人且差异不大,在此不译,感兴趣的同学可以查看原文。)

众所周知,颜色可以唤起情感,以下是传统上与颜色关联的情感:

很多著名公司在客户购买之前很久就已经用颜色唤起了特定的情绪。

客户也会将颜色和特定的行业建立联系,比如蓝色和科技,绿色和健康,红色和快餐。当有些公司为了匹配客户期望而选择用行业通用色时,有些公司发现反其道而行之可以快速让人留下印象。

举个栗子。在旅游业中,蓝色对于网站和应用来说是非常常用的。看一看下面这个网站主页:

蓝色代表着可信赖,这对旅游公司来说是一个好事。但是旅游网站使用蓝色并不是一个铁则。

维珍美国航空在设计网站时就选择了反其道而行。

当它与用户对航空网站的期待不同时,就会显得比较突出。选择一个意料之外的颜色可以有效地让用户体验到高兴,并且让他们记住你的公司。

你的网站或应用对有视觉障碍的用户来说是什么样子的?

大约8%的男性和05%的女性 患有某种形式的色盲。色盲有多种情况,但红绿色盲是最常见的。红绿色盲患者无法区分红色,绿色和具有相似值的**,尤其是当绿色中含有的**比蓝色更多时,比如下面的橄榄色背景色。

如果你不得不使用对色盲患者来说难以区分的颜色组合,你仍然可以通过提高颜色之间的对比度来保证可及性。比如下面这张图使用了非常暗的红色和非常亮的绿色,不管是否色盲都很容易看清楚。

还有一些关于可及性的要点:不要忘记那些可能在使用屏幕阅读器访问你的网站的用户。你是否曾经在填写表格的时候收到一个错误信息,比如“标红的字段是必填的”?这对于那些无法看到红色字符的人来说是极其糟糕的体验。最好避免在网站或者应用中提到颜色,并且提供更加具体的错误信息,比如“邮件地址是必填的”。

可及性测试工具

有一些很棒的工具可以帮助你测试网站的可及性。

有些优化转化率的专家会声称对按钮来说最好的颜色是大胆的、吸引眼球的红色,但也有人说绿色最佳因为绿色表示“开始”。

有大量的A/B测试显示了CTA按钮(CallToAction)的颜色改变会对转化带来极大的影响。HubSpot在以前仍叫做Performable的时候分享了这个著名的测试:

尽管他们原来预测绿色按钮会表现得更好,但是红色按钮带来的点击量高了21%。但是他们仍然提醒读者,这个测试结果本身不应该使所有人都把按钮变成红色。可能的解释是他们的用户就是喜欢红色,尽管其他的用户可能更喜欢绿色。或者,更可能的情况是,这个红色按钮得到了更多注意是因为它是这个页面上唯一的红色物体。

坏消息是并不存在一种魔法颜色能在所有网站上都表现最优。好消息是有一些经验法则可以帮助你有效地使用颜色。

对比是关键

这看起来很明显,但是我们还是要说:如果你希望用户点击某处,你要让它足够突出。如果你的网站或应用使用了很多橘色,用户可能不会马上注意到一个橘色的按钮,不管这个橘色按钮在其他公司的A/B测试中表现多好。

在我们的研究中,我们让用户指出他们在每个网站上首先会点击的东西。不出意料,用户更可能点击与背景形成强烈对比的CTA按钮。

明亮令人难忘

在上面提到的那个50人的研究中,我们问的最后一个问题是用户访问的哪个网站最令人印象深刻。

50%的用户选择了明亮的网站。有趣的是很多选择深色或者白色网站的用户是出于一些与设计无关的原因。比如一个用户认为Dropbox是最印象深刻的因为她已经有了Dropbox账号。

文字的主要目的是帮助用户去做你需要让他们做的事情——不管是探索产品,学习如何玩一个游戏,还是浏览一些令人愉快的故事。

遗憾的是,在网站和应用排版中有很多相互矛盾的选项,并且没有一个适用于所有情况的严格规则(否则事情也太简单了吧)。但是你可以做一些事情,以保证你为网站或应用选择的字体对你和你的用户有所帮助,而不是跟你唱反调。

文字的尺寸和布局会对在线阅读的体验带来巨大影响。年龄较大的人或者有视力障碍的人在面对小字的时候尤其痛苦。即使是视力正常的人盯着屏幕太久后也会觉得疲劳——当他们为了阅读不得不斜视或者放大时会感到激怒。

看看下面这个例子:对于台式机来说,正文较好的处理方式是每行50-75个字符,字号不低于16pt。

关于文本颜色和可读性,有两种不同意见:

应用多少对比度需要微妙的平衡。因为屏幕之间的差异太大,在设计师的屏幕上显得足够深的灰色在用户的屏幕上可能更淡。

在手机上有足够的对比度尤其重要,因为用户可能需要在户外或者明亮的地方使用。

W3C网站内容可及性指南 是一个不错的开始。他们设定了最小对比度的标准,保证适度低视力的用户能够阅读你的文本。你可以使用一个 对比率工具 快速找到你设定的对比度是否在合适范围中。

但是纯黑的文本(#000000)对于诵读困难者来说更难以阅读,并且经过长时间阅读后会导致眼睛疲劳。

很多设计师选择使用非常深的灰色或者实际的黑色(而不是纯黑),比如#0D0D0D,#0F0F0F,或者#141414。

一旦你选择了颜色,让真实用户在自然环境中使用任何你能想到的设备试用是绝对需要的。如果任何测试用户在阅读你的文本时遇到了麻烦,那么有理由相信你的客户正在遭遇相同的问题。

在传统的印刷排版中有个常识,衬线字体可以通过在水平方向上温和地引领视线而提高可读性和阅读速度。

但是关于这两种字体的实际区别的研究结果非常不确定。我们需要自己做试验,所以我们做了一个研究,让30个用户阅读两个除了字体之外完全相同的页面(A使用的是Arial,B使用的是Times New Roman),并测量阅读时间和理解程度。

我们得出的结果同样是难下定论的。

阅读非衬线字体页面的用户平均阅读速度高了9%,但是差异没有达到统计显著水平。并且,用户的理解率也非常接近:阅读衬线字体页面的用户的理解分数高了1%,同样也是不显著的。

唯一值得注意的区别是阅读衬线字体的用户抱怨的次数是另一组的两倍(表示段落很难阅读的用户在衬线字体组和非衬线字体组分别是6人和3人)。

所以衬线字体有什么问题呢?

首先,衬线改变了每个字母的轮廓,所以它们对有诵读困难症或视力障碍的人来说更难识别。

第二,因为这些水平线非常小,它们在低分辨率的老计算机屏幕上显示效果很差。(智能手机和平板上的Retina屏幕有更高的分辨率,会让衬线字体更容易阅读。)

这意味着我们在电子产品上只应该使用非衬线字体吗?

绝对不是。这只是意味着当你选择使用衬线字体的时候,要确保使用干净而准确的在线字体,并且——你知道的——用真实用户去测试你的选择。

你选择的字体是用户在你的网站或应用中的整体体验中的主要部分。考虑完整的情境,而不是只是在设计的时候依赖某些规则。

你的用户期待什么?

有什么更复杂的东西吗?乐趣?极简主义?在访问网站或打开你的应用之前,用户对你的品牌已经有哪些了解?你想要创造怎样的第一印象?

客户在使用什么设备?

对于大多数电子设备来说,你的用户会在火车上,在电视前,在阳光明媚的露台上阅读你的文本。确保保持他们的注意力,不要用难以阅读的文字把他们赶跑。

用户试图完成什么?

购物?学习?娱乐?确保你提供的体验与用户的需求(以及你的商业目标)相匹配。

如果你希望客户快速理解你的产品特点以便他们决定下单,那么选择让他们瞄一眼就能够理解的字体。如果你希望用一个长而吸引人的故事保持读者的注意力,那么选择让用户容易保持盯住页面的字体。

不管设计的是网站还是应用,在用户界面上的任何图标都应该为某个目的服务。当然,图标的存在是为了节约屏幕空间。但是更重要的是,图标应该帮助你的用户。如果得到正确的处理,图标可以帮你指导用户快速而直观地完成任务,而不需要过多地依赖文本。但是如果处理得不好,图标也会迷惑用户,把他们带向错误的路径,并摧毁他们使用产品的体验。

因为有很多的应用和网站都在使用令人迷惑的图标,我们想知道一个问题:让一个图标达到用户友好需要做什么呢?

我们做了一个远程可用性研究去探索移动应用上的图标带来的用户体验。我们观察了35个用户与一系列安卓应用上的190个图标的交互过程。有些图标是很明显的,比如放大镜表示搜索功能。有一些不太明显,比如一个旗帜表示群成员。有一些有文字标签,有一些则没有。

令人舒服的图标

有一些图标几乎是通用的。一个房子形状的图标会带你到主页或者主屏幕,一个购物车会让你购买东西,这都是相当安全的猜测。

在大多数情况下,图标不是一个用来发挥创意的地方。你可以依赖其他设计元素去传达品牌信息。你的图标的首要工作是指导你的用户到他们想要去的地方。用奇特的或者过度聪明的图标表示基本功能,会摧毁用户体验。保持简单就好。

令人迷惑的和矛盾的图标

当你使用有着矛盾或者多重含义的常用图标时,麻烦就来了。

想象一下你在一个应用中的一张下面看到这个图标。它表示什么?如果你点击了它会发生什么?这个图标是用来表示你喜欢某些东西,这非常清楚。

但是它会把这个或项目保存到收藏夹列表吗?它会通知某人你喜欢了它吗?它会塑造你的偏好并在你的信息来源中添加相似的或项目吗?或者它只是对支持的一种通用表达?

就像这个心,有很多图标我们常常在多种情境下见到,但是它们在不同图标中的的功能都稍有不同。考虑以下这些有多重含义的常用图标:

即使是在应用本身的情境中,这些符号也可能很令人迷惑,用户可能期待某个结果但却得到了一个不同的结果。

更别说iOS和安卓系统惯例的不同了。不同操作系统的栏图标可能非常不同,给用户带来了额外的困惑。如果你对这件事情不太确信,请阅读这篇描述了 分享图标的12种变化 的文章,其中几种很容易被误解为其他东西而不是分享。

过时的图标

很多常用的图标参照了过时的或者废弃的技术。很多应用中保留的保存图标,对于大多数使用过软盘的人来说没有问题,但很多95后会认为这些老人家们坚持使用这种图标是个怪癖。继续使用像软盘这种图标会让你的品牌对年轻用户群来说显得过时。即使是电话图标也可能需要演变,因为年轻的用户已经不太能够辨认出电话机了。

独一无二的图标

最棘手的图标挑战之一是当你的产品有独一无二的功能,不在分享、喜欢、上传、输入文本等标准动作之内时,应该怎么做。你如何使用一个简单的符号传达更加抽象的概念——比如观看你即将到来的旅游,向朋友发送一个有声读物,查看你的历史订单,或者追踪你的睡眠模式?

很多设计师在做尝试,很多设计师失败了。无论在你知道一个图标应该代表什么之后图标具有怎样的意义,对于第一次使用的用户来说它都可能带来完全不同的体验。

这并不是说如果你想要创造一个可用的用户界面,就不能远离通用图标。有一些独特的图标不管对新用户还是老用户来说都能有效地传达它们的意义。

推特著名的羽管笔图标就是很好的例子。尽管没有标签,在我们的研究中仍然有80%的用户正确地猜到它是干什么的。

针对于那些认为一图胜千言的人来说可能会有些失望:

我们很容易期望用户(尤其是手机用户)会到处点,高兴地尝试所有不同的图标直到他们发现了每个图标是干嘛的。

但实际上,用户会被新的用户界面吓到并且不会像我们期望的那样在他们的舒适区之外探索。在一个不熟悉的产品中,用户想要在采取动作之前就清楚地知道这样做会发生什么。

你的图标需要在用户点击之前为用户设定清楚的期望,而这通常意味着使用文本标签。

我们的研究结果:有标签VS没有标签

在我们的研究中,我们发现对有标签的图标来说,在88%的情况下用户能够在点击之前正确地预测将会发生什么。

而对于没有标签的图标来说,这个比率只有60%。

并且如果没有标签的图标在应用中是独一无二的,那么用户在点击之前正确预测将会发生什么的比例只有34%。

比如说,Meetup应用使用一个名牌图标表示小组活动并加上了一些额外的品牌识别。但是,因为一个空的名牌不会让大多数人想起活动或者通知,所以他们增加了标签。100%的测试参与者能够正确地猜测出这个加了标签的图标能干什么。

有一些设计师发现加标签违背了使用图标的目的,并且使用户界面显得杂乱。为了避免使用标签,他们在教程或者引导页面中加上了关于使用图标的说明,希望训练用户如何与图标交互。

虽然这可能是用来介绍独特的或者不通用的图标的好方式,但是 这不应该替代更加直觉化的设计。 记住一件事:用户常常跳过教程或者很快地忘记了他们学过的一切。教程应该是一个工具,而不是一个依靠。

在做一个新的设计的时候,跟随最佳实践比如高对比度按钮和可读性强的字体是一个很好的开始。但是最终,正确的设计决策是能够带来预期结果的那个。去发现你的设计决策是否给用户带来直觉并且以你希望的方式影响他们。

验证你的假设

把你的设计当做是你需要常常去验证、反证或改进的假设。这会给你信心去尝试很多实验并发现什么才能够带来最好的商业结果以及愉悦你的用户。

做定期的用户测试,去听用户如何描述他们在使用你的网站、应用或者产品时的体验。你将会听到他们描述你的品牌与什么情感联系在一起,你会看到很多因为令人疑惑的图标或者难以阅读的文字而让他们感到困惑的地方。

但是你不必等到有了一个开发完成的真实的产品才能去收集用户反馈;你可以在原型设计阶段就开始用户测试。这会帮助你验证你的设计决策并带着信心继续,或者快速发现和修复所有不起作用的设计。

如果你的设计已经实现了,使用A/B测试验证你的设计决策是否影响了用户行为,转化率以及以你期望的方式带来的收益。

这是当你在验证你的设计时可以询问用户的一些问题:

如果你的设计决策对用户起作用并且能够指导他们使用你的用户界面,那么用户就能够完成你期望他们完成的事情了。这不只是一个有效的设计——这也是一种巧妙的商业行为。

翻译自:

http://downloadsusertestingcom/white_papers/UserTesting_eBook_Designing_a_brilliant_UXpdf

我在 《爬取百万页面 分析用户画像》 中分析了用户的书籍喜好,这里继续尝试通过影评文章的抓取、内容清洗、影评句子提取,建立机器学习情绪预测模型,挖掘分析用户对流行**的喜好。

涉及的NLP(自然语言处理)知识点:

涉及的ML(机器学习)知识点:

**的拍摄成本高、票价也不低,消费者投入的关注度和观看成本高(最终的投入成本是包括注意力投入、金钱投入、时间投入和感情投入)。

简单算下观看一部**的成本(步骤):先看下预告内容,做下同期上映**的比较,觉得导演、演员阵容都不错,下定决心要看了,跟男/女友/老婆 /老公/基友/闺密做推荐,推荐成功后去选座买票,观影当天说不定还得先吃个饭,饭后乖乖的在影院呆上90分钟(关键时刻还得憋尿),观影结束后指不定还得来个夜宵、开个房间探讨下人生什么的。。。

读一本书的成本(步骤):1打开书/电子阅读器/手机;2 读!

这样对比看一部**比读一本书的投入成本高多了!

因此观众给出的反馈自然也比书籍会强烈一些,特别是满怀期待看完却发现是一部烂片,有种上当受骗的感觉。

因此对**光是通过词频作为喜好度是不够的,用户可能反复的在骂呢。

所以需要引入多一个分析的因子:情绪。用户提及某个**时的情绪是怎么样的,是积极愉悦、还是负面愤怒,加上这个才能有效判定用户对**或者某个事物的喜好。

在豆瓣上,用户的评分就是最直接的情绪数值:5力荐,4推荐,3还行,2较差,1很差。

但在这类写作平台上,发布文章时是没有一个选项来填写分数,也没提供选择心情的选项。

“所言即其所思”,这是普遍人性。每个用户写下的文字表达想法,在字里行间都会不经意的使用一些情绪用词来表达,这些便是我可以获取的“原始数据”。

精准推荐!用户谈论得多的东西未必是TA所喜爱的,也许是TA痛恨的(比如说前任)。如果用户在自己大力差评某部**的文章底部看到另一部相似烂片的推荐,推荐文案还写着“亲,我猜你还喜欢看这些”,估计这用户会有种吃了苍蝇刚吐出来发现迎面又飞来几只的感觉。

通过用户在讨论某事物时上下文的情绪分析,来判断对该事物的喜恶,将预测结果加入对事物的打分计算中,最后得出一个可量化、可计算的分数值,便是一个精准推荐系统的需要解决的问题。

理论上只需要一句话:要识别出文章中提及的**,以及作者对该**的评论,是好评还是差评,作为文章作者对该**的喜恶,并根据评论的情绪强烈程度转化为喜恶程度即可。

那实际上,就要解决以下问题:

下面逐一细说。

我采集了上几个比较受欢迎的**专题以及一个大V帐号文章(数据截止至采集数据时):

但由于对专题页面加了访问限制,每个专题只能访问到最新的200个列表页面,因而每个专题可获取2~3000篇文章,以此作为抽样数据样本。

要分析对**的评价,首先就要获取到文章中提到**名称有哪些,最简单的匹配规则便是提取书名号 《》 内的内容。

而实际获取到的**名称真可谓“脏乱差”,有**名、书籍名、文章名等,有些**名称会用缩写引用(如《变1》、《复联》、《生化危机4/5/6》),或者中英文混合在一起(如《机器人总动员(wall-e)》),甚至还有错漏别字(如《那些年,我们一起追过的女孩》,多了个“过”字),以及包含中英文特殊标点空白符号等,例如:

因此需要进行一轮“数据大清洗”,我使用如下清洗策略:

其中“**专用词典”,是通过采集了 「猫眼 影片总票房排行榜」 2000~2017年间上榜的所有**,约有3000+部,如图:

再根据文章中所收集到的**名称的候选文本,抓取「豆瓣网」的官方**名字(遭遇了豆瓣业内闻名的反爬策略就不多说了),合并去重后约有8400多部。看一眼才发现好多**连听都没听过,有些**名称还挺有趣,以后有时间还可以做下**名称的分析。

为了解决错别字,我通过文本相似性算法,在**专用词典里找出与之最相似名称。

知名的相似算法有不少,如:

经过简单比较,我选择了其中表现最好的 jaro_winkler_distance

运用到文章内容上,可得到相似**名称,感觉效果还可以:

构建一个Pipeline用于提取页面中**名称,对单个页面测试效果如下:

运用到所有页面上:

至此完成了**名称的提取、清洗,得出每篇文章提及的**名称,如图:

判断一篇文章的情绪,最简单的做法是通过提取所有情绪词来统计下词频及其权重可得到一个粗糙的结果,但这样的结果对“影评”类文章不是很准确。

根据观察,一篇**评论文章中,往往会有大段的**情节描述,然后夹杂一两句评论。而有些**本身剧情就是比较负面、阴暗的(如灾难片类的),但影片本身质量很高(如《釜山行》,豆瓣评分82),如果文章内容包含大量的剧情描述,那么得到关键词会偏向于负面情绪,并不能用于表达出作者对**的喜好情绪。

因此我使用了这样的提取策略:

评论句子提取的结果示例如下:

这样的策略对有些内容不是很适用,例如这样的标题:《同样是豆瓣92分,它或许比《摔跤吧!爸爸》更深》,这是典型的“借势营销”型文案,文章内容中推介的是另外一部韩国**《熔炉》,而时下《摔跤吧!爸爸》正热,标题中带上这个会更吸引用户点击。

另外一个思路是对文章进行摘要提取,然后对摘要进行情绪识别。而对于文章的主题提取,可以使用在ML算法中的用于解决 主题模型 问题的算法(如LDA),但不确定是否适合影评这种混合了大量剧情描述的文章内容。

得到相关评论文本后,便可对文本进行分词及情绪识别,这里有两种做法,一是使用带有情绪情感度的专业词典,配合专有算法;另外一种是使用机器学习算法。

一开始我使用了大连理工大学的《大连理工情感词汇本体库》,是目前最权威的中文情绪词典,共含有情感词共计27466个,包含了词语的词性种类、情感类别、情感强度及极性等信息,例如:

中文情感词汇本体的情感分类体系是在国外比较有影响的Ekman的6大类情感分类体系的基础上构建的。在Ekman的基础上,词汇本体加入情感类别“好”对褒义情感进行了更细致的划分。最终词汇本体中的情感共分为7大类21小类,如图:

把情感词典加入分词词典,对候选每个句子进行分词,得出情感词组,并累加每个情感词的强度值作为句子的情感值。

但经过测试后,发现预测效果并不理想,究其原因发现是情感词典中命中的词语太少,在句子中得不到相关词语,也就无法判断情感极性和强度。

使用情感词典的测试结果:

而专业词典的扩展需要专业领域知识,扩展起来很困难,我目前没找到更新的专业词典,国内这块的资料相当匮乏,而国外有个知名的SentiWordNet库,中文NLP研究的难度系数可想而知。

鉴于情感词典的资源限制,决定尝试使用机器学习来对文本做正、负面情绪预测。

1) 构建分词词典:

分词需要构建专用领域的词典,这样得到的分词结果才会更精确。

因为只需要有正负情感类别、不需要有情感强度及极性等信息,我使用了网络上公开的一些情感词典,:

合并、清洗和去重后,最终构建出了 14000+ 个词的积极情绪词典, 18000+ 个词的消极情绪词典。

积极词典:

消极词典:

2) 准备训练语料

从网上搜集到几个带有积极、消极的标注的评论语料数据集,分别包含了书籍、DVD、音乐、购物领域的各有4000条评论,如下图:

可惜没找到中文影评相关的语料,但找到 国外英文的影评语料 ,对,英文资料很丰富。。。

3) 训练模型

由于是文本型特征,分类算法上选择了 朴素贝叶斯 ,把数据分为2份,一半训练,另一半做测试。

使用 jieba 分词工具,对文本进行分词得到候选词组,把得到的词组作为特征输入来训练情绪预测模型。

训练后的模型测试结果如下:

训练后的模型在书籍、音乐、影碟及购物评论的语料上都有不错的效果。

在提取出的影评短句上测试:

又是“无聊”、“又俗又傻”而一个“但”字就反转了情绪,真是难为分类器了:

经过反复对比实验,发现语料的质量决定了模型的精度,而语料的扩展对比扩展专业词典却容易多了。例如几年前都没有“ 因吹斯汀 ”这些网络流行词,更不知道它代表是正面情绪,以后只要不断更新相关领域的语料库来重新训练则可得到更精确的模型。

俗话说“是骡子是马拉出来遛遛”。

得到一个预测情绪的模型后,便可对影评文章进行预测,但预测的结果是否准确?准确率又有多高?这又是个问题。

每当事情陷入停滞,我就会想起日本漫画大师安达充说过“当故事情节发展不下去的时候,加入一个新角色,是最简单的做法”。

这时需要祭出一个“旁证”了。这所谓的“旁证”,也就是目前大家比较认可的**评分网站——豆瓣网。

大家都知道豆瓣网上的**用户通过打星(5力荐,4推荐,3还行,2较差,1很差),转换得出的10分制的评分,我们可简单把1 49分视作负面评价、5 10分视作正面评价,没有分数的视作中性评价。再把豆瓣的评价结果视作大部分人认同的结果,当然这样肯定是有偏差的。

大胆假设,小心求证,先试试看吧。

根据**名词典再次去抓取豆瓣网上的**信息,这次包含了**分数::

使用获取到的**专题『**院』文章内容测试,结果如下:

1048篇中,豆瓣评分结果与模型预测符合的有974篇,准确率是929%,WOW!真的这么准吗?

看下详细结果,豆瓣评分是正面的有1022条,预测对了973篇,例如:

而豆瓣评分是负面的有28条记录,而模型只预测出1篇是负面的:

真的是模型预测错了吗?

从负面例子中抽样看看模型分解的结果:

评论《麻烦家族》(豆瓣评分48)的:

从自动摘要出来的句子来看,实际上文章作者表现出正面情绪,模型预测为正面,预测正确

欢迎分享,转载请注明来源:浪漫分享网

原文地址:https://hunlipic.com/qinggan/1096300.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2023-07-12
下一篇2023-07-12

发表评论

登录后才能评论

评论列表(0条)

    保存