人们登录“人形软件”,AI通过自主学习,1:1复刻用户的外表、兴趣和生活方式,成为用户在网络世界的虚拟代理人。这位“AI替身”能够与另一名用户的“人形软件”在虚拟世界中聊天、喝咖啡、逛街……在确定二者的匹配度后,高匹配度的两人将在真实世界正式见面。
这下可好,各位单身男女们省了不少事儿,一键登录,AI就可以帮用户自动选择约会对象,并完成基本的聊天,从而使在线相亲匹配简单化,人民公园相亲角的那些大爷大妈总算可以休息了,
而且,这可不是小说作者一厢情愿的幻想,近日,伦敦帝国理工学院研究人员对约会的未来状况作出了预测——到2025年,基因匹配和人工智能的结合,可以预测单身男女之间的吸引力和相容性,从而进行匹配。
爱情,这一人类永恒的主题,随着科技的发展,似乎发生了一些微妙的变化。
科学相亲时代,劝你不要太期待
近几年,网络婚恋交友行业发展迅速。根据艾瑞监测报告显示,2018q2中国网络婚恋交友服务PC端覆盖人数依次为938万人、1018万人和886万人,而在移动端,用户日均有效使用时长持续增长,Q2各月分别为6720万分钟、6847万分钟和7058万分钟,环比增长依次为-02%、19%和31%,网络婚恋移动端用户粘性持续提高。
但是,在这过去的几年里,在线婚恋行业也出现了不少问题,比如网恋骗局、用户交友疲劳、信息滥用等,面对这些难题,AI配对应运而生。通过大数据,深度学习,AI能够不断挖掘人们的相亲需求,进而使得相亲流程更加高效化和清晰化,在配对后期,AI还能对这段关系进行更长期的关注,提供测试、咨询等功能,这都是人工难以顾及到的。
目前,市面上的有AI元素的“红娘“也不少见,包括我们熟知的探探、网易花田,以及世纪佳缘、百合婚恋等网站,智能相对论(ID:aixdlun)在梳理了这些产品的底层AI逻辑后,发现所谓的智能配对,还是存在着一些缺陷,这主要体现在两个方面。
一方面,“AI红娘”基于社交信息为爱情定性。如今,各种各样的社交网络平台涌现了巨量而丰富的情感信息,AI能够挖掘网络上的文本信息,通过深度学习对网络文本进行细粒度的情感分析,进而达到即时获取人在网络世界的情感特征,美国的AI约会平台ViolaAI便是如此。
但AI如何能审查得了感情上的“真心实意”抑或“虚情假意”呢?在具体的操作中,交往过的男/女友,社交上的“摇一摇”匹配附近好友,说不定就成为了给当事人的爱情定性的重要指标。同时,人们的恋爱动机也会被AI看穿,而在恋爱自由的时代,你可能还会因为“不以结婚为目的的谈恋爱”受到算法的“歧视”。更敏感的是,食色性也。人性在男女关系上不一定经得起检验,检验工具却已就绪,我们做好它进入我们日常生活的准备了吗?
在人工智能出现之前,机器智能处理结构化的数据(例如 Excel 里的数据)。但是网络中大部分的数据都是非结构化的,例如:文章、、音频、视频…
在非结构数据中,文本的数量是最多的,他虽然没有和视频占用的空间大,但是他的信息量是最大的。
为了能够分析和利用这些文本信息,我们就需要利用 NLP 技术,让机器理解这些文本信息,并加以利用。
每种动物都有自己的语言,机器也是!
自然语言处理(NLP)就是在机器语言和人类语言之间沟通的桥梁,以实现人机交流的目的。
人类通过语言来交流,狗通过汪汪叫来交流。机器也有自己的交流方式,那就是数字信息。
不同的语言之间是无法沟通的,比如说人类就无法听懂狗叫,甚至不同语言的人类之间都无法直接交流,需要翻译才能交流。
而计算机更是如此,为了让计算机之间互相交流,人们让所有计算机都遵守一些规则,计算机的这些规则就是计算机之间的语言。
既然不同人类语言之间可以有翻译,那么人类和机器之间是否可以通过“翻译”的方式来直接交流呢?
NLP 就是人类和机器之间沟通的桥梁!
为什么是“自然语言”处理?
自然语言就是大家平时在生活中常用的表达方式,大家平时说的「讲人话」就是这个意思。
NLP 有2个核心的任务:
自然语言理解就是希望机器像人一样,具备正常人的语言理解能力,由于自然语言在理解上有很多难点(下面详细说明),所以 NLU 是至今还远不如人类的表现。
自然语言理解的5个难点:
想要深入了解NLU,可以看看这篇文章《一文看懂自然语言理解-NLU(基本概念+实际应用+3种实现方式)》
NLG 是为了跨越人类和机器之间的沟通鸿沟,将非语言格式的数据转换成人类可以理解的语言格式,如文章、报告等。
NLG 的6个步骤:
想要深入了解NLG,可以看看这篇文章《一文看懂自然语言生成 – NLG(6个实现步骤+3个典型应用)》
情感 分析
互联网上有大量的文本信息,这些信息想要表达的内容是五花八门的,但是他们抒发的 情感 是一致的:正面/积极的 – 负面/消极的。
通过 情感 分析,可以快速了解用户的舆情情况。
聊天机器人
过去只有 Siri、小冰这些机器人,大家使用的动力并不强,只是当做一个 娱乐 的方式。但是最近几年智能音箱的快速发展让大家感受到了聊天机器人的价值。
而且未来随着智能家居,智能 汽车 的发展,聊天机器人会有更大的使用价值。
语音识别
语音识别已经成为了全民级的引用,微信里可以语音转文字, 汽车 中使用导航可以直接说目的地,老年人使用输入法也可以直接语音而不用学习拼音…
机器翻译
目前的机器翻译准确率已经很高了,大家使用 Google 翻译完全可以看懂文章的大意。传统的人肉翻译未来很可能会失业。
NLP 可以使用传统的机器学习方法来处理,也可以使用深度学习的方法来处理。2 种不同的途径也对应着不同的处理步骤。详情如下:
方式 1:传统机器学习的 NLP 流程
方式 2:深度学习的 NLP 流程
英文 NLP 语料预处理的 6 个步骤
中文 NLP 语料预处理的 4 个步骤
自然语言处理(NLP)就是在机器语言和人类语言之间沟通的桥梁,以实现人机交流的目的。
NLP的2个核心任务:
NLP 的5个难点:
NLP 的4个典型应用:
NLP 的6个实现步骤:
版本
自然语言处理是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理是一门融语言学、计算机科学、数学于一体的科学。因此,这一领域的研究将涉及自然语言,即人们日常使用的语言,所以它与语言学的研究有着密切的联系,但又有重要的区别。自然语言处理并不是一般地研究自然语言,而在于研制能有效地实现自然语言通信的计算机系统,特别是其中的软件系统。因而它是计算机科学的一部分。
自然语言处理(NLP)是计算机科学,人工智能,语言学关注计算机和人类(自然)语言之间的相互作用的领域。
维基百科版本
自然语言处理(NLP)是计算机科学,信息工程和人工智能的子领域,涉及计算机与人类(自然)语言之间的交互,特别是如何对计算机进行编程以处理和分析大量自然语言数据。自然语言处理中的挑战通常涉及语音识别,自然语言理解和自然语言生成。
深度学习在自然语言处理中的应用已经非常广泛,可以说横扫自然语言处理的各个应用,从底层的分词、语言模型、句法分析等到高层的语义理解、对话管理、知识问答、聊天、机器翻译等方面都几乎全部都有深度学习的模型,并且取得了不错的效果。可以参看ACL2017年的accepted papers list。Accepted Papers, Demonstrations and TACL Articles for ACL 2017。从这里可以看到大部分论文都使用了深度学习的模型。那为什么深度学习在自然语言中取得这么大的进步呢。一、从数据上看,经过前些年互联网的发展,很多应用都积累到了足够量的数据。当数据量增大,以SVM、CRF等为代表的浅层模型,因为模型较浅,无法对海量数据中的非线性关系进行建模,所以不能带来性能的提升。相反,以CNN、RNN为代表的深度模型,能够随着模型复杂性的增加,对数据进行更精准的建模,从而得到更好的效果。二、从算法上看,深度学习也给自然语言处理的任务带来了很多好处。首先,word2vec的出现,使得我们可以将word高效的表示为低维稠密的向量(distributed representation),相比于独热表示表示(one-hot-representation),这一方面一定程度上缓解了独热表示所带来的语义鸿沟的问题,另一方面降低了输入特征的维度,从而降低了输入层的复杂性。其次,由于深度学习模型的灵活性,使得之前比较复杂的包含多流程的任务,可以使用end to end方法进行解决。比如机器翻译任务,如果用传统的方法,需要分词模块、对齐模块、翻译模块、语言模型模块等多个模块相互配合,每个模块产生的误差都有可能对其他模块产生影响,这使得原来的传统方法的构建复杂度很大。在机器翻译使用encoder-decoder架构后,我们可以将源语言直接映射到目标语言,从而可以从整体上优化,避免了误差传递的问题,而且极大的降低了系统的复杂性。深度学习虽然是把利器,但是并不能完全解决自然语言中的所有问题,这主要是由于不同于语音和图像这种自然界的信号,自然语言是人类知识的抽象浓缩表示。人在表达的过程中,由于背景知识的存在会省略很多的东西,使得自然语言的表达更加简洁,但这也给自然语言的处理带来很大的挑战。比如短文本分类问题,由于文本比较简短,文本所携带的信息有限,因此比较困难。像这样的问题,当样本量不够时,如何将深度学习方法和知识信息进行融合来提升系统的性能,将是未来一段时间内自然语言处理领域研究的主要问题。
深度学习是一个心理学概念,也是人工智能的核心目标。
人工智能方面的深度学习是指通过数据库的形式解析事物的内在逻辑,用计算机语言进行识别、读取、操作、反馈、修正等等这个过程。
而我理解的关于人的深度学习是不是跟深度睡眠一样,深度睡眠的人享受睡眠过程,完全沉浸入其中,一时半会儿都唤不醒?
可以分为两个方面探讨:
1、人的深度学习要进行,是不是要对事物的本质,即内在逻辑了解清楚呢?比如说牛顿的万有引力定律的发现,他是从苹果掉地上的启发而来,从而寻根究底,探寻到这个规律。这与兴趣和韧性有关。
2、人的深度学习不要被不断干扰。这与睡眠类似,不断被吵醒的人,睡眠质量肯定不高,所以,要想深度学习,时间、空间都需要安排好来,还有工具、资料等等。
欢迎分享,转载请注明来源:浪漫分享网
评论列表(0条)