NLP (Natural Language Processing),自然语言处理,是人工智能(AI)的一个子领域。
统计自然语言处理运用了推测学、机率、统计的方法来解决上述,尤其是针对容易高度模糊的长串句子,当套用实际文法进行分析产生出成千上万笔可能性时所引发之难题。
处理这些高度模糊句子所采用消歧的方法通常运用到语料库以及马可夫模型(Markov models)。统计自然语言处理的技术主要由同样自人工智能下与学习行为相关的子领域:机器学习及资料采掘所演进而成。
自然语言处理的最初目的就是实现人和计算机的自然语言对话,计算机作为对话的一个主体是自然语言处理这个概念提出的先决条件。长久以来人们对于机器人应用于生活,成为重要生产力推动社会发展。
尤其是使机器人拥有“人的智能”就充满了憧憬,自然语言处理作为人工智能领域的一个重要组成部分,对于推动机器人的真正智能化有标志性作用。
近年来计算机性能在数据存储能力、处理速度等方面的大幅提升,为海量数据的处理、概率统计,为发现语言的规律、获得内在联系成为可能。
1、NLP是什么?
答:NLP是目前世界上最实用有效的一门心理行为科学。NLP全名是Neuro Linguistic Programming,中文译为「神经语言程序学」。有人评价它:纳米技术是物理学的一次飞跃,而NLP则是人类心理学的一场革命。互联网改变了人类的生活方式、NLP则改变了人类的思维方式。NLP是一个引领人走向正面、阳光、积极、和谐的学问;是一套塑造新生活的首选法门;是一种老百姓自己的实用心理学。
2、NLP的意思是什么?
答:NLP为Neuro-Linguistic Programming的缩写,三个单词分别代表以下的意思:
Neuro(脑神经),意为“身心”,指的是我们的头脑和身体经由我们的脑神经系统联结在一起。我们的脑神经系统控制我们的感觉器官去维持与世界的联系。
lnpJistic(语法),指的是我们运用语言与别人作出相互影响,经由姿势、手势、习惯等无声语言显示我们的思考模式、信念及内心种种状态。我们的头脑与身体之间的联系机制所用的语言模式。
Programming(程式),借用计算机科学语言指出我们的意念、感觉和行为只不过是习惯性的程式,可以经由提升我们"思想”的软件而将以改善。凭借改善我们思想和行为的重复程序,便能在行动中取得更满意的效果。
故此,我认为NLP也可以解释为研究我们的大脑如何工作的学问。知道大脑如何工作后,我们可以配合和提升它,从而使人生更成功、快乐。也因此我把NLP译为“身心语法程式学”。
3、NLP研究的是什么?
答:NLP研究我们思想、情绪、行为背后的规律,为我们提供一套如何表现卓越,如何追求成功、快乐、幸福人生的
思维框架与实用技术。
NLP是一门研究人的主观世界的学科,研究我们如何创造出我们独特的内心世界。NLP从破解卓越人士的语言及思维模式入手,独创性地将他们的思维模式进行解码后,发现了人类思想、情绪和行为背后的规律,并将其归纳为一套可复制,可模仿的程序。
语言是思维的载体,NLP从语言入手,革命性地将意识与潜意识的研究带到一个全新的高度,更难能可贵的是,它不是一套学者们用来清谈的理论,而是可推及到现实生活各个层面的方法论。它被誉为现代心理学最具学科综合性,最具神奇效力,也是最具发展前景的应用成果。有人说NLP是成功学,正确的解释是,成功学只是它的冰山一角,它背后有着更深刻的脑神经学及心理学基础。
4、NLP起源于哪里?
答:NLP首创于1970年代早期。是由两位美国人——理察·班德勒(Richard Bandler)和约翰·葛瑞德(John Grinder)完成的基础理论。这两个美国人由于不满于传统心理学的治疗过程冗长,效果反复不定,因而集各家所长,加上他们独到创见,在美国加州大学经过三年的实践,奠定了NLP的基础。
理察·班德勒(Richard Bandler)和约翰·葛瑞德(John Grinder)一起研究并效仿了美国当时四位顶尖的心理治疗师与沟通大师:
催眠治疗大师也是艾瑞克森摧眠学派创始人:米尔顿·艾瑞克森
家庭治疗大师:维吉尼亚·萨提尔
完形治疗创始人:弗列兹·皮耳氏
沟通大师:格利葛利·贝特森。
他们一方面亲自向四位大师学习,另一方面也将四位大师的心法,适当的修正与发展,他们发展出来的第一个模式就是口语与非口语的沟通技巧,通过策略引导与模仿能快速学习任何事物,汲取精华。
5、为什么要学习NLP?
答:人生的困局往往来自于头脑与心灵的抵触、理智与感情的冲突、意识与潜意识的矛盾。NLP因为完全发现了思维和情绪的规律,知道如何让你的理性与感性协调一致、身心合一。所以,用它来处理各种困局、突破发展瓶颈,就如利斧断木,效果惊人,它常常能迅速抓住问题的要害,以最短的时间化矛盾于无形,很大程度上,NLP是教你找到方法的方法。
NLP发现了思维的规律,规律的特性意味着可以不断地被举一反三。因此,NLP具有无限的延展性。在这门学问出现后的三十年时间里,已经有无数的人发展出了数百个不同的技巧,并且还在不断的发展中。这些技巧可以用来处理你工作、学习、生活等各个方面的问题,并极大地提升你的学习能力、沟通能力以及幸福感。毫不夸张的说,没有哪门学问能够像NLP这样给你打开如此广阔的世界,它让你看到无限多的可能性,并给你方法,让你朝着自己想去的方向轻松快乐地向前。
6、NLP可以帮我们解决什么问题?
答:NLP是一门专业研究人主观世界的学科,可以帮我们解决一下问题:
1)NLP帮助我们深刻的了解人、认识人。了解人跟人是不同的,并且了解每个人行为、情绪、思维背后的规律,从而更有效的配合与提升我们的绩效表现。
2)NLP可以协助我们最求卓越,更快速有效的达成目标,创造成果。NLP是一门以结果为导向,注重实效的学科。
3)NLP可以丰盛我们的思想,培养积极处世的人生观与世界观。
4)NLP可以快速的提高我们的沟通、领导、管理与的能力,提高我们的思考能力,掌握大脑运作的规律,从而我们掌控人生。
5)NLP可以协助我们处理情绪困扰,消除心理障碍,提升情感平衡的能力,从而达成自我和谐与良好人际关系。
6)NLP可以快速有效的调整与改变我们的一些不良的行为习惯。
7、NLP的中心学问是什么?
答:NLP的中心学问是“模仿卓越”。我们通过模仿成功人士的行为模式与思想模式,可以做到与他们一样的效果,并且通过灵活的运用,使到我们在运用各种工具时可以更适应我们自己的情况。NLP四大智慧与核心思想为:敏锐、灵活、弹性、结果导向与系统平衡。
8、NLP学问有什么特点:
答:1)它是灵活性的。如果用两个字来形容NLP特点的话,那就是——“灵活”两个字。NLP犹如一股灵活之泉,它主张向“小河流”学习,还记得在第一章与你分享的小河流吗?小河流为了到达生命中的大海,它会不断地改变自己的形状,去越过高山、穿过草地,为了跨越沙漠,甚至愿意蒸发到空气当中,让微风带着它到大海的上空,再化为雨水落下来,到达生命中的目的地。NLP也一样,一切以效果为导向,而不拘泥于各种形式或道理;
2)它是全面性的。NLP整个体系的训练,是由修身到与人互动。由生理的觉察到心理的苏醒,直至灵性的抬头。不像有些课程只专注在治疗或某个单项的快速成功;
3)它是持续性的。NLP是改变自己,引领他人的修习训练。只要接受它就可生生不息的成长。不像有些课程,只有短期的激情效果,一阵激情后又陷入迷惘;
4)它是自主性的。经NLP训练后,学员可挑选其中某些领域继续深入或朝NLP专业发展或与其它专业结合。不像有些课程,没能帮助学员建立自主的独立性,所以上过之后还要再上;
5)它是通透性的。只要学会几种简单模式与架构,就可以活用于生活中的各种情境。比如呼应与引导的原则,既适用于与客户的互动,也适用于亲子调教,更可用于两性的互动。不像某些技巧,仅适用于少数特定的情境;
6)它是开放性的。它的结构,既有成长性,也有包容性与附益性。换句话说,它自成一家,但又可与其它领域的专业相结合,不断地与环境配合适应
9、NLP课程涉及哪些内容?
答:NLP专注于研究人的主观世界,探讨我们是如何创造出我们每个人独特的内心世界,并如何有效
的配合、调整、改变、提升与整合我们的内在世界,从而达至身心灵和谐一致。NLP探讨的内容如下:
1)人的大脑是如何工作的,并有效配合以提升人的思维能力。
2)人的情绪是如何产生的,并有效管理以提升人的情感智能
3)人的行为反应与习惯模式是怎样的,如何戒除的不良行为,调整状态,创造最佳的表现
4)如何提高我们内向沟通能力,达成身心灵和谐统一。
5)如何提升我们外向沟通能力,创造良好的人际关系,从而达到人与人,人与社会的和谐。
10、NLP实践应用在哪些方面?
答:NLP以它神奇、独特的可以改变人生的超级魅力,以及实用、易学,可操作性强的具体方法,迅速风靡世界。目前NLP已涉足并被广泛应用于人际沟通、个人成长、家庭婚姻、亲子教育、身心健康、企业经营管理、个人与组织学习、教育训练、心理治疗与生涯规划等领域。更具体地说,如个人心灵创伤、受虐、受暴力、无自信心、恐高症、家庭问题等的心理治疗;或减肥、酗酒、戒烟、戒毒、消除压力、身心不适症状等的治疗;或如何销售、如何谈判、如何领导、如何增加创造力、如何沟通等商业上的应用及改善或加强小孩、职员、组织或自己的有效学习与终生学习能力等。效果无与伦比,颇受赞赏,在全球形成了学习风潮。
11、NLP学问的发展情况怎么样
答:全世界现已出版的NLP类书籍有300余种,各种语言的NLP专业杂志10余种,在国际互联网上,NLP网站有100多个,欧美的40多个国家已有全国性NLP协会,数个国际组织在实施NLP专业资格的国际认证作业。
12、什么样的人适合学习NLP?
答:几乎所有人都可以学。尤其适用于:企业负责人、职业经理人、市场营销人员、行政人事工作者、公关人员、培训工作者、教练、教育工作者、心理咨询师、为人父母者等等。
13、NLP容易学吗?
答:很容易。NLP这门学问题虽然揭示了思维及行为活动的规律,其发现是革命性的。但是,它的理论基础却是我们大部分受过教育的人都熟悉的。NLP在短短的三十年里能够迅速地传播,得益于它"效果显著、易学易懂"的特性,它是一门小学生能听懂,大学教授觉得有深度的学问。在它的教学过程中,大量地运用体验式的互动的方法,使得整个学习的过程变得轻松有趣。
一、引言
对于电商企业来说,搜索功能是其重中之重。这是买家进行购买的最便捷有效的途径。因此我们的搜索引擎也是公司最重要的产品。而搜索的关键是什么呢,自然是能够在第一时间明确用户的意图并给出与之相匹配的商品结果。所以怎么才能更好的理解用户,怎么能够在最快的时间内给到用户想要的结果,这便是我们在搜索实践中一直探讨优化的方向与目标。本文基于这一个月的进展做一个词向量在召回中的运用分析。
二、什么是词向量
在聊 Word2vec 之前,先聊聊 NLP (自然语言处理)。NLP 里面,最细粒度的是 词语,词语组成句子,句子再组成段落、篇章、文档。所以处理 NLP 的问题,首先就要从最基础的词语开始。
举个简单例子,判断一个词的词性,是动词还是名词。用机器学习的思路,我们有一系列样本(x,y),这里 x 是词语,y 是它们的词性,我们要构建 f(x)->y 的映射,但这里的数学模型 f(比如神经网络、SVM)只接受数值型输入,而 NLP 里的词语,是人类的抽象总结,是符号形式的(比如中文、英文、拉丁文等等),所以需要把他们转换成数值形式,或者说——嵌入到一个数学空间里,这种嵌入方式,就叫词嵌入(word embedding)。
one-hot 是可认为是最为简单的词向量,但存在维度灾难和语义鸿沟等问题;通过构建共现矩阵并利用 SVD 求解构建词向量,则计算复杂度高;而早期词向量的研究通常来源于语言模型,比如 NNLM 和 RNNLM,其主要目的是语言模型,而词向量只是一个副产物。
如上图的NNLM模型(2003年推出),它是为了计算某个句子出现的概率,我们可以加入相应的先验知识,用贝叶斯公式表示则是
将输入语料进行分词,并向量化(随机初始化成为一个N维的向量),然后将他们拼接起来作为输入,经过神经网络计算后预测出下个词是目标词的概率,通过反向传播优化模型参数后,我们不但得到了一个能够预测句子出现概率的模型,也得到了一份 词向量,相同上下文语境的词有相似语义,词与词之间的关联得到了极大的提升。 而由此引申出了 Word2vec、FastText,在此类词向量中,虽然其本质仍然是语言模型,但是它的目标并不是语言模型本身,而是词向量,其所作的一系列优化,都是为了更快更好的得到词向量。GloVe 则是基于全局语料库、并结合上下文语境构建词向量,结合了 LSA 和 Word2vec 的优点。(当然词向量模型远不止这些,其他模型和衍生场景这里不展开阐述,可以作为后续的专题进行分析)
如上图是我使用fasttext对天龙八部小说训练出的词向量模型,可以明显看出其中的人物集团之间的关系,这便是词向量之间的语义聚合效果,它的出现对于NLP后续的任务效果(如文本分类、NER、翻译等)都带来了极大的提升。
三、词向量在召回模型中的运用
随着平台用户体量和商品SKU的不断扩大,用户对于搜索场景的依赖也越来越大,提升召回率便是其中重要的一环,对此我们设计了一套方案,即利用词向量构建query语义表征,考虑到对未登录词的兼容性,这里使用了fasttext进行了词向量的训练。通过相似度计算和query热度加权推测无结果query的候选query集合,利用faiss进行在线实时高速计算,结合产品的优化实现对无结果query的再次召回,线上再结合多臂机的选择策略进一步提升容错和纠错能力。
我们分析整理了平台历史所有的query语料数据,结合商品描述信息使用迭代和半人工的方式优化了自有词库,在特征处理过程中,针对中英文分别做了处理,如英文增加了编辑距离纠错,中文由于短文本信息较少使用了单字进行切割等,针对性的进行了文本处理,相应的归一化了词分布,提升了部分模型训练效果。
训练参数如下:
query候选集预测结果部分如下,可以看到在没有做其他优化的前提下已经产生了一定的效果,后续我们还可以加入更多的策略进行融合进一步满足业务的场景:
四、未来的想象空间
针对平台业务及搜索场景,NLP还会有很多的结合点。
比如:
1对query做分类预测,我们可以预测每个query词的类目意图,品牌意图等,减少关键词搜索的歧义影响。
2搭建我们自己的NER命名实体模型,引导搜索的方向及准度
3针对海外市场,如何更好的利用国内积累下的搜索源数据,通过机器翻译的方式打通语言的壁垒
4作为个性化排序模型中的语义特征搭建完善个性化模型
5为运营及市场做用户热度挖掘及监控等
NLP作为人工智能技术的掌上明珠,虽然还处于刚起步和不断完善的阶段,但是只要合理运用好并能搭配其他策略进行完善,相信还有很多的价值等待我们去挖掘。
词是最小的能够独立活动的有意义的语言成分,英文单词之间是以空格作为自然分界符的,而汉语是以字为基本的书写单位,词语之间没有明显的区分标记,因此,中文词语分析是中文分词的基础与关键。中文和英文都存在分词的需求,不过相较而言,英文单词本来就有空格进行分割,所以处理起来相对方便。但是,由于中文是没有分隔符的,所以分词的问题就比较重要。分词常用的手段是基于字典的最长串匹配,据说可以解决85%的问题,但是歧义分词很难。举个例子,“美国会通过对台售武法案”,我们既可以切分为“美国/会/通过对台售武法案”,又可以切分成“美/国会/通过对台售武法案”。
中文分词技术可分为三大类:
基于机器学习的方法里,往往需要对词的词性进行标注。词性一般是指动词、 名词、形容词等。标注的目的是表征词的一-种隐藏状态,隐藏状态构成的转移就构成了状态转移序列。例如:我/r爱/v北京/ns天安门/ns。其中,ns代表名词,v代表动词,ns、v都是标注,以此类推。
词性作为对词的一种泛化,在语言识别、句法分析、信息抽取等任务中有重要作用。
http://blogcsdnnet/truong/article/details/18847549
命名实体是指从文本中识别具有特定类别的实体(通常是名词),例如人名、地名、机构名、专有名词等。主要包含两部分:
命名实体识别是信息提取、问答系统、句法分析、机器翻译、面向SemanticWeb的元数据标注等应用领域的重要基础工具。
https://blogcsdnnet/u012879957/article/details/81777838
句法分析往往是一种基于规则的专家系统。当然也不是说它不能用统计学的方法进行构建,不过最初的时候,还是利用语言学专家的知识来构建的。句法分析的目的是解析句子中各个成分的依赖关系。所以,往往最终生成的结果是一棵 句法分析树。句法分析可以解决传统词袋模型不考虑上下文的问题。比如,“小李是小杨的班长”和“小杨是小李的班长”,这两句话,用词袋模型是完全相同的,但是句法分析可以分析出其中的主从关系,真正理清句子的关系。
中文中代词出现的频率很高,它的作用的是用来表征前文出现过的人名、地名等。例如,清华大学坐落于北京,这家大学是目前中国最好的大学之-。 在这句话中, 其实“清华大学”这个词出现了两次,“这家大学指代的就是清华大学。但是出于中文的习惯,我们不会把“清华大学”再重复一遍。
一般情况下,指代分为2种:回指和共指。
回指是指当前的照应语与上文出现的词、短语或句子(句群)存在密切的语义关联性,指代依存于上下文语义中,在不同的语言环境中可能指代不同的实体,具有非对称性和非传递性;
共指主要是指2个名词(包括代名词、名词短语)指向真实世界中的同一参照体,这种指代脱离上下文仍然成立。
目前指代消解研究主要侧重于等价关系,只考虑2个词或短语是否指示现实世界中同一实体的问题,即共指消解。
中文的指代主要有3种典型的形式:
所谓情感识别,本质上是分类问题,经常被应用在舆情分析等领域。情感一般可以分为两类,即正面、负面,也可以是三类,在前面的基础上,再加上中性类别。一般来说,在电商企业,情感识别可以分析商品评价的好坏,以此作为下一个环节的评判依据。通常可以基于词袋模型+分类器,或者现在流行的词向量模型+RNN。经过测试发现,后者比前者准确率略有提升。
自动纠错在搜索技术以及输人法中利用得很多。由于用户的输人出错的可能性比较大,出错的场景也比较多。所以,我们需要一个纠错系统。具体做法有很多,可以基于N-Gram进行纠错,也可以通过字典树、有限状态机等方法进行纠错。
这是一种类似机器人的人工智能系统。比较著名的有:苹果Siri、IBM Watson、微软小冰等。问答系统往往需要语音识别、合成,自然语言理解、知识图谱等多项技术的
问答系统(Question Answering System, QA)是信息检索系统的一种高级形式,它能用准确、简洁的自然语言回答用户用自然语言提出的问题。
基于自由文本的问答系统,基本上分为三个模块:
问句分析->文档检索->答案抽取(验证)
https://blogcsdnnet/class_guy/article/details/81535287
针对目标句子,进行各种句法分析,如分词、词性标记、命名实 体识别及链接、句法分析、语义角色识别和多义词消歧等。
抽取目标文本中的主要信息,比如从一-条新闻中抽取关键信息。主要是了解是谁、于何时、为何、对谁、做了何事、产生了有什么结果。涉及实体识别、时间抽取、因果关系抽取等多项关键技术。
主要包含了对文本的聚类、分类、信息抽取、摘要、情感分析以及对挖掘的信息和知识的可视化、交互式的呈现界面。
将输人的源语言文本通过自动翻译转化为另种语言的文本。根据输人数据类型的不同,可细分为文本翻译、语音翻译、手语翻译、图形翻译等。机器翻译从最早的基于规则到二十年前的基于统计的方法,再到今天的基于深度学习(编解码)的方法,逐渐形成了一套比较严谨的方法体系。
对大规模的文档进行索引。可简单对文档中的词汇,赋以不同的权重来建立索引,也可使用算法模型来建立更加深层的索引。查询时,首先对输人比进行分析,然后在索引里面查找匹配的候选文档,再根据一个排序机制把候选文档排序,最后输出排序得分最高的文档。
针对某个自然语言表达的问题,由问答系统给出一个精准的答案。需要对自然语言查询语句进行语义分析,包括实体链接、关系识别,形成逻辑表达式,然后到知识库中查我可能的候选答案并通过-个排序机制找出最佳的答案。
系统通过多回合对话,跟用户进行聊天、回答、完成某项任务。主要涉及用户意图理解、通用聊天引擎、问答引擎、对话管理等技术。此外,为了体现上下文相关,要具备多轮对话能力。同时,为了体现个性化,对话系统还需要基于用户画像做个性化回复
参考: https://mpweixinqqcom/s/QjpOzO8Mt17mtnC7efT8nQ
和谐气氛
人与人之间的沟通,必须在一个前提条件之下,才能取得效果,那就是和谐气氛。
和谐气氛,就是让每一个人放松下来,感到安全,并对对方有一定的信任,在这种情况下,个人与自己内心的感觉联系着,同时,大脑里理性的部分充分运作,因而最能在NLP技巧过程中取得理想的效果。
打破状态
当一个人处于某个内心状态,意念,思想及情感,而导致事情不能顺利进行或对现场环境有负面影响时,另外一个人可通过一些语言或行为为即时改变这个人的内心状态,这便是打破状态。
未来测试
未来测试是NLP技巧中必经的步骤之一,目的是引导本色的或对方想象在未来运用所学到的东西,或者测试所应用的技巧是否有效,通常,一个NLP技巧完成后,会先来个打破状态,再做个未来测试,若效果满意,便可以结束整个过程。
呼气与吸气
身体各部分向大脑传递信息,在呼气与吸气时是不同的,因此身体的机能在呼气与吸气时也会不同,呼气时身体处于一个放松的状态,适合于松弛及放松身体各部分时使用,吸气时身体处于一个强化的状态,适合于加强,凝聚及提升身体能力时使用。
时间线
人脑对于记忆或思考某件事情是有其时间位置的,一般来说,用右手的人,其过去位于左边而未来位于右边,距离现在越远的过去或未来时间,则越远离自己的鼻子,现在则会在眼前,因此他们的时间线是从左至右,从远至近又再走远。
有些人的时间线会贯通自己,未来在前面现在在眼下,过去则在身后,也有一些人的时间线在未经整理之前,是乱七八糟的。
时间线可以很容易地进行整理,调整时间线可以使一个人减少焦虑或提高积极性。在NLP技巧中,时间线更是简单的一条在地上无形的直线。
经验擎
一些事物会使我们回想起往事,因而带回这些往事中本人当时的感受,这些事物便是经验擎。
经验擎可以分为4中
1视觉型经验擎,中国成语,睹物思人是较为恰当的描述。
2听觉经验擎,歌曲,名字都属于听觉经验擎。
3感觉经验擎,握手,拥抱,吻脸,摸头等身体接触。
4内感觉经验擎,一些静坐宗派所采用的 心号 。
其中1-3的经验擎,也可转为内视,内听,内感觉型的经验擎。
以上
欢迎分享,转载请注明来源:浪漫分享网
评论列表(0条)