简单来说,几年前感觉NLP这个领域很新鲜、很空白,决定做一做。读完博士,感觉NLP比我最初接触时理解的NLP更新鲜、空白、值得挖掘。NLP很多问题都没有正式定义、或者说很难用统一的标准去训练机器、很难搞 benchmark dataset。这可能也是AI的一大挑战。我认为现在比较成熟的AI方向,问题本身的答案都是相对来说确定的。比如语音识别,拿来一段语音、说的就是什么什么话。比如vision,猫的照片就是猫、这个人脸的照片就是这个人。NLP有一些问题就没这么明确了。比如文本摘要,到底哪一个摘要是最好的呢?机器翻译,到底哪一个译文是最好的呢?复杂一些的情感分析,这篇报道作者到底有没有在暗讽这个人?如果一个问题有明确的答案,比如waston——专门参加开心辞典回答问题,算法训练起来轻松一些。如果一个问题本身答案并无明确的高下之分,算法也很无奈啊。定义新问题、以较小的代价搜集新的数据集、开发新的 evaluation method,这些与研究新算法一样有趣、有挑战性。举个简单的例子。我们想让机器自动识别出来讽刺,那么去哪里找讽刺的话呢?Ellen Riloff教授2013年有一篇论文(Sarcasm as Contrast between a Positive Sentiment and Negative Situation)。在twitter上有一些本来很倒霉、但是作者好像又很高兴的推文。这些推文有的#sarcasm 的标签:1、Oh how I love being ignored2、Thoroughly enjoyed shoveling the driveway today! :) 3、Absolutely adore it when my bus is late4、I’m so pleased mom woke me up with vacuuming my room this morning :)我们有现成的分析情感的工具,再利用这些有#sarcasm标签的推文,可以训练一个识别“什么情况是倒霉情况”的分类器。以后可以用这个倒霉识别器去识别没有标签的讽刺句子,bootstrap一下把数据集搞大。这就是一个最初级的讽刺方面的数据集。NLP圈里很多人喜欢搞新的数据集,这个现象有利有弊。但的确说明有很多空白问题需要定义、有很多空白资源需要创建。
都不错。
1、云计算:是一种基于互联网的计算模式,通过网络提供各种计算资源和服务,包括计算能力、存储空间、应用程序等。云计算具有高效、灵活、可扩展等特点,可以为企业和个人提供更加便捷、安全、经济的计算服务。云计算的应用场景非常广泛,包括数据存储、数据分析、人工智能等领域。
2、NLP:是一种人工智能技术,用于处理和分析自然语言文本,包括语音识别、语义分析、情感分析等。NLP技术可以帮助人们更好地理解和处理自然语言,为人机交互、信息检索、智能客服等领域提供支持。NLP技术的应用场景也非常广泛,包括智能语音助手、机器翻译、智能客服等领域。
自然语言处理(NLP)的研究对象是计算机和人类语言的交互,其任务是理解人类语言并将其转换为机器语言。
在目前的商业场中,NLP 技术用于分析源自邮件、音频、文件、网页、论坛、社交媒体中的大量半结构化和非结构化数据,市场前景巨大。
近年来,自然语言处理处于快速发展阶段。互联网与移动互联网和世界经济社会一体化的潮流对自然语言处理技术的迫切需求,为自然语言处理研究发展提供了强大的市场动力。
纵观自然语言处理技术研究发展的态势和现状,以下研究方向或问题将可能成为自然语言处理未来研究必须攻克的堡垒:
1、词法和句法分析方面:包括多粒度分词、新词发现、词性标注等;
2、语义分析方面:包括词义消歧、非规范文本的语义分析;
3、语言认知模型方面:比如使用深度神经网络处理自然语言,建立更有效、可解释的语言计算模型;
4、知识图谱方面:如何构建能够融合符号逻辑和表示学习的大规模高精度的知识图谱;
5、文本分类与聚类方面:通过有监督、半监督和无监督学习,能够准确进行分类和聚类;
6、信息抽取方面:对于多源异构信息,如何准确进行关系、事件的抽取等。
7、情感分析方面:包括基于上下文感知的情感分析、跨领域跨语言情感分析、基于深度学习的端到端情感分析、情感解释、反讽分析、立场分析等;
8、自动文摘方面:如何表达要点信息?如何评估信息单元的重要性;
9、信息检索方面:包括意图搜索、语义搜索等,都将有可能出现在各种场景的垂直领域,将以知识化推理为检索运行方式,以自然语言多媒体交互为手段的智能化搜索与推荐技术;
10、自动问答方面:包括深度推理问答、多轮问答等各种形式的自动问答系统;
11、机器翻译方面:包括面向小数据的机器翻译、非规范文本的机器翻译和篇章级机器翻译等。
欢迎分享,转载请注明来源:浪漫分享网
评论列表(0条)