AI关键词传统与智械篇
Artificial Intelligence (AI) —— 人工智能
Machine Learning —— 机器学习
Neural Network —— 神经网络
Deep Learning —— 深度学习
Data Mining —— 数据挖掘
Natural Language Processing (NLP) —— 自然语言处理
Robotics —— 机器人技术
Automation —— 自动化
Internet of Things (IoT) —— 物联网
Big Data Analytics —— 大数据分析
Cloud Computing —— 云计算
Virtual Reality (VR) —— 虚拟现实
Augmented Reality (AR) —— 增强现实
Smart Home —— 智能家居
Autonomous Vehicles —— 自动驾驶车辆
Facial Recognition —— 人脸识别
Voice Assistant —— 语音助手
Chatbot —— 聊天机器人
Recommendation System —— 推荐系统
Cybersecurity —— 网络安全
Blockchain Technology —— 区块链技术
Computer Vision —— 计算机视觉
Natural Language Generation (NLG) —— 自然语言生成
Smart Grid —— 智能电网
Biometrics —— 生物识别
Precision Agriculture —— 精准农业
Smart City —— 智能城市
Drone Technology —— 无人机技术
Wearable Devices —— 可穿戴设备
Smart Healthcare —— 智能医疗
Robotic Process Automation (RPA) —— 机器人流程自动化
Cognitive Computing —— 认知计算
Self-driving Cars —— 自动驾驶汽车
Machine Vision —— 机器视觉
Predictive Analytics —— 预测分析
Smart Manufacturing —— 智能制造
Emotion Recognition —— 情感识别
Virtual Assistant —— 虚拟助手
Machine Translation —— 机器翻译
Autonomous Robots —— 自主机器人
Smart Transportation —— 智能交通
Reinforcement Learning —— 强化学习
Smart Energy Management —— 智能能源管理
Humanoid Robots —— 人形机器人
Automated Trading Systems —— 自动化交易系统
Precision Medicine —— 精准医学
Smart Retail —— 智能零售
Industrial Internet of Things (IIoT) —— 工业物联网
Intelligent Tutoring Systems —— 智能辅导系统
Sentiment Analysis —— 情感分析
Smart Agriculture —— 智能农业
Autonomous Drones —— 自主无人机
Machine Perception —— 机器感知
Smart Security Systems —— 智能安防系统
Ambient Intelligence —— 环境智能
Smart Financial Technology —— 智能金融科技
Smart Waste Management —— 智能垃圾管理
Quantum Computing —— 量子计算
很多人觉得知识图谱难入门,其实主要是因为知识图谱的技术栈比较长,如果要掌握所有技术,入门时间就会很长,而且也抓不住重点。其实不要把知识图谱构建想得太复杂,掌握学习技巧,可以在几个月内具备构建知识图谱的能力。
同盾知识图谱又名“云图”,结合NLP、图计算、深度学习、知识推理和可视化等技术,面向反欺诈、风控、营销以及公共安全等场景,围绕行业知识图谱、知识图谱构建平台和知识图谱分析套件三大核心模块,提供一整套高效、灵活打造的一体化知识图谱构建与应用解决方案。同盾知识图谱具有灵活的产品架构、强大的知识计算引擎、场景化解决方案或模型、智能的可视化交互,相对技术还是挺强的,前段时间发布的《2020爱分析·知识图谱厂商全景报告》中,金融领域的四大主流应用场景,银行对公、银行零售、保险、泛金融领域知识库中,同盾知识图谱技术都榜上有名,杠杠的。
现在国内IT互联网公司大部分NLP和IR人才被BAT公司垄断,导致市面上的优秀NLP人才极少,因此很多创业公司紧缺这方面的人才。从人工智能发展的趋势来看,我认为这是一个不错的领域,可以为之奋斗一生。NLP几乎是互联网机器学习业务的必备技能。因为互联网内容最大比例的是文本。NLP挺好找工作的,但是最好机器学习的内容学全一点,毕竟实际工作内容是很多类型的,所以NLP是比较必要但不充分。我读研时好多年前就觉得自然语言是个很有前途的方向。所以想如果我读博就念这个方向。结果我找来书看过后。深深觉得自己不行。因为我念的是纯文科的语言学。
通过问卷获得数据 通常来说,数据采集有两种方式,第一种是利用网络问卷调研的方式,获得用户心理和行为习惯层面的定量数据;第二种是在产品页面设置模块、、文字等埋点的方式,收集页面数据
2
调研前工作准备 首先要明确产品定位、产品规划及架构,对产品有全面的了解;然后,再明确调研目的,研究目的是问卷调研的核心,决定了调研的方向、研究结果如何应用等接着,需要根据研究目的,确定调研的内容和目标人群,调研内容越细化越好,目标人群越清晰越好
3
如何设计问卷 在问卷设计中,题目的措辞、逻辑关系等,会影响用户对问题的理解和做答,从而直接决定了研究
在这个快速发展的智能硬件时代,困扰应用开发者的一个重要问题就是如何在功率、覆盖范围、传输速率和成本之间找到那个微妙的平衡点。企业组织利用相关数据和分析可以帮助它们降低成本、提高效率、开发新产品、做出更明智的业务决策等等。
大数据的价值体现在以下几个方面:
① 对大量消费者提供产品或服务的企业可以利用大数据进行精准营销。
② 做小而美模式的中小微企业可以利用大数据做服务转型。
③ 面临互联网压力之下必须转型的传统企业需要与时俱进充分利用大数据的价值。
设计目标决定衡量的数据指标,从设计目标出发,推导相关可量化指标。
还是以IM “购房意愿单”为例,结合该项目,我们来看一下运用gsm模型为此功能搭建数据指标框架。
Goal 设计目标
前面提到说设计目标决定衡量的数据指标,所以第一步要明确我们设计的目标是什么,或者说是为了解决什么问题。那么,购房意愿单的提出,有两个主要目标:提高C端用户发起会话的意愿度;提高 B端经纪人回复意愿度。
Sign 现象信号
确定了目标,我们再假设,如果能够达到这些设计目标,用户会产生怎样的态度和行为。假设购房意愿单真是切中了用户的需求,他们会有怎样的反应呢?
1 什么是知识增强大语言模型?
知识增强大语言模型是一种深度学习技术,旨在将特定知识应用于自然语言处理领域,以改善其表现和准确性。它使用知识嵌入来增强NLP模型,并与传统的词嵌入模型(例如Word2Vec)相比,更加准确。 比如,文心一言可以使用关于自然语言处理,语义和知识图谱的知识来学习语言,并增强任务的性能。
2 文心一言的能力有哪些?
文心一言的能力很强大。它可以用于提供精确的翻译,更好地理解自然语言,开发自然对话系统,生成新段落,找出回答,构建机器阅读系统,提取主题信息,自动问答机器等等。此外,它还可以为诸如情感分析和自动文本摘要等其他NLP任务提供增强服务。
3 文心一言如何帮助我们解决九个方面存在的问题?
文心一言可以帮助我们解决九个方面的问题,从精确的机器翻译(MT)到最佳回答技术(QA)再到文本解析技术,以及情感分析。在MT方面,文心一言可以帮助我们更有效地翻译文本,而无需考虑内容的大小或语义。通过机器学习,它可以根据文本语义和语言结构来生成最准确的翻译结果,从而帮助我们更有效地完成翻译任务。
http://wwwdocincom/p-2177206264html
任务机器人
知识图谱机器人
FAQ机器人
闲聊机器人
阅读理解机器人
query -> 纠错->标准化->文本特征提取->query改写[同义词] ->BM25 算法 -> 计算语句和候选句的相似度s(q,q') , 并排序
相似度计算:冷启动-深度学习匹配-知识图谱-拒识
https://blogcsdnnet/qq_42491242/article/details/105286787
https://zhuanlanzhihucom/p/84809907
字面匹配 文本相似度(jaccard, cosine)+ xgboost
词向量 word2vec,glove =Global Vectors for Word Representation
句向量 WMD[无监督] ,SIF
结论 虽然句子中无加权的平均词嵌入是简单的基准做法,但是Smooth Inverse Frequency是更强有力的选择
https://zhuanlanzhihucom/p/37104535
排序阶段也可以利用排序训练模型,得到知识库内的相似问,构造句对训练数据,训练有监督的模型
判断(query, question)的分数,选择分数最高的问题对应的知识点作为机器人回复
通过搜索引擎里 Query 和 Title 的海量的点击曝光日志,用 DNN 把 Query 和 Title 表达为低纬语义向量,并通过 cosine 距离来计算两个语义向量的距离,最终训练出语义相似度模型。该模型既可以用来预测两个句子的语义相似度,又可以获得某句子的低纬语义向量表达。
https://wwwjianshucom/p/8f19d915b3f8
联合学习
-文本分类:同时进行语句匹配和分类
-文本生成:匹配和seq2seq训练
多语料迁移:
-fine-tune
-adversarial loss
预训练模型
-ELMO , BERT
对话管理
query->nlu-DST-DPL -NLG ->response
NLU : 意图识别(规则或分类)槽位提取(NER)
DST-会话状态管理(DQN)
DPL- 会话策略学习,选择下一步
NLG- 根据action 返回回复文本
预判 客服机器人多轮对话的意图预判功能通常依赖于访客的接入渠道、着陆页、访问轨迹等数据,机器人可以通过这些数据来预测客户想要咨询的问题
https://blogcsdnnet/stay_foolish12/article/details/90265394
https://wwwcnblogscom/qcloud1001/p/9181900html
任务型机器人指特定条件下提供信息或服务的机器人。通常情况下是为了满足带有明确目的的用户,例如查流量,查话费,订餐,订票,咨询等任务型场景
理解了用户意图之后,通过引导用户完善任务要求,完成任务。
处理流程:场景选择,实体抽取,关系预测
问答式
引导式
根据知识逐步递进,一步步进行约束定义
从文章中抽取答案,阅读理解建模。
seq2seq, 上下文建模
ASR, NLP, TTS,MRCP
智能电话管理
人群管理,话术管理,电话任务管理,知识库管理,算法模型管理
外呼统计
任务监控,通话监控,意向度筛选,通话详情,统计分析
功能组件:语义解析,语义匹配,会话意图识别,答案生成,情感分析
深度迁移学习,知识图谱引擎
问答标注平台,模型训练平台,分布式爬虫,hadoop 集群
问答管理,相似问题,智能学习
回答,引导转人工
1- 单轮: 深度语义匹配 迁移学习 知识图谱
2- 多轮 对话管理-槽位提取-端到端学习-强化学习
3- 阅读理解机器人-开放域闲聊机器人
欢迎分享,转载请注明来源:浪漫分享网
评论列表(0条)