人工智能产品的定义较为广泛,智能硬件、机器人、芯片、语音助手等都可以叫做人工智能产品。本文讨论的人工智能产品主要是指在互联网产品中运用人工智能技术。
互联网产品主要着手与解决用户的痛点,对于C端产品来说,痛点就是指的个人想解决而无法解决的问题,如个人想要美化自己的照片,但是他不会复杂的PS软件,于是美图秀秀就可以解决这个痛点。从KANO模型中,就是满足用户的基本需求与期望需求。
人工智能产品(在互联网产品中运用人工智能技术)则是要满足用户的兴奋需求。如将情感分析运用到电商的产品评论中,用户则可以通过可视化的数据展示来大致对产品有个全面、直观的了解,而不再需要自己一页一页的翻看评论内容。
互联网产品主要关注点在于用户需求、流程设计、交互设计、商业模式等。着眼于用户需求,设计满足用户需求的产品,通过合理的流程设计、交互设计达到产品目标,进而实现商业目标。典型的思路是发现用户需求——>设计满足用户需求的产品——>迭代完善、产品运营——>商业变现。
人工智能产品关注点在于模型的构建,它不再是对于布局、交互的推敲,而是通过选择合适的数据,构建合适的模型,最终呈现出来的是好的效果。什么是好的效果呢?这就需要引入评测指标。互联网的评测指标有我们熟知的留存率、转化率、日活跃等,那么人工智能的产品主要是通过一些统计指标来描述,以情感分析为例,把情感分析看成一个分类问题,则可以使用P、R、A、F值来描述。
1)查准率(Precision):P值,衡量某类分类中识别正确的比例,如情感分析中,有10条被分类为“正向”,其中8条是分类正确的(由人工审核),那么P=8/10=80%
2)查全率(Recall):R值,又叫查全率,又叫召回度,指的是某类被被正确分类的比例,同样以情感分析为例,100条数据中有10条是正向的,机器分类后,这10条中有7条被分类为正向,则R=7/10=70%
3)F值,因为P值和R值通常是两个相互矛盾的指标,即一个越高另一个越低,F则是两者综合考虑的指标,不考虑调节P、R权重的情况下,F=2PR/(P+R)
4)精确度(Accuracy):这个最好理解,就是被准确分类的比例,也就是正确率。如100条数据,90条是被正确分类的,则A=90/100=90%。
以上指标越高,说明模型效果越好。
我们从上面内容可以知道,人工智能产品设计关注:数据——>模型——>效果评估。
现在我们以情感分析为例子说明产品设计的过程。
1)数据:
数据的选择对最终模型的结果有直接影响,情感分析,根据不同的目的,选择的数据也不同。如将情感分析运用于**票房预测,则一些更新及时、内容丰富的数据源,如微博,是比较好的选择。如果是应用于商品的评价,如电子产品,很多评测内容是无法在短短几句话内描述清楚的,这时候微博不是个好的选择,选择论坛上更新较慢、但是详细的内容就比较适合。
如果能在产品的早期就有引入人工智能的打算,则可以在产品中事先做好数据采集。
2)模型:
在选择模型中,产品需要了解不同的模型的优缺点,进而选择更加合适的模型。在情感分析中,NB、SVM、N-gram都是常用的模型,其中SVM效果最好(这是已有的结论),如果是其他的智能产品,可能需要算法团队进行实验,给出测试数据,进而选择合适的模型。
3)效果评估:
效果评估在上文中已经描述得比较清楚,具体指标不再赘述。
4)产品呈现:
最后这一步,是将结果展示给用户。在情感分析中,我们可以选择雷达图、词云、情感趋势图来展示结果。取决于产品属性,如电商产品评论挖掘,可以使用词云;
如舆论分析,可以使用情感趋势图。
人工智能产品的设计要关注:数据、模型、评判、呈现。
机器学习是人工智能的一个重要领域,按照其学习方式来分类,主要可以分为以下四种类型:
监督学习:这种类型的机器学习利用已知的数据集来训练模型,并用于预测未知数据的结果。其过程是通过输入数据和对应的输出数据,通过学习建立一个函数来预测输出。
无监督学习:这种类型的机器学习没有明确的输出,只有输入数据。其任务是在输入数据中找到有意义的结构和模式。无监督学习通常用于聚类和降维。
半监督学习:这种类型的机器学习结合了监督学习和无监督学习的特点。在半监督学习中,一部分数据有标签,一部分数据没有标签,通过有标签数据的指导来学习未标签数据。
强化学习:这种类型的机器学习利用试错法进行学习,通过对环境不断的尝试和反馈来获得最佳决策。其过程是在不断的尝试和学习中,通过获得奖励和惩罚来调整学习策略,以最大化长期奖励。
无监督学习是一种机器学习的方法,其特点是在训练模型时不需要标记好的样本数据。相比监督学习,无监督学习更加依赖于数据本身的结构和模式。下面是一些常见的用于无监督学习的样本数据:
无标签数据:无监督学习不依赖于预先标记好的数据,因此可以使用未标记的数据作为样本。这些数据通常只包含输入特征,没有对应的目标变量。
非结构化数据:无监督学习可以处理各种形式的非结构化数据,例如文本、图像、音频等。这些数据通常没有明确的类别或组织结构,需要通过无监督学习算法来探索和发现内在的模式和关系。
聚类数据:聚类是无监督学习中常见的任务之一,用于将数据集中的样本划分为不同的组或簇。在无监督学习中,可以使用未标记的数据来训练聚类算法,从中发现数据点之间的相似性和差异性。
异常检测数据:异常检测是无监督学习的另一个常见任务,用于发现数据集中的异常或离群点。无监督学习可以利用未标记的数据来构建模型,识别与正常模式不同的异常行为。
降维数据:降维是无监督学习的一种技术,用于将高维数据映射到低维空间。在无监督学习中,可以使用未标记的数据来学习数据的内部结构和特征之间的关系,以便进行降维操作。
总之,无监督学习所需的样本数据通常是未标记的数据,包括各种类型的非结构化数据,用于聚类、异常检测、降维等任务。通过这些样本数据,无监督学习算法可以自主地发现数据中的模式和结构,并提供对数据的深入理解和分析。
欢迎分享,转载请注明来源:浪漫分享网
评论列表(0条)