近段时间以来,虚拟数字人市场迅速升温,实现规模化落地还面临哪些问题?

近段时间以来,虚拟数字人市场迅速升温,实现规模化落地还面临哪些问题?,第1张

随着相关科技和经济的发展产生了很多新兴的产业,虚拟数字人市场迅速升温,引起了大家的广泛关注和讨论。这些VR市场有着很大的热度,一切都是全新的,有着很好的发展潜力和可能性。在相关的科技中已有着很大的创新,是值得大家研发的领域。因为这个领域还有着很多的未知和发展,但是不得不注意实现规模化落地也面临着非常多的困难,相关的基础设施还无法支撑这一项技术。

要想规模化落地,还要解决相关的产业链问题。虚拟数字人还是非常新兴和前沿的行业,相关的产业并没有很好的沟通协作能力,不能彼此很好的进行发展。这是非常大的一个问题,这样在进行交流和运输中会碰到很多的壁垒。让整个运作无法高效的进行,并且在运营过程中也会产生很多的麻烦和问题,这些都是一些现实的事情。

同时虚拟数字人市场相关的下游行业并没有打通,不能落地进行很好的发展,一切还在观摩的阶段。很多的消费者或者说是民众对这个事情没有一个很好的认知,一切都是非常朦胧和模糊的,这对于虚拟数字人的发展来说有着致命的打击。并且相关的服务行业没与这个虚拟数字的人进行很好的联结,不能让其更好的出现在大众的眼前。

虚拟数字人技术还有很多的弊端没有非常好的落地能力,如果一旦想在某个地区进行产业化的发展,要推动这个地区相关产业园的建设。让更多的技术和人才集聚在这个领域,这样才能让这一行业焕发出新的生命力和活力。否则的话,一切还有很多的麻烦和困难要解决。虚拟数字人生产的效率还没有一种很好的数据可以表现出来,一切都有着很大的投资,而经济效益虽然预期中是非常好的,但是无法保证。

北京时间5月17日,在北京搜狐峰会上搜狐官方和搜狗合作成功推出全网第一位“数字人”主播。什么是“数字人”?其实就是虚拟声音,可以用良多方言播报新闻。关于此技术率先研究出来的数字人模板,是当红明星柳岩。

到底什么是“数字人”

所谓“数字人”形象,其实就是模仿明星声音的虚拟朗诵人,值得关注的是这样的主持人还能模仿多种方言进行播报工作。真真的“全能明星”。“虚拟版”柳岩听着特别像原柳岩,说话、动作都很自然,毫无违和感。而且其专业度也相当高,声音声调都很自然。在数字人声音的建造中,也将人物模板——柳岩的个人辨识性习惯模仿下来。着实不易。

数字人已正式上线搜狐客户端,有趣的同时带给用户极致体验

截止日前,柳岩版数字人正在搜狐客户端“成功营业中”。其具体操作很简单,就是点进“全天不下线频道”,再单击收听小logo,柳岩的声音就萦绕入耳了。是不是相当简单?更优秀的是其方言版也是可以选择的,真心接地气。

数字人潜在原理——其实也并不复杂

柳岩版“数字人”其实是通过搜狗的AI智能延伸而来,其尖端技术仅需为数不多的声音资料、视觉素材就可以制造出多维声音输出。但是这也不是该项技术中最厉害的,更厉害的点在于其基于真人声音的逼真靠近。通过人的音色、音调以及各类方言的特殊性和唯一性的捕捉,构建出只有柳岩能发出的声音,也是着实不易。这也体现了我国互联网技术在国际上的领先地位。

阅读模式不断刷新,我们已进入“高科技换血”时代

从经典的纸质书籍阅读模式,到电子设备阅读新纪元开启。再到现在的数字人阅读模式。一切都在变化,而一切似乎都没有变化……变化的是阅读模式,不变的是我们渴求知识的心情。

“高科技换血”其实并不抽象,而是真正存在于我们身边。值得一提的是,不久之后,其他明星版本的“数字人”也会相继诞生。让我们共同期待。

大数据时代,大家拼的是技术。从“数据人”这冰山一角就能看得出来,人类的创新能力是多么的伟大且先进。愿我国网络科技能够不断前进,再创辉煌。加油中国,加油世界。

数字人的弊端我觉得相对来说比较明显,怕的就是他会不断进化,一直到最后会有了自己的思想,这就比较恐怖了,数字人一旦有了自己的思想,人类的处境就会变得相对来说危险了。

我想大家都应该承认,数字人技术已经打开了大量信息技术行业未知的机会,不过这也导致了一种奇怪心态的出现,这种奇怪的心态可能在各个行业都会出现。它更多的是一种哲学的问题,只要有足够的数据,数字人学习算法就能解决我们现实生活中面对的大多数问题。不过这个想法面临着一个大问题。它不支持数字人的进步,它实际上会大大减少信息化处理的价值,因为它忽略了重要的数字人的安全原则,而数字人不断发展对人类到底有什么影响我们却都不得而知。

数字人的普及会造成人才分化极端的问题,未来如果数字人普及起来,社会上可能有很多的工作都会被数字人代替。未来的社会上能有工作的就只剩下非常有本事的人,相对资金比较薄弱的企业或者个人,将会遭受到大规模的失业。这样就会让贫富差距越来越明显之后就再也没有办法解决这个问题了。

我相信在我们的日常生活问题中,几乎所有的东西都有利弊,数字人也一样是一把双刃剑,在数字人的发展这个方面,我们不仅要以积极向上的态度面对,与此同时我们还要对这个时代有信心,对数字人的相关研发人员有信心。

虽然虚拟数字人及其产业已经开始加速,但是要实现大规模商业化,仍面临技术门槛高、周期长、成本高、人才稀缺等难题。

虚拟数字人短期内的落地场景是面向B端的各类服务。目前来看,虚拟数字人主要分为虚拟偶像(洛天依、柳夜熙、翎Ling、梅涩甜等)、虚拟主播(央视网小C、新华社小诤、人民日报果果、湖南卫视小漾等)、虚拟员工(百信银行AIYA、哈尔滨啤酒哈酱、OPPO小布等),他们的主要功能是面向B端的媒体服务、企业服务和品牌营销服务。

虚拟数字人及其产业已经取得显著进展,但是受制于技术、成本、应用场景等因素的制约,尚处于初级发展阶段但处于加速期,其未来的快速发展取决于技术、资本、政策、商业应用场景的快速拓展,而关键则在于元宇宙整体发展情况的进展。

虚拟数字人制作价格通常从数千元到数十万元不等。在制作费用上,要求真实和功能越高,成本越高。当然了,有时会需要面部捕捉设备+动作捕捉设备,再加一套可同时配置在电脑和手机上的软硬件直播系统,价格可能要另外计算。想要节省成本,其次就要从高昂的电脑硬件上去节省,现在很多的小伙伴们没有高性能的电脑配置和高性能的存储,但是想要减少预算来制作虚拟人,那么推荐你可以选择在赞奇云工作站来进行建模制作全流程服务,摆脱本地电脑配置不足导致的效率低制作过程慢的情况。

赞奇云工作站拥有专业级显卡、超大内存等多种机器配置。机器显卡更新及时,提供高配机型,海量资源可按需选择,内置软件中心提供最新软件安装包,一键下载,省去搜索时间,提高工作效率。

数字人“长小姣”正式上岗长三角之声

 数字人“长小姣”正式上岗长三角之声, 随着长小姣的“加盟”,长三角之声短视频制播效率得到大幅提升,大大缩减了时间和技术成本,数字人“长小姣”正式上岗长三角之声。

数字人“长小姣”正式上岗长三角之声1

 在经过2个多月的“试用期”之后,全国省级电台中首位“虚拟员工”转正上岗,开始了在上海人民广播电台长三角之声的主播工作。“长小姣”是长三角之声与腾讯在线智能视频创作平台“智影”联手打造的虚拟数字人主播,2022年5月5日开启实习主播生涯。

 中国数字经济百人会7月27日发布的《数字人:数字经济新赛道》报告称,据统计,2021年数字人相关企业融资共有2843起,融资金额达2540亿元(人民币,下同)。2022年第一个月,数字人领域融资量就接近100起,融资金额超4亿元。

 报告称,数字人作为信息技术交叉融合的前沿领域,既是数字空间的基本单元,又是数字政府建设的重要抓手,将逐渐实现在多场景、多领域的广泛应用,有望成为我国数字经济发展的新增长点。

 目前,在国家相关政策的引领下,以及数字人技术进步和大量市场需求的加持下,我国数字人商业化场景应用落地提速,数字人相关企业也获得资本市场青睐,引发新一轮的数字人发展热潮。

 近年来,我国密集出台了《“十四五”数字经济发展规划》《网络直播营销管理办法(试行)》《广播电视和网络视听“十四五”科技发展规划》等多项政策,支持人工智能、5G、虚拟现实等数字人相关技术创新以及在文化和娱乐产业等领域应用,并加强信息安全领域的监管和规范。报告称,政策引领数字人技术创新和产业应用。

 报告称,数字化空间拓展消费需求市场。作为连接数字世界和现实世界的重要媒介,数字人为用户提供全新交互体验,实现人类感官维度的全面拓展。为抢抓市场机遇,众多企业纷纷入局数字人领域,资本市场也开始重点关注相关赛道,数字人领域或将迎来快速爆发期。

 报告认为,在政策、技术、需求、资本等各方驱动因素作用下,数字人的商业化应用更加多元。数字人作为当前公众接触和了解元宇宙的`重要窗口,有望成为元宇宙版图中最先快速发展并规模创收的产业。

数字人“长小姣”正式上岗长三角之声2

 2022年7月29日,在经过2个多月的“试用期”之后,全国省级电台中首位“虚拟员工”转正上岗,开始了她在上海人民广播电台长三角之声的主播工作。

 “长小姣”是长三角之声与腾讯在线智能视频创作平台“智影”联手打造的虚拟数字人主播,2022年5月5日开启实习主播生涯。第一次“出镜”,给网友们带来了有关“奥密克戎新变种或能逃避免疫保护”的最新研究动态,之后便活跃在长三角之声科创垂类节目《思创空间》的短视频专栏中。

 她充分发挥虚拟数字人主播不受时空限制的优势,第一时间将科技前沿动态传递给受众,语态鲜活、播报流畅、情感表达立体,让人耳目一新。“实习”至今,相关视频的播放量、话题阅读量已破300万。

 (图:长小姣首次实习视频画面)

 作为全国首个由省级电台创办的区域广播,长三角之声自开播之日起,就秉持“全媒体”、“产品化”运作模式,不断探索技术赋能融合转型,致力于提升区域传播影响力。继2021年试水阿基米德智能语音虚拟主播系统应用于广播新闻专栏、并联动长三角14个城市的广播频率共同播出之后,2022年5月起,再次在虚拟数字人主播领域发力,上线专属形象“长小姣”。

 长小姣基于腾讯AI的超写实数字人建模、多模态识别及生成、实时面部动作生成及驱动、迁移学习等多项人工智能前沿技术,结合扫描还原、面部肌肉驱动、表情肢体捕捉等技术,有着高达98%的真人相似度。数据显示,智影数字人唇形模型效果比真人唇形效果高234%,因此看上去更加自然,声音支持多情感、多方言、多风格朗读,令适配的内容类型也更加多元。

 不同于目前大多靠动作捕捉驱动的数字人,智影数字人播报完全依靠AI算法进行驱动,只需输入文本内容,就能根据语义播报,并即时输出播报视频。智影的云端智能视频创作工具系统目前可支持最高5000字文本配音转换,支持播报语音倍速、局部变速等效果,操作简单快捷,可一站式生成堪比真人主播的新闻播报内容。

 随着长小姣的“加盟”,长三角之声短视频制播效率得到大幅提升,大大缩减了时间和技术成本,助力提升信息传播范围和效力。

 智影不仅基于腾讯AI交互部打造了数字人播报,还联合更多腾讯AI能力推出了文本配音、文章转视频、智能横转竖等功能,无需下载,云端即可实现视频剪辑,同时支持多轨剪辑、变速、蒙版、关键帧、AI朗读、自动识别字幕、自动踩点等基础剪辑功能,面向所有用户提供免费的一站式视频剪辑及制作服务。

 此次长三角之声与智影的合作,可以说是AI赋能、持续提高传统媒体制播效率和智能化水平的典范,也为推进媒体融合向纵深发展创造了更多可能性。未来,双方还将进一步为推动人工智能技术应用于传统媒体日常内容生产提供更多场景,以技术融合持续推进新型主流媒体建设。

数字人“长小姣”正式上岗长三角之声3

 长三角之声与腾讯在线智能视频创作平台“智影”联手打造的虚拟数字人主播“长小姣”,在经过2个多月的“试用期”之后,在上海人民广播电台长三角之声转正上岗,开始主播工作。

 据了解,“长小姣”于2022年5月5日开启实习主播生涯。“长小姣”第一次“出镜”,给网友们带来了有关“奥密克戎新变种或能逃避免疫保护”的最新研究动态,之后便活跃在长三角之声科创垂类节目《思创空间》的短视频专栏中。至今相关视频的播放量、话题阅读量已破300万。

 据介绍,“长小姣”基于腾讯AI的超写实数字人建模、多模态识别及生成、实时面部动作生成及驱动、迁移学习等人工智能技术,结合扫描还原、面部肌肉驱动、表情肢体捕捉等技术,真人相似度达98%。数据显示,智影数字人唇形模型效果比真人唇形效果高234%,同时声音支持多情感、多方言、多风格朗读。

 值得一提的是,不同于目前大多靠动作捕捉驱动的数字人,智影数字人播报完全依靠AI算法进行驱动,只需输入文本内容,就能根据语义播报,即时输出播报视频。智影的云端智能视频创作工具系统目前可支持最高5000字文本配音转换,支持播报语音倍速、局部变速等效果,可一站式生成堪比真人主播的新闻播报内容。

 此外,智影在云端可实现视频剪辑,同时支持多轨剪辑、变速、蒙版、关键帧、AI朗读、自动识别字幕、自动踩点等基础剪辑功能,并提供免费的一站式视频剪辑及制作服务。

欢迎分享,转载请注明来源:浪漫分享网

原文地址:https://hunlipic.com/qinggan/938125.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2023-07-11
下一篇2023-07-11

发表评论

登录后才能评论

评论列表(0条)

    保存