未来已来:数字人,就在你身边

  • A+
所属分类:heygen ai百科



未来已来:数字人,就在你身边


这是Instagram上的百万博主Lil Miquela,她目前已经坐拥300万粉丝,甚至曾被《时代》评为“25位最具影响力的年度互联网人物”。


(图/Mil Miquela via Instagram)


几年前,Milquela曾卷入一场有趣的社交媒体事件之中。2018年,另一位名叫Bermuda的博主“爆料”,Miquela不是人!如果这还不够抓你的眼球,再告诉你一件事,Bermuda实际上也“不是人”。它们都是社交媒体上活跃的数字人


数字人早已算不上什么新鲜的概念,如今它们更是遍布社交网络。有趣的是,即使人们知道它们不是真的,依旧可以产生共鸣。用Lil Miquela的运营者的话说,人们关注的是Lil Miquela“真实且真诚的个性”。


这就引出了一个有趣的问题:为什么我们会觉得一个数字构建拥有“个性”?事实上,神经科学已经表明,我们很难不对任何看起来像人类的东西产生本能反应。我们的大脑已经与面部信号相适应,并且能对它做出情感上的反应。这也是为什么,相比于其他许多同样自动化渠道,数字人可能在某些方面更具有天然的优势


但人们的想象力不局限于此。随着ChatGPT这样的大规模语言模型的飞速发展,人们已经开始探索另一种可能性,将数字人与大规模语言模型相结合,让人机互动迈入了一种新“次元”。



  数字人的“大脑”  


我们最常说的数字人,不仅指计算机生成图像(CGI),它在更多方面可以如同“人”一般行事。计算机专家将数字人分为4种基本类型,包括虚拟助手、虚拟伙伴、虚拟代理人和虚拟影响者。


根据交互的目的和交互深度,数字人通常被分为四种类型。(图/原理,参考来源:哈佛商业评论)


如此分类的依据主要在于人机交互的目的(着重点)以及交互深度,比如,数字人的主要目标是达成一项任务,还是参与一种体验,又或者,交互的数字人是不是个性化的,还是面向更广泛的群体的。


换句话说,无论在哪种情景下,交互才是数字人的核心如果说精美的CGI仅仅为这些数字人提供了一层漂亮的皮囊,那么它还需要一个真正“有趣的灵魂”和“聪明的大脑”。这就是大规模语言模型的用武之地。


2021年9月,巨量AI模型“源1.0”问世,一经发布便问鼎全球最大规模的中文AI模型,它拥有出色的自然语言理解和生成的能力(详见《这篇文章真不是AI写的!》)就像一个聪明绝顶的“大脑”。近日,有开发者便基于“源1.0”开发了一款“一键式构建专属数字人”的架构Fay


Fay是一个完整的开源项目,其中包含了Python内核以及UE数字人模型。开发人员可以利用这个平台,便捷地构建各种类型的数字人。


根据开发者介绍,Fay的基本理念就是“把人数字化,以行人的职责”。具体来讲,首先是通过各种技术把人的特征数字化,比如进行语音识别、情绪分析,构建人的表情和动作,合成带有情绪的语音并输出,让这个数字人有了“耳朵”“嘴巴”。


Fay的核心逻辑。(图/原理,参考来源:Fay控制器)


而要让数字人履行人的职责,最核心的部分便是NLP(自然语言处理),也就是它的“大脑”。


传统程式化的对话模型只能产生机械式的回答,也就是“教什么就说什么”,因此可能总会被调侃成“人工智障”。而像源1.0这样的大模型,则有能力生成意料之外的惊喜而有趣的对话大模型还具备记忆能力,甚至可以扮演多种人物角色,使用不同的语言风格,仿佛带有情感地和人交流,从而产生真正高质量的人机交互


目前,Fay的开发者正在与各个领域的公司合作,进行更多尝试,比如为公司打造社交媒体平台的数字主播,或者在个人的手机、电脑等电子设备上运行,进行实时互动,帮助完成更具个性化的操作。


如果说钢铁侠有他的“贾维斯”,或许很快你也能拥有属于自己的数字助手。



  数字人的未来  


AI大模型可以说掀起了全球新一轮科技革命,事实上,它的发展同样给数字人带来了更多可能性。如果我们大胆畅想一下,下一代的“Lil Miquela”或许有机会表现出更多“自主性”。这并非天方夜谭。


比如,在近期的一项新研究中,一组开发团队利用GPT3.5-turbo版本,创造了一种非玩家控制角色(NPC)数字人的全新模式。生成代理(generative agent,GA)在AI大模型的驱动下可以模拟出更多人类的行为,拥有更多个性和自主能力


新研究创造了沙盒小镇,利用AI大模型驱动GA模拟人的行为。(图/Park, J. et al., arXiv)


这不仅为游戏带来了更多惊喜,同样揭开了未来数字人的更多可能性


更早一些,同样是基于源1.0模型,来自开发者社区的成员已经创造出了第一个可以跟人类玩“剧本杀”的AI。在游戏中,AI不仅能和其他玩家流畅对话,甚至会为了达成任务主动说谎“套路”人类玩家。


目前,基于源1.0已经开发上线了几十款AI应用,包括心理咨询师陪练、数字演员、正能量陪伴机器人、抬杠机器人、游戏NPC对话、文案写作、金融文本分析等等各种极具应用价值和创造力的应用。



  未来已来  


自从AI问世之初,“AI威胁论”的探讨也从未停歇。比如,就在ChatGPT火爆之时,就有人立刻列出了“最可能被ChatGPT取代的职业”的清单。但如果换个角度看待这个问题,与其说AI将取代某些职业,不如说是这些职业在未来可能会与AI产生更深度的结合。


我们得承认,的确存在许多AI能比人类更高效完成的任务,如果让算法来完成某项特定的任务,比如那些工作量大或者重复性强的工作,可以省去很多让人做的麻烦和花销,往往还能获得更加稳定而一致的表现。但人类在很多方面都是无可替代,我们不必夸大AI的能力,更不用贬低我们人类自己的智慧和贡献。


引用机器学习领域顶尖研究者吴恩达的话说,担心人工智能颠覆人类,就像是担心火星上人口过多一样,完全是杞人忧天。ChatGPT引发的热潮恰恰表明,我们可能正站在技术历史的拐点上,研究人员和开发者才刚刚开始探索AI的更大潜力。


未来已来:数字人,就在你身边

在中文领域,源1.0作为拥有2457亿参数的大规模中文AI模型,开创了适合中国大模型的商业模式。通过开源,源1.0构建了繁荣开源生态,汇聚4000余名开发者,覆盖互联网、金融、教科研和自动驾驶等行业领域,大大降低了不同行业不同任务的AI应用开发门槛,并显著提高了AI应用的精度,助力开发者实现商业化探索。


为了更好地支持开发者基于源1.0进行各类AI创新,第6期大模型开发者沙龙将于4月26日举办。本期论坛将讲述两位开发者团队基于源大模型开发的应用产生商业价值并创业成功的故事,深入探讨未来源大模型生态无限的商业想象空间及开源大模型对产业变革的深远意义。


​​

#创作团队:

撰文:Takeko

排版:雯雯

#参考来源:

https://www.wired.com/story/lil-miquela-digital-humans/

https://hbr.org/2023/03/ai-with-a-human-face

https://www.news.iastate.edu/news/2023/02/20/digital-humans

https://github.com/TheRamU/Fay

https://blog.csdn.net/aa84758481/article/details/124758727

https://arxiv.org/pdf/2304.03442.pdf

[美] 贾内尔·沙内,《你看起来好像……我爱你》,中信出版·鹦鹉螺,2021年4月

#图片来源:

封面图:Pixabay, ThankYouFantasyPictures

首图:Pixabay, ryypurnama

发表评论

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: