​“双语”郭德纲出圈!背后团队浮出水面,7个月内狂揽100万美元

  • A+
所属分类:heygen ai百科

























AI的进击,对人类现有工作的挑战,不是即将到来,而是“狼”已经来了。


01

郭德纲说英语相声火了



近期,“郭德纲说英语相声”等一系列AI视频引发高关注度,AI不仅对视频内容进行翻译,同时自动拟合声线、口型。


还有人用AI模拟知名歌星泰勒·斯威夫特、演员艾玛·沃森以及特朗普、马斯克等外国名人说地道的中文,中国演员蔡明说流利英文的短视频发布在网上,语种切换后,口型、腔调几乎一致,有人称赞“这才是译制片腔调的翻译”。


这些视频并非简单的配音或者AI变声,而是高度贴合人物声线和风格甚至连嘴型都匹配,以假乱真的程度让围观者大为震惊。


随着视频大火,视频背后的AI生成工具HeyGen也跟着浮出了水面。


据悉,HeyGen是一款AI视频生成器。目前支持10种输入语言和8种输出语言,包括英语、中文、西班牙语、意大利语和日语等。在它的加持下,视频中的人可以轻松“掌握”多国语言。HeyGen在9月新增了“视频翻译”功能,根据Similarweb显示,9月份HeyGen的访问量环比高增92%至732万,自9月中旬已超过AI视频工具Runway。


​“双语”郭德纲出圈!背后团队浮出水面,7个月内狂揽100万美元


HeyGen的产品正式上线后的一年不到,创始人徐卓(Joshua Xu)就发文表示:HeyGen在7个月内实现了100万美元的ARR(年度经常性收入),并保持连续9个月50%的月环比增长率。


​“双语”郭德纲出圈!背后团队浮出水面,7个月内狂揽100万美元


使用HeyGen不需要用户有视频编辑技能,只需选择头像—输入脚本—单击“提交”,就可以在短短几分钟内生成自己所需的视频。


每个账号都有2分钟的免费试用时长,但是生成视频需要排队等待。据《深圳商报》报道,有网友表示,自己在排队等待了7000个视频之后,终于完成了视频翻译。“口型完美,卡点和嘴型都对得上,声音克隆稍有缺陷,情感还原度稍有欠缺。毕竟只通过40秒的原视频来克隆音频,已经十分优秀了!”该网友称赞。


也有网友对《深圳商报》表示,自己仅用一张人物照片便生成了一个口播视频,有包括中文在内的50多种语言可供选择,其中,英文的口型支持最为理想。“成品效果相当出色,与此前体验过的国内同类产品相比,HeyGen在各方面都有较大的优势和突破。”


目前,HeyGen可以支持50多种语言和300多种不同的音色,用户可以上传自己的照片进行个性化形象定制,HeyGen也贴心地为用户提供了上百款数字人素材和模板。


盈利模式方面,HeyGen主要依靠C端客户付费,视频生成付费模式分为“创作者(Creator)”和“商务(Business)”两种,最低24美元/月。也支持“声音克隆、人像精调”单独付费。未来将逐步开放API接口、团队协作和企业功能。


HeyGen可以基本保证1080P的分辨率,满足广告、电商、新闻等行业的需求,还能帮助用户制作PPT。此外,HeyGen还提供了文本转视频、音频上传、视频分享和多种场景视频等功能。


当然,HeyGen还处在成长期,并不是完美的。目前,一些技术问题还会存在,比如生成的AI视频存在视频抖动、眨眼频率过高等问题。


如今,AI正广泛运用在绘图、配音、剧本写作等方面,“AI外语相声”“译制配音”等短视频的涌现,更加令人期待AI抹平语言障碍,促进传统文化交流与传播。有了AI技术,能否真正改变文艺创作和传播方式?面对快速迭代的AI冲击,会有更多文艺创作者“失业”吗?


02

来自国内创业团队



这个风靡外网的软件背后的开发者是实打实的中国团队——诗云科技(Surreal)。诗云科技由徐卓和梁望于2020年12月共同创立,其主要产品是内容生成引擎Surreal Engine,以深度学习和图形学为核心技术,旨在用AI生成内容,让用户以更低成本完成内容创作。


早在创立诗云科技之前,诗云科技联合创始人兼CEO徐卓便在该领域打下深厚基础。本科毕业于同济大学自动化专业的徐卓,后前往卡内基梅隆大学攻读计算机硕士学位。作为明星应用Snapchat前100名员工 ,徐卓从0到1搭建了Snapchat广告平台、推荐算法系统以及机器学习平台Barista,并负责AI camera的技术及产品研发,经验十分丰富。他表示,其目标是“消除语言障碍”,设想未来用不同语言制作视频内容和传播信息,将变得像打字一样简单。


另一位联合创始人兼CPO梁望,硕士毕业于卡内基梅隆大学人机交互专业,本科也来自同济大学,曾任字节跳动北美设计相关负责人。


诗云科技在成立次年3月就拿到了红杉中国和臻基金200万至300万美元的种子基金。2021年8月,又再次拿到一笔数百万美元Pre-A轮融资,由IDG资本领投、红杉中国种子基金和真格基金跟投。本轮融资主要用于技术研发、产品迭代和市场拓展。


​“双语”郭德纲出圈!背后团队浮出水面,7个月内狂揽100万美元


“诗云”取自刘慈欣科幻小说《诗云》,寓意人的创造性无法被科技取代,但创作的过程和效率却可以被机器极大优化,而现实中诗云科技要做的也是用AI生成内容,让用户以更低成本完成内容创作。


HeyGen的前身,是一款名为“Movio”的AI视频翻译平台,背后所依靠的模型是自家的多模态内容生成引擎“Surreal Engine”。


2022年7月,诗云科技推出多模态内容生成引擎Surreal Engine,将内容生产分为Understanding(理解)、Framing(视框化)、Rendering(渲染)三个步骤。区别于市面上的两大3D内容创作巨头:Epic Game的Unreal Engine和Nvidia的Omniverse,Surreal Engine让普通人也可以轻松进行高维度、可交互的内容创作。


​“双语”郭德纲出圈!背后团队浮出水面,7个月内狂揽100万美元


得益于此,HeyGen的最新版本Joshua Avatar 2.0在实时生成人物视频方面逼真度方面表现出色。


在官网上徐卓亲自上阵,推出了与自己形象一致的数字人。


​“双语”郭德纲出圈!背后团队浮出水面,7个月内狂揽100万美元


03

AI语音大爆发



网友对其潜力无比赞不绝口,有的担心这会让假消息更加泛滥。


​“双语”郭德纲出圈!背后团队浮出水面,7个月内狂揽100万美元


也有人表示:又一部分人可能要面临失业了。


​“双语”郭德纲出圈!背后团队浮出水面,7个月内狂揽100万美元


不过,它也有不足之处,比如有网友指出感情有些缺乏、翻译质量一般等等。


今年1月,微软发布了一种文本转语音AI模型“VALL-E”,该模型只需3秒钟音频,就可以合成任何人的声音,保留说话者的情绪基调,并可以说出任何内容。


到了今年秋天,AI 语音更进一步。苹果 iOS 17 操作系统新增名为“Personal Voice(个人声音)”功能支持用户把 iPhone 放在约 1.5 米远的地方录制约一个小时的音频,接下来用户就可以使用“另一个自己的声音”和他人交流。


可以预见,未来苹果生态中许多功能会和“个人声音”功能产生联动,例如 Vision Pro 的虚拟形象等。


前不久,ChatGPT 上线了语音功能,和以前一些AI机械声不同,它的声音拟真到了令人毛骨悚然的地步。它说话时,会加上一些组织语言的“emm”再说话,出现短暂停顿和轻微的呼吸声,更会结合语境进行语气处理,让语言有自然流露的情感和态度立场。它甚至有口音、有口齿音、有卷平舌和鼻音边音瑕疵,有重音,会调节不同字词句的语速。


而Animato公司推出的基于ChatGPT的智能交互式聊天系统Call Annie,已应用于苹果12以上的平台。Call Annie 还支持多模态输入,既可以打字聊天,也可以直接拍照让 Annie 看,还可以让她充当老师答疑解惑,也可以充当导游介绍地点。Call Annie一推出,就造成了美国的教育平台Chegg的股价暴跌50%。


随着算力和算法的进步,现在仅需秒级音频即可无限拟真,复制一个人的声音这件事变得越来越简单,衍生了诸多问题。


AI的进击,对人类现有工作的挑战,不是即将到来,而是“狼”已经来了。


04

慎重选择使用AI工具



对于AI可能带来的风险,监管必须推进。


今年8月15日起施行的《生成式人工智能服务管理暂行办法》指出,“提供者应当按照《互联网信息服务深度合成管理规定》对图片、视频等生成内容进行标识”,不少业内人士认为,可以通过给AI作品打上数字水印的方式来区分。但就目前网络流传的视频来看,许多AI合成作品并没有显著标识。


“AI工具确实在某些方面带来方便,但是作为用户,还是应该慎重选择使用AI工具,特别是收集个人生物信息的设备,避免个人信息的泄露,以及应该合理使用AI工具,避免对他人权益的侵害。不能过度使用AI工具对他人声音、肖像、名誉等造成损害。”福建格一律师事务所合伙人律师曾明泉对上观新闻表示。


中信建投认为,HeyGen既能丰富C端用户的娱乐传播,也能提升专业创作者的内容生产效率,用于影视、教育、营销等多领域。从最初的“AI孙燕姿”,到妙鸭相机,再到Heygen出圈,AI多模态应用正遍地开花,具备爆款应用的潜质。


中信建投建议关注AI多模态相关产品,同时关注游戏、影视、营销&电商、教育等领域的多模态应用进展。


来源 | 《商学院》杂志综合自北京商报、蓝鲸财经记者工作平台、解放日报·上观新闻、中信建投研究传媒团队、 深圳商报

封面 | 上观新闻

编辑 | 吴蒙

校对 | 袁海鸣

​“双语”郭德纲出圈!背后团队浮出水面,7个月内狂揽100万美元

​“双语”郭德纲出圈!背后团队浮出水面,7个月内狂揽100万美元

​“双语”郭德纲出圈!背后团队浮出水面,7个月内狂揽100万美元

​“双语”郭德纲出圈!背后团队浮出水面,7个月内狂揽100万美元

版权声明:“商学院”所推送的文章,除非确实无法确认,我们都会注明作者和来源。部分文章推送时未能与原作者取得联系。若涉及版权问题,烦请原作者联系我们,与您共同协商解决。联系方式:18513373688,商务合作请加微信18513373688。



获取商界新鲜资讯、聆听大佬领导“心经”
揭秘大公司里的“未可知”
直通全球22家知名商学院校

本篇文章来源于微信公众号: 商学院 喜欢可以搜索关注!

发表评论

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: