Pika出圈,AI视频时代正到来

  • A+
所属分类:heygen ai百科

事件:

11月29日,AI初创公司Pika正式推出AI视频生成工具Pika1.0,并提供网页版入口。同日公布获得5500万美元的融资,当前估值2.5亿美元。此外,23年11月多个AI视频工具取得进展,视频生成有望加速成熟。


本期投资提示:

AI视频工具技术路径清晰,目前主要面临模型、数据集、算力成本三方面掣肘。AI视频工具已从GAN(生成对抗网络)演进至Diffusion(扩散)框架,当前理论和未来技术路径较为清晰,当前主流的生成模型主要采用文本-图像-视频的方法,通过Diffusion等模型实现文生图,再通过类似Transformer的方法构建注意力机制保证帧间空间和时间的一致性,并进行插帧补足形成视频。目前AI视频工具仍面临模型、数据集、算力成本三方面的掣肘,随着产业发展和技术进步,AI视频厂商有望陆续填补相应短板。

Pika热度出圈,百花齐放下AI视频工具加速成熟。Pika发布正式产品Pika1.0,具备文生视频、图生视频、视频生视频、局部修改视频内容、修改视频尺寸五大能力,目前生成视频的时长约为3s,已在语意理解能力、生成视频的连贯性和清晰度方面有着较好表现。23年8月Runway的更新将生成视频的时长从4s延长至18s,取得较大突破。视频AI口型匹配和翻译工具Heygen商业化进展顺利,23年11月ARR(年度经常性收入)已达到1800万美元。此外,Meta、字节跳动、Stability ai的AI视频工具均在11月取得进展,百花齐放下AI视频工具有望加速成熟,爆款应用值得期待。

AI视频工具将推动创作者经济时代的到来。互联网时代已经降低了内容分发门槛和图文视频创作门槛,推动了图文、短视频UGC平台的建立。AIGC未来将提升图文、短视频UGC质量,并进一步降低更高维的长视频、游戏、3D创作门槛,“人人都是导演、人人都是游戏制作人”,全民创作时代可期。AI视频工具在C端短视频社交、B端营销创意等领域落地较快,未来随着技术成熟,还可在动画影视制作等领域应用,商业化前景广阔。

相关标的:1)有AI视频相关产品储备和探索的公司:美图公司、易点天下、焦点科技、果麦文化;2)其他在AI应用探索上有边际变化的公司:昆仑万维、掌趣科技、浙文互联;3)AI视频技术有望提升影视行业的效率,关注华策影视;4)计算机相关标的:虹软科技、万兴科技、福昕软件。

风险提示:内容和互联网监策边际趋严风险;竞争加剧影响利润率风险;AIGC技术演变过快的风险

          

Pika出圈,AI视频时代正到来

AI视频工具持续进步,爆款应用值得期待

文生视频主要经历了三个技术发展阶段。1)基于GAN(生成对抗网络):2017年,TGANs-C等模型已可基于GAN和VAE方法在文本描述下自回归生成视频帧,但存在分辨率低、视频目标运动单一而孤立等缺陷;2)融合Transformer架构:2021年,VideoGPT等模型推出基于GAN(用于图像生成)和Transformer架构(用于正确视频帧顺序)的混合方法,可有效实现视频时长的延展;3)基于Diffusion架构:2022年4月,来自谷歌的研发人员发布《Video Diffusion Models》,将扩散模型从图像生成推广至视频生成领域,成为当前视频生成工具的基石理论,Runway Gen2等工具都基于该架构。    

从技术路径来看,当前主流的生成模型主要采用文本-图像-视频的路径。即通过Diffusion等模型实现文生图,再通过类似Transformer的方法构建注意力机制,以保证帧间空间和时间的一致性,确认关键帧的排序,并在关键帧间进行插帧补足,形成视频。

模型能力、数据集、算力成本为掣肘AI视频工具落地的核心要素。1)算法和模型:需要在逻辑关系、语意和图像理解等方面提升,以保证生成的视频逼真且具备合理的叙事性。2)训练数据:当前高质量文本-视频对等数据集稀缺,随着AI视频工具陆续获得更多用户,数据飞轮效应有望加速数据集丰富度提升。3)算力:AI视频需要生成多帧图片进行拟合、且须保持帧间空间和时间的一致性,高算力消耗导致视频生成成本高,抬升了推广普及的难度,仍待算法改进及算力成本下降。目前AI视频工具仍面临模型、数据集、算力成本三方面的掣肘,随着产业发展和技术进步,厂商有望陆续填补相应短板。    

Pika出圈,AI视频时代正到来

百花齐放下,AI视频工具的理论与模型迭代进步迅速。除Pika1.0外,23年11月有多个AI视频工具取得进展:1)Runway Gen-2发布更新,生成视频的清晰度可达到4K,视频质量明显提升。2)Meta发布Emu Video,能够基于文本生成 512x512的4秒高分辨率视频,在生成质量和文本忠实度上表现较好。3)字节团队推出视频生成新方法PixelDance,可在生成视频中实现较好的动态性;并计划在未来2-3个月内推出产品。4)Stablility ai推出视频生成工具Stable Video Diffusion,支持文本到视频、图像到视频生成。百花齐放的竞争下,AI视频工具正在加速成熟,有望迎来属于AI视频工具“ChatGPT时刻”。

Pika出圈,AI视频时代正到来

AI视频工具将推动创作者经济时代的到来。互联网时代已经降低了内容分发门槛和图文视频创作门槛,推动了图文、短视频UGC平台的建立。AIGC未来的改变:提升图文、短视频UGC质量,并进一步降低更高维的长视频、游戏、3D创作门槛,“人人都是导演、人人都是游戏制作人”,全民创作时代可期。AI视频工具在C端短视频社交、B端营销创意等领域落地较快,未来随着技术成熟,还可在动画影视制作等领域应用,商业化前景广阔。    

Pika出圈,AI视频时代正到来

Pika:推出正式产品Pika1.0,用户规模已超54万

23年11月推出正式产品,联合创始人来自斯坦福。Pika成立于23年4月,成立后不久于Discord社区推出了AI视频生成工具的测试版本,经历超过四个月测试后,推出第一个正式产品Pika1.0,截至23年11月30日Pika已拥有超过54万用户。创始人:1)联合创始人、CEO 郭文景,为斯坦福大学AI实验室博士,A股公司信雅达实际控制人郭华强之女。2)联合创始人、CTO Chenlin Meng,为斯坦福计算机博士。

获得AI产业内多位核心管理者投资。公司公布完成总额为5500万美元的融资,估值为2.5亿美元。公司获得AI产业资本的青睐,目前公司的投资者包括Adam D'Angelo(Quora创始人及CEO)、NatFriedman(GitHub 前CEO)、Elad Gil、Clem Delangue(Hugging Face 联合创始人及 CEO)、Aravind Srinivas(Perplexity CEO)、Keith Peiris(Tome CEO )等。

Pika1.0核心功能:1)文生视频:语意理解能力、生成视频的连贯性和清晰度表现较好。时长方面:目前生成视频的时长为3s,暂落后于竞品Runway,Runway在8月的更新中将生成视频最高时长从4秒延长至18秒。2)图生视频:生成视频时长目前为3秒,有望支持图生视屏的镜头控制功能。3)视频生视频:输入一段原视频,Pika可根据用户要求的场景生成各种风格的视频动画。4)局部修改视频内容:输入原视频,用户可圈定需要修改的部分并提出要求,单独改变所圈定的元素。5)修改视频尺寸:扩写图片为AI绘画工具中的典型功能,Pika将该功能在视频生成中实现。

Pika出圈,AI视频时代正到来    


Heygen:可实现视频内容AI口型匹配及翻译,商业化进展顺利

Heygen主要功能为短视频内容AI口型匹配和翻译。可将一段视频中演讲者的发言更换为另一种语言并相应改变面部口型,曾因生成了泰勒斯威夫特说中文等视频而获得出圈关注。目前公司已开发自有视频AI模型,文本处理方面的大模型则是与OpenAI和Anthropic进行合作,此外与Eleven Labs合作获取音频技术支持。商业化进展较快,场景瞄准营销、教育、培训等。Heygen于2022年7月正式发布AI产品,根据公司披露,其在产品上线7个月后实现100万美元的ARR(年度经常性收入),23年11月的ARR达到1800万美元,商业化进展顺利。23年11月,公司获得560万美元的新一轮融资,当前估值已经达到7500万美元。

Runway:Gen2生成质量具备优势,生成视频时长可达18s

视频生成工具性能领先行业,当前已实现商业化。Runway的标准/专业/无限会员每月可获得625/2250/无限积分,价格分别为12/28/76美元/月,可额外购买积分,价格为100积分/美元,生成视频每秒时长消耗约5积分。Runway在8月发布更新,将Gen2的生成视频的最大长度从4秒提升至18秒,实现较大突破;11月的更新则增加了运动画笔等功能,并有效提升了视频画质。

AI视频生成之外,推出丰富AI工具赋能音视频创作工作流。AI视频生成仅为Runway的功能之一,其将AI能力拓展至视频制作的众多流程。基于自有云视频剪辑平台,Runway已发布了超过30个AI工具,包括文本/图像/视频生成等功能,旨在推出AI工具覆盖视频创作全工作流。

Pika出圈,AI视频时代正到来


相关标的

重点关注:1)有AI视频相关产品储备和探索的公司:美图公司、易点天下、焦点科技、果麦文化;2)其他在AI应用探索上有边际变化的公司:昆仑万维、掌趣科技、浙文互联;3)AI视频技术有望提升影视行业的效率,关注华策影视;4)计算机相关标的:虹软科技、万兴科技、福昕软件。

美图公司:AI视觉类产品覆盖生活和生产力场景。美图去年年底起陆续发布AI动漫、AI简笔画、AI写真等功能;截至目前,图生图超3000万人使用,文生图超2000万人使用,头像制作超800万人使用。今年6月发布产品主打生产力场景,根据公司10月发布会, 1)WHEE创作生态初见成效,生成的优质AI效果超550万。2)开拍用户规模快速增长,9月MAU突破35万。3)WinkStudio自7月中旬上线以来,已服务近10万名视频创作者。4)美图设计室2.0已为近百万中小电商卖家提供AI商拍服务。5)AI数字人生成工具DreamAvatar已于8月26日上线,主打AI演员与AI主播。6)AI修图师RoboNeo于7月开启内测,当前DAU近万人。美图在AI领域优势:1)流量优势,从修图到用于社交娱乐的个人图片生成以及生产力场景,高频打低频切入更顺畅。2)多年积累的图片资源、美学欣赏和技术优势。    

易点天下:公司是出海营销领军,拼多多、阿里等的合作伙伴,电商广告主投放稳健增长。公司推出AIGC营销素材平台KreadoAI。截至23Q3,KreadoAI已覆盖全球67个国家,注册用户数60万,有AI视频制作、AI工具、AI模特和克隆服务功能。根据公司股权激励草案,24年扣除汇兑损益后利润总额的股权激励目标3.45亿。

焦点科技:AI助手麦可将推出AI视频功能。旗下有B2B跨境电商平台中国制造网,依托平台推出AI助手麦可,现已具备AI图片生成、智能拓客等众多功能,计划在23年底推出AI视频、数字人等新功能,AI视频可帮助平台卖家创作营销素材,有望进一步赋能跨境电商产业链。

果麦文化:布局AI校对和AI漫画。2023年果麦文化以现金1,500万元增资星图比特,增资后持股比例为6%,并签订了《AI文字校对软件开发合作协议》,委托星图比特为公司开发AI文本校对中的SaaS软件和算法系统,负责完成AI文本校对软件的设计开发、移交、培训服务工作;公司拥有丰富IP和作家,同时公司布局的AI漫画大模型,未来将陆续推出动画电影、短剧、互动漫画等;公司储备了一部主投主控的动画大电影,AI漫画大模型赋能创作。

昆仑万维:11 月 4 日公司宣布昆仑万维天工大模型现已通过《生成式人工智能服务管理暂行办法》备案,面向全社会开放服务。12月1日,昆仑万维正式发布天工SkyAgents平台。

掌趣科技:AI+游戏探索。1)2023年6月,掌趣与悠米达成业务合作,共同开发AI游戏创作平台,旨在降低厂商开放世界游戏的开发门槛,并通过该平台分享游戏成果。2)7月,公司与行者AI达成战略合作,希望通过行者AI自研的各类AIGC产品扩大公司的技术及创新工具储备,加速AI游戏创作平台的研发。3)11月,掌趣与LAYABOX达成战略合作协议,致力于打造AI 游戏引擎,双方合作的LayaAir 3.1,定位为“最易用的 AIGC 引擎生态”,支持 AI 资源生成、AI 插件、编辑器AI 控制与 AI 技术客服等功能。当前,LayaAir3.1的 AI 功能内测申请入口已经开放。

浙文互联:公司在AIGC方面,布局了营销领域的小模型、数字战士SaaS平台、米画等应用工具;11月24日,百信(华为“鲲鹏+昇腾”核心生态伙伴)CEO一行参访浙文互联杭州总部,双方就协同推进数字文化算力底座建设等进行探讨。华策影视:牵手河马游戏,AI视频工具有望赋能影视内容制作。根据华策影视官微,华策集团将牵手河马游戏,将共同打造互动影视内容。首个合作产品预计将于明年初推出,并将与电视剧《去有风的地方》进行IP联动,合作项目对《去有风的地方》IP元素进行改编或复用,预计将于2024年初推出。AI视频工具有望帮助公司有望在影视内容制作上降本增效。    


风险提示

行业监管环境变化风险。互联网和文化产业受到国家相关政策和职能部门监管,平台经济反垄断、内容题材管理、未成年保护等方面均有涉及,互联网出海也需遵守当地市场的法律法规,因此国内外相关监管政策如果收紧可能会影响相关公司的经营。

竞争加剧影响利润率风险。当前互联网行业用户红利进入尾声,各方为寻求增长可能加剧对用户的争夺从而影响利润率水平。

AIGC技术演变过快的风险。当前AIGC仍处于发展的早期,大模型性能、AI产品形态等仍在快速发展中,相关公司产品有陷入落后的风险。

          

     

本篇文章来源于微信公众号: 热点投研 喜欢可以搜索关注!

  • 我的微信
  • 这是我的微信扫一扫
  • weinxin
  • 我的微信公众号
  • 我的微信公众号扫一扫
  • weinxin

发表评论

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: