阿里发布MACH：一句话生成逼真的3D数字人

阿里最近在AI开源模型上动作特别多，发布了多个惊艳的项目！

从一张图让任何人跳“科目三”：

到AnyText将文字完美地融合到图像中：

最近又发布了一个非常棒的项目：一句话生成逼真的3D数字人！下面是视频介绍：

Make-A-Character：在几分钟内生成高质量的文本到 3D 角色

该项目可以根据文本描述创建逼真的3D人物，可以在 2 分钟内制作可控制、逼真、完全实现的 3D 角色。

用户完全定制细致的面部特征，包括脸型、眼睛、虹膜颜色、发型和颜色、眉毛、嘴巴和鼻子的类型，添加皱纹和雀斑。

直观的文本提示促进了这种定制，为个性化角色创建提供了用户友好的界面。

该项目利用大型语言和视觉模型的力量进行文本意图理解和中间图像生成，随后是一系列以人为形象的视觉感知和3D生成模块。

阿里发布MACH：一句话生成逼真的3D数字人

项目主要特点：

1）可控性强

系统让用户能够根据自己的喜好，精细调整面部特征，包括脸型、眼睛形状、虹膜颜色、发型及其颜色、眉型、嘴形和鼻子形状，甚至可以添加皱纹和雀斑。

通过直观的文本提示操作，为用户打造了一个友好的个性化角色创建界面。

2）高度真实

所生成的角色基于真人扫描数据集构建。此外，角色的头发以细丝形式而非网格形式制作。

利用 Unreal Engine 中的物理基础渲染（PBR）技术进行渲染，该技术以其高质量的实时渲染能力著称。

3）全面完整

打造的每个角色都是完整的模型，包括眼睛、舌头、牙齿、整个身体和服装。

这种全面的设计确保角色可立即投入到各种场景中使用，无需额外建模。

4）可进行动画处理

角色配备了高级的骨骼装置，支持执行标准动画，使角色显得栩栩如生，同时在各种动态场景中展现出极高的适应性。

5）与行业标准兼容

采用了显式三维表，确保了与游戏和电影行业标准的计算机图形（CG）流程的无缝对接。

工作原理：

Make-A-Character 框架：这个系统运用大语言模型（LLM）来识别各种面部特征，如脸型、眼睛形状、嘴型、发型及其颜色、眼镜款式等。

这些特征随后转化为相应的视觉元素，用以指导 Stable Diffusion 和 ControlNet 合成相应的参考肖像图像。

接下来，通过一系列二维面部解析和三维生成模块，构建并组合目标面部的网格结构和纹理，同时添加匹配的配件。

这种参数化的表现形式使得生成的三维头像能够轻松地进行动画处理。

阿里发布MACH：一句话生成逼真的3D数字人

体验地址：https://www.modelscope.cn/studios/XR-3D/InstructDynamicAvatar/summary

Github：https://github.com/Human3DAIGC/Make-A-Character

项目论文：https://arxiv.org/pdf/2312.15430.pdf

更多优质项目和实战案例可加入星球查看：

登录 找回密码