IBM发布量子计算重大进展、5分钟即可做一个自己的分身、通过再生疗法逆转听力损失、将静态图片转换为动作视频…

发表评论

A+

所属分类：heygen ai百科

12月5日XiaoHu.AI 日报更新

🖥 IBM 量子计算的重大进展

🖼 对视频特定区域修改功能演示

🏃‍♀️ MagicAnimate：基于扩散模型的人类图像动画框架

👂 通过再生疗法逆转听力损失

🎵 Suno 文字生成音乐 AI 模型 Chirp v1 的重大更新

👯 HeyGen 推出 Avatar 2.0：即时虚拟分身技术

阅读时长: 5 minutes

—

IBM 量子计算的重大进展

在其年度量子峰会上，IBM 宣布了一系列在量子计算领域的重大进展，这些进展标志着量子计算技术向实用化迈出了重要一步。

主要进展和内容：

IBM Quantum System 2：这是全球首个模块化规模实用化的量子计算机，代表了量子计算向可扩展性迈进的重要里程碑。
IBM Condor 量子处理器：Condor 是一款拥有 1,121 个超导量子位的量子处理器，基于 IBM 的交叉共振门技术。它在芯片设计、量子位密度、制造和层压板尺寸等方面都取得了显著进展。
IBM Quantum Heron 处理器：Heron 是 IBM 迄今为止错误率最低的量子计算芯片，拥有 133 个固定频率量子位和可调节的耦合器。它的设备性能提高了 3-5 倍，几乎消除了串扰。
Qiskit 1.0：IBM 宣布了 Qiskit 1.0 的发布，这是一款广泛使用的开源量子编程软件，具有新功能，以帮助科学家更容易和更快地执行量子电路。
生成式 AI 模型：IBM 展示了用于自动化量子代码开发和优化量子电路的工程化生成式 AI 模型。
量子发展路线图至 2033 年：IBM 发布了延伸至 2033 年的量子发展路线图，设定了提高门操作质量的新目标，以实现大规模量子计算的全部潜力。

重要性和影响：

IBM 的这些进展不仅在技术层面取得了突破，也为量子计算的未来应用和发展奠定了基础。通过这些先进的量子处理器和系统，IBM 正在推动量子计算朝着更加实用和可扩展的方向发展。

更多信息：

详细：https://newsroom.ibm.com/2023-12-04-IBM-Debuts-Next-Generation-Quantum-Processor-IBM-Quantum-System-Two,-Extends-Roadmap-to-Advance-Era-of-Quantum-Utility

—

Pika 对视频特定区域修改功能演示

'Modify Region'

—

MagicAnimate：基于扩散模型的人类图像动画框架

MagicAnimate 是一个由字节跳动开发的基于扩散模型的人类图像动画框架，可将静态图片转换为动作视频，并支持与文本结合生成动画，甚至支持多人照片的动画化。

主要功能和特点：

视频转换为草图：将标准视频转换为草图风格的动画。
保持语义和时间连贯性：确保转换后的草图视频在视觉上与原视频保持语义一致性，展现时间连贯性。
视频编辑和涂鸦：提供基于草图的视频编辑和涂鸦功能，允许用户添加颜色填充、调整大小和叠加涂鸦。

工作原理：

贝塞尔曲线表示：使用逐帧贝塞尔曲线表示视频，为草图化提供结构化框架。
跨帧笔触初始化：创新的初始化方法确定曲线在不同帧中的起始位置和宽度。
优化算法：基于CLIP特征的语义损失和一致性损失来优化曲线位置，保证草图与原视频在视觉上的一致性和时间上的连贯性。

更多信息：

阿里前几天发的只靠单张照片和动作就能生成跳舞视频的项目一下就被字节跳动秒了...因为他们没有发布代码和演示，字节今天直接就放出了同样的项目并提供了代码和演示。

项目及演示：https://showlab.github.io/magicanimate/
论文：https://arxiv.org/abs/2311.16498
GitHub：https://github.com/magic-research/magic-animate
Huggingface 在线测试：https://huggingface.co/spaces/zcxu-eric/magicanimate
Colab在线测试：https://colab.research.google.com/github/camenduru/MagicAnimate-colab/blob/main/MagicAnimate_colab.ipynb

—

通过再生疗法逆转听力损失

麻省理工学院衍生的 Frequency Therapeutics 研究团队开发了一种小分子药物，用于逆转听力损失。这种药物通过注射到耳朵中促进耳内毛细胞的再生，这些毛细胞对听力至关重要。

关键信息：

毛细胞的重要性：耳内微小的毛细胞对于听力至关重要，但它们很容易因噪音、药物等因素死亡，一旦死亡就不会再生。
小分子药物：Frequency Therapeutics 开发的小分子药物能够刺激这些毛细胞的再生。
临床试验结果：在临床试验中，一些接受治疗的参与者听力有了明显的改善。

更多信息：

详细：https://news.mit.edu/2022/frequency-therapeutics-hearing-regeneration-0329

—

Suno 文字生成音乐 AI 模型

Suno：一款基于文字生成音乐的 AI 模型，已经在 Discord 上线，带来了多项重大更新和改进。

主要特性：

多语言支持：现在支持包括中文在内的超过 50 种语言，扩大了其应用范围。
音频质量提升：Chirp v1 对音频质量进行了增强，使生成的音乐更加清晰和专业。
音乐风格/流派选择：用户可以根据个人喜好选择不同的音乐风格或流派。
歌曲结构控制：通过使用 [verse]、[chorus] 等标签，用户可以更加精确地控制歌曲的结构。
更快的生成速度：与之前版本相比，Chirp v1 大幅提升了音乐生成的速度。

主要功能：

基于文字描述的音乐生成：用户只需输入一段文字描述，包括音乐风格和期望，Suno 即可生成带歌词的音乐。
生成带人声的音乐：新模型不仅能生成音乐，还能加入 AI 吟唱的人声。
生成时长：可以生成两段大约 30 秒的音乐。
用户友好的操作：操作方式类似于 Midjourney，简单易用。
潜力：Suno 的这一创新有成为下一个重要 AI 音乐生成工具的潜力。

—

HeyGen 推出 Avatar 2.0：即时虚拟分身技术

HeyGen 近日推出了 Avatar 2.0，这是一项允许用户快速创建个人虚拟分身的技术，名为 "Instant Avatar"。这项技术的推出可能对个人内容创作和数字媒体产业产生重要影响。

主要特点和功能：

快速创建虚拟分身：用户可以在短短 5 分钟内使用手机快速创建个人的虚拟分身。
多语言支持：内置翻译工具支持多语言内容的创建。
口型同步：支持口型与多语言声音的同步匹配，提高视频的真实性。
免费使用：这项服务对用户免费开放。

更多信息：

详细：https://heygen.com/article/introducing-avatar-2-0-instant-avatar

📝 历史项目记录：xiaohu.ai

感阅

谢读

感谢阅读，关注关注关注！

本篇文章来源于微信公众号: 互联网的那点事喜欢可以搜索关注!

发表评论取消回复

登录 找回密码

登录找回密码