热门

智谱 AI 发布视频生成工具“清影”：30 秒快速生成，免费开放体验

热点资讯2年前发布时间煮雨

10,464 00

智谱 AI 今日宣布，对视频生成模型进行全新升级，并正式推出新一代产品 ——CogVideoX。

CogVideoX 模型目前已在智谱清言的 PC 端、移动应用端以及小程序端正式上线。所有 C 端用户均可通过智谱清言的 AI 视频生成功能「清影」（Ying），免费体验 AI 文本生成视频和图像生成视频的服务。

据介绍，CogVideoX 的核心技术特点如下：

针对内容连贯性问题，智谱 AI 自主研发了一套高效的三维变分自编码器结构（3D VAE）。该结构能够将原始视频数据压缩至原始大小的 2%，降低了视频扩散生成模型的训练成本和难度。结合 3D RoPE 位置编码模块，该技术提升了在时间维度上对帧间关系的捕捉能力，从而建立了视频中的长期依赖关系。
在可控性方面，智谱 AI 打造了一款端到端的视频理解模型，该模型能够为大量视频数据生成描述。这一创新增强了模型对文本的理解和对指令的遵循能力，确保生成的视频更加符合用户的输入需求，并能够处理超长且复杂的 prompt 指令。
模型采纳了一种将文本、时间、空间三维一体融合的 transformer 架构。该架构摒弃了传统的 cross attention 模块，设计了 Expert Block 以实现文本与视频两种不同模态空间的对齐，并通过 Full Attention 机制优化模态间的交互效果。

「清影」的主要特点如下：

快速生成：仅需 30 秒即可完成 6 秒视频的生成。
高效的指令遵循能力：即使是复杂的 prompt，清影也能准确理解并执行。
内容连贯性：生成的视频能够较好地还原物理世界中的运动过程。
画面调度灵活性：例如，镜头能够流畅地跟随画面中的三只狗狗移动。

此外，智谱大模型开放平台 bigmodel.cn 也部署了「清影」。企业和开发者可通过 API 调用式，体验并使用「清影」的文本生成视频和图像生成视频功能。

附智谱官网链接：https://chatglm.cn/video

本文来源： IT之家【阅读原文】

热点资讯 # AI 文本生成视频 # bigmodel.cn # CogVideoX # 图像生成视频 # 智谱 AI # 智谱大模型 # 清影

© 版权声明

文章版权归作者所有，未经允许请勿转载。

阿里云ECS “99套餐” 双11特惠 36元/年

相关文章

英伟达 GeForce RTX 显卡包装标志变更，添加 AI 相关字样

英伟达 GeForce RTX 显卡包装标志变更，添加 AI 相关字样

热点资讯 # GeForce RTX # Powering Advanced AI # 英伟达

2年前

05,4390

端侧最强开源 AI 模型 Llama 3.2 登场：可在手机运行，从 1B 纯文本到 90B 多模态，挑战 OpenAI 4o mini

端侧最强开源 AI 模型 Llama 3.2 登场：可在手机运行，从 1B 纯文本到 90B 多模态，挑战 OpenAI 4o mini

2年前

05,0520

快手启动“可灵 AI”电影共创计划：联合李少红、贾樟柯、薛晓路等导演出品 AIGC 电影短片

快手启动“可灵 AI”电影共创计划：联合李少红、贾樟柯、薛晓路等导演出品 AIGC 电影短片

热点资讯 # AIGC # 可灵Ai # 程一笑

2年前

04,0410

美图公司旗下 AI 短片创作工具 MOKI 开放：覆盖动画短片、网文短剧、故事绘本等

美图公司旗下 AI 短片创作工具 MOKI 开放：覆盖动画短片、网文短剧、故事绘本等

热点资讯 # AI短片创作 # AI短片创作工具 # MOKI

2年前

04,3580

暂无评论

none

暂无评论...