Kling AI 发布 3.0 模型,开启人人皆可成为导演的时代
内容摘要
Kling AI 今日宣布推出其 Kling 3.0 模型系列,包括 Video 3.0、Video 3.0 Omni、Image 3.0 和 Image 3.0 Omni。这些模型基于集成的统一训练框架,支持文本、图像、音频和视频的全模态输入和输出,将视频的理解、生成和编辑整合到一个简化的 AI 工作流程中,从而实现更强的叙事逻辑和提示遵循能力。
Video 3.0 的主要升级包括:通过参考视频和图像实现改进的元素一致性;原生支持英语、中文、日语、韩语、西班牙语及其口音的音频生成,甚至支持多角色说不同语言的复杂对话场景;视频生成时长延长至 15 秒;以及更逼真的照片级输出。Video 3.0 Omni 引入了多镜头故事板功能,提供高级参考控制。Image 3.0 模型现在支持 2K 和 4K 超高清输出。
Kling 3.0 系列体现了多模态视觉语言(MVL)框架,标志着从基础视频生成到专业编排的演进。该模型现已向 Ultra 订阅者开放独家早期访问,并将很快向公众发布。自 2024 年 6 月推出以来,Kling AI 已服务超过 6000 万创作者。
(来源:Prnewswire)