Gemini 3.1 Flash Live:让音频AI更自然、更可靠

Gemini
谷歌推出了Gemini 3.1 Flash Live,一个高质量的音频模型,提供更高的精度和更低的延迟,以实现自然可靠的实时对话。

内容摘要

谷歌推出了Gemini 3.1 Flash Live,这是其最高质量的音频和语音模型,旨在实现自然可靠的实时对话,提供更直观的体验。该模型现已向开发者(通过Google AI Studio中的Gemini Live API预览版)、企业(通过Gemini Enterprise for Customer Experience)以及普通用户(通过Search Live和Gemini Live)开放。对于开发者而言,3.1 Flash Live在复杂任务执行方面更加可靠,并在多项基准测试中领先,同时它还改进了对音调的理解,能更自然地适应用户的表达。对于普通用户,Gemini Live的响应速度更快,能将对话的连贯性保持更长时间。此外,该模型固有的多语言能力支持Search Live扩展到全球200多个国家和地区。所有通过3.1 Flash Live生成的音频都使用SynthID进行了数字水印处理,以帮助防止错误信息的传播。

(来源:Gemini)