火山语语打造首个超写实数字人员工“小灿”
火山语音最近发布了首位超写实数字员工小灿,引起了广泛关注。小灿是火山语音团队和朝夕光年江南团队共同打造的S级超写实数字人形象,具有语音识别、自然语言处理、情感识别等多种功能,能够提供更加有效的服务。
火山语音打造的数字员工“小灿”
小灿的外形、动作、语言和情感交互都非常逼真,改变了大众对数字人的一贯认知。她通过火山语音团队丰富且领先的对数字人AI的驱动能力,实现了更加近似真人的口型动作表现。例如,在AI驱动口型方面,团队通过使用行业领先的非自回归模型的唇形生成网络,合成与输入文本或语音完全匹配的唇形,准确率高达98.55%。
值得提及的是,小灿还具备“一条音频秒级别音色复刻”(zero shot TTS)的能力,可以做到高保真还原真人音色、说话风格以及声学环境等特点,在核心技术架构全自研的基础上,关键指标均保持业界前沿。此外韵律模块基于自回归GPT类大模型,目前训练数据超过 20 万个小时,架构可扩展性很强,未来预计可支持 100 万小时以上数据训练;模块支持code-switch,即无论prompt为中文或者英文,都可支持直接输出中文、英文及混合内容。
总的来说,小灿是数字人研发领域艺术与技术融合的杰出成果,她不仅具备超写实的数字人形象,更是高效且富有人情味的问题解决助手。
据介绍,火山语音是一家专注于语音交互技术的公司,致力于为用户提供智能、高效、便捷的语音服务。通过先进的语音识别和自然语言处理技术,火山语音能够实现人机对话、语音搜索、语音翻译等功能,为用户带来全新的语音体验。
本文由小熊AI网发布,不代表小熊AI网立场,转载联系作者并注明出处:https://www.xiaoxiong360.com/html/info/1180.html