火山语音推出超写实数字员工小灿,引领行业变革!
近年来,数字人发展备受关注,市场规模呈现高速增长的态势。有报告预测:到2026年中国AI数字人市场规模将达102.4亿元人民币。尽管形势利好,但数字人行业却仍存在技术门槛高、成本高,但体验感不佳等诸多难题,动辄一套动捕服就需要几万乃至几十万,再加上背后十几人的运营团队,数字人制作成本始终居高不下。
伴随人工智能和深度学习等技术的不断突破,如今数字人逐渐实现了投入与用户体验之间的平衡,火山语音发布的首个超写实数字人员工小灿,便是一例成功尝试。
据了解,火山语音数字人技术已从单纯的外表打造向动作、情感交互等方向进军,让其能更高效理解需求,更顺畅地与人们交互。其中,AI驱动能力作为数字人发展的重要技术,它不仅能让数字人更低成本、更高效率打造细腻的表情、连贯的动作,还能让数字人带给用户更接近人类的真实体验。
火山语音数字人IP“小灿”
在多年技术积淀下,目前火山语音团队已建立了包括2D、3D卡通和3D超写实在内的虚拟数字人产品矩阵,涵盖“播报型数字人”和“交互型数字人”两种类型,其中播报型数字人,即输入文本或语音,就可生成自然生动的数字人播报视频;交互数字人作为播报型数字人的形态升级,依托于火山语音长期积累的成熟语音交互技术,可以做到“善听”、“会说”、“能想”,与用户面对面实时交互。
火山语音突出的AI驱动口型能力,可以与输入文本或语音完全匹配的唇形合成,准确率高达98.55%。在声音呈现方面,火山语音团队的“一条音频秒级别音色复刻”技术在数字人小灿的身上实现落地应用:能够让数字人高保真还原真人音色、说话风格,还能还原声学环境,极大提升用户与数字人互动时的体验感。团队多项核心自研技术以及3D超写实数字人整套形象设计、资产制作、高成本影视级cg管线视频内容的制作能力等,让火山语音团队未来在数字人领域的探索与创作中拥有强大的技术基础和优势能力。
2022年6月,火山引擎虚拟人数字平台已获得信通院首批数字人系统基础能力认证。2023年初,火山语音还加入了“十四五”国家重点研发计划项目“实时高逼真孪生数字人关键技术研发与应用示范”的建设中,与江南游戏工作室合作,通过整合交互理解、智能对话管理、智能驱动三大模块,构建支持定制化并适用于多样场景的数字人智能“对话”系统,实现多模态交互对话。
未来,火山语音还将继续围绕数字人,进行一系列创新应用的加速落地,不断探索AI与业务场景的高效融合,让数字人在更多行业生根发芽。
火山语语打造首个超写实数字人员工“小灿”火山引擎:字节跳动为企业提供的数字化中台火山引擎-企业提供数字化中台
本文由小熊AI网发布,不代表小熊AI网立场,转载联系作者并注明出处:https://www.xiaoxiong360.com/html/product/1256.html