1. 主页 > 观赛道 > AI数字人

思必驰DFM-2大模型:打造多说多国语言和方言的数字人

AIGC(人工智能生成内容)正在爆发,科技革新不断,数字人在各种场景中崭露头角,如数字人主播、数字人解说员、数字人导购等。根据真人AI生成数字人分身,这项技术已经从未来走进现实。

思必驰

数字人(Digital Human)是指利用计算机技术和人工智能技术,根据真实人类的外貌、动作、声音等特征,生成的具有高逼真度以及高交互性的虚拟人物,可以为人类提供多样化的服务。

思必驰DFM- 2大模型,精通多国语言,还说方言

近期,思必驰DFM- 2 大模型及创新技术应用成果发布。思必驰基于DFM- 2 大模型推出的自然场景数字人生成技术,采用扩散生成模型,通过小数据模型训练,实现高品质数字人生成,个性化对话生成与语音合成模型无缝结合,构建可自由交互的个性化数字形象。

思必驰打造的数字人不仅能说会道,还精通粤语、四川话、上海话各地方言及英语、法语、俄语等各国语言,可应用于智能家居、智能车载、智能轨交、市场营销等场景,为人类生活带来更多可能。

思必驰联合始人、首席科学家俞凯数字人

思必驰联合始人、首席科学家俞凯数字人

数字人的打造需要运用计算机图形学、计算机视觉、自然语言处理、智能语音等领域的知识和技术,从而从形态到声音上打造一个媲美真人的数字人。

思必驰打造的数字人,无论是声音、表情、动作还是形象,都与真人高度接近,甚至还可以根据不同场景,切换语言与人类进行交互。

声音复刻为数字人赋予真人同款声音,思必驰声音复刻技术服务,支持男声、女声、童声及中、英文和方言复刻,可辅助用户打造不同年龄、不同性别的数字人形象。

情感合成让数字人也能表达喜怒哀乐,思必驰可合成高音质、多情感的音色,呈现“高兴、抱歉、撒娇、中性”等多种情感声音,为数字人的情感表达赋予了更多活力,提升了人机交互体验。

单人千音让数字人也能说方言外语,思必驰单人千音技术可以在短时间内快速将单个发音人的音色,迁移成为粤语、四川话、上海话、苏州话、闽南语等方言以及俄语、德语、日语、法语、泰语、西班牙语等外语,让数字人“青出于蓝而胜于蓝”。

数字人应用将更为广泛

在市场营销领域,数字人可用于线上直播进行产品营销推广,降低公司的人力成本;在智能车载领域,数字人可融入车载系统,为用户提供导航等服务提供更智慧的出行体验;在家居领域,数字人可入驻家电大屏中,为用户提供菜谱推荐、家务规划、情感陪伴等服务,成为用户贴心的数字人管家;在轨交领域,数字人可在车站提供路线导航、购票咨询、信息咨询等服务,降低轨交领域人力成本。

相较于真人,数字人可以不受时间或空间的限制,随着大模型技术的应用,数字人也持续释放价值。未来,思必驰将基于DFM- 2 大模型,综合全链路语音交互技术,为用户带来更具特色的数字人形象,加速推进AI技术的应用落地。

思必驰:自然场景虚拟数字人生成技术,音画合一体验更好

本文由小熊AI网发布,不代表小熊AI网立场,转载联系作者并注明出处:https://www.xiaoxiong360.com/html/vup/1354.html