照片说话应用：让照片“开口说话”

近日，首都在线联合武智院共同上线 “照片说话”应用，用户可以通过简短的文本描述或录音文件，让照片开口说话。该应用依托首都在线高性能异构智算平台的全栈智能算力服务能力，结合武智院“紫东太初”2.0全模态大模型的经验与技术，可以令用户体验到个性化AI创作的魅力。

多模态大模型“紫东太初”虚拟人

多模态大模型“紫东太初”虚拟人

创作时，用户仅需要上传自己的真实人物照片，即可一键实现训练、微调、部署自己的文生图模型，从而感受AIGC“个性化动态照片”的创作魔力。

具体步骤如下

第一步：为本视频命名，输入视频名称

第二步：上传真人照片，照片全尺寸展示区根据用户选择的照片按照原始尺寸比例展示；右侧可选择默认照片，也可上传任意人物照片。

第三步：输入播报内容。文本输入支持用户输入需要播报的内容；

可以通过语速、停顿、多音字配置等内容控制播报内容，鼠标滑动到相关功能按钮上即可提示；

可以选择不同的音色来播报这段话；

支持上传录音文件并调整音频音量。

点击合成后，会弹窗进行预估费用计算，计算完毕后则可进行确认合成。

您可在右上角用户头像处点击“我的合成记录”中查看，支持预览、下载和删除。

首都在线与武智院的本次合作，双方将结合彼此优势，围绕大语言模型、AI内容创作及数字人等内容，在产品、技术、推广方面展开深入的合作，共同打造人工智能领域联合解决方案，为客户提供更加全面和创新的服务，共同探索并推动人工智能领域的创新和发展。

本文由小熊AI网发布，不代表小熊AI网立场，转载联系作者并注明出处：https://www.xiaoxiong360.com/html/info/857.html