1. 主页 > AI行业 > 行业快讯

照片说话应用:让照片“开口说话”

近日,首都在线联合武智院共同上线 “照片说话”应用,用户可以通过简短的文本描述或录音文件,让照片开口说话。该应用依托首都在线高性能异构智算平台的全栈智能算力服务能力,结合武智院“紫东太初”2.0全模态大模型的经验与技术,可以令用户体验到个性化AI创作的魅力。 

多模态大模型“紫东太初”虚拟人

多模态大模型“紫东太初”虚拟人

创作时,用户仅需要上传自己的真实人物照片,即可一键实现训练、微调、部署自己的文生图模型,从而感受AIGC“个性化动态照片”的创作魔力。

具体步骤如下

第一步:为本视频命名,输入视频名称

第二步:上传真人照片,照片全尺寸展示区根据用户选择的照片按照原始尺寸比例展示;右侧可选择默认照片,也可上传任意人物照片。

第三步:输入播报内容。文本输入支持用户输入需要播报的内容;

可以通过语速、停顿、多音字配置等内容控制播报内容,鼠标滑动到相关功能按钮上即可提示;

可以选择不同的音色来播报这段话;

支持上传录音文件并调整音频音量。

点击合成后,会弹窗进行预估费用计算,计算完毕后则可进行确认合成。

您可在右上角用户头像处点击“我的合成记录”中查看,支持预览、下载和删除。

首都在线与武智院的本次合作,双方将结合彼此优势,围绕大语言模型、AI内容创作及数字人等内容,在产品、技术、推广方面展开深入的合作,共同打造人工智能领域联合解决方案,为客户提供更加全面和创新的服务,共同探索并推动人工智能领域的创新和发展。

本文由小熊AI网发布,不代表小熊AI网立场,转载联系作者并注明出处:https://www.xiaoxiong360.com/html/info/857.html