AI软件技术
-
对抗性攻击对人类有效吗?研究表明:人类的大脑和人工神经网络一样会受影响
神经网络由于其自身的特点,容易受到对抗性攻击。然而,谷歌DeepMind的最新研究表明,我们人类的判断也会受到这种对抗性扰动的影响。人类的大脑和人工神经网络(A...
-
TF-T2V视频方案有什么用?可基于大规模无文本标注的视频数据进行视频生成
在过去的两年里,随着大规模图文数据集如LAION-5B的开放,出现了许多令人惊叹的图片生成方法,如StableDiffusion、DALL-E2、Control...
-
如何估计照片光照环境?DiffusionLight,用AI绘制铬球精准评估
DiffusionLight是一种使用生成的镀铬球来估计图像中的光照的方法。研究人员开发了一种简单但有效的技术来估计单个输入图像中的照明。他们使用在数十亿张标准...
-
清华&NUS发布成果:通过简单对话,让大模型自动标注图像
多模态大模型集成了检测分割模块后,抠图变得更加简单!只需用自然语言描述需求,模型就能快速标注出要寻找的物体,并给出文字解释。这一全新多模态大模型是由新加坡国立大...
-
粗略说明一下什么是多模态代理?
多模态代理是一种能够处理和理解多种类型的信息,并能够在各种不同的应用程序中执行任务的系统。它结合了多种感知模态,如视觉、听觉、语音等,以实现更智能和全面的代理能...
-
向量数据库的查询和索引资源压力如何求解?
向量数据库的查询和索引操作相对于传统的关系型数据库来说更为复杂,这给企业带来了更大的计算和存储资源压力。此外,国内的向量数据库生态系统相对较为薄弱,对于中小企业...
-
什么是大模型控标参数?
大模型控标参数是指在训练大模型时需要控制的参数,这些参数可以影响模型的训练过程和最终性能。这些参数包括学习率、批量大小、迭代次数等。大模型控标参数相关的衡量标准...
-
什么是多层级描述生成方法?
多层级描述生成方法是一种用于生成自然语言描述的技术,它通过将描述任务分解为多个层次来提高生成结果的质量。这种方法的核心思想是逐步构建描述,从低级细节开始,逐渐添...
-
走近APE:一种全开源的多模态分割模型
多模态分割模型是一种处理多种模态信息的深度学习模型,这里的“模态”可以理解为不同类型的数据,例如文本、图像、视频和音频等。这种模型不仅能够处理图像和文本形式的数...
-
AI文本到图像生成,Diffusion Models as Prior很关键!
DiffusionModelsasPrior(DMP,译作“扩散模型作为先验”)是一种基于扩散过程的生成模型,它使用先验分布来控制生成数据的分布。在这种方法中,...
-
简单说一说智能驾驶技术
智能驾驶AD(AutoDrive)是一种广泛应用的前沿技术,其背后的技术原理和结构包括感知、算力、算法和控制等软硬件集成。它主要依赖于不同类型的传感器去实现对周...
-
数字人的表情是如何与文字内容进行匹配的?
目前,虚拟数字人的应用日渐广泛,我们看到数字人的表情与数字人说话的文本内容非常匹配,毫无违和感,这使得数字人非常逼真,那么,技术上是如何做到数字人表情和文本内容...
-
向量数据库的向量数据长什么样?举例说明一下
向量数据库是一种专门用于存储和处理向量数据的数据库系统。与传统的关系型数据库不同,向量数据库主要针对高维向量数据进行高效的存储、查询和分析。它能够快速计算向量之...
-
支持向量机SVM是什么意思?
支持向量机(Supportvectormachine,SVM)是一种监督学习模型,用于分类、回归和异常检测。它在1995年被提出,由Vapnik和Lerner在...
-
扩散模型在AI中有什么应用?
扩散模型是一种用于描述和预测信息、创新或疾病在社会网络中传播的数学模型。它基于一个基本假设:个体在决策时会受到其周围人的影响。扩散模型在社会科学、经济学、生物学...