检测到您正在使用 Safari 浏览器,可能影响导出功能的正常使用,建议您下载
Google Chrome
、
Microsoft Edge
、
Firefox
。
X
智研平台
会员
绑定机构
扫描成功
请在APP上操作
打开万方数据APP,点击右上角"扫一扫",扫描二维码即可将您登录的个人账号与机构账号绑定,绑定后您可在APP上享有机构权限,如需更换机构账号,可到个人中心解绑。
登录机构账号
登录 / 注册
登录 / 注册
机构登录
复制成功
设置
万方会员
暂未开通会员
开通即享超值福利、会员权益
优质内容推荐
立即开通
个人中心
我的智研
订阅
收藏
退出登录
简
繁
搜索
首页
>
期刊导航
> Universe Scientific Publishing
> 2024年6卷1期
>
基于多模态特征融合的图像文本检索
DOI:
10.12361/2661-3727-06-01-168366
基于多模态特征融合的图像文本检索
文摘阅读
16
第三方链接
3
导出题录
18
被引
0
李 松泽, 吴 钰茹, 王 俊杰, 何 劲仪, 曾 雨琪, 但 松健
重庆第二师范学院
全文直达
引用
收藏
分享
打印
摘要:
随着智能终端和多媒体社交网络的快速发展,多模态数据(如文本和图像)呈现爆炸式增长,导致对不同模态数 据互相检索的需求日益增加。然而,模态之间的语义鸿沟限制了对海量多模态数据的有效分析和信息挖掘。因此,实现精 准的跨模态信息检索成为学术界的重要挑战,尤其是在文本生成图像和图像生成文本的应用场景中。本文研究了基于 5000 条文本信息和 50000 张图片的文本生成图像检索,以及基于 50000 条文本信息和 5000 张图片的图像生成文本检索。通过计 算归一化特征之间的余弦相似度,找出相似度排名前五的图像或文本。研究采用深度学习方法,特别是 CN-CLIP 模型, 促进文本与图像的多模态特征融合,实现双向生成,提升用户的检索体验。CN-CLIP模型在多模态表征学习中具有重要意义, 采用对比学习方式在大规模图像 - 文本对数据集上进行预训练,成功建立视觉与语言之间的联系。该模型在视觉语言检索 中表现优异,并在零镜头图像分类中展现出色性能。其简单有效的方法论推动了多模态表征学习和计算机视觉的研究进展, 为跨模态信息检索、图像标注和视觉问答等应用提供了强大支持。随着技术的不断进步,CN-CLIP模型将继续在多模态学习、 图像标注、视觉问答等领域发挥重要作用,引领新的研究方向。
关键词:
文本生成图像;图像生成文本;多模态特征融合;CN-CLIP 模型
在线出版日期:
2025-08-22
(万方平台首次上网日期,不代表论文的发表时间)
Universe Scientific Publishing
ISSN:2661-3719
年,卷(期):
2024
,6
(1)
相关文献
换一换
1.
会阴冲洗方预防重症监护室导尿管相关性尿路感染的理论探讨
金宣佑
等;
中国民间疗法
;
2025
2.
神经源性膀胱患者尿路感染和无症状菌尿的特征分析
陈世凯
等;
浙江医学
;
2025
3.
经颅磁刺激联合间歇性导尿术治疗神经源性膀胱患者的效果
李亚利
等;
中国民康医学
;
2025
4.
基于沟通达标理论的护理干预结合多形式健康教育在神经源性膀胱患者间歇导尿中的应用效果
谢婧
等;
临床医学研究与实践
;
2025
5.
基于多模态特征融合的图像文本检索
李诗雨
等;
中华医院感染学杂志
;
2020
相关主题
神经源性膀胱
间歇导尿
生活质量
间歇性导尿
泌尿系感染
meta
相关学者
乔甫
四川大学华西医院
朱红军
苏州大学附属第一医院
李玉森
济宁医学院附属医院
张大伟
苏州大学附属第一医院
李诗雨
四川大学华西医院
相关机构
湖南省新宁县人民医院
陕西省榆林市榆阳区人民医院
石楼县人民医院
北京西山医院
重庆市南岸区妇幼保健院
x
回到
顶部
分享到微信朋友圈
打开微信,点击底部的“发现”,使用 “扫一扫” 即可将网页分享到我的朋友圈