时间:2024-09-23 来源: 中国图象图形学学会
嘉宾介绍
钱胜胜,中国科学院自动化研究所副研究员。入选北京市杰青、中国科协青托和ACM SIGMM 中国新星。研究方向为跨媒体推理和多媒体内容分析,在IEEE TPAMI等IEEE/ACM Trans.期刊和CCF-A类会议上发表论文50余篇,相关成果获中国科学院优秀博士学位论文、ACM Multimedia 2016年最佳论文、ACM Multimedia 2019年最佳论文提名、SIGIR 2024年最佳论文提名等。担任CCF多媒体专委会副秘书长,主持国家重点研发计划青年科学家项目,科技委专项,国家自然科学基金青年、面上、腾讯微信犀牛鸟专项、快手科研专项和小米青年学者科研专项等,相关成果为快手、腾讯和航天防务等提供了重要的技术支持。
报告介绍
报告题目:知识驱动的跨媒体推理研究
报告摘要:在数字时代,信息呈现多媒体化的趋势。然而,传统的深度学习模型具有可解释性弱、推理过程黑盒的缺点。知识驱动的跨媒体推理旨在通过引入专家知识、世界知识和因果关联等,提升跨媒体推理模型的可解释性和可信性,增强对复杂现实场景的理解、处理和解释能力,更好地服务于实际应用。通过知识驱动的跨媒体推理,能够更深入地理解不同媒体之间的关联性,促使对复杂信息的更全面、深入的理解和推理。本报告将对知识驱动的跨媒体推理最新进展进行介绍,包括基于变分因果推理的解释性视觉问答、结合神经符号推理的解释性视觉问答,基于多模态智能体的少样本解释性视觉问答,以及基于发散式大模型推理的零样本组合图像检索等。
直播信息
直播时间
9月24日(星期二)19:00-20:00
腾讯会议室
会议号:900-3977-8124
请添加会议官方微信:CSIG_1990,备注“云讲堂+会员号+姓名”获取入群邀请