时间:2024-09-04 来源: 中国图象图形学学会
嘉宾介绍
周嘉欢,北京大学王选计算机研究所研究员、助理教授、博士生导师,国家级人才计划青年项目(海外)入选者,北京大学小米博雅青年学者。2013年本科毕业于清华大学自动化系,2018年博士毕业于美国西北大学计算机科学专业。主要研究方向为计算机视觉、机器学习、人工智能等,已发表CCF-A和IEEE Trans论文四十余篇,包括Nature子刊、IEEE TPAMI、IJCV、IEEE TIP、CVPR、ICCV、ECCV、AAAI等计算机视觉领域顶级期刊和会议论文。主持包括国家自然科学基金优秀青年科学基金项目(海外)、国家自然基金委面上项目、多项校企合作项目等。担任CCF计算机视觉专委会执行委员,国际期刊Machine Vision and Applications编委、国际会议CVPR、NeurIPS、ICME、ICPR领域主席,AAAI程序委员会委员。
报告介绍
报告题目:大模型视觉提示学习方法
报告摘要:近年来,随着大模型技术的不断发展,视觉/多模态大模型集体涌现。通过海量数据训练得到的视觉大模型蕴含着丰富的预训练知识,对其进行全量微调便能应用于多种下游视觉任务。然而,全量微调会带来巨大的计算开销,导致视觉大模型的实际应用受到限制。因此,如何实现预训练视觉大模型的高效微调,提升其在下游任务的泛化能力,具有重要意义。视觉提示学习技术旨在保持预训练模型冻结的同时,仅引入少量的可学习提示参数,调整预训练模型使其适应下游任务。相比于全量微调,视觉提示学习技术能够显著降低视觉大模型微调的计算开销,具有重要的理论和应用价值。本报告聚焦大模型视觉提示学习方法,主要内容包括两个方面:(1)针对大模型视觉提示学习中差异化信息难建模的挑战,探讨实例级视觉提示学习方法;(2)针对大模型视觉提示学习中差异化知识难利用的挑战,探讨组合式视觉提示利用方法。
直播信息
直播时间
9月10日(星期二)19:00-20:00
腾讯会议室
会议号:900-3977-8124
请添加会议官方微信:CSIG_1990,备注“云讲堂+会员号+姓名”获取入群邀请