CSIG图像图形学科前沿讲习班—“视频/图像语义感知和理解”

时间:2023-05-25      来源: 中国图象图形学学会

图 1 讲习班现场

20230521日,由中国图象图形学学会(CSIG)主办、南京邮电大学通信与信息工程学院、南京邮电大学先进技术研究院、CSIG机器视觉专委会、江苏省人工智能学会承办的第22CSIG图像图形学科前沿讲习班(IGAL22)在南京邮电大学圆满闭幕。本期讲习班主题为视频/图像语义感知和理解,由南京邮电大学周全副教授和高广谓副研究员担任学术主任,来自全国各地的专家、老师以及学生齐聚一堂,共同参与了这场精彩的学习盛宴。

图 2 鲍秉坤教授致辞

在5月20日上午举行的开班仪式上,通信学院副院长鲍秉坤教授对本期讲习班的主题及报告嘉宾进行了介绍,代表学会向专委会表示感谢。同时希望大家能够借助本次讲习班的学习契机,充分交流与学习,推动图像感知与交互理解的发展,也欢迎广大图像图形领域研究者积极参与学会开展的各项活动。

图 3 王井东作报告
讲习班第一场报告,是由百度计算机视觉首席科学家王井东带来的题为“视觉识别:Transformer方法与基础模型”的分享。他介绍了两部分内容:一是基于Transformer的计算视觉,如DWNet、HRFormer、OCRNet等,这些算法利用Transformer的注意力机制来提高视觉任务的性能;二是百度文心·CV大模型VIMER,以数据为中心的算法和应用,展示了Transformer在计算机视觉领域的强大潜力和广泛应用场景。

图 4 李泽超教授作报告

接着,南京理工大学李泽超教授围绕“细粒度视觉内容分析与推理”的主题作了分享。李泽超教授介绍了在开放环境下,如何对图像视频内容进行更细致的分类和检索,提出了基于知识迁移的小样本识别、深度协同因子分解模型、基于区域定位哈希的细粒度图像检索、基于注意力金字塔特征的细粒度小样本识别等方法,并列举了一些实际应用场景。

图 5 林巍峣教授作报告

20号下午,上海交通大学林巍峣教授作了题为“基于参数化表示的视觉目标与行为感知”的分享。他介绍了一种利用参数化表示来提高视觉目标与行为感知的方法,包括参数驱动的大范围目标检测、参数化表示的时空行为定位和参数化对齐的时序行为步骤挖掘等,这些方法可以提高感知的准确性和效率。

图 6 穆亚东研究员作报告

接着,北京大学穆亚东研究员围绕“视觉-语言感知与控制”的主题作了分享,穆亚东研究员介绍了如何利用视觉和语言的多模态信息来指导自动化系统的动作,提出了一些解决模态对齐和动作策略学习的方法,如基于弱监督信息的视觉定位、视觉-语言基础模型ECLIP模型、带有空间路径先验或树型Transformer的视觉语言导航等,并展望了这一领域的未来发展。

图 7 王鹏教授作报告

21号上午,西北工业大学王鹏教授作了题为“无人移动平台自主进化学习方法与应用” 的分享。王鹏教授分别由机理机制和研究思路对三个层次的自主化模型进行了介绍,提出了基于无人移动平台的自主进化学习方法,并展示了其广泛的应用场景。

图 8 宋井宽教授作报告
接着,电子科技大学宋井宽教授围绕“多媒体紧致表征与分析”的主题作了分享,宋井宽教授围绕哈希和量化这两种紧致特征表达方法,介绍了多媒体紧致表征中的经典算法和最新进展以及它们在快速检索、视觉压缩和模型压缩等场景中的应用。报告还讨论了紧致表征如何保留关键信息和实现离散优化的问题。

图 9 严骏驰教授作报告

21号下午,上海交通大学严骏驰教授作了题为“端到端多模态自动驾驶” 的分享。严骏驰教授对端到端自动驾驶方法的背景以并对感知模型、预测模型、规控模型、以及端到端模型进行了详细的介绍,同时给出了大型车道线检测数据集OpenLane和OpenDenseLane,并汇报了这一领域的最新进展。

图 10 王兴刚教授作报告
最后一场报告,华中科技大学王兴刚教授围绕“Transformer的驾驶场景感知和大规模预训练” 的主题作了分享。王兴刚教授对Transformer进行了十分详尽的介绍,并提出了基于Transformer的一整套解决方案,以Query作为目标的表征,通过自注意力和交叉注意力来实现时空一体化的场景表征和目标-场景交互学习,得到了一系列实时性高、精度高的驾驶场景感知方法。报告还介绍了基于Transformer的大规模视觉语言预训练模型EVA,以及它在多个视觉下游任务中的优异表现。

图 11 现场互动

图 12 结营合影

本次讲习班专家报告精彩、内容丰富,学员们积极互动、踊跃提问、收获颇丰,不仅加深了对专业领域的认知,还拓宽了视野和思维,更促进了同行之间的交流与合作。第22期“视频/图像语义感知和理解”前沿讲习班在各位报告嘉宾、广大同行以及学会的各级领导的大力支持下,取得了圆满成功。

Copyright © 2024 中国图象图形学学会

京公网安备 11010802035643号 京ICP备12009057号-1

地址:北京市海淀区中关村东路95号 邮编:100190

技术支持:中科服