时间:2023-05-25 来源: 中国图象图形学学会
图 1 讲习班现场
2023年05月21日,由中国图象图形学学会(CSIG)主办、南京邮电大学通信与信息工程学院、南京邮电大学先进技术研究院、CSIG机器视觉专委会、江苏省人工智能学会承办的第22期CSIG图像图形学科前沿讲习班(IGAL22)在南京邮电大学圆满闭幕。本期讲习班主题为“视频/图像语义感知和理解”,由南京邮电大学周全副教授和高广谓副研究员担任学术主任,来自全国各地的专家、老师以及学生齐聚一堂,共同参与了这场精彩的学习盛宴。
图 2 鲍秉坤教授致辞
在5月20日上午举行的开班仪式上,通信学院副院长鲍秉坤教授对本期讲习班的主题及报告嘉宾进行了介绍,代表学会向专委会表示感谢。同时希望大家能够借助本次讲习班的学习契机,充分交流与学习,推动图像感知与交互理解的发展,也欢迎广大图像图形领域研究者积极参与学会开展的各项活动。
图 4 李泽超教授作报告
接着,南京理工大学李泽超教授围绕“细粒度视觉内容分析与推理”的主题作了分享。李泽超教授介绍了在开放环境下,如何对图像视频内容进行更细致的分类和检索,提出了基于知识迁移的小样本识别、深度协同因子分解模型、基于区域定位哈希的细粒度图像检索、基于注意力金字塔特征的细粒度小样本识别等方法,并列举了一些实际应用场景。
图 5 林巍峣教授作报告
20号下午,上海交通大学林巍峣教授作了题为“基于参数化表示的视觉目标与行为感知”的分享。他介绍了一种利用参数化表示来提高视觉目标与行为感知的方法,包括参数驱动的大范围目标检测、参数化表示的时空行为定位和参数化对齐的时序行为步骤挖掘等,这些方法可以提高感知的准确性和效率。
图 6 穆亚东研究员作报告
接着,北京大学穆亚东研究员围绕“视觉-语言感知与控制”的主题作了分享,穆亚东研究员介绍了如何利用视觉和语言的多模态信息来指导自动化系统的动作,提出了一些解决模态对齐和动作策略学习的方法,如基于弱监督信息的视觉定位、视觉-语言基础模型ECLIP模型、带有空间路径先验或树型Transformer的视觉语言导航等,并展望了这一领域的未来发展。
图 7 王鹏教授作报告
21号上午,西北工业大学王鹏教授作了题为“无人移动平台自主进化学习方法与应用” 的分享。王鹏教授分别由机理机制和研究思路对三个层次的自主化模型进行了介绍,提出了基于无人移动平台的自主进化学习方法,并展示了其广泛的应用场景。
图 9 严骏驰教授作报告
21号下午,上海交通大学严骏驰教授作了题为“端到端多模态自动驾驶” 的分享。严骏驰教授对端到端自动驾驶方法的背景以并对感知模型、预测模型、规控模型、以及端到端模型进行了详细的介绍,同时给出了大型车道线检测数据集OpenLane和OpenDenseLane,并汇报了这一领域的最新进展。
图 11 现场互动
图 12 结营合影
本次讲习班专家报告精彩、内容丰富,学员们积极互动、踊跃提问、收获颇丰,不仅加深了对专业领域的认知,还拓宽了视野和思维,更促进了同行之间的交流与合作。第22期“视频/图像语义感知和理解”前沿讲习班在各位报告嘉宾、广大同行以及学会的各级领导的大力支持下,取得了圆满成功。