时间:2023-04-06 来源: 中国图象图形学学会
2023年3月31日,由中国图象图形学学会(CSIG)主办,CSIG会员发展与服务工作委员会和优博俱乐部联合承办的第三期学生会员分享论坛在线成功举办。论坛由北京科技大学徐婧林副教授主持,邀请3位优秀博士研究生和2位硕士研究生作学术报告,由5位评议嘉宾(含主持人)对研究工作做出点评并解惑,共同围绕研究生学术生涯的热点话题进行探讨。
首先会员发展与服务工委会主任马思伟教授介绍了学生会员分享论坛的活动形式、理念原则以及学会已经举办和计划举办的一系列优质学术交流活动,并指出学生会员论坛是“平凡的小窗口”、“服务的大舞台”,能为学生会员群体提供更多差异化服务,帮助其开拓学术视野,激发创新思维。马教授强调中国图象图形学学会是一个致力于给图像图形领域研究人员和广大会员提供高质量学术服务平台的全国性一级学会组织,也是一个重要的人才举荐平台,希望大家都能积极参加学会各项学术活动,并预祝本次活动取得圆满成功。
图 1 CSIG学生会员分享论坛合影
图 2 CSIG会员工委会主任马思伟教授致辞
接下来,三位博士生和二位硕士生分别带来精彩的学术报告。季葛鹏作题为“Towards AI-Powered Colonoscopy”的报告。报告指出结直肠癌作为世界第三大癌症群,慢慢演变成为工业化国家恶性死亡的第二大原因,严重威胁着人类的生命健康。内镜医师在检查时通过光学诊断方式准确地发现并判断息肉所在区域,将避免不必要的手术切除和病理检查,提高了结直肠镜筛查的成本-效益比。本工作引入了领域内首个大规模视频息肉分割数据集SUN-SEG,其包含了1,106个视频片段以及158,690个视频帧,视频流畅度高达每秒30帧,并提供了具有密集型逐帧标注的分割标签、病理标签、视觉属性标签、弱监督标签等,为各类丰富的医学图像分析、处理任务提供了可能性,也启发了很多交叉学科研究方向。
马思伟教授就季葛鹏同学的研究工作和提出的问题作出了点评和回答。他指出报告的设计内容丰富、条理清晰,值得同学们借鉴和学习。
图 3 The Australian National University博士生季葛鹏作报告
图 4 会员发展与服务工委会主任马思伟教授点评
陈翔作题为“面向恶劣环境下的视觉增强方法”的报告。报告指出图像视频作为计算机感知场景的关键,其质量在很大程度上决定了智能感知算法的鲁棒性。然而复杂环境下图像视频获取的过程容易受恶劣外部环境(如浓雾、雨雪、极低照度)的影响,导致所获取的图像视频质量低、内容看不清。如何实现恶劣外部成像环境中的图像视频清晰化从而提升现有方法对图像视频内容理解的性能是解决恶劣环境下自适应感知的关键。为此,以图像去雨任务为研究对象,分别提出一种全监督算法和一种无监督算法的解决思路,前者通过稀疏Transformer的方法学习高质量的映射关系,后者通过对比学习的方法刻画潜在空间的因果关系。
马超副教授就提出的位置和内容的稀疏性作出了深入点评,并对陈翔同学的研究方向给出实用建议和见解。
图 5 南京理工大学陈翔博士作报告
图 6 上海交通大学马超副教授点评
郑鹏作题为“一种更强的组合作式协同显著物体检测器”的报告。该报告介绍了所提出的端到端组协同学习网络GCoNet+。该方法在CoSOD任务上达到了新的SoTA水准。模型主要通过两种关键指标以挖掘共识信息:(1)组内紧凑型:通过组亲和模块构建一致性;(2)组间分离性:通过组对比模块筛选共识信息。并设计了三个模块:(1)循环式辅助分类模块,以促进模型在语义等级的学习;(2)置信增强模块:以辅助模型提升最终:预测结果图的质量;(3)基于群的对称三元组损失函数,使模型学习到更多区分度。在以上三个最新基准上进行了更多实验,效果超越了所有最新的模型。
刘鑫辰研究员对郑鹏同学研究工作进行点评。他指出报告设计逻辑清晰,并肯定了代码和模型的开源的必要性。
图 7 Aalto University 郑鹏硕士作报告
图 8 京东探索研究院资深研究员刘鑫辰点评
唐珊作题为“基于概率采样的自动语义风格迁移”的报告。报告提出了一种基于概率采样的语义对齐方法,有选择性地对风格图像中的特征像素点进行选择,实现自动语义对齐。报告指出风格迁移是指将一张图像的风格转移到另一张图像上,基于全局统计量对齐的思想,当两幅图的语义内容不能很好对齐时,其传输效果往往不好,因此提出了一种基于概率采样的语义对齐方法,其可以作为一种非参数的即插即用模块嵌入到许多风格迁移网络中。同时,使用此模块,用户可以在不调整内容损失与风格损失平衡参数的情况下决定内容的保留程度。
董燕妮副教授就唐珊同学所提出的语义对齐模型学术贡献进行了点评,并讨论了定量化评价指标研究的必要性。
图 9 云南大学唐珊硕士作报告
图 10 中国地质大学董燕妮副教授点评
林卉作“基于多面注意力机制的人群计数”的报告。主要汇报在人群计数方向的一些科研进展。首先,在 IJCAI 2021 中,基于测度理论的角度提出半平衡 Sinkhorn 损失函数,避免不准确的伪密度图监督对计数精度的负面影响。其次,在 CVPR 2022 中,针对人群计数任务中的两个难点,提出了基于多面注意力机制的计数方法。共有三个模块:(1)Transformer 中可学习的区域注意力机制,实现动态地为每个特征分配注意力;(2)与其配套的局部注意力正则化,通过最小化不同特征位置的注意力偏差来监督变形器网络的训练,解决尺度差异问题;(3)实例注意力损失,可在训练期间动态地关注最重要的实例,减弱标签噪声带来的负面影响。并提出了一种基于密度代理引导的半监督计数方法基于密度代理的半监督人群计数。
徐婧林副教授就林卉同学研究领域内的标注不确定性、监督信号、模型的优化方向以及智能安防等工作作出点评。
图 11 西安交通大学博士生林卉作报告
图 12 北京科技大学徐婧林副教授点评
panel讨论环节由徐婧林副教授主持,评议嘉宾和报告人共同围绕“如何有针对性地阅读科研文献?”“如何提升学术论文写作能力?”“如何跟踪研究领域最新技术?”“如何从看论文到产生idea?”等研究生学术生涯的热点话题进行了热烈的交流讨论与互动,通过此次活动,参会的学生们纷纷表示在此次活动中收获颇丰、受益匪浅。
图 13 panel交流讨论合影