中国图象图形学学会第五期学生会员分享论坛成功举办

时间:2023-07-28      来源: 中国图象图形学学会

2023年7月25日,由中国图象图形学学会(CSIG)主办,CSIG会员发展与服务工作委员会和优博俱乐部联合承办的第五期学生会员分享论坛在线成功举办。论坛由中山大学副教授胡建芳主持,邀请4位优秀博士生作学术报告,由4位评议嘉宾对研究工作做出点评并解惑,共同围绕研究生学术生涯的热点话题进行探讨。

首先中国图象图形学学会会员发展与服务工委会主任马思伟教授介绍了学生会员分享论坛的活动形式、理念原则以及学会已经举办和计划举办的优质学术交流活动,并对参加此次论坛的评议嘉宾及讲者表示感谢。马思伟教授强调中国图象图形学学会是一个致力于给图像图形领域研究人员和广大会员提供高质量学术服务平台的全国性一级学会组织,也是一个重要的人才举荐平台,希望大家都能积极参加学会各项学术活动,为学会作出贡献,并预祝本次活动取得圆满成功。


image001.png

图 1 CSIG学生会员分享论坛合影

image003.png


图 2 CSIG会员发展与服务工委会主任马思伟教授致辞

接下来,四位博士生分别带来精彩的学术报告。北京理工大学张宇翔同学作题为“基于领域泛化的高光谱图像跨场景分类方法研究”的报告。报告指出,在实际应用中,由于遥感数据的标记样本获取困难、成本高等一系列因素的影响,新场景(目标域)数据通常会出现标记样本不足或材记样本缺失情况,从而导致分类效果不佳或无法分类,利用源域的数据对目标域分类是目前最为常见的学习方法。但是,受大气、光照等因素的影响,源域和目标域数据存在差异,常规分类方法不能很好地解决跨场景预测问题。报告从领域泛化层面出发,提出包括单源域扩展泛化框架和视觉-语言多模态表征框架的跨场景分类算法,实现基于源域样本对目标域的精准分类。

image005.png

图 3 北京理工大学博士生张宇翔作报告

西北工业大学程塨教授就张宇翔同学的报告内容进行深入点评,并从跨场景、高光谱、图像分类、多源数据融合等方向提出了一系列问题,双方进行了交流探讨。

image007.png

图 4 西北工业大学程塨教授点评

天津大学韩瑞泽同学作题为“动态多视角协同与大场景多粒度视频分析”的报告。报告指出,以人为中心的视频分析是计算机视觉领域的重要研究方向。近年来,围绕以人为中心的视频分析取得了巨大进展,从早期的特定场景中单人目标,发展到近来的真实场景下多人目标视频分析理解。然而,对于真实场景下多对象复杂关系的视频分析任务,采用传统的单一视角单一任务技术往往无法满足实际需求。为此,报告首次提出动态互补视角协同多目标感知、全景多粒度行为理解等新问题,并对此开展了深入研究。

image009.png

图 5 天津大学博士生韩瑞泽作报告

上海科技大学高盛华教授对多相机协同感知、多目标时空关联感知、多粒度行为识别等方面做出点评,肯定了相关工作的原创性和对视频分析领域的拓展,并对未来研究方向给予了建议和指导。

image011.png

图 6 上海科技大学高盛华教授点评

重庆大学黄福香同学作题为“面向开放场景的多模态图像检索方法研究”的报告。主要汇报图像检索是计算机视觉领域的重要研究方向,具有广阔的应用前景。近年来,图像检索取得了巨大进展,从早期的单模态检索模式发展到灵活的多模态检索模式。然而,在开放的真实场景中,光照、背景、风格等因素引起的数据分布差异导致传统的单模态检索难以满足实际需求。为此,报告首次提出了跨域检索问题,并开展了深入研究,提出了概率加权紧凑特征学习算法和无监督域适应哈希算法。此外,为了提升多模态检索方法的泛化性和准确性,提出了一种即插即用的对抗各向同性梯度增强算法和一种语言引导局部渗透模型。

image013.png

图 7 重庆大学博士生黄福香作报告

成都电子科技大学姬艳丽教授就黄福香同学报告内容的作出了深入点评,从报告本身到研究成果进行了全面的评价,对领域直方图的计算量及影响、各向同性梯度增强提出问题,并对未来研究方向给出了实用建议和见解。

image015.png

图 8 电子科技大学姬艳丽教授点评

香港科技大学陈竞晔同学作题为“基于扩散模型的视觉文本渲染”的报告。报告指出扩散模型因其出色的生成能力而受到越来越多的关注,但目前仍然难以生成准确的视觉文本。基于此,提出了TextDiffuser算法:首先,Transformer模型生成从文本提示中提取的关键词的布局,然后由扩散模型根据文本提示和生成的布局生成图像。此外,我们贡献了第一个具有OCR注释的大规模文本图像数据集MARIO-10M,包含1000万个图像-文本对。我们进一步收集了MARIO-Eval基准来评估视觉文本生成算法。通过实验和用户调研,我们展示了TextDiffuser具有灵活性和可控性,可以基于使用文本提示或与文本模板图像生成高质量的文本图像,或对文本区域进行修复以重新生成包含视觉文本的图像。

image017.png

图 9 香港科技大学博士生陈竞晔作报告

香港科技大学(广州)陈颖聪助理教授就textdiffuser算法的实际应用价值与实现细节及拓展性方面做出点评。

image019.png

图 10 香港科技大学(广州)陈颖聪助理教授点评

panel讨论环节由胡建芳副教授主持,报告人共同围绕“如何有针对性地阅读科研文献?”“如何提升学术论文写作能力?”“如何推动科研在实际场景的应用?”“大模型盛行,高校学生如何做有意义的科研?”等研究生学术生涯的热点话题进行了热烈的交流讨论与互动,通过此次活动,参会的学生们纷纷表示在此次活动中收获颇丰、受益匪浅。

image021.png

图 11  panel交流讨论

论坛报名征集:有意报名参加此活动的同学,请扫描下方二维码填写信息,学会秘书处将在收到申请后一周内予以回复。

image024.gif

联系人及联系方式

联系人:秦老师

联系邮箱:membership@csig.org.cn

联系电话:010-82544676

Copyright © 2024 中国图象图形学学会

京公网安备 11010802035643号 京ICP备12009057号-1

地址:北京市海淀区中关村东路95号 邮编:100190

技术支持:中科服