中国图象图形学学会第20期学生会员分享论坛成功举办

时间:2026-02-02      来源: 中国图象图形学学会

2026年1月30日,由中国图象图形学学会(CSIG)主办,CSIG优博俱乐部、会员发展与服务工作委员会、青年工作委员会承办的第20期学生会员分享论坛在线成功举办。论坛由电子科技大学邱荷茜副教授主持,邀请四位优秀博士生作学术报告,并邀请四位评议嘉宾对研究工作做出点评并解惑,共同围绕研究生学术生涯的热点话题进行探讨。 

 1770021017917639.png

合影

天津理工大学博士生周浩樑作题为“面向开放动态场景的组合式图像检索研究”的报告。石恒璨教授对周浩樑同学的报告进行了有针对性的深入点评。他首先肯定了该项工作在组合式图像检索这一学术前沿领域的积极探索,并关注其与工业界实际应用的结合程度,并进一步围绕三个方面展开讨论:首先,他关切该任务在工业界的实际应用现状,周同学结合电商搜索等场景说明了其落地潜力;其次,他探讨了在大模型背景下该领域面临的痛点与挑战,周同学指出当前方法仍依赖大模型的通用能力,需进一步强化面向组合推理的专项能力与可解释性;最后,他询问了现有算法在处理复杂图像与文本时的能力边界,周同学表示当前基准数据集仍以简单场景为主,未来需向更复杂、细粒度的视觉理解与文本意图拓展。

1770021025806418.png 

天津理工大学周浩樑博士生作报告

湖南大学孙龙副研究员作题为“高效视频图像复原算法研究”的报告,西北工业大学惠乐副教授对孙龙副研究员的报告进行了深入而全面的点评,他指出,方法的选择需结合具体应用场景来考虑。例如,在端侧计算场景中,受限于算力,传统的基于CNN等方法可能更为适用;而对于追求高质量视觉效果的场景、可采用端云结合的方式,通过生成式模型来增强低质图像的质量。

1770021061660497.png

湖南大学孙龙副研究员作报告

浙江大学博士生黄启涵作题为“基于提示指引的多模态大模型推理增强”的报告。姜阳邦彦老师对黄启涵同学的报告进行了系统且深入的点评。他首先就研究方法的泛化性提问,探讨了在数学几何数据上训练的模型向其他QA任务迁移的潜力,黄同学阐述了其方法在“有标准答案”任务上的优势及局限性。随后,姜老师提出了一个关键技术关切:在使用偏好优化时是否会面临“奖励黑客”风险。黄同学详细说明了为缓解此问题采取的双重措施:一是采用基于最终答案打分的GRPO方法,二是将数据集中的选择题改为填空题以杜绝猜测,姜老师对此扎实的工作表示赞许。最后,姜老师引导黄同学将研究置于更广阔的学术脉络中,思考其结合多模态大模型与图像生成技术的新思路,与传统VQA中解决文本偏见方法的根本区别与创新所在,并建议通过回溯传统工作来更清晰地定位自身贡献。

1770021087522032.png

浙江大学博士生黄启涵作报告

华中科技大学博士生朱良辉作题为“高效率计算机视觉感知与生成”的报告。上海交通大学易冉副教授首先肯定了朱良辉同学在研究中采取的“融合线性架构”的思路。随后,她聚焦于技术细节,就报告中提到的新方法(Dig)相比Mamba等线性模型在速度上实现四倍以上提升的来源提出了具体疑问。朱良辉同学对此进行了深入解释,指出传统线性扫描方法的顺序执行特性会随模型规模增大导致效率急剧下降。而他们所提出的“block-by-block”设计,通过巧妙最小化额外的矩阵运算和顺序扫描次数,从根本上解决了这一可扩展性瓶颈,从而在大型模型上获得了显著的效率优势。易冉老师对该工作的深度和分析表示赞赏,并进一步从应用前景角度出发,建议并期待该加速方法能拓展至视频生成领域,以应对当前生成高分辨率或长序列视频时面临的巨大推理时间挑战,认为这将具有重要价值。

1770021097174027.png 

华中科技大学博士生朱良辉作报告

Panel环节由邱荷茜副教授主持,点评专家和报告人共同围绕研究生生涯中热点话题进行了经验分享。直播间互动频繁,气氛热烈。通过此次活动,促进了博士生之间的学术交流、有助于学术视野的开拓以及创新思维的酝酿。参会的学生们纷纷表示在此次活动中收获颇丰、受益匪浅。

 


Copyright © 2026 中国图象图形学学会

京公网安备 11010802035643号 京ICP备12009057号-1

地址:北京市海淀区中关村东路95号 邮编:100190

技术支持:中科服