中国图象图形学学会第六期学生会员分享论坛成功举办

时间:2023-10-09      来源: 中国图象图形学学会

2023年9月27日,由中国图象图形学学会(CSIG)主办,CSIG会员发展与服务工作委员会和优博俱乐部联合承办的第六期学生会员分享论坛在线成功举办。论坛由大连理工大学张平平副教授主持,邀请4位优秀博士生作学术报告,由4位评议嘉宾对研究工作做出点评并解惑,共同围绕研究生学术生涯的热点话题进行探讨。

首先中国图象图形学学会会员发展与服务工委会主任马思伟教授介绍了学生会员分享论坛的活动形式、理念原则以及学会已经举办和计划举办的优质学术交流活动,并对参加此次论坛的评议嘉宾及讲者表示感谢。马思伟教授强调中国图象图形学学会是一个致力于给图像图形领域研究人员和广大会员提供高质量学术服务平台的全国性一级学会组织,也是一个重要的人才举荐平台,希望大家都能积极参加学会各项学术活动,为学会作出贡献,并预祝本次活动取得圆满成功。

image002.jpg

图 1 CSIG第六期学生会员分享论坛合影

image004.gif

图 2 CSIG会员发展与服务工委会主任马思伟教授致辞

接下来,四位博士生分别带来精彩的学术报告。南洋理工大学计算机学院周满博士作题为“定制化底层视觉基础框架和理论体系”的报告。报告指出,当前比较流行的底层视觉框架和理论研究强烈地依赖高层视觉的发展,然而两者所面临的实际场景和任务需求存在天差地别,这也制约了底层视觉的发展上限,为此研究定制化底层视觉基础框架和理论有望实现底层视觉领域“上天入地”的愿景。

image006.jpg

图 3 南洋理工大学计算机学院周满博士作报告

华为公司高级研究员谢凌曦就周满博士的报告内容进行深入点评,肯定了引入先验去进行定制化视觉模型的可行性和价值所在,并从底层视觉的度量指标、基础模型等方向提出了一些建议,双方进行了交流探讨。

image008.gif

图 4 华为公司高级研究员谢凌曦点评

中国科学院自动化研究所张熙同学作题为“面向多模态语义理解与推理的视觉问答研究”的报告。报告提出,面向多模态语义理解与推理,针对视觉问答任务(VQA),探索两个关键问题,挖掘多模态语义关联,实现更可靠推理。第一个问题是面向多模态推理的泛化性,探索多种数据偏差,构建用于验证模型泛化性的数据集,并基于度量学习提高模型泛化性;第二个问题是面向现实场景,考虑动态更新的多模态数据,设计可连续学习的新视觉问答范式。

image010.gif

图 5 中国科学院自动化研究所博士生张熙作报告

北京航空航天大学刘偲教授对报告中VQA模型与多模态大模型的性能比较、VQA生成答案的形式、答案预测时引入外部知识等方面做出点评,肯定了相关工作的原创性和对多模态模型泛化性分析领域的拓展,对未来研究方向给予建议和指导。

image012.gif

图 6 北京航空航天大学刘偲教授点评

清华大学孙景翔同学作题为“Next3D—超写实3D数字人生成与驱动”的报告。主要介绍了Next3D—一种新颖的可驱动3D GAN框架。该框架可从非结构化2D图像中无监督地学习生成高保真和多视角一致的3D虚拟人像,并且在驱动处理上,可以实现全头旋转,面部表情,眨眼和凝视方向等精细控制。此外,Next3D还提供了强大的3D先验,可以用于one-shot数字人像拟合以及基于文本的3D人像风格编辑等。

image014.gif

图 7 清华大学大学博士生孙景翔作报告

武汉大学叶茫教授就孙景翔同学报告的内容作出了深入点评。从报告本身到研究成果进行了全面的评价,对其三维人脸生成框架中的表征形式以及驱动方式提出问题,并对未来研究方向给出了实用建议和见解。双方结合多视角数据实现360度头部生成以及结合个性化数据实现具有特定表情特点的三维数字人驱动应用等热点问题进行探讨。

image016.gif

图 8 武汉大学叶茫教授点评

华中科技大学林娴同学作题为“面向医学图像分割的自适应Transformer方法研究”的报告。报告指出Transformer因其卓越的远距离依赖关系编码能力和高效的特征表示学习能力在医学图像分割领域引起了广泛关注。然而,Transformer的计算复杂度大、训练成本高,在标注数据有限、目标复杂多变的医学图像分割任务中,往往容易产生严重的注意力崩塌、依赖关系冗余、边界细节丢失等问题。为此,首次对Transformer进行卷积化、自适应剪枝和边界感知窗口划分, 从自适应感受野、自适应依赖关系、自适应窗口划分三个维度对面向医学图像分割的Transformer展开深入研究。

image018.gif

图 9 华中科技大学博士生林娴作报告

西北工业大学夏勇教授就林娴同学报告中医学图像特性出发找出现有方案优缺点以及用大量实验进行佐证的研究思路进行了全面评价。并对医学图像的特性进行了补充,表示目标不清楚、对比度低、图像质量差、几何结构复杂等都会造成CV里面性能好的方法在医学领域效果不好。最后,夏勇教授还针对Transformer中的自注意力机制对解决多模态医学数据特征融合等问题发表了自己的见解。

image020.gif

图 10 西北工业大学夏勇教授点评

panel讨论环节由张平平副教授主持,报告人共同围绕“如何有针对性地阅读科研文献?”“如何从看论文到产生idea?”“如何推动科研在实际场景的应用?”“大模型盛行,高校学生如何做有意义的科研?”等研究生学术生涯的热点话题进行了热烈的交流讨论,腾讯会议室及寇享学术直播间互动频繁,气氛热烈。通过此次活动,参会的学生们纷纷表示在此次活动中收获颇丰、受益匪浅。

image022.jpg

图 11  panel交流讨论


论坛报名征集

有意报名参加此活动的同学,请扫描下方二维码填写信息,学会秘书处将在收到申请后一周内予以回复。

联系人及联系方式

联系人:秦老师

联系邮箱:membership@csig.org.cn

联系电话:010-82544676

Copyright © 2024 中国图象图形学学会

京公网安备 11010802035643号 京ICP备12009057号-1

地址:北京市海淀区中关村东路95号 邮编:100190

技术支持:中科服