时间:2025-08-04 来源: 中国图象图形学学会
2025年7月31日,由中国图象图形学学会(CSIG)主办,CSIG优博俱乐部、会员发展与服务工作委员会、青年工作委员会承办的第十七期学生会员分享论坛在线成功举办。论坛由电子科技大学博士后研究员龙珍主持,邀请4位优秀博士生作学术报告,并邀请4位评议嘉宾对研究工作做出点评并解惑,共同围绕研究生学术生涯的热点话题进行探讨。
会议合影
北京航空航天大学博士生陈科研作题为“遥感图像视觉感知高效基础模型方法研究 ”的报告。湖南大学佃仁伟教授对陈科研同学的报告进行了重要点评。他指出,当前遥感大模型已取得显著进展,但在多源、多模态、多时相等方面仍存在提升空间和研究需求。佃仁伟老师提到,遥感大模型的核心特色在于其有效整合多分辨率、多场景、多时相、多任务信息的能力,能够处理包括光学、SAR、红外、高光谱等在内的多元遥感数据,并适应实际应用场景需求。他还特别指出了不同传感器在辐射特性和色彩表现上的差异,为遥感大模型的未来发展提出了重要的建设性意见。
北京航空航天大学博士生陈科研作报告
香港大学博士生窦志杨作题为“From Static 3D Geometry to Dynamic 4D Content: Analysis, Recovery, and Generation”的报告,浙江大学廖依伊研究员对窦志杨同学的报告进行了深入而全面的点评,她首先探讨了动作数据规模扩展面临的挑战,指出当前公开可用的动作捕捉数据仅约40小时,强调从视频中重建高质量动作数据的重要性,但也指出现有技术难以满足动画行业对动作精度的严苛要求。针对强化学习能否替代数据规模扩展的问题,廖老师认为参考动作数据仍是关键,并提出将物理仿真技术融入动作捕捉过程以提高数据质量的前瞻性思路。
香港大学博士生窦志杨作报告
清华大学博士生李凯智作题为“空间音频仿真及轻量化语音分离模型”的报告。上海交通大学程正雪助理研究员针对李凯同学的研究进行了深入点评。针对声学仿真研究SonicSim,程老师重点探讨了人工听觉仿真与真实人耳感知的差距问题,指出当前虽通过语音增强和分离任务间接评估仿真效果,但仍需专业人工耳设备进行更精准的验证。在轻量化模型TIGER的讨论中,她深入剖析了频带分离和参数共享技术对计算效率的提升机制,特别关注了频域维度压缩带来的计算量优化。她还指出梅尔谱特征在语音分离任务中的适用性局限,强调保持音频波形重建能力的重要性。
清华大学博士生李凯作报告
华中科技大学博士生廖本成作题为“面向大模型的新型高效率网络架构设计”的报告。北京航空航天大学李胜曦教授针对廖本成同学的研究工作进行了深入点评与交流。他首先就双向扫描机制在视觉任务中的应用提出专业见解,指出图像块间缺乏明确时序关系的特点使双向扫描具有独特优势,并进一步探讨了该机制在视频处理中的扩展可能,建议结合帧内双向和帧间单向扫描的混合策略。针对模型蒸馏技术,李老师深入讨论了其在encoder-decoder与decoder-only架构的普适性,廖本成同学也是给出自己的实验结果验证了这一性质。
华中科技大学博士生廖本成作报告
Panel环节由电子科技大学博士后研究员龙珍主持,点评专家和报告人共同围绕研究生生涯中热点话题进行了经验分享。直播间互动频繁,气氛热烈。通过此次活动,促进了博士生之间的学术交流、有助于学术视野的开拓以及创新思维的酝酿。参会的学生们纷纷表示在此次活动中收获颇丰、受益匪浅。