时间:2026-02-01 来源: 中国图象图形学学会
中国图象图形学学会-黄山论坛(第三期)将于2026年2月3日在合肥科学岛举行,论坛由中国图象图形学学会与中国科学院合肥物质科学研究院智能机械研究所共同主办,中国图象图形学学会合肥会员活动中心承办,安徽省人工智能学会、安徽省电子学会人工智能专委会协办。
参加本次论坛不收取任何费用,欢迎各位专家学者参会。
为便于统计参会人数、提前录入车牌方便通行,请参会老师和同学于2月2日中午12点前扫码填写参会回执并提交。
论坛主席:宋博、汤进、贾伟
论坛时间:2026年2月3日
论坛地点:中国科学院合肥物质科学研究院-科学岛(蜀山区蜀山湖路350号)会议中心一楼 科学岛报告厅
论坛联系人: 张强 15855196055
论坛日程

论坛嘉宾及报告信息

刘青山
报告题目:三维点云表征学习方法研究
报告人简介:刘青山,博士,南京邮电大学教授博导,国家杰青/教育部特聘教授,主要从事模式识别、图像理解等人工智能领域相关研究等,近年来主持承担了科技部2030人工智能重大专项项目、国家自然基金重点项目等。曾获江苏省科学技术一等奖、教育部自然科学二等奖、中国电子学会自然科学一等奖,中国图象图形学学会自然科学一等奖等。带领团队入选全国高校黄大年式教师团队和江苏省双创团队。现兼任中国计算机学会计算机视觉专委会副主任、中国图象图形学学会常务理事、江苏省人工智能学会副理事长等。
报告内容:激光雷达 (LiDAR) 凭借其高精度、高可靠性的三维感知能力,在自动驾驶与机器人等智能系统中得到了广泛应用。然而,LiDAR 点云数据的精细标注过程成本高、周期长,已成为制约其大规模应用与持续发展的重要因素。围绕这一问题,本报告从数据驱动的视角出发,系统探索了在无标注条件下引入图像先验知识的激光雷达表征学习研究工作。相关研究分别从激光雷达与图像之间的时序一致性,以及激光雷达数据天然具备的多表征互补特性等方面展开,引导激光雷达特征的有效学习,从而缓解点云数据固有的稀疏性问题,并显著降低对人工标注的依赖。这些工作为构建高效、可扩展的激光雷达感知系统提供了新的研究思路与技术路径。

查红彬
报告题目:具身视觉与SLAM:在线学习的途径
报告人简介:查红彬,安庆师范大学教授;北京大学智能学院教授,信息科学技术学部副主任。主要从事计算机视觉与智能人机交互的研究,在三维视觉几何计算、三维重建与环境几何建模、传感器即时定位与地图构建等方面取得了一系列成果。出版学术期刊及国际会议论文350多篇,其中包括IEEE T- PAMI,IJCV, IEEE T-VCG, IEEE T-RA等国际期刊以及ICCV, ECCV, CVPR等国际学术会议论文150多篇。
报告内容:具身智能的本质是实现心智功能与身体、行为、环境的多层次反馈闭环处理,强化智能体与环境的紧耦合。SLAM的主要功能是同步完成传感器即时定位与环境地图构建,是具身智能研究中不可或缺的核心要素。为了提高具身视觉系统在真实复杂场景中的泛化能力,我们应充分保证视觉系统的环境自适应性,而在线学习方法是达到这一目标的有效途径。该报告将围绕基于在线学习的SLAM问题,介绍我们近来的一些想法和尝试,主要内容包括:使用在线学习系统忘却机理的动态SLAM算法;基于单目视频处理的全景三维几何与实例语义重建;基于在线持续学习的自适应VIO系统;利用隐式地图全局性与不确定性表达能力的自主建图方法。

吴小俊
报告题目:黎曼流形上的人工智能
报告人简介:吴小俊,IAPR Fellow、AAIA Fellow、AIIA Fellow、NAAI Member、江南大学二级教授、至善教授、研究生院院长、Josef Kittler人工智能研究院院长、教育部装备发展部联合基金创新团队负责人、科技部中英人工智能联合实验室主任、教育部/江苏省人工智能国际合作联合实验室主任、2006年教育部新世纪优秀人才、江苏省333工程第一层次人才。从事模式识别与人工智能的研究,在TPAMI、IJCV、TIP、CVPR、ICCV、AAAI等期刊和会议上发表学术论文400余篇,出版学术著作5本,研究论文被谷歌学术引用2万8千余次,h指数为75。研究成果获得国内外学术奖励30余项,其中包括多项国际竞赛冠军、国际会议最佳论文奖、IETE Gowri Memorial Award 、教育部科技进步一等奖、合作者Josef Kittler院士获2015江苏省国际科技合作奖和2016中国政府友谊奖;担任了2项国家重点研发计划项目首席科学家和3项国家自然基金重点项目负责人。曾在英国、法国和港澳台地区留学和学术访问,曾担任多个国际和国内学术会议主席、程序主席和大会报告人。现任IEEE智慧城市指导委员会委员、中国人工智能学会模式识别专委会副主任、多本国际期刊主编或编委、教育部计算机类教学指导委员会委员、中国图象图形学学会理事和江苏省人工智能学会副理事长等职。
报告内容:由于目前的深度学习是建立在欧式空间的,但是现实世界坐落在黎曼流形上,如何在黎曼流形上建立人工智能算法是一个道法自然的方向。本报告将介绍如何在黎曼流形上建立深度学习算法。首先从工程计算角度对黎曼流形的基本概念和方法论简单介绍;然后给出黎曼流形上深度学习算法建立的思想和方法,同时介绍这些方法的应用。

马华东
报告题目:视频物联网技术演进及未来展望
报告人简介:马华东,北京邮电大学学术委员会副主任、讲席教授。2010-2021年历任计算机学院执行院长等职务。2009年获国家杰出青年科学基金,2010年被聘为国家973计划项目“物联网体系结构基础研究”首席科学家,2019年入选国家基金委创新群体“物联网基础理论与关键技术”项目负责人,2023年度中国计算机学会王选奖获得者。兼任国务院学位委员会学科评议组成员,教育部科技委委员;中国人工智能学会副理事长,ACM中国理事会主席,IEEE/CCF/CAAI会士。长期从事物联网、人工智能、多媒体领域的研究,在多媒体传感计算、视频物联网、新型感知技术、媒体智能处理算法等方面取得一批有国际影响力的原创或创新性成果,授权国家发明专利100余项,发表论文400余篇。牵头获得国家级教学成果二等奖、教育部自然科学一等奖等奖励;获IEEE T-MM年度最佳论文奖、日内瓦国际发明展金奖等国际奖励。
报告内容:视频物联网是支撑平安中国、数字中国建设的新型信息基础设施。本报告首先介绍了视频物联网系统的概念及技术演进,然后介绍人工智能时代视频物联网目前面临的挑战性问题,特别是云边端协同视频计算、智能系统运维、智能服务生态等值得关注的研究方向,最后讨论了视频物联网的未来发展前景。

张新鹏
报告题目:从深度模型确权到AIGC溯源
报告人简介:张新鹏,国家杰出青年科学基金获得者,二级教授。曾赴美国纽约州立大学宾汉顿分校、英国肯特大学访学,受德国洪堡基金会资助作为资深研究员赴德国康斯坦茨大学访学。主持国家自然科学基金重点项目、国家自然科学基金原创探索项目、国家重点研发计划、国家863计划等科研项目40余项。发表论文400余篇,被引20000余次,连续十二年入选“爱思唯尔”中国高被引学者榜单,并入选“科睿唯安”全球高被引科学家。申请发明专利30余项,授权近20项。以第一完成人获上海市自然科学奖一等奖,参与获得国家级教学成果二等奖两次。担任 IEEE Trans. on Information Forensics and Security (IEEE T-IFS)等国际学术期刊的 Associate Editor、ACM IH&MMSec与IEEE WIFS等国际学术会议的程序委员会主席和大会主席。
报告内容:随着AI技术的不断进步,大模型在不同领域展现出巨大的潜力,但同时也面临各种风险问题。一方面,大模型昂贵的开发成本,对模型非法窃取与传播将严重损害模型持有者的正当权益。另一方面,利用AIGC技术生成逼真的虚假照片、视频和声音等信息信息可能被别有用心者用于操纵公众舆论、捏造虚假宣传、抹黑商业对手、诋毁个人名誉甚至实施精准欺诈。模型水印技术作为一种主动防御手段,近年来被广泛应用于深度模型的版权保护和生成内容溯源。本报告将介绍深度学习模型水印的发展历程,探讨判别式模型水印和生成式模型水印的核心问题和面临的挑战,展望AIGC水印发未来发展。

曹汛
报告题目:脑启发视觉信息表征与编码研究
报告人简介:曹汛,南京大学教授,博士生导师,主要从事图像和视频处理、计算摄像研究。现任南京大学脑机接口研究院执行院长、通信工程系主任,国家“新一代人工智能”重大专项专家组成员,南京市青科协会长。主持国家重大仪器等科研项目,融合多学科建立成果转化平台,指导学生多次获互联网+/国创赛、挑战杯等全国大学生顶级赛事特等奖和金奖。理论研究成果发表Nat. Nanotech.、Nat Comm.、Optica、IEEE T-PAMI、中国科学、电子学报以及NeurIPS、CVPR等会议,研究入选欧洲图像领域年度研究进展报告,被报道领域的变革式进展(Revolutional advancement)。研制了系列高分辨率、高通量成像仪器装置,获国家技术发明奖一等奖(2012)、教育部技术发明一等奖(2011)、Microsoft Fellowship(2011)、中国青年五四奖章(2022)。
报告内容:人脑视觉系统是目前最好的编解码器,仅依靠10bits每秒的信息处理能力便能实现对上万亿bits信息的实时高质量处理。从人脑视觉系统模型出发,团队提出了频率无偏的高效类脑视觉信息表示方法,搭建了光学元件与解码算法联合优化的新型类脑成像系统,构建了统一多模态数据处理和多任务决策的类脑编码引擎。相关成果被应用数学最高奖得主评价为缓解了类脑视觉表示中的训练稳定性问题,获中国电子学会科技进步一等奖。

俞俊
报告题目:面向低空具身智能体的多模态感知与自主决策
报告人简介:俞俊,国家杰出青年基金获得者,现任哈尔滨工业大学(深圳)智能科学与工程学院院长、二级教授、博导。浙江大学计算机学院本科、博士,新加坡南洋理工大学博后。曾分别入选国家优青与青年长江等人才计划。主持基金委重点项目、科技部重点研发项目、省杰青人才项目等。致力于图像处理与分析、多模态内容理解的研究。发表IEEE/ACM Trans及CCF A类论文百余篇,授权国家发明型专利30余项,谷歌引用2.3万余次。任IEEE TMM、TCSVT、Pattern Recognition等汇刊编委。曾以第一作者获IEEE TMM, TIP, TCYB等期刊的最佳论文奖,获省自然科学一等奖 2021(排名第一)。成果在人民日报、阿里等落地。
报告内容:近年来,多模态模型的快速发展显著推动了具身智能体在感知理解、动作规划与自主决策等方面的能力提升。作为典型应用形态,低空自主智能无人机在低空经济快速发展的背景下受到广泛关注。然而,其在复杂环境中的感知精度、自主导航与控制决策能力仍面临诸多挑战。为提升系统的智能化水平,学术界与产业界围绕多模态感知、自主决策等关键技术持续开展深入研究。报告将系统梳理低空具身智能的最新研究进展,并探讨未来的发展趋势与关键技术路径。

蒋树强
报告题目:开放环境下的视觉导航
报告人简介:蒋树强,中国科学院大学特聘教授,中国科学院计算计算技术研究所客座研究员,博士生导师,先后担任期刊《IEEE TMM》、《ACM ToMM》、《IEEE Multimedia》、《计算机研究与发展》、《JCST》、《CAD学报》编委,中国人工智能学会具身智能专委会主任,中国计算机学会多媒体专委会副主任、中国自动化学会网络计算专委会副主任、ACM SIGMM中国分会副主席。主要研究方向是多媒体内容分析、多模态具身智能。主持承担科技创新2030-“新一代人工智能”重大项目、国家自然科学基金青年基金A类(杰青)、B类(优青)、重点等项目20余项,发表论文200余篇,获授权专利20余项,多项技术应用到实际系统中,先后获省部级或学会奖励5项。
报告内容:具身智能是真实物理世界中人工智能的重要表现形态,具身导航是指智能体根据任务目标,感知与理解周围环境并执行交互动作走到指定位置,这是具身智能系统与真实世界交互的关键技术。真实具身场景面临着诸多挑战,包括场景结构和语义的未知性带来的开放场景问题,目标种类和功能属性未知所构成的开放目标问题,以及物体位置和状态随时间演化所导致的动态变化问题。这些因素要求智能体具备更强的环境适应能力、任务泛化能力以及对环境变化的鲁棒应对能力。本报告将首先介绍具身智能、具身记忆、具身导航的研究背景,重点分享基于场景记忆、功能推理、自适应学习、与多目标导航的最新进展,具体包括功能推理的开放目标导航以及具备实时适应能力的元学习方法等,最后介绍具身导航从虚拟到真实环境的适配并给出演示。

吴飞
报告题目:生成式垂直领域大模型:由通到专的实践和思考
报告人简介:吴飞,浙江大学特聘教授,博士生导师。主要研究领域为人工智能、多媒体分析与检索。现任浙江大学本科生院院长、国家人工智能教材基地执行主任,曾任浙江大学人工智能研究所所长,美国加州大学伯克利分校统计系访问学者。国家杰出青年基金获得者、国务院学位委员会智能科学与技术学科评议组成员、教育部人工智能科技创新专家组工作组组长(2018.8-2020.12),浙江大学第九届永平杰出教学贡献奖获得者,曾以第一完成人身份获浙江省、教育部、中国电子学会和中国人工智能学会科技进步一等奖,获2025年浙江省高等教育教学成果奖特等奖(第二完成人)、主编教材入选第二届全国教材建设奖一等奖公示名单。教育部计算机101计划核心课程《人工智能引论》负责人,开设国家级首批线上一流课程《人工智能:模型与算法》,著有《人工智能导论:模型与算法》、《人工智能引论》、《人工智能通识引论》和《走进人工智能》等教材和科普读物。
报告内容:本报告介绍生成式大语言模型中预训练、有监督微调和人在回路反馈等代表性算法,刻画机器学习从分段学习、端到端学习、进而All-in-One的变迁。同时介绍以高质量教材级语料打造的智海系列学科垂直领域大模型“智海三乐”和“智海-录问”,并且对垂直领域大模型和AI智能体等未来发展进行了思考。