时间:2024-02-21 来源: 中国图象图形学学会
问:请介绍一下您的团队、团队的研究领域和研究内容,以及在相关研究方面所取得的成果。
我所在团队依托于北京交通大学“ 交通大数据与人工智能”教育部重点实验室,在实验室主任李浥东教授带领下开展科研工作,我是其 中“多模态融合感知与交互”方向带头人。团队由四名全职教师,50多名博士生、硕士生及本科生组成。团队秉持“知行合一”的校训精神,是一支满怀科技理想、求真务实、勇于担当的年轻团队。我们团队面向综合交通智能化的国家战略需求,结合人工智能及大数据技术在交通行业的迅速发展趋势,研究基于视频和传感器数据的交通场景理解和预测。同时,结合图像、视频及3D点云数据处理,研究复杂、开放环境下的特定目标检测与识别、场景理解,跨模态跨视角目标再识别等任务,围绕基于注意力机制的特征学习、小样本 /零样本学习、跨领域迁移学习等工作展开。
近年来,团队致力于交通大数据感知、处理与分析方面的基础和应用研究。团队以国家战略需求为导向,瞄准国际科技前沿,承担了军科委基础加强计划项目、科技部重点研发计划、国家自然科学基金联合重点项目等项目,在交通数据采集 、多源多模态数据融合、智能视频语义理解、跨模态感知推理等基础研究领域创新性地开展工作,这些工作在智慧交通、智能安防等领域具有良好的应用前景和广阔的应用空间。具体来说:
1)交通视频智能处理:围绕我国交通基础设施智能化建设,对交通系统中的人 、车、基础设施等进行深度感知和智能分析。针对高铁视频数据低质量、小样本 、高噪声、强缺失等难点问题,我们设计了全视角的高铁运行环境视频采集系统 ,并研究自监督学习下的目标检测、鲁棒的多标记学习算法以及渐进式超分辨率图像生成模型等方法,从数据层面、模型层面对铁路接触网异物检测、高铁护栏 /声屏障缺损检测、高铁铁轨及刹车制动盘面检测等问题进行了系统研究,并在中国国家铁路集团有限公司下属的16个铁路局推广应用,获得2020年度中国计算机学会科技进步优秀奖(二等奖),参与制定“智能轨道交通系统人机物安全无线监 控”国家标准。
2)跨模态感知与推理:复杂开放场景中的跨模态数据,存在模态缺失、模态特征无法对齐、跨模态语义鸿沟等难点,如何减少跨模态特征之间的差异性,是跨模态感知与推理中的一个关键问题。围绕这一问题,团队研究基于注意力机制的模态一致性对齐、广义零样本学习、跨域跨视角学习等方法,在CVPR、AAAI、IJCAI、ACM MM等国际会议上发表多篇研究工作,获得IEEE 计算机学会2020 年度最佳论文奖提名奖,中国移动智慧城市客创马拉松专题比赛二等奖,中国生物特征识别大会行为识别竞赛二等奖等奖项。
问:您为什么选择这个研究方向,该研究方向的主要研究意义是什么?
团队长期从事机器视觉、模式识别等方向的基础理论与应用研究,在研究过程中,结合我国“交通强国”重要战略以及北京交通大学学科建设重点不断调整,逐渐形成了围绕智慧交通领域的多源多模态数据融合感知与交互的研究方向 。传统 的交通场景分析主要基于摄像头 、雷达和传感器等 单一模态的感知技术 ,无法满足复杂交通环境下的 实时感知和决策需求 。而多模态感知则可以利用多 种感知技术 (如摄像头、雷达、GPS等) 进行信息 融合 ,从而提高交通场景的感知精度和鲁棒性 , 以 实现更加智能化 、高效化和精细化的交通管理 。复 杂动态的交通场景 ,为人工智能技术提供了丰富的 数据支撑和开放的验证环境 , 从技术创新本身来 说 ,这一领域的研究 ,如多模态感知 、交通大数据 分析 、虚实结合的自动驾驶等从原理 、方法上都需 要相关新理论 、新方法 、新技术的支撑 。从实际应用角度看,智慧交通的发展有力带动了沿线经济社会发展、相关产业转型升级和城市群崛起,在促进国民经济高效健康发展、改善人民生活水平方面意义重大。
举例来说 ,在面向复杂交通场景下的行人辨识工作中,普遍存在跨摄像头、跨模态(白天、夜间)识别的准确率不高的问题,针对这一难点问题,团队提出了基于注意力机制的跨域行人再识别、关键点引导的跨模态再识别以及与相机感知风 格分离的无监督对比学习方法,相关论文工作发表在IEEE TMM2023、 AAAI2019、ACM MM2021、2022及IEEE ICME 2022等国际会议上。此外,个人数据属于受关注度比较高的隐私数据,基于此在2023年度国家重点研发计划“多媒体大数据的隐私保护技术”课题资助下,我们研究数据的分布式安全共享 、数据加密传输等技术工作顺利开展并进行应用。
问:在科学研究中遇到的重大机遇和挑战,以及是如何应对的?有什么经验可以分享?
科学探索的过程中,往往是机遇与挑战并存。面向复杂动态交通场景下的感知与识别问题,最大的难点在于感知目标的复杂多样性,以及感知环境受天气、光照 、地域等因素影响产生的复杂变化。因此如何提高数据的可用性,提升数据质量和标签的可靠性,建立相应的领域知识,探索智能识别算法理论框架,实现理论向产业应用的转化是其中的重大挑战。例如,在面向轨道交通的高铁周边异物检测问题中,由于受天气(雾霾、雨雪)以及光照(逆光、暗夜)影响,课题组深入现场进行需求调研,收集了大量视频图像数据,设计了专门的视频采集装置,并研究了其中的数据增强方法,有效缓解了视频数据受运动模糊和高噪声干扰问题,大辐提升了检测算法的准确性。此外,积极参与学会、专委会组织的研讨会 ,与国内、国际学者进行广泛交流,是开拓研究视野,提升科研能力的有效途径。
问:您对年轻的研究人员的寄语?
非常鼓励年轻研究人员在科学探索过程中勇敢尝试和创新。对于刚从事独立研究工作的年轻研究人员,可以从以下三方面进行尝试:
(1)保持辩证的思维方式:在探索新领域的过程中,选好一个方向,保持独立且思辨的思维方式,要预先判断其中的可能关键性问题,坚持不懈地进行实验和测试,不断调整方法和做出改进, 以最终取得突破创新。
(2)注重合作与共享:科学研究不能闭门造车,在遇到困难的时候,与同行广泛交流、与团队通力合作,可以拓宽研究思路,促进信息和资源的共享,避免重复工作,加速研究进展。
(3)保持良好的心态:在研究过程中可能遇到失败,也需要不断更新自己的知识体系,所以保持良好的心态和持续的学习热情非常重要。
金一教授
北京交通大学教授、博士生导师,国家重点研发计划“智能机器人”重点专项专家委员会委员。CSIG交通视频专委会副秘书长,多媒体专委会、青工委、女工委委员。获 IEEE CS最佳论文奖提名奖,CCF 科技进步优秀奖 ,北京市教学成果奖二等奖等奖励。主持科技部重点专项课题、 国家自然科学基金项目、教育部中移动联合基金课题、军科委领域基金课题等。发表学术论文70余篇,申请发明专利 32项。任 AAAI 、ACM MM 、IJCAI 程序委员会成员,多个国际期刊的编委、客座编辑。