时间:2024-05-24 来源: 中国图象图形学学会
2024年5月22日,“CSIG图像图形中国行”来到了深圳,本次活动的主办单位为中国图象图形学学会(CSIG),承办单位有广东省图象图形学会(GD-SIG)、CSIG 数字媒体取证与安全专委会、深圳大学电子与信息工程学院(广东省智能信息处理重点实验室, 深圳市媒体信息内容安全重点实验室, 深大-软牛人工智能联合创新中心)、中山大学网络空间安全学院。深圳大学陈昌盛副教授、中山大学杨文元助理教授和深圳大学李斌教授为会议执行主席。本次会议邀请了来自北京大学彭宇新教授、哈尔滨工业大学(深圳)何道敬教授、电子科技大学(深圳)高等研究院陈厅教授、中山大学(深圳)操晓春教授、江南大学吴小俊教授、华南理工大学金连文教授、香港科技大学(广州)何新磊助理教授,以及北京大学深圳研究生院张健助理教授。本次活动在深圳大学粤海校区校友广场多功能厅举行,与会人数100余人。
图 1 会场布置
图 2 深圳大学广东省智能信息处理处理重点实验室主任李斌教授主持开场
图 3 深圳大学电信学院副院长李岩山教授
图 4 学科带头人黄继武教授致辞
图 5 彭宇新教授作报告
来自北京大学王选计算机研究所的彭宇新教授带来了题为"多维感知驱动的AIGC"的报告。介绍了从空间、时间和布局等维度感知图像视频等视觉内容中的多维时空信息,实现视觉内容的可控精细生成。阐明了语义知识迁移、图像理解与细节定向编辑、生成过程可解释性、网络效率优化等多方面的研究问题,并提出创新解决方法,最后提出了AIGC领域中的关键挑战。
图 6 何道敬教授作报告
来自哈尔滨工业大学(深圳)的何道敬教授就“关于人工智能推动产业创新的一些实践”进行了深入探讨。介绍了在国产开源区块链核心技术体系的研发进展,并展示了通过构建基于区块链的电碳协同交易模拟平台,阐述了基于深度学习的加密恶意流量检测技术,以及分享了人工智能对劳动力市场影响的社会实验。介绍了在可信人工智能关键技术及平台研发,自主研制的大模型和多模态感知大模型,这些技术为企业级大模型提供解决方案。
图 7 陈厅教授作报告
来自电子科技大学(深圳)高等研究院的陈厅教授带来题为“区块链系统的安全性”的报告。介绍了区块链技术中的安全挑战并为区块链技术的稳健发展和实际应用中的安全性提供保障。通过先进的安全措施和分析技术来保护用户资产,防止非法交易和欺诈行为。从软件漏洞的发现,转账行为的识别,交易分析,逆向工程,平台的交易优化等方面进行了深入研究,以提高区块链交易的透明度和追踪能力。
图 8 操晓春教授作报告
来自中山大学(深圳)的操晓春教授在其题为“可信人工智能”的报告中,深入探讨了可解释人工智能的重要性,详细阐释了对抗性机器学习的概念,并介绍计算机视觉任务出现的各种扰动以及对抗方法。在对抗性攻击的分类和防御方面,对大规模攻击、黑盒目标检测攻击、三维点云攻击以及成对比较攻击等多种攻击手段进行了系统性分类,并深入分析了这些攻击手段对现有计算机视觉系统的影响。
图 9 深圳大学“荔园优青”陈昌盛副教授下午开场致辞
图 10 吴小俊教授作报告
来自江南大学的吴小俊教授带来了题为“基于信息融合的视觉容生成:深度学习方法”的报告。探讨了图像融合技术及其在图像内容生成中的应用。提到轻量级深度学习方法在通过图像融合生成多样化图像内容方面展现出优异的性能,并且内容生成可以与下游任务进行交互,同时,也指出AIGC领域面临诸多挑战。详细阐述了图像融合的典型方法,并特别介绍了LRRNet——一种基于理论推导、具有可解释性的深度神经网络技术。
图 11 金连文教授作报告
来自华南理工大学的金连文教授在的演讲中提出了关于“多模态大模型与OCR大模型的深入思考”。他概述了基础模型与大模型的快速发展,并介绍了基于视觉的多模态大语言模型的通用架构,展示了OCR技术在大模型时代正从多任务多模型向大一统的基础模型转变。提出关于多模态大模型的一些思考,从多模态大模型其他范式,在下游任务中与专有模型的对比,算力问题,多模态统一模型等方面探讨大模型技术带来的智能革命。
图 12 何新磊老师作报告
来自香港科技大学(广州)的何新磊老师探讨了“生成式人工智能时代下内容安全面临的机遇与挑战”。他强调了生成式人工智能在生产内容时产生有害图像的风险,加强内容安全监管的重要性,以及通过技术手段来缓解现有风险的可行性。从生成有害内容风险,生成内容检测与溯源,缓解现有的内容安全风险等方面进行详细讲解,并为理解和应对生成式AI在内容安全方面的挑战提供解决方案。
图 13 张健老师作报告
来自北京大学深圳研究生院的张健老师带来了题为“面向AIGC 的多功能数字水印与版权保护研究”的报告。展示了他在图像编辑和取证技术方面的最新进展,介绍了图像精准控制生成的科研历程,以及篡改定位、定制化溯源水印等多种水印功能。此外,分享了关于实现联合版权保护和篡改定位的解决方案,通过训练联合图像位隐写网络,以及引入基于提示的后估计模块来提高定位的准确性和鲁棒性。
图 14 活动现场
图 15 嘉宾合影