活动预告
第十期CSIG企业行—走进金山办公将于5月7日举办
时间:2023-04-21 来源: 中国图象图形学学会
更好地服务领域内企业,中国图象图形学学会拟于5月7日在珠海举办第十期CSIG企业行—走进金山办公,通过搭建学术界与企业交流合作平台,为企业创新发展提供科技支撑,并为图像图形领域高校师生提供与企业互动机会,集结产学研力量,共同推动图像图形领域的发展。本次活动的主题为“ AI大模型时代下的文档识别和理解前沿技术探讨 ”,特邀中国科学院自动化研究所、北京科技大学、华中科技大学、华南理工大学专家和学者,与金山办公技术团队一道探讨文档图像分析与识别前沿趋势。承办单位:珠海金山办公软件有限公司
CAA模式识别与机器智能专委会
CSIG文档图像分析与识别专委会
CSIG青年工作委员会
活动时间:2023年5月7日 上午
活动地点:珠海金山办公软件园 7号楼(广东省珠海市香洲区唐家湾港湾大道321号金山软件园7号楼)
报名链接:https://f.wps.cn/g/sESq7H4C/


个人简介:1998年加入金山办公软件,从事软件开发将近20年,主要从事多个平台客户端相关技术开发,擅长 GUI 框架,大型客户端软件架构,音视频处理等技术领域。
1998年-2004年:从事金山词霸,金山快译,金山游侠等工具软件开发;2007年-2010年:任职诺基亚中国,参与Symbian OS开发,负责架构设计和核心代码开发;2010年-2017年:作为架构师负责欢聚时代直播相关基础技术开发,被评为公司最高级别技术专家;2017年至今:担任金山办公副总裁,负责公司AI方向的研发,包括AI算法研究、AI技术实施和相关产品服务开发。

刘成林 中国科学院自动化研究所副所长,研究员
报告摘要:文档图像识别的任务包括版面分析、文本识别、图形符号识别、信息抽取等。近年来,得益于深度学习方法的发展,文档识别性能快速提升,在文档数字化、票据处理、笔迹录入、智能交通、信息检索等领域得到广泛应用。然而,实际应用也表明,现有技术在识别精度和可靠性、可解释性、自适应性等方面还有明显不足,还有很多技术问题有待解决。另一方面,人工智能大模型的快速发展促使我们重新思考文档识别领域今后的发展方向,除了解决识别层次的遗留问题,应面向文档语义理解和应用,在语义信息抽取和决策层面开展研究。本报告对文档识别技术现状做简要回顾,分析现有技术的不足,并提出人工智能大模型时代新的研究问题和方向。专家简介:刘成林,中国科学院自动化研究所副所长,研究员、博士生导师,中国科学院大学人工智能学院副院长。1989年、1992年、1995年分别在武汉大学、北京工业大学、中国科学院自动化研究所获学士、硕士和博士学位。1996年至2004年先后在韩国科学技术院、日本东京农工大学、日立中央研究所从事博士后和研发工作。2005年起在中国科学院自动化研究所任研究员。2008年获得国家杰出青年科学基金。研究兴趣包括模式识别、机器学习、文字识别与文档分析等。在国内外期刊和学术会议上发表论文300余篇,合著英文专著一本。现任Pattern Recognition期刊和《自动化学报》的副主编,以及多个期刊的编委。任国际模式识别学会副主席,中国人工智能学会副理事长、会士,中国自动化学会会士、模式识别与智能系统专委会主任,中国图象图形学学会常务理事。美国电气电子工程师协会会士 (IEEE Fellow)、国际模式识别学会会士(IAPR Fellow)。

报告摘要:在诸如智能驾驶、网络内容安全等开放环境中,新数据、新模式、新类别不断涌现,模式识别与文字识别技术及应用出现新挑战。本报告首先简要回顾开放集模式识别的基本概念和主要技术,然后介绍其中的一个新方向——“开放集文字识别”(Open-Set Text Recognition),较详细地阐述其基本定义、通用框架和典型算法,最后对开放环境下的模式识别与文字识别技术及应用进行了初步的探讨与展望。专家简介:殷绪成,教授、博士生导师,国家杰出青年科学基金获得者、科技创新2030——“新一代人工智能”重大项目首席科学家,本科、硕士毕业于北京科技大学计算机系,博士毕业于中国科学院自动化研究所,现为北京科技大学计算机与通信工程学院院长、模式识别与人工智能技术创新实验室主任,中国图象图形学学会文档图像分析与识别专委会副主任/秘书长。长期从事模式识别、文字识别、计算机视觉、人工智能芯片、工业智能技术研究及应用,在IEEE T-PAMI、IEEE T-IP、CVPR、ICDAR等学术期刊会议上发表近100篇论文;以第一完成人获北京市科技进步奖一等奖1项、教育部科技进步奖二等奖1项,带领团队连续四届荣获国际文档分析与识别大会技术竞赛共15项冠军。
白翔 华中科技大学教授
报告题目: 《基于视觉与语言模型的语义分割与文字检测》专家简介:白翔,华中科技大学人工智能与自动化学院教授,国家杰青获得者,IAPR Fellow,机器视觉与智能系统湖北省工程研究中心主任。主要研究方向计算机视觉与模式识别、文档分析等。已在计算机视觉与模式识别领域一流国际期刊和会议如PAMI、CVPR等发表论文80余篇,谷歌总引用逾三万次,h值88。由于在场景文字检测与识别取得的显著成绩,2019年在国际模式识别协会主办的国际文档分析与识别会议上获得IAPR/ICDAR Young Investigator Award (青年研究者奖)。现任期刊IEEE TPAMI, Int. J. of Document Analysis and Recognition, Pattern Recognition, Frontier of Computer Science, 中国科学-信息科学、自动化学报编委。现任IAPR混合会议特设委员会委员,IEEE SPS Wuhan Chapter主席,曾任CVPR、AAAI、ICPR等人工智能主流国际会议的领域主席或竞赛主席十余次,并获得AAAI-2019 Outstanding SPC Award,2014-2022连续9年入选Elsevier中国高被引学者榜。

金连文 华南理工大学教授
报告题目:面向文档图像的篡改文本鲁棒检测:新数据与新方法
报告摘要:篡改文本的检测在信息安全中扮演着重要的角色,具有很大的学术研究及实际应用价值。然而针对拍照文档的篡改文本检测的公开研究报道不多,仍然是一个极具挑战的研究问题。在本报告中,我将简要回顾图像文本篡改检测近年来的一些代表性方法和进展,介绍我们团队近期提出的一种新颖的针对文档图像的文本篡改检测器(Document Tampering Detector,DTD),详细介绍DTD方法的技术原理和实验结果。此外,还将介绍我们构建的一个大规模文档图像文本篡改数据集(DocTamper,共17万张不同类型的文档图像和对应的篡改标注),以及DocTamper的构建方法。最后,对包括文本篡改检测在内的OCR领域未来的一些新方向及新问题进行讨论和展望。
专家简介:金连文,男,华南理工大学二级教授,兼任中国图象图形学学会(CSIG)常务理事、广东省图象图形学学会理事长、CSIG文档图像分析与识别专委会主任、CAA-PRMI和CAAI-PR专委会常务委员等职。主要研究领域为文字识别、文档图像理解等,在IEEE Transactions及权威国际会议上发表学术论文200余篇,其中SCI Q1区+CCF A类论文90余篇,Google Scholar论文被引用数11000余次,H-Index 55。作为负责人先后主持国家科技支撑计划课题、国家重点研发计划课题/子课题、国家自然科学基金重点项目/面上项目、广东省自然科学基金团队项目/重点项目、企业合作项目等科研项目40余项;获省部级科技奖5项(其中一等奖2项,二等奖3项);荣获中国人工智能学会、中国电子学会和中国图象图形学学会科技进步二等奖各1项;指导学生参加国际国内学术竞赛荣获冠军20余次。

熊龙飞 金山办公CV技术总监
报告摘要:PDF编辑需求是指通过对PDF文档进行编辑、修改、添加注释等操作来满足用户的特定需求,这种需求在办公、教育和研究等领域都非常普遍。标准件PDF编辑技术路线相对清晰,市面上有很多产品可以解决此类需求。扫描件PDF一般是通过扫描仪扫描或手机APP拍摄生成,其内容已变成不可编辑的图片,已失去了可编辑性,想要对其进行二次编辑,不仅需要对图片内的文字做定位和识别,还需对各类元素的排版以及文字属性做识别,在修改内容时亦需要保持文字的样式和排版合理与美观,对技术提出的挑战相对要大很多。金山办公在标准件和扫描件编辑上都已积累多年经验,且于2023年3月更新了新的扫描件PDF编辑方案,能够给用户带来更进一步的体验提升。本报告将简述金山办公在扫描件PDF编辑上的技术路线并呈现效果。专家简介:熊龙飞:男,研究生毕业于德国基尔大学,电子信息科学与技术专业,研究生主要研究领域为:BCI(脑机接口)和图像处理,参与发表两篇SCI收录的IEEE EMBC文章。有过三次创业经历,2019年11月加入金山办公,现为金山办公技术总监,组建了CV团队。负责OCR、文档识别和理解、PDF编辑、扫描等多个重点项目的研发管理工作。实现了全球第一个移动端拍照弯曲矫正功能,版式还原实现了行业领先的效果。目前版式还原已在扫描件PDF转化、拍照扫描、PDF编辑、双层PDF等多个业务上应用。申请专利二十余篇,其中六篇已获得授权。2021年起任中国图象图形学学会《文档图像分析与识别专委会》专业委员,为国际PDF组织企业成员,《珠海欧美同学会》和《珠海市海归青年交流促进会》会员。2021年带领团队获得金山办公技术大奖一等奖,2021年荣获金山办公和金山集团双料十佳员工。2022年获得“珠海创新创业好青年”称号。2022年指导金山队伍获得CSIG中国图象图形挑战赛小票识别赛道冠军和总决赛冠军。

金山办公是国内领先的办公软件产品和服务提供商,于2019年11月18日在上海证券交易所上市,是中国“硬科技”的代表性企业。作为一家源自中国的科技公司,秉持“绽放智慧的力量”这一品牌理念,金山办公在过去35年持续深耕办公赛道,从开创计算机“中文字处理时代”,到引领未来办公新方式,始终致力于为人们提供高效可靠、轻松愉悦的办公体验,为智慧的表达与传递创建高效平台。凭借以WPS、金山文档、金山数字办公平台等为代表的办公产品,金山办公为来自全球220多个国家和地区的用户提供办公服务。截至2022年底,金山办公主要产品月活设备数突破5.7亿。荣誉奖项方面,金山办公2014年荣获国家战略性创新产品,2015年荣获科学技术奖一等奖、Google Play“顶尖开发者”、Google最佳应用奖、中国电子学会科学进步一等奖,2017年荣获国际软件博览会金奖、2019年荣获中国政府信息化产品技术创新奖等。公司重视学术研究和产学研结合的落地,在2022年的CSIG图像图形挑战赛中获得小票识别赛道冠军和总决赛冠军;2022年起,连续两年赞助和支持了CCIG和VALSE等国内图像领域的学术会议;2022年,公司在德国参加PDF大会并做了PDF转化技术为主题的技术分享。
“CSIG企业行”是中国图象图形学学会主办的走进企业系列活动,旨在充分利用学会专家资源,搭建学术界与企业交流合作平台,为企业创新发展提供科技支撑,为图像图形领域高校师生提供与企业互动机会,共同推动图像图形领域的发展。
有意承办活动的企业,请扫描下方二维码申请,学会秘书处将在收到申请后5个工作日内予以回复。


2023年3月18日,CSIG企业行——走进上海合合信息

2023年3月27日,CSIG企业行——走进商汤科技

2023年3月16日,CSIG企业行——走进中科深智

2021年5月14日,CSIG企业行——走进海康威视

2021年5月23日,CSIG企业行——走进中车株洲电力机车研究所
Copyright © 2025 中国图象图形学学会
京公网安备 11010802035643号 京ICP备12009057号-1
地址:北京市海淀区中关村东路95号 邮编:100190
技术支持:中科服