近期,计通学院殷绪成教授团队针对视频文本跟踪、检测和识别间复杂的信息影响、共享和反馈,创造性地引入了多目标跟踪技术,提出了基于贝叶斯理论的网络视频文本检测识别统一框架,解决了复杂环境下文本检测跟踪识别研究的信息融合框架性问题。该项研究在数字与智慧城市、图像视频内容理解、网络信息安全管理等应用领域具有良好的发展潜力。以田澍博士为第一作者、殷绪成教授为通讯作者、苏亚博士/郝红卫教授为共同作者的相关研究成果学术论文(A Unified Framework for Tracking Based Text Detection and Recognition from Web Videos)被国际顶级期刊IEEE Trans. PAMI接收(DOI: 10.1109/TPAMI.2017.2692763)。
据悉,殷绪成教授团队近年来在复杂环境下图像视频文本检测与识别研究方面连续取得新进展,在IEEE Trans. PAMI上已发表3篇高水平论文。其中,2014年发表的论文《Robust Text Detection in Natural Scene Images》入选ESI高被引论文。在国际顶级学术会议IJCAI 2016上,以田澍博士和博士生裴唯一为共同第一作者、硕士生左泽雨为共同作者、殷绪成教授为通讯作者,发表了场景视频文本检测研究相关学术论文(Scene text detection in video by learning locally and globally)并作口头报告,引起了国际同行的关注。此外,该团队在2015年国际文档分析与识别大会技术竞赛上以明显优势获得“视频文本检测提取”等四项冠军。
IEEE Trans. PAMI(IEEE Trans. Pattern Analysis and Machine Intelligence,《IEEE模式分析与机器智能汇刊》)是模式识别、人工智能领域国际上最权威的学术刊物,2016年SCI影响因子6.077,在人工智能领域130种SCI期刊中排名第三;以论文影响力(Article Influence Score)排名,在所有的电气电子工程领域257种SCI期刊中排名第一;该期刊也是中国计算机学会推荐国际期刊“人工智能”领域的A类期刊。IJCAI(International Joint Conference on Artificial Intelligence,国际联合人工智能大会)作为为中国计算机学会推荐国际会议“人工智能”领域的A类会议,被业内认为是人工智能领域国际上最权威的学术会议。