中国图象图形学学会助力“一带一路”,促进国际交流共谋科技发展

来源:中国科协网 时间:2022/05/05

  近日,在中国图象图形学学会理事、青年工作委员会主任白翔的指导下,华中科技大学埃塞俄比亚籍电信学院2019级博士研究生王兴发布首个阿姆哈拉语场景文字检测与识别综合公共数据集和初步的算法解决方案。其论文“Comprehensive Benchmark Datasets for Amharic Scene Text Detection and Recognition”发表在国内计算机领域顶级期刊SCIENCE CHINA Information Sciences上。

  

  埃塞俄比亚联邦民主共和国是非洲大陆最古老的非殖民化独立国家之一,也是非洲第二大人口大国,是中国“一带一路”倡议的积极参与者与推动者。阿姆哈拉语是埃塞俄比亚的官方工作语言,也是仅次于阿拉伯语的第二大闪米特语系,在世界范围内有着广泛应用。埃塞俄比亚/阿姆哈拉文字(Abugida)是非洲最古老的书写系统之一,被应用于东非的至少23种语言中,共计被超过1.2亿人使用。对基于阿姆哈拉语的文字图片进行识别,将有助于促进东非国家在办公、交通、旅游等相关领域的数字化智能化转型。

  基于阿姆哈拉语的文字图片识别是一项极具挑战性的任务。为了解决构成阿姆哈拉语的不同字母具有高度的视觉相似性、目前缺乏公开的面向非洲文字理解的文字数据集等难点,王兴在白翔的指导下,提出了首个全面的、公开的阿姆哈拉文字识别数据集,数据集分为HUST-ART、HUST-AST、A.B.E.和Tana四个部分,总共包含了15039张真实场景的文字图像以及2927682张合成的文字图像。

  论文被SCIENCE CHINA Information Sciences接收后,相关成果及数据在网络上公开发布,受到广泛关注。该工作将促进埃塞俄比亚官方语言和其他非洲语言的文字识别应用。

  埃塞俄比亚联邦民主共和国大使馆向华中科技大学致函特别感谢学校对埃塞俄比亚籍电信学院2019级博士研究生王兴WONDIMU GEBRE DIKUBAB的培养与帮助,以及对进一步增进中埃两国之间友谊作出的贡献。

  

  目前王兴和白翔教授正在筹备中非合作技术论坛,以进一步促进中非之间的文字识别技术合作。