王平教授团队在信息管理领域国际权威期刊IPM上发表古汉语理解最新研究成果
发布时间:2024-02-26       发布者:       浏览次数:

近日,档案智能开发与服务国家档案局重点实验室研究员、武汉大学信息管理学院王平教授团队在信息管理领域国际权威期刊Information Processing & Management (IPM)发表题为“Confidence-based Syntax encoding network for better ancient Chinese understanding”的古汉语理解研究领域最新研究成果。IPM是信息管理领域的TOP期刊。2022届武汉大学本科生张石头是论文的第一作者;王平教授是通讯作者;武汉大学为论文第一完成单位。


目前基于神经网络的模型不断取得快速进展,但语法仍然是自然语言处理(NLP)领域的基础要素,尤其是在中文语言理解的背景下,由于缺乏高质量的句法标注,通过整合句法信息理解古汉语方面的研究还鲜有研究。本文利用无监督推导和现代汉语句法分析器生成的“不那么完美”的噪声句法树,探索句法在增强古代汉语理解方面尚未开发的潜力。为了实现这一目标,本文提出了一种新颖的句法编码组件:基于置信度的句法编码网络(cSEN)。该组件旨在减轻无监督句法推导噪声和古代汉语与现代汉语之间不兼容产生的副作用而设计的。

图1 提出的cSEN的架构


通过实验古代诗歌主题分类和古今汉语翻译两个代表性的古代汉语理解任务,验证了所提出的cSEN的有效性,研究发现在有噪声的场景中,该模型始终优于基线方法。此外,本文还构建了一个新的古代汉语诗歌主题分类数据集,为未来的研究提供了基础,并解决了目前古代汉语语料库标注不足的问题。

图2 cSEN与传统的图编码网络GAT结果比较



该研究获得了国家自然科学基金、国家留学基金委员会等项目的资助。