:21:22:07

世纪中文出版社 ——“建设顶级中文期刊”为使命!期待与您同行......
请输入您想了解的内容!
截图后在输入框直接粘贴

请您为我的服务评分:

发送提交
PDF下载
结合字形特征与迭代学习的金融领域命名实体识别

刘宇瀚 刘常健 徐睿峰 骆旺达 陈奕 吉忠晟 应能涛

哈尔滨工业大学(深圳)计算机科学与技术学院

摘要: 针对中文金融文本领域的命名实体识别,该文从汉字自身特点出发,设计了结合字形特征、迭代学习以及双向长短时记忆网络和条件随机场的神经网络模型。该模型是一种完全端到端且不涉及任何特征工程的模型,其将汉字的五笔表示进行编码以进行信息增强,同时利用迭代学习的策略不断对模型整体预测结果进行改进。由于现有的命名实体识别研究在金融领域缺乏高质量的有标注的语料库资源,所以该文构建了一个大规模的金融领域命名实体语料库HITSZ-Finance,共计31 210个文本句,包含4类实体。该文在语料库HITSZ-Finance上进行了一系列实验,实验结果均表明模型的有效性。
关键词: 金融领域命名实体识别;中文语料库;深度学习
DOI:
基金资助:
文章地址:https://www.ccnpub.com/wenzhangd-2-97208

版权所有 © 2025 世纪中文出版社  京ICP备2024086036号-2