人工客服-连接成功!
世纪中文出版社 ——“建设顶级中文期刊”为使命!期待与您同行......
人工客服:2025-06-08 23:08:38
世纪中文出版社 ——“建设顶级中文期刊”为使命!期待与您同行......
请输入您想了解的内容!
点击去下载截图软件
截图后在输入框直接粘贴
请您为我的服务评分:
一般
发送提交
检索
AI智能检索
学术期刊
首页
文章
期刊
投稿
首发
学术会议
图书中心
新闻
新闻动态
科学前沿
合作
我们
一封信
按学科分类
按期刊分类
医药卫生
(21)
工程技术
(38)
数学与物理
(12)
经济与管理
(12)
人文社科
(41)
化学与材料
(9)
信息通讯
(10)
地球与环境
(25)
生命科学
(2)
首页
>
文章
面向机器学习的流式文档逻辑结构标注方法研究
DOI
:
,
PDF
下载:
78
浏览: 508
作者
:
刘倩
;
李宁
;
田英爱
;
作者单位
:
北京信息科技大学计算机学院
;
关键词
:
结构标注
;
文档结构识别
;
机器学习
;
摘要:
针对采用机器学习方法识别流式文档结构时语料库稀少、语料标注复杂的问题,该文在研究文档的逻辑结构和编辑语义特征的基础上,确立流式文档逻辑结构标注体系,并提出一种三段式的半自动文档逻辑结构标注方法:第一阶段通过机助人工实现文档元数据的分离式标注,第二阶段自动重建逻辑结构,第三阶段自动填充特征向量。实验结果表明,该文提出的文档逻辑结构标注方法能够节省人工成本、提高机器学习算法对文档结构识别的准确率与召回率,F值达到97.5%。
投稿
相关文章
大数据技术在金融风控中的应用研究
程序化护理干预模式在脑出血患者中的应用及对认知水平的影响研究
一种用于小孔径攻丝的工装设计
一种便携式自动控制气动短路接地装置研制
关于建筑电气安装工程施工质量控制研究
学术共建
清华大学出版社
北大中文系
国家工程技术数字图书馆
维普网
万方数据库
版权所有 © 2025 世纪中文出版社
京ICP备2024086036号-2