基于自然语言处理技术的工作票审核系统研究与应用
麦俊佳 黄丰
生成PDF 清样下载 引用

复制成功

导出题录

参考文献( GB/T 7714-2015 ) 复制

麦俊佳 黄丰,. 基于自然语言处理技术的工作票审核系统研究与应用[J]. 交叉科学研究,2022.12. DOI:10.12721/ccn.2022.157063.
摘要:
工作票制度作为电力工作中的重要环节,要求票面内容不得有任何错误。针对传统的工作票编制、审核需人工进行,存在着工作量大、效率低、容易出错疏漏等问题,本文提出了一种基于自然语言处理技术的工作票审核方法,结合自动语义分析提取工作票票面关键信息进行校验,核对是否存在线路名称、人员资质、工作地段与任务范围不符、固定语段错误等多种类型的常见错误,可以有效辅助办票、审票人员工作,杜绝典型的常见错误,保证作业安全。
关键词: 工作票审核自然语言处理语义分析
DOI:10.12721/ccn.2022.157063
基金资助:基金课题:基于自然语言处理技术的工作票审核系统研究与应用,基金编号:030819KK63371138

1  引言

工作票是电网日常运维作业过程中的重要安全制度,是防止发生人身和设备事故所必须的重要组织措施之一。工作票制度的有效执行是检修作业工作许可及保障作业安全的前提。近年来,电网不断加大建设投入,电网网架结构愈趋复杂,设备规模不断增大,检修工作频繁增多,然而传统的工作票编制、审核仍然需要人工进行,存在着工作量大、效率低、容易出错遗漏等问题,工作票票面错误、安全措施不准确、不规范、不完整等问题突出,严重影响了线路工作的安全开展,甚至威胁着电网人身及设备安全[1]

随着人工智能技术的发展,自然语言处理技术在文本处理任务上日趋成熟,其为电网工作票开票及审核提供了新的思路。可利用自然语言处理技术可实现工作票内容语义分析和关键信息提取,自动校验票面内容是否存在常见错误,核对是否存在线路名称、人员资质、工作地段与任务范围不符、固定语段错误等多种类型的常见错误,从而辅助办票、审票人员工作,杜绝典型的常见错误,保证作业安全[2]

目前多数电网调度运行部门采用制定标准化的工作票模板,通过人工填写相关信息生成工作票,在工作票审核环节,涉及的信息审查点较多,包括工作安全措施完整性、规范性审查,工作时间、工作人员、工作内容等是否正确完备,审核耗时较长且存在人为出错[3]。仍然缺乏对电力工作票语言信息的提取和自动审核分析方面的研究。鉴于电网工作票开票及审核过程中存在的一些问题,本文在有研究的基础上对自然语言处理技术进行了研究,提出了一种基于自然语言处理技术的工作票审核系统。基于电网工作票的文本特点,利用自然语言处理技术对电网工作票涉及的停电线路、电压等级、检修设备、安全措施等内容提取出来,结合智能规则库实现工作票工作指令及安全措施完整性、规范性及正确性检查,实现电网工作票关键内容的自动分析校核,机器代人,省时省力,有效降低了审票人员的工作量,保证了作业安全。

2 工作票审核系统结构

本文设计并实现了一种基于自然语言处理技术工作票审核系统。通过对工作票历史、标准票数据收集及整理,结合安规及检修作业指导书构建专业词典,包含线路、电压等级、设备类型、操作动作等标准词库。其次,利用自然语言处理技术对工作票特征文本区域的文本内容进行提取及预处理,获得工作票文本内容分词及词性标注序列,实现工作票工作指令及安全措施的术语标准性检查,其次结合标准票信息比对模型实现工作票的操作项、安全措施完整性及正确性比对检查。智能工作票系统整体架构如下所示:

1.png

图 1 智能工作票系统整体架构图

3 工作票审核系统功能流程

工作票智能审核具体功能如图2所示,审核项目包括以下几点:

(1)人员信息审核。人员姓名是否填写正确;人员资质是否正确(建立人员资质库进行比对);工作负责人是否存在同一时间担任多张工作票负责人的情况。

(2)人员数量审核。人员数量是否正确,若存在分组派工单,则应审核各小组人数是否正确。

(3)计划工作时间审核。计划工作时间是否与停电检修单的计划时间一致。

(4)作业单位和班组审核。单位和班组是否正确,是否具有资质(建立单位资质库进行比对)。

(5)工作任务审核工作任务是否与停电检修单工作任务一致。(注:工作任务应明确至具体杆塔号,不得笼统写区段)

(6)停电线路名称审核。停电线路名称与停电检修单的停电线路、工作任务中的停电线路是否一致。

(7)工作地段审核。核对工作地段是否与工作任务中的地段信息一致。

(8)应拉断路器(开关)和隔离开关(刀闸)信息审核。核对变电站名称、线路名称、开关名称、刀闸名称是否正确,开关、刀闸编号与能量系统的信息进行校核。

(9)接地刀闸信息审核。核对变电站名称、线路名称、接地刀闸名称是否正确,接地刀闸编号与能量系统的信息进行校核。

(10)应挂标示牌信息审核。核对应设遮栏、应挂标示牌(注明位置)是否正确。

(11)其他安全措施和注意事项信息审核。工作地段中同塔架设的带电线路、交叉带电线路(导、地线松紧工作的上、下方)、100m以内两侧距离最近的平行带电线路或其他带电设备电压等级和名称;无保留的带电线路或带电设备时填写无;审核安全注意事项是否齐全准确,无其他安全注意事项时填写无。

(12)应装设的接地线审核。审核此处的接地线编号同一施工单位、同一时间内不得相同,接地线编号需按要求规范编号。

(13)签发信息审核。审核工作票签发人信息是否正确、是否具有签发资质。签发时间是否早于计划工作开始时间。

(14)备注信息审核。审核人员电话是否正确,备注栏需注明需配电设备、变电设备同停情况,开工作业前由工作负责人核实,签名确认,并写明确认时间。

2.png

图 2 智能工作票系统功能流程图

4 工作票审核系统关键技术

基于自然语言的工作票文本处理,本文以线路第一种工作票为例,工作票如图3所示。特征文本区域包括工作任务、停电线路名称、工作地段、工作要求的安全措施及应装设的接地线文本区域。首先利用中文分词对特征文本区域进行分词处理。不同于西方语言,书面汉语的词语之间无分明的空格标识,句子以字符串的形式出现。中文文本分词是将工作票中由汉字组成的句子切分成单个独立的词,这是进行文本挖掘的前提[4]。分词的准确与否,将影响到搜索结果的相关度排序。文中采用结巴算法对大量文本进行分词处理,其综合了字符串匹配分词和统计分词的特点。其中,除了其自带的词典外,根据其可以自定义词典的功能,添加了电力领域的专业词汇。若文本中出现词典内不包含的词,则使用基于概率统计的隐马尔可夫模型对其进行识别。在中文分词的基础上进行词性标注,在词性标注模型中作出如下定义:线路l、电压等级vl、变电站st、一次设备eq1、二次设备eq2、一次设备编号n_eq1、二次设备编号n_eq2、专有名词nus、操作动词v、状态词s、助词副词z、连接词c、介词j、方位词f。完成工作票文本内容分词及词性标注后,可进一步进行工作票文本内容实体提取工作,包括线路、电压等级、操作设备、安全措施等实体,并结合构建的专业词典进行工作票操作指令术语标准性检查,以同一设备的不同表达为例,检修设备规范名称为“110kV培训1线”,实际工作票中可能出现“110kV培训2线”这样的描述,通过工作票自然语言处理模型能够有效识别出不规范的表达或者错误表达,从而实现工作票内容合规性检查的目的。

3.png

图 3 线路第一种工作票

5 结语 

通过基于自然语言处理技术工作票审核系统的研发,能够实现电网工作票开票及审核的自动化,提升工作效率,保障工作票工作指令及安全措施的完整、规范及准确表达,降低人为失误给电网调度检修工作及电网系统运行带来的风险,对电网安全稳定运行具有重要意义[5]。本文开发的工作票系统实现了工作票票面关键信息自动校验核对,可以有效辅助办票、审票人员工作,杜绝典型的常见错误,保证作业安全。工作票具有固定的格式和特定逻辑[6],因此对于工作票识别及校验,应用场景是高度一致的,后续可在电网企业输电、变电和配电专业推广使用。该技术的应用,可有效推进传统运维向智能运维转型,有着广阔的应用前景。

》在线投稿系统

*文章题目:
*作者姓名:
*电子邮箱:
*通讯地址:
*联系方式:

  备      注:

*上传稿件:

支持上传.doc,.docx,.pdf,.txt,.wps文件

投稿须知:

1、审稿结果将于1~7个工作日以邮件告知,请注意查收(包含录用通知书、审稿意见、知网CNKI查重报告)。

2、提交投稿后,若7个工作日之内未接到录用通知,则说明该文章未被录用,请另投他刊。

3、凡投寄本刊稿件,如在内容上有侵权行为或不妥之处,均应文责自负。本刊有权对来稿进行文字编辑、加工和修改,如不同意,请附说明,以便妥善处理。

4、多作者文稿署名时须征得其他作者同意,排好先后次序,通知用稿后不再改动。

5、凡投往本刊稿件一经录用发表,其版权归本刊所有。

6、本刊已全文录入中国知网、万方、维普等数据库,如作者不同意被收录,请提前申明,未申明者,本刊一律视为同意被收录。

7、请勿一稿多投。