一、引言
在数字化的背景下,随着信息技术的发展,各行各业对于信息化的依赖程度都日益增强。机房是信息化系统运行的基础,是保存各种服务器、存储、网络等各类设备的地方,在这其中包含了各种各样数据的存储、处理和传输的重要工作。而网络运维则是保证信息能够在网络环境中高效、稳定、安全地传递,实现数据的价值转换,如果发生问题就会导致整个组织的信息资产被窃取,或者遭受严重的破坏,给组织造成很大的损失。所以,建立信息和网络安全视角下机房和网络运维的安全体系是非常重要的。引入具体案例,进一步讲解了机房及网络运维存在的安全问题有哪些?主要包括物理安全威胁、网络攻击、数据泄露、人员泄密等等,一旦这些问题出现了会怎样?会严重危害组织的信息资产安全和网络业务运转。
二、机房与网络运维安全风险剖析
2.1 机房物理安全风险
2.1.1 机房环境风险
机房物理环境可分为机房外部环境和内部环境两个方面,其中外部环境包括:地质因素、水源、供电情况、辐射等对机房的安全运行造成的影响。如果机房所在地处于多地震或发生洪水等自然地理灾害的地方或者是周围的周围环境中有较多强电磁场源或者易燃易爆等场所,则会给机房带来很大的安全隐患。另外还包括机房内温湿度、气压等环境状况对设备运转和寿命影响的问题。比如温度过高容易使设备发生过热死机现象;温度湿度过大容易引起设备内部短路故障,严重时导致毁坏。
2.1.2 机房设备安全风险
机房内有大量服务器、存储设备、网络设备等硬件设备,容易因为出现硬件老化、故障、电源问题等因素产生异常情况;另外机房设备缺乏物理安全防护,比如机柜不上锁、没有采取散热措施等都会引发机房设备被窃、损坏和过热故障等问题。
2.1.3 机房电力供应风险
机房正常运行,供电稳定是保障的基础。比如常停断电或电压剧烈波动、电源断开等情况,将有可能使设备出现突然故障关机的情况,造成数据丢失和系统损毁;虽然UPS能够在一段时间内保证机房的动力供应,但是当长时间停电而无任何应急发电措施时,则难以保证动力供应正常。
2.2 网络安全风险
2.2.1 网络攻击威胁
网络攻击本来就比较频繁,DDoS(分布式拒绝服务)攻击、入侵攻击、恶意软件、网络钓鱼等常见的网络攻击手段严重威胁着网络安全。DDoS 攻击主要是将海量服务器无法处理的请求在短时间内通过发送到目标服务器,导致服务器瘫痪;入侵攻击则是入侵者企图通过窃取敏感信息非法获取系统权限;包括病毒、木马、勒索软件等在内的恶意软件在网络中传播,可以对系统和数据进行破坏;钓鱼通过对用户进行伪装欺骗,获取敏感信息,如用户的账号、密码、银行卡、身份证等。
2.2.2 网络漏洞风险
网络漏洞无处不在,不管是操作系统的漏洞,还是应用软件、网络设备中的漏洞,都是威胁到网络安全的因素,恶意用户可以利用这些漏洞进行攻击,从而获得对系统的控制权或者窃取到有价值的信息,未做及时更新的操作系统及应用软件存在着已知漏洞,而外部的黑客就可以通过这些漏洞对我们的系统进行远程攻击;而且配置的不当也会引发安全问题,如:防火墙规则配置错误或者不严谨、网络访问控制弱等。
2.3 数据安全风险
2.3.1 数据泄露风险
数据泄露在数据安全风险里也占了很大的比重,比如内部人员非法操作,比如没经过授权就访问、拷贝数据以及文件等行为;或者通过网络攻击的方式获得我们的数据,还有存储机密资料的一些设备丢失或者被盗窃等,都会导致数据泄露的情况出现,并对我们的经济和公司的品牌都造成巨大的损失。
2.3.2 数据丢失风险
数据丢失的原因有很多:如硬件故障、软件错误、误操作、自然灾害等等。比如硬盘坏了,可能就导致存储在上面的数据没法再读取了;误删了重要的数据文件,并且也没有备份的话,那就真丢了。而一旦数据丢失,会对企业的业务产生不可挽回的影响,轻则企业日常运作受阻,重则出现业务中断的情况。
2.4 人员管理风险
2.4.1 人员安全意识不足
参与机房与网络运维人员若缺乏安全风险意识,认识不到安全运维管理重要性,则容易在日常工作中出现违规操作,如设置简单密码、随意共享账号、在不安全的网络环境中处理敏感信息等,从而为安全事故埋下隐患。
2.4.2 人员权限管理混乱
不合理的人员权限分配,如权限过大、权限未及时收回等,可能导致人员滥用权限,进行未经授权的操作。例如,离职人员若未及时注销账号和收回权限,可能利用原有权限访问系统,造成数据泄露或破坏。
2.5 运维流程风险
2.5.1 运维制度不完善
由于缺少完善的运维管理相关制度(如:设备巡检制度、故障处理流程、变更管理流程等),导致运维工作有管理缺位的现象,效率较低,容易出错,例如,在设备巡检过程中如果没有任何的巡检内容、巡检标准,很难发现隐患。
2.5.2 应急响应能力不足
如果缺少应急响应能力或者应急响应机制不健全,一旦发生安全事件或者系统故障的时候,就无法做到有效应急处置,就有可能造成事故扩大化,之后给公司造成更大的损失。例如:黑客对公司发起DDOS攻击的时候,未启动应急预案并无法快速采取对应防护手段,则公司的服务器会处于长久的宕机状态,从而使得公司的相关业务也处于停摆的状态。
三、机房与网络运维安全策略
3.1 强化物理安全防护
3.1.1 优化机房环境
要考虑机房选址地理因素安全,远离灾害多发地区、强电场和磁场干扰、易燃易爆环境。机房内要配有温湿度控制系统,保证机房温度维持在22℃~24℃之间,湿度控制在40%~60%之间,并且需要配备空气净化器,保持机房内空气干净;机房需要设置防火防水防雷电保护措施,需要安装配有火灾报警系统的灭火装置,设置防水围堰,做好防雷地线接地工作等。
3.1.2 加强设备安全管理
严格执行机房设备资产管理,建立设备台账,对设备的型号、配置、购买时间、维护记录等情况做出详细登记;加强对机房设备的物理安全保护,保证机房设备的安装需要使用坚固的机柜,并且在机柜的前后面板都加装门锁,防止机房设备被盗或者被非法拆卸;同时定期对机房内的设备进行巡检维护,查看设备的运行情况以及设备的连接状况,对出现的设备故障能够及时解决,并淘汰更换设备老旧、性能下降的设备。
3.1.3 保障电力供应稳定
在市电断电后可以维持较长时间供电,保证设备继续运行用于保存数据和安全关机的UPS,备用发电设备如柴油发电机的配置、以及定期维修和测试。当长时间停电时可以及时启用备用发电机组,使机房一直保持电力供应。同时要时刻注意电力系统供电情况,做好出现停电后可能出现的情况预想,及时发现问题,避免出现问题。
3.2 构建多层次网络安全体系
3.2.1 部署网络安全设备
网络的安全基础设备就是防火墙。部署在网络边界上的防火墙的主要任务是过滤所有的进出网络的数据流,来阻挡非法访问及恶意攻击,并且要基于网络安全策略设置合理的访问控制规则,使得合法流量可以通过而阻止非法流量通过;除了以上提及的网络设备外,如果企业有网络业务时,还应该部署入侵检测系统(IDS)以及入侵防御系统(IPS),可以实时监测网络流量情况,并针对入侵行为进行侦测与阻断。IDS是用于检测网络中存在的异常行为以及可疑的行为,IPS是主动式地进行攻击阻拦、防御的工作。还需要部署防病毒网关,在一些重要节点检测病毒、木马等恶意代码是否进入内网,以便提前做好防护。
3.2.2 加强网络漏洞管理
网络漏洞管理是一个相当重要的过程,漏洞扫描和漏洞修复及防护属于其中主要内容。这就需要采取一些具体措施如:定期对网络设备、操作系统以及应用程序等开展安全漏洞扫描,并且针对已扫描出的问题进行分级评估,针对漏洞的危害性以及危害范围采取不同的处理方式,比如对于危害性较大的漏洞需立刻开展修复工作;但是也有一些漏洞目前暂时无法进行有效修复,针对此情况就需要对其做好临时性的防护工作,以此来减少隐患带来的威胁;另外还要实时跟进操作系统以及应用软件方面的相关补丁更新和及时对系统进行升级。
3.2.3 实施网络访问控制
建立并实施网络访问控制。根据用户的职能、职责以及业务需求,合理分配网络访问权;利用多因素认证手段结合使用,包括用户名/密码、数字证书、指纹/人脸等身份认证方式,确保用户的真实身份;采用ACL(访问控制列表)控制,对网络设备端口的访问只能通过网络设备上配置的ACL实现,只有得到允许的设备才能访问网络上的资源。对于外网用户可以通过虚拟专用网络(VPN)技术接入内网,实现远程用户的接入安全,保证远程访问的安全。
3.3 实施数据安全管理
3.3.1 数据加密保护
机房设备存放的是用户的各类信息以及企业的财务信息和机密数据等,可以通过加解密技术手段保证这些信息的安全性,对于数据本身,主要是通过加密的方式,确保存储数据和传输数据不会被别人窃取或篡改,在数据存储层面可以应用磁盘加密的方式对硬盘上的数据进行加解密,只授权使用的人员才能读取这些密文的数据;针对数据的传输,可以在网络上传输时利用 SSL/TLS加解密技术来实现网络传输数据的保密及完整。
3.3.2 数据备份与恢复
数据备份是数据安全的重要前置手段,在机房运维中,需要制定并检查完善数据备份策略,定期对重要数据进行全量备份和增量备份。备份数据可以在本地,也可以存储在异地,异地备份可以防止本地灾难导致数据丢失;同时可采用如磁带备份、磁盘备份、云备份等多种备份方式,提高备份数据的安全性和可靠性。此外,为确保备份数据应急时可用,还需要定期对备份数据结果进行数据恢复测试:能够在本地发生资料遗失或损毁的情况下,利用备份资料迅速恢复,从而保证业务的连续性。
3.4 优化人员管理与培训
3.4.1 提升人员安全意识
按照计划组织相关人员认真参加信息安全培训,进一步提高安全意识,防范能力,培训的内容包括信息安全相关法律、法规、制度、常见网络攻击手段与防范办法、数据保护意识等;采取典型案例分析、模拟演练、安全攻防等方式,让大家深刻地认识到信息安全的重要性,逐渐将一些好的习惯贯穿于平时工作的方方面面,并且也促进了一些安全技术的应用能力。
3.4.2 完善人员权限管理
严格执行人员权限管理制度,按照人的职责和业务要求分配系统访问权限;主要措施是采取最小权限的原则,即分配人员最少必须的权限,避免因权限太大带来安全隐患;定期审查岗位人员的权限,并更新相应的岗位变更情况,将离职或退休等人员已经不再需要的各种岗位权限及时收回;杜绝无权占用的现象;并对人员的操作行为加强审计,记录、跟踪人员对系统的使用、对数据的操作等,对不规范的操作行为及时发现并处理。
3.5 完善运维流程与应急响应机制
3.5.1 建立健全运维管理制度
针对机房和网络运维工作,需要有完备的运维管理制度,比如设备巡检制度、变更管理制度、故障处理制度、安全审计制度等,这些制度中都要有针对每一个运维人员所规定的工作职责以及操作规范,这样才能保证整个运维安全工作的规范化和标准化。其中措施如下:设备巡检制度要对设备巡检的重点、巡检的内容、巡检的时间周期、巡检的方法、巡检的记录、问题的跟踪提出要求;故障处理流程要明确故障报告、诊断、处理、恢复、跟踪、改进的过程及各人的责任;系统变更流程需对系统的变更提出申请、审批、实施、验证、改进的要求。
3.5.2 加强应急响应能力建设
针对机房和网络运维应急响应,要建立应急响应机制,制定应急预案,确定应急处理流程、责任人等;预案中需涵盖安全事件、系统故障类型如:网络攻击、数据泄漏、设备故障、停电等;对于各种安全故障情况制定应对措施,并对预案进行定期演练,使相关人员能快速反应并掌握良好的应急配合能力;针对预案过程中出现的问题,不断地去修正完善;建立应急响应资源库,准备好应急所需要的物资和工具(备用设备、应急软件、安全防护设备等)。
四、后记
机房与网络运维安全关系到企业信息资产的安全,与业务正常运行也息息相关,是企业信息与网络安全重要组成部分。通过分析机房与网络运维中存在的物理安全风险、网络安全风险、数据安全风险、人员管理风险和运维流程风险,针对性地提出强化物理安全防护、构建多层次网络安全体系、实施数据安全管理、优化人员管理与培训以及完善运维流程与应急响应机制等安全策略,可以有效提高机房与网络运维安全性和可靠性。在实际工作中,还应根据组织的实际情况和安全需求,不断完善和优化机房与网络运维安全体系,以应对日益复杂多变的信息安全挑战。
参考文献:
1、陈定球,戴景镕. 系统化构架网络安全保护的实践与探索——以湖南广播电视台广告经营管理系统为例[J]. 网络安全技术与应用, 2024, 1(1): 1-8.
2、刘洋,陈晓明. 智能化机房运维平台中的数据安全防护技术研究[J]. 计算机应用与软件, 2022, 39(12): 1-6.
3、唐传金. 网络安全运维中的风险评估与应急响应机制[J]. 信息安全与通信保密, 2020, (10): 34-39.
4、陈定球. 基于安全协作的广告经营管理系统设计和与实现[D]. 湖南大学硕士论文,2013.