1.数据中心运维需要具备哪些知识和能力
运维工程师熟悉tcpip系列协议,熟练配置思科和华为网络能参考手册配置其他厂商设备包括安全设备熟悉服务器硬件系统配置操作系统unixlinuxwindows等安装配置检测其运行等熟悉常见的应用如webftp邮件等服务搭建及排查熟悉常见的系统安全设置,以及整个安全体系架构会安装及配置维护常见数据库oraclemysqlsql-server等有一定的存储方面的知识。
要熟悉你服务器的环境相关的东西特别是网络相关熟悉服务器的硬件配置熟悉服务器上的操作系统及各种常见的应用系统熟悉发生故障的时候处理流程等不强求你精通内核调优等但是你知识要全面而且有一两手是拿手的。
2.数据中心的运维都有哪些技术要求
作为应用型的运维来说,除了需要了解基础的普通维护之外,还要足够的了解具体的软件产品,这样就可以很好的进行软硬件部署架构的设计、性能测试、产品部署上线、平时产品线上的故障监测和侦错等工作,也能够更好的与其他人进行配合。所以说,除了基本的服务器和数据库操作能力,了解软件的设计和性能测试优化也是很重要的,当然如果能够掌握一些脚本编写是更好的。
数据中心的运维为了保证设备能够更稳定、更安全,需要进行监控和侦错,减少错误的发生,也可以在一定的程度上,减少运维费用的支出。当然这些也是一个运维人员工作成效的重要表现,这些对于公司来说,是非常重要的。
内容来源于:ITSS符合性评估落地工具-云雀运维!!
3.IDC运维工作需要掌握什么知识
IDC运维工作包含2个方面,就是数据岗位和动力岗位岗位不同掌握的和应做的也不同,没有专业的书和视频介绍 以下位数据为例,应具备最少以下知识~ IDC机房值班巡查操作指南(数据专业)IDC机房巡查是IDC值班人员的一项基础且重要的工作内容,通过机房巡查可以发现IDC机房现场的网络设备、机架、综合布线、卫生等的状况,及时发现问题,第一时间解决,确保机房的安全稳定运行。
IDC机房巡检固定频率为2小时/次,每次巡检后应及时在《IDC机房值班巡查日志(数据)》中要按要求进行记录并签字确认。巡检要求认真仔细,按质按点(偏差不超过半小时)的进行,值班人员应对值班期间的巡检结果负责。
巡查的主要内容:1、检查机房卫生状况:要求机房内清洁明亮,机柜及地面无明显灰尘;机房内无杂物、无危险品、无工程废料,无积水;要求物业人员对机房每两周至少清洁一次,在施工期间应增加清洁频次。2、检查IDC机房各门、窗、锁是否有损坏,能否正常开启,门禁卡是否能正常使用,是否有无人值守未上锁的门。
及时关好门、窗。如果有解决不了的问题,及时向值班长报告。
3、IDC值班人员应检查各路视频监视系统运行状态及录像,查看是否出现以下异常情况: ①、视频监视系统是否正常:是否有录像、录像是否清晰。②、重点监视区域是否有异常。
③、被监视区域人员活动是否有违规行为。如果监控系统运作有异常,及时通知相应的系统支撑人员。
同时在表格中记录异常现象。如果发现监视区域人员有违规操作,应及时对该违规行为进行制止。
4、检查日常值班使用的《广东省电信IDC综合业务运营支撑系统》及《政企客户支撑协作平台》运行使用是否正常,检查机房集中监控系统的运行是否正常,如果遇到计算机不能正常启动或者系统平台不能正常使用或有异常应及时处理,如果有解决不了的问题,应及时向值班长报告。5、检查机架和布线情况:(1)、采用超五类布线系统,布线系统在每个机架上提供结构化布线槽,综合布线系统采用上走线布线。
(2)、要求槽架内电源线、信号线分敷。(3)、对于布放的光缆需要套管或布放在线槽内。
(4)、在ODF、DDF、MDF等配线架上的跳线必须有标签标识。(5)、主要电路、重要客户电路等设备要有标识。
(6)、配线架的正面跳线要遵循如下标准:①、所有正面跳线要求做到“横平竖直、松紧适度”。②、要求所有走线必须下图所示,绕经圆柱。
③、同一配线架内的跳线,以中间为界,分两边跳线(并按第2条要求绕经圆柱),只允许配线架上、下方走线槽存在横跨中心线的跳线。④、允许跨配线架跳线;⑤、同一走向的跳线用扎带成捆,并在拐角处用扎带固定;⑥、按照实际走线距离制作跳线,并预留一定长度(10-15cm)防止水晶头制作错误以及走线过紧影响传输质量;对于定制跳线(定长),走线方式可按照下图方式并根据实际情况走线;⑦、注意:圆柱不允许的绕线方式见下图:⑧、注意:圆柱不允许的绕线方式见下图: ⑨、对拆机业务,需拆除相应跳线。
对于不符合要求的布线行为,责成相应的施工、维护人员进行整改。6、检查机房的核心交换机设备的运行情况,有无异常声响或告警声;指示灯状态是否正常,不亮或者红色,表示可能有故障,如发现核心交换机设备有异常,要及时向值班长反应情况,并拨打深圳电信0755-28816666做故障申报处理;如果客户的托管设备如有类似情况应及时通知客户处理。
4.数据中心如何高效做运维
从数据中心的日常业务运维方面考虑,则主要有日常检查、应用变更、软硬件升级、突发故障等
1、日常检查:根据数据中心承载业务重要性的不同,要对数据中心里的所有运行的设备进行例行检查。检查服务器应用服务是否正常,CPU内存等利用率是否正常。对应用业务进行检查,看业务运行是否正常。还有对数据中心的机房环境也要进行检查,环境的温度、湿度、灰尘是否合乎要求。
2、应用变更:数据中心承载的业务不会是一成不变的,随着业务的多样化和不断发展,经常要对业务进行调整,包括服务器和网络的设置。因此要对服务器和网络设备操作很熟悉,主要需要掌握Linux服务器命令和网络协议,要根据应用的需要,及时准确做出变更。
3、软硬件升级:数据中心的设备一般运行周期是五年,不断地有设备需要逐渐淘汰进行更换,也有一些设备因为存在软件缺陷需要升级,因此软硬件升级也是维护工作的一部分。软硬件升级时需要做好回退机制,以防升级出现问题时无法回退,业务长时间无法恢复。
4、突发故障:没有任何一个数据中心是不出故障的,在数据中心运行的过程中都会出现这样那样的问题。对于突发故障,高水平的维护人员可以静下心来冷静分析故障的触发原因,迅速找到解决的方法,如果在短时间内找不到解决方法,也可以通过切换到备用设备上先恢复业务,再进行分析。