沙龙活动小节

在 youku 上偶然看到的一个沙龙交流,讲的还不错,所以做了下面这个记录,大部分都是些基本的东西,讲的还是蛮实在的。

(上)http://v.youku.com/v_show/id_XMzM0OTQ2NTQw.html
(下)http://v.youku.com/v_show/id_XMzM0OTQ4Mzcy.html

题目:软硬兼施做运维

1.资源分析
*服务器 – 施工(电量,U 位)
电量是固定的,不是想有就有的,R410 空载 0.9A,R510(2U)
带宽,优质用户
1U 比 2U 的更省 U 位,但是散热和扩展性会差一些
网络设备的电量可忽略,网线,走线是技术也是艺术
2.5 存硬盘比 3.5 寸硬盘贵,省电,体积小

2.一个机柜规划图
要有冗余 – 防火墙x2,外网交换机x2,内网交换机x2,交换机保留空 U
每两台 server 空 1 U,做散热

3.硬件性能
*主流 CPU 的处理能力,核心,主频,特殊的需要有指令集
*数据传输最慢的硬盘,内存,缓存,寄存器,CPU。CPU 没有处理过来的情况,只有数据传输传不过来的情况,即 IO 等待
*两块 600G 的一般用到 400G

4.硬件的可靠性
*单个硬件 99% 可靠
*电源,双电
*硬盘,RAID1,RAID10。RAID 卡的故障逐年上升,比硬盘的概率可以比了
*网线和网络设备,思科的都是单电设备,单网线容易故障,双网卡绑定解决
*机柜上放一台装好系统的备机
*远程卡

5.合理配置服务器
*硬件资源的合理性,1U 的机器能放几块硬盘?
*花大价钱买了低配,高价的服务器不高配,有某个组件托后腿
*不要配合预算去买设备
*dell 在线配置服务器

6.带宽和互联互通
*带宽是重大成本和重要指标,互连互通是国情特色
*小机房的带宽是你接入交换机的带宽
*根据业务类型选择单线,多线,最好还是 BGP
*使用压缩技术用运算能力还带宽
*消耗带宽最多的是图像,可以降低像素或者使用 CDN
*互联互通要靠我们自己发现,让 IDC 去解决。不要让数据擅自越过运营商的鸿沟,根据 traceroute 来看数据开始阻塞/丢失的地点判断是谁的问题

7.机房安全
*可以带人参观的机房是很烂的
*远离六合彩等,免得遭攻击
*机房稳定,看价位,口碑
*选多个 IDC,让每个 IDC 的业务都是不是不可替代的

8.机房环境
*值班人员的态度和能力,在紧急情况下就是你的眼睛和手
*到现场的距离也是重要因素
*机房由于某些原因屏蔽了某些端口
*服务器能否招之即来,挥之即去
*购买带宽和 U 位,好的机柜是要排队等的

9.与谁同行,与谁共赢
*不会沟通的是个废物
*技术问题
*责任心
*让人做他擅长的事

10.我们需要英雄
*英雄来拯救我们
*在业务出问题时,不能因为自己技术原因来搁置业务,找人帮忙解决
*第一类是技术大牛
*第二类是领导,耐心教导

11.南辕北辙的无用功
*沟通失误的后果是劳动成果归零
*要主动沟通避免无用功,反复督促,尽量通过邮件,文档沟通,口头不算

12.我们不能有求必应
*提需求的人仅仅是提需求的人 – 提需求的思想奔放,但不一定能解决实际问题
*抹不开面子死扛的都是蠢货 – 是不是死命令,有可能是一时兴起
*刚柔并济的将麻烦踢开 – 对方充满希望,让对方希望破灭。让机房测试网络,反而让我们先看看自己的设备有没有问题

13.城门着火,殃及池鱼
*这是一种用于攻击的假需求 –
*这种假需求我们要沉着应对 – 是真的刁难还是真抓住把柄,跟领导,销售沟通顺畅,把自己出现的问题造成的影响说清楚。外部的尽量让商务去解决,你只要解决技术的上的事情。不要跟客户承诺

14.用修剪果树的方式修剪需求

15.处理好真需求
*需求有优先级 – 有冲突时,资源不够时,先处理哪些?二八原则
*需要有时间表,没有时间表的计划很难执行
*需求要有责任人,多人负责或者没人负责就像三个和尚没水喝 – 作业计划书