log 收集处理方式汇总

syslog 比较老了,支持的的 log 类型也不是很多,比如 apache 的,默认是不支持 syslog 的,需要特殊的设置,这只是 apache 一个服务的 log,nginx 了?
如果有钱,可以考虑 splunk,全平台支持。免费的每天是 500MB,并且功能有限;收费的价格不是很便宜,并且用的量越多,收费越多。

有钱不如多买些机器,部署一些开源的服务,这比买现成的产品服务靠谱多了,这类服务跟 Oracle 类似,进去了比较难出来,还有个问题是,由于是按使用量计费,如果像 DNS 查询出错了,会在短时间內产生大量的 log,这会很快把一天的限额给用完。

商业的除了 splunk 之外,还有如下的几个:
1. loglogic
http://www.loglogic.com/

2. logrhythm
http://logrhythm.com/

3. loggly
http://www.loggly.com/

4. xpolog
http://www.xpolog.com/

5. LogScape
http://www.liquidlabs.com/main/index.php/products.html

6. sumologic
http://www.sumologic.com/

下面列的都是些开源的产品,有些做的还是相当不错的, 扩展性很强,不比 Splunk 差,排名没有先后。
Continue reading

DELL 12G 服务器型号

整理了一份 DELL 12G 产品的列表,随之升级的还有 Intel 对应的 CPU,最大的特点就是终于可以摆脱 Broadcom 的烂网卡了,可以使用 Intel 的网卡驱动。最初使用的 GD 编辑的,转到 wp 上不方便,直接截图了,每个图的数据从我的 ref 上都可以找到。另外,图片看不清可以"Copy Image Location",然后再打开。

 


DELL 12G 部分服务器总览 Continue reading

基础网络升级(三)

前两篇(1, 2)基本覆盖了此次升级的整个思想以及操作过程包括一些细节的涉及,不过在升级完之后,我们部署在老机房的监控系统发现,从老到新的中间的链路的质量比较差,三层之间路由接口的丢包很严重:
# ping IP_NEW repeat 8000

平均会丢 100+ 个包,丢包率超过了 1%,从监控到对端服务器的丢包就更严重了,平均都在 10%,峰值能达到 80%,注意这是两个打通的内网,我们也因此几乎无法登录到新机房的服务器进行操作,即使进去了,ssh 也是『卡』的让人随时受不了,网页完全打不开。丢包没有任何的时间特征,几乎是全天候。花了很长的时间 debug 确认了应该不是我们的问题之后,目光转移到了我们的服务商那里,猜测可能是中间链路的光纤或者连接器之类的问题。

期间,由于不稳定造成了几次很严重的网络中断。后来,对方的工程师也承认这根光纤衰减跟正常的偏差较大。最终决定更换这根光纤。

结果可想而知,下图是我们新机房某台交换机的 ping latency,效果很明显。

有时候我们会太天真的认为,光纤是很稳定的,正常情况下,是不可能出问题的,不过偏偏就是中了。

事后也进行了一些讨论包括 post-mortem,不过都是些治标不治本的点到为止,尽管我对此事非常的关注甚至『恼火』,在跟对方的邮件沟通中措辞非常的严厉,不过也只是搔搔痒罢了,我能做的就这么多。
当然,上面一系列的工作不属于我的工作范畴,既然做了就把他做好,至于有些不该知道的,就装作不知道好了。这个基础升级就写到这里为止,再下去就真的要到非技术层面了。

我为什么坚持使用 *nix 而不使用 MicroSHIT

最近有不少推友说把用了 N 久的 Ubuntu、Debian 什么的卸掉了,用回了久违的 MicroSHIT。那我来写篇『我为什么坚持使用 *nix 而不使用 MicroSHIT』来提出点『反对』意见吧。

先简单的介绍下我自己,我是一名 operations engineer,然后日常的 desktop 是 Arch Linux。

貌似都是以利与弊或者得到失去来总结的,那我也按照这个套路来吧。

首先,用 MicroSHIT 的那坨东西会失去或者说煎熬什么。

1. 要安装一个类似 PuTTy,或者 SecureCRT 类似的玩意儿,一个非常难用的 『terminal』,弄不好还被搞个后门。这个对于一个 7×24 的工程师来说,没有了 ssh 就没有一切。

2. 有人说用 MicroSHIT 主要是用他的 Office 套件,不过大家扪心自问吧,有多少人用的是盗版的或者破解的?有多少人是花钱购买的?或者有人说我可以使用 WPS,支持国产嘛,不过你愿意每次打开,右下角都要弹出一个恶心的窗口,让你注册登录那个什么金山快盘,另外,我在 MicroSHIT 上的技能确实比较烂,不知道如何屏蔽这类的垃圾应用。

3. 娱乐,游戏,音乐,电影?这类我的要求不是很高。游戏基本不碰,电影要么 online 要么 Transmission 拖下来直接 mplayer 看,音乐全部 online。

4. IM?要么 gmail,要么 gtalk,你如果愿意被审查,愿意被强奸,你完全可以使用这个全球安装量最大的,同时在线人数最高的,灰常灰常流弊的流氓软件。

5. 有人说 MicroSHIT 下安装软件方便,看到这话我就笑了,那些安装 QQ 的每次点击那个 .exe 文件都会有很多选项吧,『是否要安装 xx』,『是否要安装 oo』。我相信看我这篇博客的不可能不在乎这些而直接默认全部『下一步』,这个貌似能体现 MicroSHIT 下软件的流氓所在,国外的相对较好,大陆流弊的都是不问你愿不愿意安装『xx附件』就直接给你安好了。

有了上面的几点,完全没有理由使用这么一个难用的流氓 OS。下面谈谈用 nix 的好处,这个 google 能到一大把,这里只说个性问题。

1. 有人说 *nix 桌面难用,我个人觉得我现在这套 Arch+Awesome 的非常简洁高效,想怎么切就怎么切,想怎么新建窗口就怎么新建窗口,最差默认安装个 Ubuntu 12.04 都比 MicroSHIT 下新建个窗口来的方便。

2. 办公问题,无非就是 office 的问题,这个我通过行政手段基本已经避免,也就是说,我基本不收 .doc 类的文件,即使要用,gdocs 还能凑活着看。

最后说说 Mac,10 个有 7 个是装逼使用的,1 个真正喜欢的,还有 2 个是既不会用 *nix 又不屑用 MicroSHIT 的。

基础网络升级(二)

上一篇做的主要工作其实只是打通了两个机房的内网。升级完成之后,由原来的『无序』变得相对『有序』。

由于历史原因,起初的网络不得不如此的冗长 :-(

不过,经过研究发现,本质上依然无序的二层结构,除了启用了 ip routing。因为,机房与机房之间的连接是通过两台二层机器完成的,这两台机器纯粹充当了网线的角色,使用 access 相连接,同时又出现了 SPOF 的问题。

基础网络升级(一)里面完成的部分操作

Continue reading