自动监控NowSMS

最近颇为苦恼的一件事情是系统监控. 由于项目进入试运营阶段, 需要有人随时监控服务器的运行. 于是安排一个美国同事和一个中国同事为一组, 全天24小时监控系统的运行: 美国同事负责他们的白天8:00AM~20:00PM, 而俺们则负责他们的晚上 (即我们的白天), 20:00PM~次日8:00AM. 监控的内容倒是不复杂, 只需打开VNC监控几台服务器就可以了, 其中包括察看日志信息; 分析错误; 和错误处理.

不过毕竟这种工作是比较无味的, (1) 需要阅读很多LOG文件分析其中的关联和错误信息, 费神劳心 (2)由于网络带宽的问题, 监控操作响应比较迟钝

于是写了一个WEB脚本直接分析本地保存的NowSMS的日志文件, 理清几个日志文件之间的关系, 问题也就自动暴露出来了. 然后发现其中仍然有手工操作, 即需要手动下载日志文件, 感觉很不爽, 于是又写了自动下载的脚本… 于是一切都简单了, 只需打开一个网页, 更新最新的日志文件, 问题和统计信息全部展现在眼前, 非常省心.

一个通宵+一个白天的价值就此体现, 心安!

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注