很简单,挂了自动重启那种。
supervisor 有这种功能的吧
init-daemontools
用SIGCHLD串一串
这种对于做运维的太简单了,可以先检测,发现不正常kill掉,然后重启,把这功能做成脚本放到crontab里,5分钟运行一次。
最好有一个工具会更好吧,比如
/sbin/daemon-mointer searchd xxxxxxxx
然后就万事大吉了。
supervisor可以自动重启挂掉的应用。
可以试试monit
你要是会用shell,这比工具简单多了。
我去,你们运维就是这样不管3721不正常就kill吗?代码发来看看,哈哈
对于不正常的进程,首先上去就是重启,你别说,重启能解决90%的问题。
这个我同意,这是能最大化节省运维时间和成本的方法,与其消耗100分钟的时间去查原因,还不如直接花1秒时间重启服务来得快。
supervisor
自己写
https://gist.github.com/binux/1587684
supervisor +1
直接跑个while true ? 也是个好思路。。。。
while true +1
写过一个服务,一直跑下去会出现奇葩问题,所以.....自带主动停止功能 ^-^
daemontools拯救世界(不是那个虚拟光驱)
骚年学学systemd吧
居然还有这么多人不知道supervisor
pip install supervisor
为什么要用while true,5分钟之类的跑一次不行么,要是代码逻辑有问题,瞬间就把机器弄死了。
就我一个人用 upstart 么。。
就我一个人用 god 么。。
you are not alone :P
supervisor +1
谢谢您们的介绍!
monit
用supervisord也要注意server重启后supervisor自己会自动运行,不然负责监控的死了
http://supervisord.org/running.html#running-supervisord-automatically-on-startup
python-supervisor不能保证它自己不死啊
直接用forever,还可以根据不同的日志输出到不同文件里方便排查问题