运维视界 Linux服务器出现离奇的一幕我惊呆了 最近遇到一个服务器(Ubuntu Server 18.04 LTS 64位)负载几千的值,但是CPU使用率并不是很高。如下图:一开始以为是平台显示问题,但是远程到服务器以后,发现服务器就是这么高的负载... 08月28日 1,822 ℃ 发表评论 阅读全文
运维问题 解决Jenkins性能缓慢的问题 没有什么比缓慢的持续集成系统更令人沮丧的了。它减慢了反馈循环并阻止代码快速投入生产。虽然像使用性能更好的服务器可以为您争取时间,但您最终必须投资于维持持续集成工作流程的成本。Jenkins 是目前最流... 01月22日 2,415 ℃ 发表评论 阅读全文
运维视界 Prometheus发布Agent模式来处理新的用例范围 由 CNCF 托管的领先开源监控解决方案 Prometheus 今天宣布了一种新的运行模式:Prometheus Agent。这种新的工作方式支持新的工作流,如低资源环境、边缘网络和物联网。它使用的资... 11月18日 1,888 ℃ 发表评论 阅读全文
生活随笔 再一次被阿里云套路到没睡好觉 阿里产品的监控和服务器一些基础指标一直使用他们的云监控,最近在优化监控指标的时候,无意间发现站点监控任务全部被停了,到期时间是7月底。选择批量启用但是无效,经过研究才发现是改版了,不知道是6月还是7月... 08月17日 1,754 ℃ 发表评论 阅读全文
运维问题 记录一次MySQL CPU持续100%解决历程 环境:服务器:腾讯云2H4G数据库:腾讯云TDSQL-C MySQL 1H1G前段时间对某个网站进行了改版,然后某天发现网站内页访问有时候会等待很久,阿汤博客就分享一下解决这一问题的历程。首先登录监控... 03月01日 4,706 ℃ 发表评论 阅读全文
运维视界 二十多款开源的服务器监控软件,你用过几款? 1、ConkyConky能在多个的平台上运行,像Windows,Linux,Mac OS,大多数BSD都可以。它有简单的文本、总线进度条,图形窗口不同字体和颜色来显示信息,用户界面简单,300多个内置... 10月23日 10,216 ℃ 发表评论 阅读全文
运维文档 Kubernetes集群Prometheus Operator钉钉报警配置 最近把Prometheus监控迁移到了kubernetes集群中,部署文档参考《Kubernetes环境使用Prometheus Operator自发现监控SpringBoot》,各类监控项的数据采集... 09月29日 5,735 ℃ 发表评论 阅读全文
运维文档 Kubernetes环境使用Prometheus Operator自发现监控SpringBoot SpringBoot迁移kubernetes的工作已经完成得差不多,已经能基于原来的SpringBoot架构实现无感迁移,各项测试访问,服务间调用都正常,这几天准备迁移Prometheus监控到kub... 09月21日 6,627 ℃ 发表评论 阅读全文
运维文档 SpringBoot1.5.X接入prometheus监控基于Eureka服务自发现 Prometheus监控对微服务的整合还是比较友好的,尤其是在有大量微服务的时候,不可能每新增一个服务,就去手动修改Prometheus的配置,增加服务监控配置,这个时候就需要使用服务自发现。今天阿汤... 09月14日 5,264 ℃ 发表评论 阅读全文
运维问题 升级Prometheus报错Error refreshing servic Unexpected response code: 404解决办法 最近优化grafana视图,发现有些新grafana视图,在老版6.x兼容不是很好,想着把监控全家桶升级下:grafana v6.3 升级到 grafana v7.1.5。prometheus v2.... 09月01日 4,136 ℃ 发表评论 阅读全文
运维问题 SpringBoot1.5.x 使用prometheus监控Tomcat线程显示异常解决办法 项目之前一直使用的SpringBoot 1.5.10 (SpringCloud Dalston.RELEASE),prometheus监控的依赖micrometer-registry-promethe... 04月24日 6,041 ℃ 发表评论 阅读全文
运维问题 Prometheus报错Error refreshing service Unexpected response code: 503解决办法 今天终于把这个搁置了几个月没有解决的问题解决了,真的是找遍了Google、百度文档,没有找到一个解决方案,这里分享一下解决办法。公司项目使用的是spring cloud,注册中心使用的Eureka,监... 11月20日 9,203 ℃ 1 阅读全文
运维文档 open-falcon邮件告警配置 1、直接下载二进制包#wget http://cactifans.hi-www.com/open-falcon/mail-provider.tar.gz2、创建工作目录,最好创建在open-falco... 01月30日 6,510 ℃ 发表评论 阅读全文
运维文档 open-falcon微信告警配置 1、安装chat,最好创建在open-falcon目录下面,方便管理。#cd /usr/local/open-falcon/#git clone https://www.github.com/yanj... 01月30日 6,222 ℃ 发表评论 阅读全文
运维文档 open-falcon监控nginx详细配置 由于官方给的插件需要lua模块支持,所以需要重新编译nginx,否则会报错nginx: unknown directive "lua_package_path" 1、下载相关库文件... 01月26日 7,436 ℃ 1 阅读全文
运维文档 open-falcon监控java详细配置 1、开启jmxa、单实例#vim $CATALINA_HOME/bin/catalina.sh #填写如下代码CATALINA_OPTS="-Dcom.sun.manageme... 01月26日 6,557 ℃ 发表评论 阅读全文
运维文档 open-falcon监控mysql详细配置 1、下载源码插件编译#export GOPATH=/var/falcon#mkdir /var/falcon/#go get -u github.com/open-falcon/mymon#cd $G... 01月26日 6,662 ℃ 发表评论 阅读全文
运维文档 小米监控open-falcon支持redis带密码访问 open-falcon默认不支持redis带密码的访问,如果需要支持密码访问,需要修改源码,重新编译。如果不想修改源码重新编译,本身服务器的redis实例其他应用正在使用,去除密码认证比较麻烦,可以在... 01月25日 5,366 ℃ 发表评论 阅读全文
运维文档 小米监控open-falcon-0.2安装部署详细配置 一、环境准备1、配置阿里云yum源#wget -O /etc/yum.repos.d/CentOS-Base.repo http://mirrors.aliyun.com... 01月25日 5,282 ℃ 发表评论 阅读全文
运维文档 MySQL运行状态show status详解 要查看MySQL运行状态,要优化MySQL运行效率都少不了要运行show status查看各种状态,下面是参考官方文档及网上资料整理出来的中文详细解释,不管你是初学mysql还是你是mysql专业级的... 01月15日 3,453 ℃ 1 阅读全文