#排查

跟我学-域名解析故障排查技巧

天苍苍,野茫茫,网站一瘫,唯有泪两行!!客户跳,老板叫,解析故障,心惊又肉跳!!对企业网站来说,很怕出现网站打不开的情况,一旦发生,准会发现公司技术部呈现一片哀嚎景象。为了让运维的难兄难弟们做个精致的小白领,小编特别为你们总结了一套《域名解析故障排查技巧实操全网最全手册》,并分为“初阶版”“进阶版”,跟我学完保您在排查...

Flink on YARN(下):常见问题与排查思路

Flink支持Standalone独立部署和YARN、Kubernetes、Mesos等集群部署模式,其中YARN集群部署模式在国内的应用越来越广泛。Flink社区将推出FlinkonYARN应用解读系列文章,分为上、下两篇。上篇分享了基于FLIP-6重构后的资源调度模型介绍FlinkonYARN应用启动全流程,本文将...

Flink Checkpoint 问题排查实用指南

在Flink中,状态可靠性保证由Checkpoint支持,当作业出现failover的情况下,Flink会从最近成功的Checkpoint恢复。在实际情况中,我们可能会遇到Checkpoint失败,或者Checkpoint慢的情况,本文会统一聊一聊Flink中Checkpoint异常的情况(包括失败和慢),以及可能的原...

实战经验 | Cassandra Java堆外内存排查经历全记录

最近准备上线cassandra这个产品,同事在做一些小规格ECS(8G)的压测。压测时候比较容易触发OOMKiller,把cassandra进程干掉。问题是8G这个规格我配置的heap(Xmx)并不高(约6.5g)已经留出了足够的空间给系统。只有可能是Java堆外内存使用超出预期,导致RES增加,才可能触发OOM。0....

超干货!Cassandra Java堆外内存排查经历全记录

最近准备上线cassandra这个产品,同事在做一些小规格ECS(8G)的压测。压测时候比较容易触发OOMKiller,把cassandra进程干掉。问题是8G这个规格我配置的heap(Xmx)并不高(约6.5g)已经留出了足够的空间给系统。只有可能是Java堆外内存使用超出预期,导致RES增加,才可能触发OOM。0....

内存泄露排查记录

一、问题定位手段一:通过jstat -gcutil 快速定位GC问题(首先)命令格式: jstat -gcutil <pid> <period> 命令样例:jstat -gcutil 11900 ...
代码星球 代码星球·2021-02-16

windows 排查javaWeb程序占用CPU过高问题(可追踪到问题代码所在行)

 1.情景展示  java虚拟机占用这么高的CPU,肯定不正常!  2.原因分析  第一个是tomcat,正在运行java项目;  第二个是eclipse,因为eclipse的运行依赖于java。  现在的问题是:tomcat的CPU使用率达到了90%,单独运行tomcat是不可能占用这么多CPU的,所以,问...

Mysql远程连接数据库报错排查:pymysql.err.OperationalError: (2003, "Can't connect to MySQL server on '**.**.**.**' (timed out)")

 排查流程:1.使用ping命令,看网络是否联通。2.使用netstat-nltp|grep3306查看mysql服务是否正常开启。3.再次检测一次Mysql的连接配置是否正确(用户名和密码是否正确,格式端口是否是整型,其他格式是否正确)。4.以上都检测好了,但是连接过程中还是出现超时问题,看看系统的防火墙是...

Linux排查僵尸进程

 排查过程僵尸进程是因为父进程没有回收子进程的资源而出现的,那么,要解决掉它们,就要找到它们的根儿,也就是找出父进程,然后在父进程里解决。top:查看发现僵尸进程  查找僵尸进程:ps-aux|grepZ  找到僵尸进程的父进程:ps-ef|grep子进程pid&nbs...
代码星球 代码星球·2021-02-14

利用阿里开源工具进行排查线上CPU居高问题 转

出处: 利用阿里开源工具进行排查线上CPU居高问题   在我们开发过程中,无法避免的会出现所谓的垃圾代码,导致服务器的CPU一直处于100%。但我们应用已经上线,导致服务器CPU居高,但又不知道哪边出现的问题,我们应该怎么去找出哪边的代码出现问题呢?今天老顾就介绍几种工具去快速定位。我们先来编写一下...

Java内存泄漏的排查总结

Java内存泄漏的排查总结https://blog.csdn.net/fishinhouse/article/details/80781673(缺图见下一条)内存泄漏的解决方案(转载)https://blog.csdn.net/dyhdengyahui/article/details/80770654...

cpu load过高问题排查

top命令中loadaverage显示的是最近1分钟、5分钟和15分钟的系统平均负载。系统平均负载被定义为在特定时间间隔内运行队列中(在CPU上运行或者等待运行多少进程)的平均进程数。如果一个进程满足以下条件则其就会位于运行队列中:它没有在等待I/O操作的结果它没有主动进入等待状态(也就是没有调用’wait’)没有被停...

java在线问题排查利器之Btrace&Greys

java在线问题排查利器之Btrace&Greys...

mysql开启登录日志和sql日志 排查错误

 首先看是否开启了日志showglobalvariableslike'%general%';  setglobalgeneral_log=on;//打开setglobalgeneral_log=off;//关闭    参考:http://blog.csdn.net/fdipzone/art...

使用druid连接池的超时回收机制排查连接泄露问题

在工程中使用了druid连接池,运行一段时间后系统出现异常:Causedby:org.springframework.jdbc.CannotGetJdbcConnectionException:CouldnotgetJDBCConnection;nestedexceptioniscom.alibaba.druid.po...
首页上一页12345下一页尾页