centos7服务器无缘无故卡死原因排查持续维护

玩技站长 运维笔记42,4461字数 1665阅读5分33秒阅读模式

状态描述:

服务器开了一段时间后自动死机,屏幕有显示但是键盘和鼠标都没有响应。

问题排查:(此次导致的问题)

服务器端安装了进程守护应用,开启之后过一会就会出现这个问题,重启电脑后只要进程守护程序启动就会出现这个问题。所以开始查看守护里面的进程日志。文章源自玩技e族-https://www.playezu.com/300554.html

centos7服务器无缘无故卡死原因排查插图文章源自玩技e族-https://www.playezu.com/300554.html

1、原因是因为服务器中端口冲突,进程守护程序不断和系统中的一个服务5500的端口抢占导致服务器死机。文章源自玩技e族-https://www.playezu.com/300554.html

2、之前查看了网站的cpu和内存都没有过高的问题也会死机,所以查看了/var/log/message并没有什么用。查看内存进程占用smem -k也没有发现什么问题。文章源自玩技e族-https://www.playezu.com/300554.html

处理方式:

将服务器中的端口更改为其他的端口即可解决这个问题。文章源自玩技e族-https://www.playezu.com/300554.html

经验总结:

这种问题只看服务器记录是看不出来什么问题的,如果之前服务器是正常运行的,那么还是要将近期安装的软件或者程序重新关闭挨个测试。文章源自玩技e族-https://www.playezu.com/300554.html

常见问题:

硬件故障服务器硬件可能出现问题,如硬盘故障、内存错误、电源问题等,这些问题可能导致服务器无响应或卡死。可以通过检查硬件日志、进行硬件测试或联系供应商来排除这些问题。文章源自玩技e族-https://www.playezu.com/300554.html

资源耗尽服务器资源(如内存、CPU、磁盘空间)耗尽可能导致系统无法响应。可以通过查看系统日志、监控服务器资源使用情况以及优化应用程序的资源使用来解决此问题。文章源自玩技e族-https://www.playezu.com/300554.html

软件冲突或错误操作系统或应用程序中的软件冲突、错误或漏洞可能导致服务器卡死。确保操作系统和应用程序处于最新版本,并查看系统日志以了解任何异常或错误信息。文章源自玩技e族-https://www.playezu.com/300554.html

配置问题不正确的配置可能导致服务器无法正常运行。检查系统配置文件、网络配置、服务配置等,确保它们正确并符合服务器需求。文章源自玩技e族-https://www.playezu.com/300554.html

安全问题恶意活动、网络攻击或未经授权的访问可能导致服务器卡死。确保服务器安全性措施完善,如使用防火墙、更新安全补丁、配置访问控制等。

如果你无法确定具体的原因,可以尝试以下步骤来排除问题:

检查服务器日志查看系统日志、应用程序日志以及其他相关日志文件,寻找任何异常或错误信息。

监控服务器资源使用系统监控工具(如top、sar、vmstat等)来监视服务器的资源使用情况,查看是否有资源耗尽的情况。

进行硬件测试运行硬件诊断工具,如memtest86+来测试内存,smartctl来检查硬盘健康状况等。

检查网络连接检查网络配置、网络连接是否正常,并查看是否有异常的网络活动。

更新和修复软件确保操作系统和应用程序处于最新版本,并安装任何可用的安全补丁或更新。

审查系统配置检查系统配置文件、服务配置以及应用程序配置,确保它们正确且适合服务器环境。

命令介绍:

查看带宽IO层方法 1)查看外网访问IO流量带宽及占用命令iftop。(适用场景,网络堵塞造成的cpu内存100%) 安装命...
运维笔记
1118
查看系统日志:
dmesg:显示内核环缓冲区的内容,可查看系统启动信息和内核相关的错误。

/var/log/messages:包含系统日志的主要文件,记录了系统级别的事件和错误。
监控服务器资源:
top:显示系统中运行的进程和资源使用情况,按需按键 Shift + M 可以按照内存使用量排序。

sar:系统性能监控工具,可用于查看系统资源的历史使用情况。

vmstat:报告虚拟内存、进程、系统I/O等信息。
进行硬件测试:
memtest86+:用于测试系统内存的工具,需要从官方网站下载并创建可启动的内存测试盘。

smartctl:用于检查硬盘的健康状况和执行自检的工具,可通过 smartctl -a /dev/sdX 命令来查看硬盘信息。
检查网络连接:
ifconfig 或 ip addr:查看网络接口的配置和状态信息。

ping:用于测试与其他主机的连通性,例如 ping google.com。

netstat:显示网络连接、路由表、接口统计等信息,如 netstat -tulpn 查看当前的网络连接和开放的端口。
更新和修复软件:
yum update:用于更新 CentOS 7 上的软件包和系统组件。

yum upgrade:类似于 yum update,但可以处理软件包的升级和替换。
审查系统配置:
/etc 目录:包含大多数系统配置文件,如 /etc/sysctl.conf(内核参数配置)、/etc/hosts(主机名和IP映射配置)等。

/etc/network 目录:包含网络配置文件,如 /etc/network/interfaces(网络接口配置)等。

/etc/services:包含已知端口和服务的列表,可用于检查端口与服务的映射关系。

进阶命令:

htop:

htop 是一个交互式的系统监视工具,可以替代传统的 top 命令。它提供了更友好的界面和更多功能。

安装 htop:使用以下命令安装 htop:

yum install htop

运行 htop:输入 htop 命令即可打开 htop 界面。

在 htop 中,你可以查看并管理系统中运行的进程,了解 CPU 和内存使用情况,以及排序进程等。

iftop:

iftop 是一个用于监控网络流量的工具,可以实时显示网络接口的流量信息。

安装 iftop:使用以下命令安装 iftop:

yum install iftop

运行 iftop:输入 iftop 命令即可打开 iftop 界面,默认情况下会显示所有网络接口的流量信息。

iftop 提供了很多选项和过滤器,例如限制显示特定网络接口、设置显示时间间隔等。你可以通过查看 iftop 的帮助文档或执行 iftop -h 命令来了解更多用法。
centos7服务器无缘无故卡死原因排查插图1
Linux运维实战:CentOS 7.6操作系统从入门到精通
本书通过大量实例,循序渐进地讲解了在Linux 发行版CentOS7.6系统中的基础操作、用户管理、权限管理、磁盘管理、shell编程等技术和各种实战经验与技巧。
46.11
 最后更新:2023-6-30
评论  4  访客  2  作者  2
    • ae688.net
      ae688.net 0

      My brother suggested I might like this web site. He was entirely right.
      This post actually made my day. You cann’t
      imagine just how much time I had spent for this information!
      Thanks!

      • dagathomo
        dagathomo 0

        This is really interesting, You’re a very skilled blogger.
        I have joined your feed and look forward to seeking more of your great post.
        Also, I’ve shared your website in my social
        networks!

      匿名

      发表评论

      匿名网友
      确定

      拖动滑块以完成验证