문제: 커널 경보가 다운되지 않았지만 서버도 다운되지 않았습니다. 소프트 락업 버그의 원인 분석, 소프트 락업 이름 설명: 소프트 락업은 이 버그가 시스템을 완전히 멈추지 않지만, 여러 프로세스(또는 커널 스레드)가 특정 상태(보통 커널 영역)에 고정되어 있으며, 많은 경우 커널 락 사용 때문입니다.
syslogd@centos7-itsvse에서 11월 22일 13:52:22에 보낸 메시지 ...
kernel:NMI watchdog: BUG: soft lockup - CPU#3 stuck for 22s! [java:6062]
워치독 요약하자면, 워치독은 시스템의 정상 작동을 보장하거나 데드 루프, 교착 상태에서 벗어나기 위한 메커니즘입니다.
워치독은 하드웨어 워치독과 소프트웨어 워치독으로 나뉩니다. 하드웨어 워치독은 타이머 회로를 사용하며, 타이밍 출력은 회로의 리셋 쪽에 연결되고, 프로그램은 일정 시간 범위 내에서 타이머를 비워(일반적으로 '피드 더 독'이라고 불림)하여 프로그램이 정상적으로 작동할 때 타이머가 넘치지 않아 리셋 신호를 생성할 수 없습니다. 프로그램이 실패하고 타이머 기간 내에 워치독이 리셋되지 않으면, 워치독 타이머가 오버플로우되어 리셋 신호를 생성하고 시스템을 재시작합니다. 소프트웨어 감시독의 원리는 동일하지만, 하드웨어 회로의 타이머는 프로세서 내부 타이머로 대체되어 하드웨어 회로 설계를 단순화할 수 있지만, 시스템 내부 타이머 자체의 고장을 감지할 수 없기 때문에 하드웨어 타이머만큼 신뢰성이 높지는 않습니다.
소프트웨어 워치독에는 두 가지 유형이 있는데, 클럭 인터럽트를 기반으로 소프트 락업을 감지하는 일반 소프트 독과 하드 락업을 감지하는 NMI 독(NMI 인터럽트를 기반으로 함)입니다.
참고 1: 클럭 인터럽트 우선순위는 NMI 인터럽트보다 낮습니다 참고 2: 락업은 CPU를 차지하는 커널 코드의 특정 구간을 의미합니다. 잠기는 시스템 전체가 반응하지 않게 만들 수 있습니다. 소프트 락업과 하드 락업은 CPU 쉴드가 중단될 때 발생한다는 점만 다릅니다. ———————————————— 저작권 고지: 이 글은 CSDN 블로거 "Hober_yao"의 원본 기사로, CC 4.0 BY-SA 저작권 계약에 따라 작성되었으며, 재인쇄를 위해 원본 출처 링크와 이 문장을 첨부해 주시기 바랍니다. 원본 링크:https://blog.csdn.net/yhb1047818384/article/details/70833825
면책 조항: Code Farmer Network에서 발행하는 모든 소프트웨어, 프로그래밍 자료 또는 기사는 학습 및 연구 목적으로만 사용됩니다; 위 내용은 상업적 또는 불법적인 목적으로 사용되지 않으며, 그렇지 않으면 모든 책임이 사용자에게 부담됩니다. 이 사이트의 정보는 인터넷에서 가져온 것이며, 저작권 분쟁은 이 사이트와는 관련이 없습니다. 위 내용은 다운로드 후 24시간 이내에 컴퓨터에서 완전히 삭제해야 합니다. 프로그램이 마음에 드신다면, 진짜 소프트웨어를 지원하고, 등록을 구매하며, 더 나은 진짜 서비스를 받아주세요. 침해가 있을 경우 이메일로 연락해 주시기 바랍니다.
Mail To:help@itsvse.com