개요
개발환경으로 여러대의 온프레미스를 proxmox 서버로 하이퍼바이저를 구성하여 다양한 개발환경으로 사용중에 있다.
오늘 비상전력 작업이 있어, 시스템 재기동을 함께 진행하였는데 proxmox가 재기동 후 몇몇 VM들이 실행되지 않는 현상이 발생하였다.
이에 proxmox VM 실행 오류 2가지의 해결 방법에 대해 알아보겠다.
1. VM is locked (snapshot)
현재 100 VMID의 VM이 잠금 표시가 나타나며 실행되지 않는 상황이다.
정확하게는 "VM is locked (snapshot)” 라고 에러가 나타나며 VM이 실행되지 않는데, 이는 표기 그대로 VM이 잠금 상태가 되었기 때문이다.
주로 스냅샷 작업 도중 시스템이 중단되거나 재시작된 경우 발생할 수 있다고 한다.
proxmox 서버에 cli로 접근하여 다음 명령을 입력해서 상태를 확인한다.
잠금 상태 확인
qm listn ‘VMID’
명령어 결과를 보면 VMID 100번이 실행되지 않는것을 확인할 수 있다.
다음 명령으로 잠금을 해제하고 vm start를 진행하겠다.
잠금 해제
qm unlock ‘VMID'
VM 실행 (콘솔에서 GUI로 실행하는 것과 동일하다.)
qm start 'VMID'
정상 동작이 확인된다.
2. cluster not ready - no quorum? (500)
오류가 발생한 환경을 잠시 설명하자면,
해당 proxmox서버의 경우는 2개의 proxmox서버를 합쳐 cluster로 동작하고 있었는데, 이후 노드 1개가 제외되어 1개의 노드(proxmox 서버)만 동작중에 있다.
이때 vm 실행 시 no quorum 가 발생하여 실행되지 않는데, 이는 proxmox cluster 중에서 노드 중 하나 이상이 down되어 있거나 네트워크 연결이 끊겼을 때 발생한다.
! proxmox는 홀수 개의 노드로 구성하는것이 좋다.
예를 들어 3개 노드 cluster에서라면, 2개 이상의 노드가 살아 있어야 쿼럼을 유지할 수 있다.(마치 쿠버네…..)
즉, 쿼럼을 확보하러면 노드 수를 늘리거나 down된 노드를 다시 켜는 방법이 일반적이다.
나의 경우에는 노드 1개 단일로 사용중이기 때문에 vm 실행 시 쿼럼 인증(요구) 설정을 해제하여 동작시켰다.
다음 명령으로 status를 확인한다.
클러스터 상태 및 쿼럼 여부 확인
pvecm status
1, 2는 하이퍼바이저 1, 2를 뜻한다.
- Expected votes, Total votes를 확인하면 cluster가 쿼럼을 얼마나 유지하는 지 확인할 수 있다.
(위의 경우 1)
다음 명령을 입력하여 쿼럼 확인 절차를 비활성화한다.
pvecm expected 1
위와 같은 조치를 통해 오류를 해결하고 정상적으로 동작할 수 있게 되었다.
'DevOps > virtualization_가상화' 카테고리의 다른 글
[가상화] VMware vSphere 개요 (0) | 2023.10.11 |
---|---|
[가상화] x86 가상화 아키텍쳐 구현 방식 (0) | 2023.09.20 |
[가상화] 전가상화와 반가상화 (0) | 2023.09.18 |
[가상화] 하이퍼바이저란 무엇인가? (0) | 2023.09.11 |
[가상화] x86 가상화를 이해하기 위한 기초 지식 (0) | 2023.09.09 |