我们云平台日常的虚机可能会出现虚机内部hang住或者死机的情况,无法登录虚机内部,对于调查定位问题难度很大,除了查看qemu和libvirt的日志,其他的手段有限,下面说一下个方法可以在宿主机dump虚机内部的vmcore文件,然后通过crash工具debug虚机内部问题,下面具体说说步骤。
- 查看虚机
zjp@zjp ~> virsh list
Id Name State
---------------------------
4 kata-test running
5 generic-2 running
- 选定需要dump的虚拟机,如kata-test
zjp@zjp ~> sudo virsh dump --memory-only kata-test /tmp/vmcore.img
zjp@zjp ~> ll -al /tmp/vmcore.img
-rw------- 1 root root 2.2G 4月 23 15:00 /tmp/vmcore.img
可以看到dump出来了虚拟机内部的内存快照,我们就可以利用该文件,debug虚拟机内部具体什么原因出现hang住等问题。