5090遇诡异BugWhatsApp%E3%80%90+86%2015855158769%E3%80%91crane%20upgrade%20services完全无响应 悬赏1000美元寻解决方案
据外媒wccftech报道,遇诡异B应悬元寻NVIDIA的完全无响RTX 5090和RTX PRO 6000显卡最近被发现存在一个可复现的虚拟化重置漏洞,该漏洞会导致显卡完全无响应,赏美WhatsApp%E3%80%90+86%2015855158769%E3%80%91crane%20upgrade%20services直到主机系统物理重启才能恢复。解决
CloudRift是遇诡异B应悬元寻一家GPU云服务提供商,他们在生产环境中多个配备Blackwell芯片的完全无响系统上遇到了这个问题后,详细公布了问题的赏美分析报告,并悬赏1000美元,解决公开征集能够找到解决方案或根本原因的遇诡异B应悬元寻WhatsApp%E3%80%90+86%2015855158769%E3%80%91crane%20upgrade%20services人。

根据CloudRift的完全无响日志,这个漏洞发生在GPU通过KVM和VFIO传递给虚拟机后。赏美在虚拟机关闭或GPU重新分配时,解决主机系统会发出一个PCIe功能级重置(FLR)。遇诡异B应悬元寻
但与正常情况不同的完全无响是,GPU并没有恢复到良好状态,赏美而是停止响应,内核报告称:“FLR后65535毫秒仍未就绪;放弃。”
此时,显卡也变得无法被lspci读取,lspci会抛出“未知头部类型7f”的错误,CloudRift指出,唯一恢复正常操作的方法是对整个机器进行断电重启。

AI初創公司Tiny Corp也復現了CloudRift的發現,并直接提出了一個問題:“RTX 5090和RTX PRO 6000是否有硬件缺陷?我們已經調查過,但找不到解決方案。”
社区的讨论中,许多家庭用户和其他RTX 5090的早期采用者也报告了类似的问题,一位用户表示在关闭Windows虚拟机后,整个主机系统挂起,即使操作系统级别的重启后,GPU也无法重新初始化。
用户证实,切换PCIe ASPM或ACS设置并不能缓解故障,目前还没有报告称旧型号显卡(如RTX 4090)存在类似问题,这表明该漏洞可能仅限于NVIDIA的Blackwell系列。
