围绕 native engine 的 ComfyUI 节点包

ComfyUI-QuantFunc 是一个 ComfyUI 插件,背后接的是 QuantFunc 的 C++ 和 CUDA 扩散推理引擎。README 说它能用量化方式加速 text-to-image 和 image editing 模型,速度提升 2x 到 11x,并支持 SVDQ 离线量化和 Lighting 运行时量化。

关键点是:它不是纯 Python 节点包。首次启动时,插件会从 ModelScope 自动下载匹配的 native library,Linux 是 libquantfunc.so,Windows 是 quantfunc.dll。这让安装简单,但信任边界也包括二进制引擎和 updater。

安装路径

推荐方式是把插件 clone 到 ComfyUI 的 custom nodes 目录:

cd ComfyUI/custom_nodes
git clone https://github.com/QuantFunc/ComfyUI-QuantFunc.git

首次启动时插件会下载匹配的 engine binary。如果自动下载被跳过,README 说可以手工把 libquantfunc.so 放到 bin/linux/,或把 quantfunc.dll 放到 bin/windows/

硬件和软件要求

README 列出的最低要求包括 NVIDIA RTX 20 系或更新显卡、8 GB VRAM、560 或更新驱动、CUDA Runtime 13.0 或更新、cuDNN 9.x、Linux glibc 2.31 或 Windows 10/11,以及 ComfyUI embedded Python 里的 Python 3.9 或更新版本。Linux 部分还写了 CUDA 12 和 CUDA 13 runtime package。

这个目标很窄。如果你在 macOS、AMD GPU、旧 NVIDIA 卡,或不能加载下载二进制文件的受控环境里,它大概率不合适。

当前 README 的重点

README 标注当前插件 0.0.02、engine 0.0.07。新增点包括 v2 loaders、适配 diffusers、BFL、Flux、nunchaku SVDQ、bundled checkpoint 和 HF 格式的 universal adapters、inpainting、QwenImage、QwenImage-Edit、Flux.2 Klein、worker-process cleanup、zip-slip guard 和 IPC bound checks。

性能声明很吸引人,但要在自己的模型、GPU、驱动和 workflow 上验证。量化扩散加速对硬件和模型格式很敏感。

相关

站内其他 AI 媒体工具可以看 harry0703/MoneyPrinterTurboOpenCut-app/OpenCutheygen-com/hyperframes

FAQ

ComfyUI-QuantFunc 是纯 Python 吗? 不是。它是 ComfyUI 插件,会加载 QuantFunc native engine binary。

支持 Windows 吗? README 列出 Windows 10/11,并有 quantfunc.dll 路径。

需要什么 GPU? README 写的是 NVIDIA RTX 20 系或更新,至少 8 GB VRAM。

安装前最该看什么? 看 CUDA、驱动、cuDNN、GPU 代际,以及你是否接受自动下载 native binary。