这里推荐一个本地微调大模型的框架。
ZO2,一个仅用18G显存就能全参微调175B大模型的框架(当然也支持微调小一些的模型)。
更新:现在ZO2支持Qwen3啦,全参微调32B的版本只需要6GB显存。
Code: ***s://github***/liangyuwang/zo2 Paper: ***s://arxiv.org/abs/2503.12668。

特朗普称美国完成对伊朗三处核设施的打击,具体情况如何?伊朗会如何反击?…

如何评价MiniMax开源首个视觉RL统一框架V-Triune,实现推理感知一肩挑,其技术上有何优势?…

雷军为什么不愿意用性价比打法进军NAS?…

想问一下莆田鞋真的靠谱吗?…
备案号: 网站地图