估算大模型需要多大的显存
估算大模型需要多大的显存
目前模型的参数绝大多数都是float32
类型, 占用4个字节。所以一个粗略的计算方法就是,每10亿个参数,占用4G显存(实际应该是10^9*4/1024/1024/1024=3.725G
,为了方便可以记为4G)
好在我们可以才用半精度的FP16/BF16
来加载,这样每个参数只占2个字节,所需显存就降为一半,只需要13.04G。游戏学习两不误。
半精度是个不错的选择,显存少了一半,模型效果因为精度的原因会略微降低,但一般在可接受的范围之内。
如果有个3070显卡,8G显存,还有的玩么?可以玩,采用int8的精度,显存再降一半,仅需6.5G,但是模型效果会更差一些。
所以说,如果模型想要训练,只看前3部分,需要的显存是至少推理的3-4倍。7B的全精度模型加载需要78G ~ 104G。