将GPT家族模型极限压缩,1700+亿参数稀疏性达50%性能不减,单GPU即可 - 知乎

将GPT家族模型极限压缩,1700+亿参数稀疏性达50%性能不减,单GPU即可 - 知乎