Cerebras 發布 GLM-4.7 的新版本,尺寸縮減約 40%

Cerebras 最近推出了其 GLM-4.7 的新版本,稱為 REAP,該版本實現了約 40% 的尺寸縮減。這一改進不僅減少了模型的存儲需求,還提高了運行效率。此外,新版本還引入了一種 4-bit AWQ 量化技術,該技術的大小約為 121GB,能夠在 8 台 RTX 3090 顯示卡上完整運行。這些更新使得 GLM-4.7 在性能和資源利用上都有了顯著提升,對於需要強大計算能力的用戶來說,無疑是一個重要的進步。

來源:https://x.com/TheAhmadOsman/status/2013469973650244071


Posted

in

by