代码批注
All 代码批注 articles.
-
part1: Mixtral7x8B generate
2026-03-24
学习Mixtral7x8B的模型架构文件, part1, 这一部分主要从高度封装的角度, 梳理Mixtral是怎么generate的
-
sparsegpt核心代码解析
2026-03-20
sparsegpt的核心方法和类函数, 深度解析其中的add_batch和fastprune方法