利用Kaggle免费预训练minimind轻量化模型

公开的训练代码在这里(可利用双 T4 约 90% 算力,模型收束很快): https://www.kaggle.com/code/fishbyshark/minimind 项目的开始 我个人本地只有一张 AMD 显卡,而 GitHub 上的高星大模型开源项目(如这次复现的 MiniMind)几乎全系绑定 CUDA 生态。我想到了白嫖 Kaggle 免费的双 T4 GPU 算力。 ...

2026年2月23日 · 7 分钟 · 1275 字 · 鱼肉