利用Kaggle免费预训练minimind轻量化模型

公开的训练代码在这里(可利用双 T4 约 90% 算力,模型收束很快): https://www.kaggle.com/code/fishbyshark/minimind 项目的开始 我个人本地只有一张 AMD 显卡,而 GitHub 上的高星大模型开源项目(如这次复现的 MiniMind)几乎全系绑定 CUDA 生态。我想到了白嫖 Kaggle 免费的双 T4 GPU 算力。 ...

2026年2月23日 · 7 分钟 · 1275 字 · 鱼肉

部署并学习GPT2模型

项目概述 这是我的第一个大语言模型部署实践项目。通过本项目,我成功在本地环境中部署并运行了基于 GPT 架构的 DistilGPT2 模型,实现了文本生成功能。 参考教程: AI-Guide-and-Demos 开源教程 ...

2026年2月18日 · 3 分钟 · 593 字 · 鱼肉