大模型 | 鱼肉的Blog

利用Kaggle免费预训练minimind轻量化模型

公开的训练代码在这里（可利用双 T4 约 90% 算力，模型收束很快）： https://www.kaggle.com/code/fishbyshark/minimind 项目的开始我个人本地只有一张 AMD 显卡，而 GitHub 上的高星大模型开源项目（如这次复现的 MiniMind）几乎全系绑定 CUDA 生态。我想到了白嫖 Kaggle 免费的双 T4 GPU 算力。 ...

部署并学习GPT2模型

项目概述这是我的第一个大语言模型部署实践项目。通过本项目，我成功在本地环境中部署并运行了基于 GPT 架构的 DistilGPT2 模型，实现了文本生成功能。参考教程： AI-Guide-and-Demos 开源教程 ...