利用Kaggle免费预训练minimind轻量化模型
公开的训练代码在这里(可利用双 T4 约 90% 算力,模型收束很快): https://www.kaggle.com/code/fishbyshark/minimind 项目的开始 我个人本地只有一张 AMD 显卡,而 GitHub 上的高星大模型开源项目(如这次复现的 MiniMind)几乎全系绑定 CUDA 生态。我想到了白嫖 Kaggle 免费的双 T4 GPU 算力。 ...
公开的训练代码在这里(可利用双 T4 约 90% 算力,模型收束很快): https://www.kaggle.com/code/fishbyshark/minimind 项目的开始 我个人本地只有一张 AMD 显卡,而 GitHub 上的高星大模型开源项目(如这次复现的 MiniMind)几乎全系绑定 CUDA 生态。我想到了白嫖 Kaggle 免费的双 T4 GPU 算力。 ...
项目概述 这是我的第一个大语言模型部署实践项目。通过本项目,我成功在本地环境中部署并运行了基于 GPT 架构的 DistilGPT2 模型,实现了文本生成功能。 参考教程: AI-Guide-and-Demos 开源教程 ...