复盘:利用AI 5小时入门MCM 2023 Wordle 建模
摘要 我决定做一次尝试:把 AI 当作严厉的「技术合伙人」。用苏格拉底式追问,从零学习了 MCM 2023 Problem C (Wordle 预测), 一、为什么选这道题? C题偏数据型,我觉得三天高强度的比赛是一个非常 fancy 的事情。但对于我来说,我确实非常缺乏所需的数学和机器学习知识,所以我先要求 AI 以提问的方式带我完整地体验一遍数学建模竞赛。 ...
摘要 我决定做一次尝试:把 AI 当作严厉的「技术合伙人」。用苏格拉底式追问,从零学习了 MCM 2023 Problem C (Wordle 预测), 一、为什么选这道题? C题偏数据型,我觉得三天高强度的比赛是一个非常 fancy 的事情。但对于我来说,我确实非常缺乏所需的数学和机器学习知识,所以我先要求 AI 以提问的方式带我完整地体验一遍数学建模竞赛。 ...
公开的训练代码在这里(可利用双 T4 约 90% 算力,模型收束很快): https://www.kaggle.com/code/fishbyshark/minimind 项目的开始 我个人本地只有一张 AMD 显卡,而 GitHub 上的高星大模型开源项目(如这次复现的 MiniMind)几乎全系绑定 CUDA 生态。我想到了白嫖 Kaggle 免费的双 T4 GPU 算力。 ...