Logo南极Python

大模型炼丹术

分类 - 大模型炼丹术
2025
LLM指令微调:训练一个人工智能助手-大模型炼丹术(八)
2025-04-10
LLM指令微调:训练一个人工智能助手-大模型炼丹术(八)
LLM微调:训练一个垃圾邮件分类器-大模型炼丹术(七)
2025-03-23
LLM微调:训练一个垃圾邮件分类器-大模型炼丹术(七)
剖析LLM的解码策略-大模型炼丹术(六)
2025-03-12
剖析LLM的解码策略-大模型炼丹术(六)
LLM自回归预训练过程详解-大模型炼丹术(五)
2025-03-11
LLM自回归预训练过程详解-大模型炼丹术(五)
动手搭建GPT2架构-大模型炼丹术(四)
2025-03-07
动手搭建GPT2架构-大模型炼丹术(四)
从单头到多头,深度解析大模型的注意力机制-大模型炼丹术(三)
2025-03-04
从单头到多头,深度解析大模型的注意力机制-大模型炼丹术(三)
从离散的token IDs到具有语义信息的embedding-大模型炼丹术(二)
2025-02-24
从离散的token IDs到具有语义信息的embedding-大模型炼丹术(二)
从tokenizer说起,为LLM自回归预训练准备数据集-大模型炼丹术(一)
2025-02-20
从tokenizer说起,为LLM自回归预训练准备数据集-大模型炼丹术(一)
1
公告
本站内容的最终版本将发布在微信公众号[南极Python]
最新文章
轻量级大语言模型MiniMind源码解读(七):像搭积木一样构建一个大模型
轻量级大语言模型MiniMind源码解读(七):像搭积木一样构建一个大模型2026-01-24
轻量级大语言模型MiniMind源码解读(六):从稠密到稀疏,详解专家混合模型MoE
轻量级大语言模型MiniMind源码解读(六):从稠密到稀疏,详解专家混合模型MoE2025-11-26
轻量级大语言模型MiniMind源码解读(五):魔改的注意力机制,细数当代LLM的效率优化手段
轻量级大语言模型MiniMind源码解读(五):魔改的注意力机制,细数当代LLM的效率优化手段2025-10-26
轻量级大语言模型MiniMind源码解读(四):旋转位置编码原理与应用全解析
轻量级大语言模型MiniMind源码解读(四):旋转位置编码原理与应用全解析2025-10-19
2025年8月,Meta出品的DINO系列再出新作!视觉自监督的GPT时刻真的到来了!|DINOv3
2025年8月,Meta出品的DINO系列再出新作!视觉自监督的GPT时刻真的到来了!|DINOv32025-09-06
分类
  • MiniMind源码解读12
  • 呓语系列连载8
  • 大模型炼丹术8
  • 推荐系统18
  • 数据竞赛8
  • 机器学习算法7
  • 深度学习笔记100
  • 神奇的Python4
标签
推荐算法 Python 呓语 计算机基础 ML Spark RL GAN 数据竞赛 模型推理 Transformer DL 扩散模型 LLM 性能优化 自监督
归档
  • 一月 2026 1
  • 十一月 2025 1
  • 十月 2025 2
  • 九月 2025 2
  • 八月 2025 3
  • 七月 2025 1
  • 六月 2025 2
  • 五月 2025 5
网站信息
文章数目 :
189
最后更新时间 :
©2025 - 2026 By Fuhanshi