图片
本书介绍

《深度学习调优指南中文版》的核心内容整理,按章节提炼重点,方便快速掌握:


📌 第1章:开始新项目的指南

  • 模型架构:从成熟、常用架构开始(如ResNet、Transformer),优先复现相关论文。

  • 优化器:默认选Adam或SGD+momentum,复杂优化器(如NAdam)后期再考虑。

  • Batch Size

    • 选硬件支持的最大值以加速训练,但需重新调优所有超参数(尤其学习率)。

    • 不直接用于提升验证集性能。

    • 注意Batch Norm需固定虚拟Batch Size(如Ghost Batch Norm)。

  • 初始配置:从简单、低资源消耗的配置起步,逐步迭代。


📌 第2章:科学调优方法

  • 增量调优:从简单配置开始,逐步添加功能,避免一次性复杂化。

  • 实验设计

    • 目标超参数:需研究其影响的参数(如层数)。

    • 冗余超参数:需调优以公平比较(如学习率)。

    • 固定超参数:保持不变的参数(如激活函数)。

  • 实验分析

    • 检查搜索空间边界(最佳点是否在边界?)。

    • 采样密度是否足够(试验次数是否覆盖关键区域?)。

    • 训练曲线:识别过拟合、训练不足、步间方差等问题。

  • 结果验证:用Isolation图比较目标超参数的最佳值,排除冗余参数干扰。


📌 第3章:训练步数决策

  • 不受计算限制:训练至验证性能饱和,通过回溯检查点选择最佳步数。

  • 受计算限制

    • 两轮调优

    • 逐步增加训练时长,平衡探索与资源消耗。

  1. 短运行(如10%时长)筛选超参数(架构、优化器)。

  2. 长运行验证,调整学习率衰减(如延长预热步数)。


📌 第4章:训练管道优化

  • 输入管道

    • 用性能分析工具(如TensorFlow Profiler)诊断瓶颈。

    • 优化数据存储(本地化)、减少在线预处理、使用预读取(prefetch)。

  • 评估设置

    • 评估用更大Batch Size,固定步长间隔(非时间间隔)。

    • 抽样验证集需与完整集性能一致,避免偏差。

  • 检查点与跟踪

    • 保存多个最佳检查点,回溯选择。

    • 记录实验配置、性能指标(推荐电子表格或工具如Weights & Biases)。


📌 第5章:常见问题解答

  • 学习率衰减

    • 默认用线性或余弦衰减,复杂方案多为人工调优结果,谨慎复现。

  • Adam超参数

    • 试验次数<10:调学习率。

    • 10-25次:加调β1。

    • 25次:再加调ε和β2。

  • Quasi-Random-Search

    • 优于贝叶斯优化的场景:高并行、需可解释性、非自适应需求。

    • 实现:低差异序列(如Halton序列)。

  • 调试优化失败

    • 不稳定诊断:学习率扫描→梯度范数监控→早期间歇评估。

    • 修复方法

  1. 学习率预热(从0逐步提升)。

  2. 梯度截断(阈值设为梯度范数90%分位数)。

  3. 检查架构问题(如归一化位置、残差初始化)。

  • 术语澄清:深度学习中的“超参数”实为“元参数”(非贝叶斯先验)。


  • 🔍 关键原则总结

    1. 渐进式优化:从简单到复杂,避免过度调优。

    2. 科学实验:明确目标、隔离变量、验证假设。

    3. 资源意识:在计算受限时,优先快速迭代。

    4. 工具化:自动化实验跟踪、可视化(如TensorBoard)。

    5. 可复现性:固定随机种子、记录环境配置。


    📂 适用场景

    • 监督/自监督学习,尤其是CV、NLP领域。

    • 中小团队或个人研究者,资源有限时需高效调参。

    本书免费下载地址


        关注微信公众号“人工智能产业链union”回复关键字“AI加油站35”获取下载地址。

    往期推荐:
    【AI加油站】第一部:《大型语言模型应用检索增强生成:改变搜索、推荐和 AI 助手》附下载
    【AI加油站】第二部:《程序员的自我修炼手册》(附下载)
    【AI加油站】第三部:《大规模语言模型:从理论到实践》(附下载)
    【AI加油站】第四部:《使用生成式人工智能和Python开始数据分析》(附下载)
    【AI加油站】第五部:《使用生成式人工智能和Python开始数据分析》(附下载)
    【AI加油站】第六部:《时间序列:建模、计算与推断》(附下载)
    【AI加油站】第七部:《因果关系的逻辑理论的好书-A Logical Theory of Causality》(附下载)

    【AI加油站】第八部:《模式识别(第四版)-模式识别与机器学习》(附下载)

    【AI加油站】第九部:《Python深度学习(中文版)》(附下载)
    【AI加油站】第十部:《机器学习方法》(附下载)
    【AI加油站】第十一部:《深度学习》(附下载)
    【AI加油站】第十二部:《从零开始的机器学习》(附下载)
    【AI加油站】第十三部:《Transformer入门到精通》(附下载)
    【AI加油站】第十四部:《LLM 应用开发实践笔记》(附下载)
    【AI加油站】第十五部:《大模型基础 完整版》(附下载)
    【AI加油站】第十六部:《从头训练大模型最佳实践》(附下载)
    【AI加油站】第十七部:《大语言模型》(附下载)
    【AI加油站】第十八部:《深度强化学习》(附下载)
    【AI加油站】第十九部:清华大学《大模型技术》(附下载)
    【AI加油站】第二十部:Prompt入门神书-《Prompt 学习指南》(附下载)
    【AI加油站】第二十一部:吴恩达&open AI联合推出《大模型通关指南》(附下载)
    【AI加油站】第二十二部:《李宏毅深度学习教程》值得反复阅读的神书!(附下载)
    【AI加油站】第二十三部:Prompt经典中文教程-《提示工程指南》(附下载)
    【AI加油站】第二十四部:爆火下载28万次!MIT最新神书《理解深度学习》(附下载)
    【AI加油站】第二十五部:LLM4大名著,OpenAI专家强推《深度解析:大语言模型理论与实践》(附下载)
    【AI加油站】第二十六部:NLP大牛Thomas Wolf等新书《Transformer自然语言处理》(附下载)
    【AI加油站】第二十七部:哈工大博士耗时一年整理《PyTorch常用函数手册》,轻松掌握PyTorch的各种操作(附PDF下载)
    【AI加油站】第二十八部:大模型炼丹大师必备《深度学习调优指南中文版-系统性优化模型》(附下载)
    【AI加油站】第二十九部:炸裂发布!《大语言模型:导论》重磅发布!(附下载)
    【AI加油站】第三十部:最值得读的LLM书!下载量10w+!《基于Transformer和扩散模型的生成式AI》(附下载)
    【AI加油站】第三十一部:RL稀缺宝典!《强化学习的艺术》(附下载)
    【AI加油站】第三十二部:一本醍醐灌顶的教科书!《大语言模型提示工程:构建LLM应用的艺术与科学》(附下载)