Skip to content

链式法则与反向传播

它在 AI 中解决什么问题?

占位说明:解释复合函数模型中梯度如何从 loss 逐层传回参数。

核心概念

  • 待补:chain rule
  • 待补:computation graph
  • 待补:backpropagation

关键公式

待补:Lθl=Lhlhlθl

它出现在模型的哪里?

  • 待补:multi-layer neural network
  • 待补:Transformer block backward
  • 待补:automatic differentiation

后续需要补充

  • 待补:定义
  • 待补:直觉
  • 待补:例子
  • 待补:常见误区

以知识图谱方式组织 AI 学习路径。