关于“DeepScaleR:通过扩展强化学习,用1.5B模型超越O1-Preview”(译文)阅读报告

引言

今天我们要解读的是一篇非常有意思的文章,主题是“DeepScaleR:通过扩展强化学习,用1.5B模型超越O1-Preview”。这名字听起来有点拗口,别担心,我们一步步来拆解。

原文

这里先放上中文译文,如有兴趣阅读原文的朋友可以访问URL:

阅读更多

深度学习数学基础入门

前言

为了学习,也为了看懂深度学习中的定律、函数、方程等,所以狠心的整理回顾了一下涉及到深度学习中的一些数学基础知识。

知识列表:

I. 预备知识:基础数学概念回顾

  1. 集合
    • 集合的定义与表示 (列举法、描述法)
    • 集合的基本关系 (子集、真子集、空集、全集)
    • 集合的基本运算 (并集、交集、补集、差集)
    • 韦恩图 (Venn Diagram) 的理解与应用
阅读更多
You need to set client_id and slot_id to show this AD unit. Please set it in _config.yml.