余昌叶

人物简介:

余昌叶,资深算法工程师,哈尔滨工业大学优秀毕业生。曾就职于腾讯等多家一线互联网企业,拥有十年行业经验。主要研究方向为大模型、强化学习、推荐系统及图像处理。具备扎实的数学功底与深厚的算法理论基础,主导并完成多项核心技术项目的工程化落地。已获六项国家发明专利,曾荣获科研类全国航空航天模型锦标赛亚军等专业奖项,以及腾讯卓越研发奖(团队)、腾讯知识奖等多项企业级荣誉。

大模型算法:强化学习、微调与对齐书籍相关信息


内容简介:

《大模型算法:强化学习、微调与对齐》系统地讲解了大模型技术、训练算法(包括强化学习、RLHF、DPO、SFT与蒸馏等)、效果优化及其实践。全书以大语言模型为核心,内容广泛且深入,绝大部分内容适用于视觉语言模型和多模态大语言模型。 《大模型算法:强化学习、微调与对齐》适合AI算法与工程领域的从业者,相关专业的学生,希望深入了解大模型技术、拥抱AI与大模型浪潮的读者阅读。