XeLabs/cs-self-learning

mirror of https://github.com/PKUFlyingPig/cs-self-learning.git synced 2026-06-25 19:07:04 +08:00

Yuchen Wang 3c7a5e37e3 update

2025-04-02 11:46:36 +00:00

6.7 KiB

Raw Blame History

CS294/194-196 大型语言模型（LLM）智能体课程

课程简介

所属大学：UC Berkeley
先修要求：无
编程语言：Python
课程难度：🌟🌟🌟
预计学时：100 小时
课程内容涵盖 LLM 推理、工具使用、多智能体协作及应用领域如代码生成和机器人技术。
提供丰富的资源，包括课程网站 CS294/194-196 课程主页、MOOC 网站 Large Language Model Agents MOOC、YouTube 讲座视频及 GitHub 笔记。
课程作业包括阅读总结、实验和项目，如参与 LLM Agents Hackathon。
扩展学习可关注春季课程 CS294/194-280 Advanced Large Language Model Agents及相关 GitHub 资源 Awesome LLM Agents。

课程结构与内容

课程系统探讨 LLM 智能体的核心内容，包括：

LLM 基础与推理：涵盖思维链（Chain-of-Thought）、自我一致性（Self-Consistency）等技术，通过中间步骤提升模型推理能力。
智能体基础设施：包括检索增强生成（RAG）、工具调用（Tool Use）、多智能体协作框架（如 AutoGen）。

课程先修要求建议学生具备机器学习和深度学习的基础知识，如修过 CS182、CS188、CS189 等课程。

###学习资源为支持自学，课程提供了丰富的资源：

课程网站：CS294/194-196 课程主页，包含详细大纲、注册信息及联系方式。
MOOC 网站：Large Language Model Agents MOOC，提供额外的实验室、证书及互动社区，适合无法参加正式课程的学生。
讲座视频：所有 12 场讲座均有 YouTube 录播，具体日程和链接如下表：

日期	主题	嘉宾讲师	视频链接
9月9日	LLM 推理	Denny Zhou, Google DeepMind	视频
9月16日	LLM 智能体：简史与概述	Shunyu Yao, OpenAI	视频
9月23日	智能体 AI 框架 & AutoGen, 构建多模态知识助手	Chi Wang, AutoGen-AI; Jerry Liu, LlamaIndex	视频
9月30日	生成式 AI 的企业趋势及构建成功智能体/应用的关键组件	Burak Gokturk, Google	视频
10月7日	复合 AI 系统 & DSPy 框架	Omar Khattab, Databricks	视频
10月14日	软件开发智能体	Graham Neubig, Carnegie Mellon University	视频
10月21日	企业工作流 AI 智能体	Nicolas Chapados, ServiceNow	视频
10月28日	神经与符号决策制定的统一框架	Yuandong Tian, Meta AI (FAIR)	视频
11月4日	Project GR00T: 通用机器人蓝图	Jim Fan, NVIDIA	视频
11月18日	基础模型时代的开源与科学	Percy Liang, Stanford University	视频
11月25日	测量智能体能力与 Anthropic 的 RSP	Ben Mann, Anthropic	视频
12月2日	构建安全可信 AI 智能体及科学与证据为基础的 AI 政策	Dawn Song, UC Berkeley	视频

每个讲座均有对应阅读材料，详情见课程网站 CS294/194-196 课程主页。

课程笔记：GitHub

经典相关论文与资源

课程重点讨论的论文和框架按技术方向分类如下：

推理与规划

ReAct：结合推理与行动的框架，提升任务解决能力，论文：ReAct: Synergizing Reasoning and Acting in Language Models。
Chain-of-Thought：通过中间步骤激发模型推理，论文：Chain-of-Thought Prompting Elicits Reasoning in Large Language Models。
Chain-of-Thought Reasoning Without Prompting：探索无提示的思维链推理，论文：Chain-of-Thought Reasoning Without Prompting。

智能体框架

AutoGen：支持多智能体对话的开发框架，论文：AutoGen: Enabling Next-Gen LLM Applications via Multi-Agent Conversation。
DSPy：面向复合 AI 系统的编程框架，论文：DSPy: Compiling Declarative Language Model Calls into Self-Improving Pipelines。

应用场景

代码生成：
- SWE-agent：自动化软件工程的智能体接口，论文：SWE-agent: Agent-Computer Interfaces Enable Automated Software Engineering。
机器人技术：
- Voyager：基于 LLM 的开放式具身智能体，论文：Voyager: An Open-Ended Embodied Agent with Large Language Models。

扩展学习建议

为进一步深入学习，建议：

实践项目：参与 LLM Agents Hackathon，尝试构建支持工具调用（如 Web 自动化）的智能体，Hackathon 提供应用、基准测试和基础研究等多个轨道。
进阶课程：关注春季课程 CS294/194-280 Advanced Large Language Model Agents，聚焦 LLM 推理、数学证明和代码生成等高级主题。
在线资源：
- Large Language Model Agents MOOC：提供课程材料、实验室和证书，适合自学。
- Awesome LLM Agents：收集了大量关于 LLM 智能体的框架、论文和项目，适合深入研究。