mirror of
https://github.com/PKUFlyingPig/cs-self-learning.git
synced 2026-06-25 19:07:04 +08:00
6.7 KiB
6.7 KiB
CS294/194-196 大型语言模型(LLM)智能体课程
课程简介
- 所属大学:UC Berkeley
- 先修要求:无
- 编程语言:Python
- 课程难度:🌟🌟🌟
- 预计学时:100 小时
- 课程内容涵盖 LLM 推理、工具使用、多智能体协作及应用领域如代码生成和机器人技术。
- 提供丰富的资源,包括课程网站 CS294/194-196 课程主页、MOOC 网站 Large Language Model Agents MOOC、YouTube 讲座视频及 GitHub 笔记。
- 课程作业包括阅读总结、实验和项目,如参与 LLM Agents Hackathon。
- 扩展学习可关注春季课程 CS294/194-280 Advanced Large Language Model Agents及相关 GitHub 资源 Awesome LLM Agents。
课程结构与内容
课程系统探讨 LLM 智能体的核心内容,包括:
- LLM 基础与推理:涵盖思维链(Chain-of-Thought)、自我一致性(Self-Consistency)等技术,通过中间步骤提升模型推理能力。
- 智能体基础设施:包括检索增强生成(RAG)、工具调用(Tool Use)、多智能体协作框架(如 AutoGen)。
课程先修要求建议学生具备机器学习和深度学习的基础知识,如修过 CS182、CS188、CS189 等课程。
###学习资源 为支持自学,课程提供了丰富的资源:
- 课程网站:CS294/194-196 课程主页,包含详细大纲、注册信息及联系方式。
- MOOC 网站:Large Language Model Agents MOOC,提供额外的实验室、证书及互动社区,适合无法参加正式课程的学生。
- 讲座视频:所有 12 场讲座均有 YouTube 录播,具体日程和链接如下表:
| 日期 | 主题 | 嘉宾讲师 | 视频链接 |
|---|---|---|---|
| 9月9日 | LLM 推理 | Denny Zhou, Google DeepMind | 视频 |
| 9月16日 | LLM 智能体:简史与概述 | Shunyu Yao, OpenAI | 视频 |
| 9月23日 | 智能体 AI 框架 & AutoGen, 构建多模态知识助手 | Chi Wang, AutoGen-AI; Jerry Liu, LlamaIndex | 视频 |
| 9月30日 | 生成式 AI 的企业趋势及构建成功智能体/应用的关键组件 | Burak Gokturk, Google | 视频 |
| 10月7日 | 复合 AI 系统 & DSPy 框架 | Omar Khattab, Databricks | 视频 |
| 10月14日 | 软件开发智能体 | Graham Neubig, Carnegie Mellon University | 视频 |
| 10月21日 | 企业工作流 AI 智能体 | Nicolas Chapados, ServiceNow | 视频 |
| 10月28日 | 神经与符号决策制定的统一框架 | Yuandong Tian, Meta AI (FAIR) | 视频 |
| 11月4日 | Project GR00T: 通用机器人蓝图 | Jim Fan, NVIDIA | 视频 |
| 11月18日 | 基础模型时代的开源与科学 | Percy Liang, Stanford University | 视频 |
| 11月25日 | 测量智能体能力与 Anthropic 的 RSP | Ben Mann, Anthropic | 视频 |
| 12月2日 | 构建安全可信 AI 智能体及科学与证据为基础的 AI 政策 | Dawn Song, UC Berkeley | 视频 |
每个讲座均有对应阅读材料,详情见课程网站 CS294/194-196 课程主页。
- 课程笔记:GitHub
经典相关论文与资源
课程重点讨论的论文和框架按技术方向分类如下:
推理与规划
- ReAct:结合推理与行动的框架,提升任务解决能力,论文:ReAct: Synergizing Reasoning and Acting in Language Models。
- Chain-of-Thought:通过中间步骤激发模型推理,论文:Chain-of-Thought Prompting Elicits Reasoning in Large Language Models。
- Chain-of-Thought Reasoning Without Prompting:探索无提示的思维链推理,论文:Chain-of-Thought Reasoning Without Prompting。
智能体框架
- AutoGen:支持多智能体对话的开发框架,论文:AutoGen: Enabling Next-Gen LLM Applications via Multi-Agent Conversation。
- DSPy:面向复合 AI 系统的编程框架,论文:DSPy: Compiling Declarative Language Model Calls into Self-Improving Pipelines。
应用场景
- 代码生成:
- SWE-agent:自动化软件工程的智能体接口,论文:SWE-agent: Agent-Computer Interfaces Enable Automated Software Engineering。
- 机器人技术:
- Voyager:基于 LLM 的开放式具身智能体,论文:Voyager: An Open-Ended Embodied Agent with Large Language Models。
扩展学习建议
为进一步深入学习,建议:
- 实践项目:参与 LLM Agents Hackathon,尝试构建支持工具调用(如 Web 自动化)的智能体,Hackathon 提供应用、基准测试和基础研究等多个轨道。
- 进阶课程:关注春季课程 CS294/194-280 Advanced Large Language Model Agents,聚焦 LLM 推理、数学证明和代码生成等高级主题。
- 在线资源:
- Large Language Model Agents MOOC:提供课程材料、实验室和证书,适合自学。
- Awesome LLM Agents:收集了大量关于 LLM 智能体的框架、论文和项目,适合深入研究。