mirror of
https://github.com/PKUFlyingPig/cs-self-learning.git
synced 2026-06-26 03:17:01 +08:00
75 lines
No EOL
6.7 KiB
Markdown
75 lines
No EOL
6.7 KiB
Markdown
# CS294/194-196 大型语言模型(LLM)智能体课程
|
||
|
||
## 课程简介
|
||
|
||
- 所属大学:UC Berkeley
|
||
- 先修要求:无
|
||
- 编程语言:Python
|
||
- 课程难度:🌟🌟🌟
|
||
- 预计学时:100 小时
|
||
- 课程内容涵盖 LLM 推理、工具使用、多智能体协作及应用领域如代码生成和机器人技术。
|
||
- 提供丰富的资源,包括课程网站 [CS294/194-196 课程主页](http://rdi.berkeley.edu/llm-agents/f24)、MOOC 网站 [Large Language Model Agents MOOC](https://llmagents-learning.org/f24)、YouTube 讲座视频及 GitHub 笔记。
|
||
- 课程作业包括阅读总结、实验和项目,如参与 [LLM Agents Hackathon](http://rdi.berkeley.edu/llm-agents-hackathon/)。
|
||
- 扩展学习可关注春季课程 [CS294/194-280 Advanced Large Language Model Agents](http://rdi.berkeley.edu/adv-llm-agents/sp25)及相关 GitHub 资源 [Awesome LLM Agents](https://github.com/kaushikb11/awesome-llm-agents)。
|
||
|
||
---
|
||
|
||
|
||
## 课程结构与内容
|
||
课程系统探讨 LLM 智能体的核心内容,包括:
|
||
- **LLM 基础与推理**:涵盖思维链(Chain-of-Thought)、自我一致性(Self-Consistency)等技术,通过中间步骤提升模型推理能力。
|
||
- **智能体基础设施**:包括检索增强生成(RAG)、工具调用(Tool Use)、多智能体协作框架(如 AutoGen)。
|
||
|
||
课程先修要求建议学生具备机器学习和深度学习的基础知识,如修过 CS182、CS188、CS189 等课程。
|
||
|
||
###学习资源
|
||
为支持自学,课程提供了丰富的资源:
|
||
- **课程网站**:[CS294/194-196 课程主页](http://rdi.berkeley.edu/llm-agents/f24),包含详细大纲、注册信息及联系方式。
|
||
- **MOOC 网站**:[Large Language Model Agents MOOC](https://llmagents-learning.org/f24),提供额外的实验室、证书及互动社区,适合无法参加正式课程的学生。
|
||
- **讲座视频**:所有 12 场讲座均有 YouTube 录播,具体日程和链接如下表:
|
||
|
||
| 日期 | 主题 | 嘉宾讲师 | 视频链接 |
|
||
|------------|----------------------------------------------------|-------------------------------------|-------------------------------------------------|
|
||
| 9月9日 | LLM 推理 | Denny Zhou, Google DeepMind | [视频](https://www.youtube.com/live/QL-FS_Zcmyo) |
|
||
| 9月16日 | LLM 智能体:简史与概述 | Shunyu Yao, OpenAI | [视频](https://www.youtube.com/watch?v=RM6ZArd2nVc) |
|
||
| 9月23日 | 智能体 AI 框架 & AutoGen, 构建多模态知识助手 | Chi Wang, AutoGen-AI; Jerry Liu, LlamaIndex | [视频](https://www.youtube.com/live/OOdtmCMSOo4) |
|
||
| 9月30日 | 生成式 AI 的企业趋势及构建成功智能体/应用的关键组件 | Burak Gokturk, Google | [视频](https://www.youtube.com/live/Sy1psHS3w3I) |
|
||
| 10月7日 | 复合 AI 系统 & DSPy 框架 | Omar Khattab, Databricks | [视频](https://www.youtube.com/live/JEMYuzrKLUw) |
|
||
| 10月14日 | 软件开发智能体 | Graham Neubig, Carnegie Mellon University | [视频](https://www.youtube.com/live/f9L9Fkq-8K4) |
|
||
| 10月21日 | 企业工作流 AI 智能体 | Nicolas Chapados, ServiceNow | [视频](https://www.youtube.com/live/-yf-e-9FvOc) |
|
||
| 10月28日 | 神经与符号决策制定的统一框架 | Yuandong Tian, Meta AI (FAIR) | [视频](https://www.youtube.com/live/wm9-7VBpdEo) |
|
||
| 11月4日 | Project GR00T: 通用机器人蓝图 | Jim Fan, NVIDIA | [视频](https://www.youtube.com/live/Qhxr0uVT2zs) |
|
||
| 11月18日 | 基础模型时代的开源与科学 | Percy Liang, Stanford University | [视频](https://www.youtube.com/live/f3KKx9LWntQ) |
|
||
| 11月25日 | 测量智能体能力与 Anthropic 的 RSP | Ben Mann, Anthropic | [视频](https://www.youtube.com/live/6y2AnWol7oo) |
|
||
| 12月2日 | 构建安全可信 AI 智能体及科学与证据为基础的 AI 政策 | Dawn Song, UC Berkeley | [视频](https://www.youtube.com/live/QAgR4uQ15rc) |
|
||
|
||
每个讲座均有对应阅读材料,详情见课程网站 [CS294/194-196 课程主页](http://rdi.berkeley.edu/llm-agents/f24#syllabus)。
|
||
|
||
- **课程笔记**:[GitHub](https://github.com/rajdeepmondaldotcom/CS294_LLM_Agents_Notes_Fall2024)
|
||
|
||
## 经典相关论文与资源
|
||
课程重点讨论的论文和框架按技术方向分类如下:
|
||
|
||
### 推理与规划
|
||
- **ReAct**:结合推理与行动的框架,提升任务解决能力,论文:[ReAct: Synergizing Reasoning and Acting in Language Models](https://arxiv.org/abs/2210.03629)。
|
||
- **Chain-of-Thought**:通过中间步骤激发模型推理,论文:[Chain-of-Thought Prompting Elicits Reasoning in Large Language Models](https://arxiv.org/abs/2201.11903)。
|
||
- **Chain-of-Thought Reasoning Without Prompting**:探索无提示的思维链推理,论文:[Chain-of-Thought Reasoning Without Prompting](https://arxiv.org/abs/2402.10200)。
|
||
|
||
### 智能体框架
|
||
- **AutoGen**:支持多智能体对话的开发框架,论文:[AutoGen: Enabling Next-Gen LLM Applications via Multi-Agent Conversation](https://arxiv.org/abs/2308.08155)。
|
||
- **DSPy**:面向复合 AI 系统的编程框架,论文:[DSPy: Compiling Declarative Language Model Calls into Self-Improving Pipelines](https://arxiv.org/abs/2310.03714)。
|
||
|
||
### 应用场景
|
||
- **代码生成**:
|
||
- **SWE-agent**:自动化软件工程的智能体接口,论文:[SWE-agent: Agent-Computer Interfaces Enable Automated Software Engineering](https://arxiv.org/abs/2402.01030)。
|
||
- **机器人技术**:
|
||
- **Voyager**:基于 LLM 的开放式具身智能体,论文:[Voyager: An Open-Ended Embodied Agent with Large Language Models](https://arxiv.org/abs/2305.16291)。
|
||
|
||
|
||
## 扩展学习建议
|
||
为进一步深入学习,建议:
|
||
- **实践项目**:参与 [LLM Agents Hackathon](http://rdi.berkeley.edu/llm-agents-hackathon/),尝试构建支持工具调用(如 Web 自动化)的智能体,Hackathon 提供应用、基准测试和基础研究等多个轨道。
|
||
- **进阶课程**:关注春季课程 [CS294/194-280 Advanced Large Language Model Agents](http://rdi.berkeley.edu/adv-llm-agents/sp25),聚焦 LLM 推理、数学证明和代码生成等高级主题。
|
||
- **在线资源**:
|
||
- [Large Language Model Agents MOOC](https://llmagents-learning.org/f24):提供课程材料、实验室和证书,适合自学。
|
||
- [Awesome LLM Agents](https://github.com/kaushikb11/awesome-llm-agents):收集了大量关于 LLM 智能体的框架、论文和项目,适合深入研究。 |