cs-self-learning/docs/大语言模型/ Agent/CS294.md
Yuchen Wang 3c7a5e37e3 update
2025-04-02 11:46:36 +00:00

75 lines
No EOL
6.7 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

# CS294/194-196 大型语言模型LLM智能体课程
## 课程简介
- 所属大学UC Berkeley
- 先修要求:无
- 编程语言Python
- 课程难度:🌟🌟🌟
- 预计学时100 小时
- 课程内容涵盖 LLM 推理、工具使用、多智能体协作及应用领域如代码生成和机器人技术。
- 提供丰富的资源,包括课程网站 [CS294/194-196 课程主页](http://rdi.berkeley.edu/llm-agents/f24)、MOOC 网站 [Large Language Model Agents MOOC](https://llmagents-learning.org/f24)、YouTube 讲座视频及 GitHub 笔记。
- 课程作业包括阅读总结、实验和项目,如参与 [LLM Agents Hackathon](http://rdi.berkeley.edu/llm-agents-hackathon/)。
- 扩展学习可关注春季课程 [CS294/194-280 Advanced Large Language Model Agents](http://rdi.berkeley.edu/adv-llm-agents/sp25)及相关 GitHub 资源 [Awesome LLM Agents](https://github.com/kaushikb11/awesome-llm-agents)。
---
## 课程结构与内容
课程系统探讨 LLM 智能体的核心内容,包括:
- **LLM 基础与推理**涵盖思维链Chain-of-Thought、自我一致性Self-Consistency等技术通过中间步骤提升模型推理能力。
- **智能体基础设施**包括检索增强生成RAG、工具调用Tool Use、多智能体协作框架如 AutoGen
课程先修要求建议学生具备机器学习和深度学习的基础知识,如修过 CS182、CS188、CS189 等课程。
###学习资源
为支持自学,课程提供了丰富的资源:
- **课程网站**[CS294/194-196 课程主页](http://rdi.berkeley.edu/llm-agents/f24),包含详细大纲、注册信息及联系方式。
- **MOOC 网站**[Large Language Model Agents MOOC](https://llmagents-learning.org/f24),提供额外的实验室、证书及互动社区,适合无法参加正式课程的学生。
- **讲座视频**:所有 12 场讲座均有 YouTube 录播,具体日程和链接如下表:
| 日期 | 主题 | 嘉宾讲师 | 视频链接 |
|------------|----------------------------------------------------|-------------------------------------|-------------------------------------------------|
| 9月9日 | LLM 推理 | Denny Zhou, Google DeepMind | [视频](https://www.youtube.com/live/QL-FS_Zcmyo) |
| 9月16日 | LLM 智能体:简史与概述 | Shunyu Yao, OpenAI | [视频](https://www.youtube.com/watch?v=RM6ZArd2nVc) |
| 9月23日 | 智能体 AI 框架 & AutoGen, 构建多模态知识助手 | Chi Wang, AutoGen-AI; Jerry Liu, LlamaIndex | [视频](https://www.youtube.com/live/OOdtmCMSOo4) |
| 9月30日 | 生成式 AI 的企业趋势及构建成功智能体/应用的关键组件 | Burak Gokturk, Google | [视频](https://www.youtube.com/live/Sy1psHS3w3I) |
| 10月7日 | 复合 AI 系统 & DSPy 框架 | Omar Khattab, Databricks | [视频](https://www.youtube.com/live/JEMYuzrKLUw) |
| 10月14日 | 软件开发智能体 | Graham Neubig, Carnegie Mellon University | [视频](https://www.youtube.com/live/f9L9Fkq-8K4) |
| 10月21日 | 企业工作流 AI 智能体 | Nicolas Chapados, ServiceNow | [视频](https://www.youtube.com/live/-yf-e-9FvOc) |
| 10月28日 | 神经与符号决策制定的统一框架 | Yuandong Tian, Meta AI (FAIR) | [视频](https://www.youtube.com/live/wm9-7VBpdEo) |
| 11月4日 | Project GR00T: 通用机器人蓝图 | Jim Fan, NVIDIA | [视频](https://www.youtube.com/live/Qhxr0uVT2zs) |
| 11月18日 | 基础模型时代的开源与科学 | Percy Liang, Stanford University | [视频](https://www.youtube.com/live/f3KKx9LWntQ) |
| 11月25日 | 测量智能体能力与 Anthropic 的 RSP | Ben Mann, Anthropic | [视频](https://www.youtube.com/live/6y2AnWol7oo) |
| 12月2日 | 构建安全可信 AI 智能体及科学与证据为基础的 AI 政策 | Dawn Song, UC Berkeley | [视频](https://www.youtube.com/live/QAgR4uQ15rc) |
每个讲座均有对应阅读材料,详情见课程网站 [CS294/194-196 课程主页](http://rdi.berkeley.edu/llm-agents/f24#syllabus)。
- **课程笔记**[GitHub](https://github.com/rajdeepmondaldotcom/CS294_LLM_Agents_Notes_Fall2024)
## 经典相关论文与资源
课程重点讨论的论文和框架按技术方向分类如下:
### 推理与规划
- **ReAct**:结合推理与行动的框架,提升任务解决能力,论文:[ReAct: Synergizing Reasoning and Acting in Language Models](https://arxiv.org/abs/2210.03629)。
- **Chain-of-Thought**:通过中间步骤激发模型推理,论文:[Chain-of-Thought Prompting Elicits Reasoning in Large Language Models](https://arxiv.org/abs/2201.11903)。
- **Chain-of-Thought Reasoning Without Prompting**:探索无提示的思维链推理,论文:[Chain-of-Thought Reasoning Without Prompting](https://arxiv.org/abs/2402.10200)。
### 智能体框架
- **AutoGen**:支持多智能体对话的开发框架,论文:[AutoGen: Enabling Next-Gen LLM Applications via Multi-Agent Conversation](https://arxiv.org/abs/2308.08155)。
- **DSPy**:面向复合 AI 系统的编程框架,论文:[DSPy: Compiling Declarative Language Model Calls into Self-Improving Pipelines](https://arxiv.org/abs/2310.03714)。
### 应用场景
- **代码生成**
- **SWE-agent**:自动化软件工程的智能体接口,论文:[SWE-agent: Agent-Computer Interfaces Enable Automated Software Engineering](https://arxiv.org/abs/2402.01030)。
- **机器人技术**
- **Voyager**:基于 LLM 的开放式具身智能体,论文:[Voyager: An Open-Ended Embodied Agent with Large Language Models](https://arxiv.org/abs/2305.16291)。
## 扩展学习建议
为进一步深入学习,建议:
- **实践项目**:参与 [LLM Agents Hackathon](http://rdi.berkeley.edu/llm-agents-hackathon/),尝试构建支持工具调用(如 Web 自动化的智能体Hackathon 提供应用、基准测试和基础研究等多个轨道。
- **进阶课程**:关注春季课程 [CS294/194-280 Advanced Large Language Model Agents](http://rdi.berkeley.edu/adv-llm-agents/sp25),聚焦 LLM 推理、数学证明和代码生成等高级主题。
- **在线资源**
- [Large Language Model Agents MOOC](https://llmagents-learning.org/f24):提供课程材料、实验室和证书,适合自学。
- [Awesome LLM Agents](https://github.com/kaushikb11/awesome-llm-agents):收集了大量关于 LLM 智能体的框架、论文和项目,适合深入研究。