Keyboard shortcuts

Press or to navigate between chapters

Press S or / to search in the book

Press ? to show this help

Press Esc to hide this help

第一部分:入门篇

大模型入门:不会编程的人,应该怎么开始使用 AI?

🌱 "用好大模型的第一步,不是理解所有技术细节,而是知道它能做什么、不能做什么,以及怎样把任务说清楚。"

本章不要求你会编程,也不要求你理解神经网络。我们只从使用者的角度出发,把大模型当成一个日常工具来理解。

零基础读者进入大模型世界的路线图

你可以先把大模型想象成一个非常擅长语言工作的助手:它能读材料、写草稿、改表达、做总结、列计划、解释概念、生成代码,也能陪你一起头脑风暴。

但它不是绝对可靠的专家,也不是天然知道事实真相的数据库。它更像一个能力很强、反应很快、但需要你检查结果的协作者。

用好大模型的第一步,不是学习复杂理论,而是学会把任务说清楚。

本章应该怎么读?

这一章是写给零基础读者的。你不需要记住所有模型名字,也不需要精确计算 token,更不需要理解模型内部怎么训练。

建议你只抓住四件事:

你要建立的直觉一句话理解
大模型是什么一个擅长处理语言的协作者
大模型能做什么帮你读、写、改、总结、解释、规划
怎么问更有效给背景、目标、材料、要求和输出格式
什么时候要小心重要事实、数字、法律、医疗、金融建议都要验证

如果你读完本章之后,能开始把大模型用于自己的学习、写作、办公或编程辅助,那么这一章的目的就达到了。

大模型不是搜索引擎,而是语言协作者

很多人第一次用大模型时,会把它当成搜索引擎来用:

世界上最高的山是哪座?
某某公司今年营收是多少?
某个新闻是真的吗?

这当然也能问,但这不是大模型最有价值的地方。

搜索引擎更擅长帮你找到资料来源;计算器更擅长完成精确计算;大模型真正擅长的是处理语言和任务

大模型不是搜索引擎,而是语言协作者

比如,同样是一篇很长的文章:

  • 搜索引擎可以帮你找到它。
  • 浏览器可以帮你打开它。
  • 大模型可以帮你总结它、解释它、改写它、提炼它的观点,甚至帮你把它变成一份讲稿。

所以,一个更准确的理解是:

搜索引擎帮你找资料,大模型帮你处理资料。

如果你只问大模型一个事实问题,它可能只是一个不稳定的问答机器;但如果你把一段材料、一项任务、一个目标交给它,它就会变成一个很有用的协作者。

把大模型想象成一个“能力很强但需要检查的实习生”

对零基础读者来说,最容易理解的大模型类比是:实习生

这个实习生读过很多材料,写东西很快,模仿能力很强,也能帮你整理思路。但它有几个明显缺点:

  • 它可能不知道你真正的背景。
  • 它可能误解你的目标。
  • 它可能为了给出完整答案而编造细节。
  • 它可能把旧信息当成新信息。
  • 它写出来的东西很像真的,但不一定真的正确。

因此,正确的使用方式不是“让它一次性给最终答案”,而是和它来回协作。

把大模型当成能力很强但需要检查的实习生

一个常见的使用闭环是:

  1. 你告诉它任务和背景。
  2. 它给出初稿。
  3. 你检查哪里不对、哪里不够。
  4. 你补充要求。
  5. 它继续修改。
  6. 最后由你决定能不能使用。

例如,你可以这样说:

你是AI科普领域的专家。
我准备写一篇给高中生看的 AI 科普文章。
请先帮我列一个大纲,不要直接写全文。
要求语言轻松,不要出现复杂公式。
每一节都给一个生活类比。

这比简单说“帮我写一篇 AI 文章”要好得多,因为它给了模型明确的身份、读者、任务、限制和输出目标。

大模型能帮普通人做什么?

大模型最基础的能力不是“像人一样思考”,而是围绕语言做各种变换和组织

你给它一段话,它可以总结;你给它一个主题,它可以起草;你给它一堆想法,它可以整理;你给它一个概念,它可以解释;你给它一段代码,它可以分析。

大模型能帮普通人做什么

从普通人的角度,可以先把它的用途分成几类:

场景大模型能做什么你可以这样问
学习解释概念、制定学习计划、出题、批改答案“用初中生能懂的话解释什么是通货膨胀”
写作起草、润色、改风格、扩写、压缩“把这段话改得更清楚、更适合公众号开头”
办公写邮件、整理会议纪要、提炼待办事项“把这段会议记录整理成负责人、事项、截止时间三列”
阅读总结长文、提炼观点、对比资料“总结这篇文章的核心观点,并列出作者的三个论据”
编程解释代码、生成脚本、排查报错“这段 Python 报错是什么意思?我应该怎么改?”
创意起名、写脚本、做方案、头脑风暴“给一个 AI 入门课程起 10 个标题,风格要轻松”
决策辅助列选项、做利弊分析、补充盲点“我应该买平板还是笔记本?请帮我列决策表”
多模态看图、读截图、解释图表“这张报表说明了什么问题?”

这里有一个很重要的原则:

大模型最适合帮你完成初稿,而不是替你做最终判断。

比如它可以帮你写简历初稿,但你要检查经历是否真实;它可以帮你总结合同,但重要条款仍要找专业人士确认;它可以帮你分析体检报告,但不能替代医生诊断。

怎么向大模型提问?

很多人觉得模型不好用,不一定是模型太差,而是问题太模糊。

比如这类问题通常效果不好:

帮我写个方案。

模型不知道你是谁,不知道方案给谁看,不知道目标是什么,不知道篇幅多长,也不知道你喜欢什么风格。它只能猜。

对新手来说,最简单的提问公式是:

背景 + 目标 + 材料 + 要求 + 输出格式

新手最实用的提问公式

我们把刚才那个模糊问题改写一下:

我是一名大学老师,准备给零基础学生上一节 90 分钟 AI 入门课。
目标是让他们知道大模型能做什么,并完成一次有效提问。
请帮我设计课程大纲。
要求:
1. 不讲公式;
2. 每 20 分钟有一个互动;
3. 最后给一个课堂练习;
4. 用表格输出。

这个问题就清楚得多。

它告诉了模型:

  • 背景:大学老师,面向零基础学生。
  • 目标:理解大模型能做什么,并完成一次有效提问。
  • 任务:设计课程大纲。
  • 要求:不讲公式、有互动、有练习。
  • 格式:用表格输出。

你也可以把它记成一个模板:

你现在扮演【角色】。
我要完成【任务】。
背景是【背景信息】。
我已经有的材料是【材料】。
请你按照【要求】完成。
输出格式是【格式】。
如果信息不够,请先问我问题。

最后一句“如果信息不够,请先问我问题”非常有用。它会让模型不要急着编,而是先补齐关键信息。

token 是什么?

使用大模型时,经常会看到一个词:token

中文定名为“词元”,可以把 token 粗略理解成:模型处理文字时使用的小颗粒

token 是模型眼里的文字小颗粒

比如一句话:

我想让大模型帮我总结这篇文章。

在模型内部,它不会像人一样完整地看这句话,而是会把文字切成一个个更小的单位。中文里,一个 token 可能接近一个字、一个词或一个标点;英文里,一个 token 可能是一个单词,也可能是单词的一部分。

普通用户不需要精确计算 token。你只要记住一句话:

输入越长,输出越长,消耗的 token 就越多。

这里的“输入”不只是你刚刚打的那一句问题,还可能包括:

  • 你前面多轮对话的历史。
  • 你上传的文档。
  • 你粘贴的代码。
  • 系统给模型的规则。
  • 工具调用返回的内容。

模型回答你的内容,则会变成输出 token。

一次调用的 token 成本从哪里来

因此,一次大模型调用的成本通常可以粗略理解为:

总成本 ≈ 输入 token 成本 + 输出 token 成本

很多模型的输出 token 会比输入 token 更贵,因为生成内容需要更多计算。

一次使用大模型大概要花多少钱?

如果你使用的是 ChatGPT、Claude、Gemini、Kimi、豆包、通义、DeepSeek 这类面向普通用户的产品,通常不需要自己计算每次 token 成本。你更常见的是免费额度、会员订阅、次数限制或套餐限制。

如果你是开发者,通过 API 调用模型,就需要更关注 token 成本。

到本书写作时,大模型 API 已经比早期便宜很多。普通聊天、短文本润色、简单总结这类任务,单次成本通常很低;但如果你让模型处理长文档、整个代码库,或者让 Agent 自动执行很多步,成本就会明显上升。

不同任务的 token 消耗阶梯

可以用下面这个表建立直觉:

使用场景token 消耗感受成本提醒
问一个简单问题很低通常不用太担心
润色一段话很低适合日常高频使用
写一篇短文输出越长成本越高
总结一篇长文章中等文章越长输入越多
分析几十页 PDF较高注意上下文长度和费用
分析整个代码库较高可能需要分批处理
Agent 自动执行几十步可能很高要设置预算和停止条件

这里要特别注意多轮对话。

很多聊天产品会把历史对话一起发给模型,这样模型才能“记得前面说过什么”。这很方便,但也意味着对话越长,输入 token 可能越多。

如果你发现一个对话已经非常长,可以考虑开启新对话,并先让模型总结前面的关键信息,再把总结带到新对话里。

新手到底该用哪个 AI?怎么下载?要不要付费?

很多新手最关心的问题不是模型排行榜,而是三个很实际的问题:我现在该用哪个?去哪里下载?要不要花钱?

先给一个直接结论:

完全零基础的新手,不要一开始研究所有模型。先选一个容易打开、中文体验好、免费额度够用的聊天产品,用一周再决定要不要付费。

怎么选模型:先看任务,不看排行榜

如果你只想马上开始,可以这样选

你的情况推荐先用为什么
只想体验 AI、写作、总结、学习豆包Kimi通义千问文心一言智谱清言中文体验好,注册和使用门槛低,通常有免费额度
经常读长文档、论文、报告KimiClaudeGemini更适合长文本阅读、总结和提炼观点
想要综合能力强,能写作也能写代码ChatGPTClaudeGemini通用能力强,适合问答、写作、代码和复杂任务
主要写代码、改项目CursorTraeGitHub CopilotClaude Code能和代码编辑器或项目文件结合,不只是聊天
想低成本调用 API 或本地部署DeepSeekQwenLlama更偏开发者场景,普通新手可以暂时不用管

如果你还是不知道怎么选,可以按这个顺序来:

  1. 第一步:先用一个国内聊天产品,比如 豆包Kimi
  2. 第二步:如果你能正常访问海外服务,再试 ChatGPTClaudeGemini
  3. 第三步:如果你开始写代码或改项目,再考虑 CursorTraeGitHub Copilot 这类编程工具。

对大多数零基础用户来说,第一周只用一个工具就够了。不要今天换这个、明天换那个,否则你很难判断到底是工具不行,还是自己的提问方式还不清楚。

去哪里下载或打开?

最安全的方式是:优先用官网、官方应用商店,不要随便下载来历不明的安装包。

使用方式怎么开始适合谁
网页端在浏览器里搜索产品名称,进入官网登录使用电脑用户,不想安装软件的人
手机 AppApp Store、安卓应用商店搜索产品名称日常聊天、拍照识图、碎片时间使用
桌面客户端从产品官网下载,比如 CursorTrae需要读写代码项目、长时间办公的人
编辑器插件VS CodeJetBrains 等编辑器插件市场安装已经在写代码的人

新手可以记住这几个原则:

  • 能用网页端就先用网页端:不用安装,风险最低。
  • 手机端适合日常使用:比如拍照识图、语音提问、随手总结。
  • 编程工具不要太早装:如果你还不写代码,先用聊天产品就够了。
  • 看清官方来源:下载前确认产品名称、开发者和官网,避免山寨应用。

常用 AI / Agent 官方入口速查

下面这张表不是排行榜,而是给新手准备的安全入口清单。链接和产品形态可能会变化,实际下载时仍然以官网、官方应用商店和项目 README 为准。

工具 / 产品类型官方入口新手怎么用
ChatGPT聊天产品 / 通用 AI 助手ChatGPT / OpenAI适合通用问答、写作、学习、代码解释
Claude聊天产品 / 长文档与代码助手Claude适合长文档阅读、严谨写作、代码理解
Gemini聊天产品 / 多模态助手Gemini适合图片、视频、长资料和 Google 生态
DeepSeek聊天产品 / 模型 APIDeepSeek Chat / DeepSeek API 平台普通用户用聊天网页;开发者再看 API
豆包中文聊天产品 / 多模态助手豆包适合中文日常使用、写作、搜索、图片理解
Kimi中文聊天产品 / 长文档阅读Kimi适合上传资料、总结长文档、读论文报告
Qwen / 通义千问中文聊天产品 / 开源模型生态Qwen Chat / 通义千问 / Qwen GitHub普通用户用聊天入口;开发者看开源模型和 API
CursorAI IDE / 编程 AgentCursor适合在类似 VS Code 的编辑器里写代码、改项目
TraeAI IDE / 编程 AgentTrae 国际版 / Trae 国内版适合中文开发者在 IDE 里使用 AI 编程能力
GitHub Copilot编程助手 / IDE 插件GitHub Copilot适合在 VS Code、JetBrains、Visual Studio 等编辑器里补全和解释代码
Claude Code终端编程 AgentClaude Code / 官方文档适合在终端里读项目、改文件、跑测试;新手要先从小任务开始
CodexOpenAI 编程 Agent / CLIOpenAI Codex GitHub / OpenAI适合开发者在终端或 ChatGPT 生态里处理代码任务
WorkBuddy桌面 Agent / 办公 AgentWorkBuddy适合处理文件、表格、PPT、会议纪要和多步骤办公任务
OpenClaw开源本地 Agent / 自动化平台OpenClaw GitHub更适合愿意折腾部署的用户;新手要先看 README 和权限说明
Hermes Agent开源自学习 AgentHermes Agent / GitHub适合想研究开源 Agent、记忆和技能学习机制的开发者

如果你只是想开始用 AI,不必把这些全装一遍。更稳妥的顺序是:先用 豆包KimiChatGPT 这类聊天产品;开始写代码后再用 CursorTraeCopilot;需要 AI 真正操作文件和流程时,再考虑 WorkBuddyOpenClawHermes Agent 这类 Agent 工具。

免费版够不够?什么时候需要付费?

新手刚开始通常不需要马上付费。先用免费版完成下面这些任务:

  • 解释一个概念。
  • 总结一篇文章。
  • 润色一段文字。
  • 制定一个学习计划。
  • 帮你改一封邮件。
  • 分析一张截图或一份短文档。

如果你连续用了一周,发现它确实能帮你省时间,再考虑付费。

情况建议
只是偶尔问问题免费版通常够用
每天都用来学习、写作、办公可以考虑开一个月会员试试
经常上传长文档、图片、表格付费版通常限制更少,体验更稳定
经常写代码、调试项目可以考虑 CursorCopilot 或更强的聊天模型会员
只是想试试看不建议一开始年付,先月付或先免费试用
要在程序里调用模型 API这是开发者场景,通常按 token 或调用量计费,新手可以先跳过

付费时要注意两点:

  1. 付费不等于答案一定正确:重要事实、数字、法律、医疗、金融建议仍然要核验。
  2. 不要同时订阅太多工具:普通用户先固定一个主力工具就够了,等遇到明确瓶颈再换。

一个简单的选择建议是:

不想折腾:先用 豆包Kimi。想要更强综合能力:再试 ChatGPTClaudeGemini。开始认真写代码:再上 CursorWorkBuddyGitHub Copilot

最重要的是:

不要问“哪个模型永远最好”,而要问“我现在这个任务,用哪个最省事”。

从聊天窗口到 AI 工具:普通人应该怎么选?

前面我们一直在讨论“选哪个模型”。但当你真正开始用 AI 时,很快会遇到另一个问题:

  • 我应该直接用 ChatGPTClaudeGemini 这样的聊天产品,还是用专门的 AI 编程工具?
  • Claude CodeCodexCursorTrae 看起来都能写代码,它们有什么区别?
  • WorkBuddyOpenClaw 这类桌面 Agent 是不是更高级?
  • HarnessTrace 这些工程化概念,新手现在需要关心吗?

先记住一个非常实用的判断:

模型是“大脑”,工具是“工作台、手脚、权限和过程记录”。

同一个模型,放在聊天窗口里,主要是在回答你;放在编程 Agent 里,就可以读项目、改文件、运行测试;放在办公 Agent 里,可能还能整理文档、操作表格、生成 PPT;放在企业 Agent 系统里,则需要权限、日志、评测和审计来保证安全可靠。

从聊天模型到 AI 工具:应该选哪个

所以,新手不必一开始就研究所有工具。你只要先问自己三个问题:

先问自己如果答案是更适合选择
它需要操作我的文件或代码吗?不需要,只是问答、写作、总结聊天产品
它需要理解并修改一个项目吗?需要读代码、改文件、跑测试编程 Agent / AI IDE
它需要长期执行、调用工具或处理敏感数据吗?需要自动化、权限、审计、回滚Agent Harness / Trace / 企业工作流

一句话总结:

先用聊天产品学会提问,再用 Agent 处理真实任务,最后才考虑 Harness 和 Trace 这类工程体系。

先分清:模型、聊天产品、Agent、Harness、Trace 不是一回事

这些词经常被混在一起,但它们其实处在不同层级。

名词更像什么典型例子新手怎么理解
模型大脑GPTClaudeGeminiDeepSeekQwen负责理解、推理和生成内容
聊天产品对话窗口ChatGPTClaudeKimi豆包通义最适合入门,用来问答、写作、总结、解释
AI IDE / 编程 Agent会改代码的 AI 同事Claude CodeCodexCursorTraeCopilot能读项目、编辑文件、运行命令、修 bug
办公 / 桌面 Agent会操作办公工具的 AI 助手WorkBuddyOpenClaw能处理文件、表格、PPT、消息和多步骤流程
HarnessAgent 的外壳和控制台工具编排、权限、记忆、评测、日志让 Agent 安全、稳定、可控地执行任务
Trace / Agent Trace过程记录执行日志、代码归因、审计记录记录 AI 做了什么,方便检查、追责和回滚

可以把它们想象成一个逐层增强的系统:

模型 → 聊天产品 → Agent 工具 → Harness → Trace / 审计 / 评测

越往右,AI 能做的事情越多,但风险和管理成本也越高。对新手来说,正确的顺序不是“直接上最强工具”,而是先从低风险场景开始,逐步放权

1. 聊天产品:最适合新手的第一站

如果你的任务主要是读、写、改、总结、解释、规划,聊天产品通常就够用了。

常见选择包括:

  • ChatGPT:综合能力和工具生态成熟,适合通用问答、写作和代码辅助。
  • Claude:长文档阅读、文字表达和严谨总结通常表现很好。
  • Gemini:多模态和长上下文能力突出,适合图片、视频、长资料和 Google 生态。
  • Kimi:中文长文档阅读体验友好,适合资料总结、论文和报告阅读。
  • 豆包通义文心GLM:适合中文办公、内容生成和国内应用生态。
  • DeepSeekQwen:常被开发者用于代码、推理、低成本 API 或本地部署。

比如你可以这样问:

我有一份 20 页的行业报告。
请先帮我总结成 10 条要点,再列出 3 个我应该重点关注的风险。
要求:不要编造报告里没有的信息。

聊天产品的优点是门槛低、风险低、反馈快。它不直接操作你的电脑,也不会自动修改文件,所以非常适合建立使用 AI 的基本感觉。

适合它的任务

  • 学习一个新概念。
  • 润色一段文字。
  • 总结一篇文章或一份报告。
  • 制定学习计划、工作计划或活动方案。
  • 解释一段代码或一个报错。

如果你还不确定自己该用什么工具,先从聊天产品开始,通常不会错。

2. AI IDE / 编程 Agent:适合真实项目里的开发任务

当任务从“问问题”变成“请帮我改这个项目”时,聊天窗口就不够方便了。

这时可以使用 Claude CodeCodexCursorTraeCopilot 这类 AI 编程工具。它们的共同点是:不只是回答问题,而是能围绕代码库工作。

它们通常可以帮你做这些事:

  • 阅读项目结构。
  • 搜索函数和调用关系。
  • 解释陌生代码。
  • 修改文件。
  • 根据报错继续修复。
  • 生成测试用例。
  • 运行测试或命令,并根据结果迭代。

不同工具可以粗略这样理解:

工具更适合什么场景新手使用建议
Claude Code在项目里完成多步骤代码任务、读代码、改文件、跑测试适合中大型项目,但第一次最好从小修改开始
CodexOpenAI 生态里的代码生成、脚本编写、自动化开发适合写脚本、补测试、修小 bug
Cursor在 AI 编辑器里边写边问、生成 diff、理解项目适合习惯 VS Code 风格工作流的人
TraeAI 原生 IDE / Agent 编程体验适合希望在 IDE 里使用 Agent 能力的人
Copilot日常补全、解释代码、生成局部函数或测试适合低摩擦地嵌入现有 IDE

更安全的使用方式是:先让它读,再让它改。

请先阅读这个项目的登录流程,不要马上改代码。
先告诉我:
1. 登录入口在哪里;
2. token 是在哪里生成和保存的;
3. 如果我要增加短信验证码,需要改哪些文件。

等它说明清楚后,再让它执行:

按照刚才的方案修改。
要求:
1. 不改变现有密码登录逻辑;
2. 新增短信验证码校验;
3. 修改后运行相关测试;
4. 最后总结改了哪些文件。

新手提醒:不要一上来就说“帮我重构整个项目”。更好的做法是让 AI 先解释流程、定位问题、修改一个小功能,再逐渐扩大任务范围。

3. 办公 / 桌面 Agent:适合多文件、多工具、多步骤任务

如果你的任务不是写代码,而是处理文档、表格、PPT、文件夹、消息和流程,那么 WorkBuddyOpenClaw 这类办公或桌面 Agent 更合适。

它们和聊天产品的区别在于:聊天产品主要“回答”,桌面 Agent 更强调“执行”。

比如你可以让它做:

  • 整理一个文件夹里的资料。
  • 总结多份客户访谈记录。
  • 从表格里提取关键信息。
  • 生成汇报大纲或 PPT 初稿。
  • 把日报、周报、会议纪要转成待办事项。
  • 调用外部工具,把结果发送到团队群或工作流中。

WorkBuddy 更像面向职场用户的办公助手,适合文档、表格、PPT、会议纪要和流程整理。

OpenClaw 更像一个可扩展的 Agent 工作台,重点是让 AI 连接工具、执行技能、调用接口,甚至接入飞书、Telegram、Discord 等工作流。

你可以这样描述任务:

请帮我整理这个文件夹里的 20 份客户访谈记录。
输出:
1. 每个客户的核心需求;
2. 高频问题 Top 5;
3. 可以放进 PPT 的三页总结大纲。

如果是自动化流程,可以这样说:

每天早上 9 点读取指定文件夹里的日报,
总结昨天新增的问题,
按严重程度排序,
然后发送到团队群里。

这类工具的效率很高,但也更需要注意权限。凡是能读写本地文件、访问企业数据、发送消息或调用接口的 Agent,第一次使用时都最好限制范围,先用测试文件夹或非敏感资料验证效果。

4. Harness:让 Agent 安全稳定工作的“外壳”

Harness 不是普通用户每天打开来聊天的产品。它更像是 Agent 系统的工程外壳。

一个 Agent 想真正可靠地干活,光有模型不够,还需要一整套配套能力:

  • 工具列表:它能调用哪些工具?
  • 权限控制:哪些文件能读?哪些命令能执行?哪些操作必须人工确认?
  • 记忆系统:哪些信息需要长期保存?哪些内容不能保存?
  • 执行环境:代码在哪里运行?失败了怎么停止?能不能回滚?
  • 评测机制:怎么判断它做得对不对?
  • 日志和审计:它每一步做了什么?谁批准的?

这些能力合在一起,就可以理解成 Agent 的 Harness

一句话:

模型决定 Agent 有多聪明,Harness 决定 Agent 能不能安全、稳定、可控地做事。

如果你只是个人用户,暂时知道这个概念就够了;如果你要把 Agent 用在团队或企业里,Harness 就会变得非常重要。

5. Trace:给 AI 的执行过程留下可检查的轨迹

TraceAgent Trace 指的是记录 Agent 执行过程的机制。

当 AI 只是帮你改一句话时,不需要复杂记录;但当它开始改代码、处理客户数据、调用接口、发送消息时,你就需要知道:

  • 它读了哪些文件?
  • 它改了哪些内容?
  • 它为什么做这个决定?
  • 哪一步引入了问题?
  • 人类有没有审核?
  • 出问题后能不能追责和回滚?

这就是 Trace 的价值:不是让 AI 更会回答,而是让 AI 做过的事可以被检查、复盘和追责。

这里还要注意一个名字相近的工具:Trae

名称更像什么重点
Trace / Agent Trace过程记录和审计机制记录 AI 做了什么,方便检查、归因和回滚
TraeAI 编程 IDE / Agent 工具帮开发者写代码、读项目、改文件

简单说:Trace 是“记录过程”,Trae 是“帮你编程”。

到底应该用哪个?给新手的选择路线

如果你还是不知道怎么选,可以直接按下面的路线走。

你是谁 / 你要做什么优先选择暂时不用急着选
完全零基础,只想体验 AIChatGPTClaudeKimi豆包通义OpenClawHarness
学生 / 写作者 / 办公用户ClaudeChatGPTKimiWorkBuddy复杂 Agent 框架
刚学编程ChatGPTClaudeCopilotCursor让 Agent 自动重构大项目
日常开发者Claude CodeCodexCursorTrae没有权限控制的自动执行脚本
团队技术负责人编程 Agent + Trace + 代码审查流程只看模型榜单,不建流程
想做自动化工作流WorkBuddyOpenClawMCPHarness直接给 Agent 全盘权限
企业内部落地Harness、权限系统、审计、评测、私有化模型只靠个人聊天账号处理敏感数据

一个更稳妥的上手顺序是:

  1. 先用聊天产品:学会把任务说清楚。
  2. 再用 AI IDE / 编程 Agent:让 AI 读代码、改小功能、跑测试。
  3. 再用办公 / 桌面 Agent:让 AI 处理文件、表格、PPT 和多步骤任务。
  4. 最后再考虑 Harness 和 Trace:当你需要长期运行、团队协作、权限控制和审计时再引入。

最重要的是,不要一开始就追求“全自动”。

AI 工具越自动,越要慢慢放权:先让它建议,再让它修改,最后才让它执行。

普通人的七天入门练习

如果你刚开始用大模型,可以用一周时间做下面这些练习。

这些练习不需要编程,也不需要任何专业背景。关键是把它放进真实生活和工作里。

天数练习示例问题
第 1 天解释一个你最近没看懂的概念“用生活类比解释什么是大模型”
第 2 天改一段你自己写的话“把这段话改得更清楚、更自然”
第 3 天总结一篇文章“把这篇文章总结成 5 条要点,并列出作者观点”
第 4 天让它当老师“请围绕这个知识点给我出 5 道练习题,并给答案”
第 5 天制定一个计划“帮我设计一个 14 天英语口语练习计划”
第 6 天做一次决策分析“我该买平板还是笔记本?请按场景列优缺点”
第 7 天完成一个真实任务初稿“帮我写一封申请延期提交作业的邮件,语气礼貌”

练习时可以刻意观察三件事:

  1. 你给的信息越多,回答是不是越贴近需求?
  2. 你要求输出格式后,结果是不是更容易使用?
  3. 你指出问题让它修改后,结果是不是明显变好?

如果答案是肯定的,你就已经理解了大模型使用中最重要的部分:它不是一次性答案机器,而是可以迭代的协作者。

大模型最容易犯哪些错?

大模型回答问题时经常很流畅、很自信,甚至排版也很漂亮。但这不代表它一定正确。

大模型最容易犯的五类错

常见风险主要有五类。

1. 一本正经地编造

大模型可能会编出不存在的论文、作者、链接、法律条文、统计数据,甚至给出看起来很像真的引用。

所以,当你问它事实性问题时,最好要求它给出来源,并自己核验来源是否真实。

2. 把旧信息当成新信息

有些模型没有联网能力,有些模型的知识更新不及时。它可能不知道最新政策、最新产品价格、最新模型名称或最新公司动态。

如果问题和“当前时间”有关,最好使用可联网搜索的工具,或者自己查官方资料。

3. 数学和精确计算出错

大模型擅长解释数学思路,但不总是擅长精确计算。简单算术它也可能算错,复杂计算更应该交给计算器、电子表格或代码。

一个实用方法是:让模型写出计算过程,再用可靠工具验证结果。

4. 误解你的真实意图

如果你只说“帮我写一个方案”,它不知道你要商业方案、课程方案、活动方案,还是项目方案。

你越不提供背景,它越需要猜;猜得越多,答偏的概率越高。

5. 格式正确但内容错误

这是最容易迷惑人的地方。

大模型可以把错误内容写得非常整齐:有标题、有表格、有编号、有结论,看上去很专业。但形式好看不等于内容可靠。

因此,越重要的事情,越不要只问一次。

你可以让模型做这些自检:

请检查你刚才的回答中,哪些部分是确定的,哪些部分需要进一步验证。
请从反方角度质疑这个方案,指出它最可能失败的三个原因。
请列出你回答中依赖的关键假设。如果这些假设不成立,结论会怎样变化?

这类追问能显著提高结果质量。

从“会用”到“用好”:下一步该学什么?

当你开始有意识地给背景、提要求、检查结果、继续追问时,你其实已经进入了 Prompt Engineering 的世界。

正确使用大模型的闭环

从这里往后,你可以继续学习几个更进阶的主题,帮助你建立对 Agent 的整体认知,并理解驱动 Agent 运转的大语言模型基础。如果你只是想要学会使用大模型,读到这里就可以了。

章节内容你将获得
第1章 什么是 Agent?Agent 的定义、架构、历史与应用场景建立完整的概念框架
第2章 大语言模型基础LLM 原理、Prompt Engineering、API 调用熟练驾驭 Agent 的"大脑"

开始学习:第1章 什么是 Agent?