第 2 课:零基础入门——从豆包开始
🎯 核心实操目标
学习目标:改掉像和 Siri 或客服那样只和 AI 发简短指令的习惯。本节课结束时,你需要掌握基于上下文窗口的【深度增量干预法】,理解如何通过“定干、添枝、塑叶、收束”的逐步控制策略稳步推进,引导大模型产出符合学术要求的输出。
📋 课前准备(5 分钟自检)
账号
- [ ] 豆包(必备,国内零基础友好):doubao.com
- [ ] 至少一个海外平台账号(任选其一):GPT-5 / Claude 4.8 / Gemini 2.5
工具/环境
- [ ] 一台可上网的电脑(Windows / Mac / Linux 均可)
- [ ] 任意浏览器(推荐 Chrome / Edge / Safari 最新版)
- [ ] 一份用于记录提示词与对话的本地笔记(Markdown / Word / Notion)
数据/素材
- [ ] 一段你自己工作/学习中真实卡住的文字问题(用作实操对象)
应急通道
- 海外平台无法访问 → 用国产替代:Kimi K2 / DeepSeek V3 / 通义千问
- 浏览器卡顿 → 关闭其他标签后重试,AI 网页对内存敏感
- 不会注册 → 加入课程答疑群索取注册教程
场景导入:为什么它总是答非所问,措辞也不得体?
当一位初次接触 AI 的研究生需要给导师或期刊编辑写一封正式的请求信时,常见的指令是这样的:
‘帮我写封邮件给我导师,问他要上次组会那份原始问卷数据。’几秒钟后,AI 返回了一封措辞别扭的邮件,里面甚至包含类似
老师您好,请尽快把数据发我,谢谢。这种像在催进度、缺乏分寸感的表达。使用者感到失望,觉得 AI 不好用,于是关掉了网页。 但问题其实在于:这位新手没有向工具交代完整的【框架前提】。要充分调用模型的能力,需要学会用【逐层追问法】反复校准它的输出边界。
指令迭代漏斗:逐层收紧约束
高质量的学术产出很少能靠一句话直接生成,它依赖于你在多轮对话中不断收紧约束的过程。请看下面这条“指令逐步收紧链”:
实战拆解:向导师请求查阅数据的多轮追问流程
📋 模拟场景:你的硕士论文要做交叉验证,需要用到上学期组会上王老师课题组采集的那份问卷原始数据。数据由王老师掌握,你得写封邮件,得体地申请查阅。
动作一:先做一次“低约束指令测试”
你可以在豆包里直接用日常口语输入:
“你能帮我写封邮件给我的导师王老师吗?上学期组会他们课题组做过一份问卷调查,我想问他要那份原始数据,用来给我的硕士论文做交叉验证。”
AI 由于缺乏明确的边界约束,会在一两秒内给出回复。此时即使你觉得这份初稿质量不佳,也不要关闭窗口或新开话题。 接下来要在这个【上下文窗口】内继续迭代修正。
动作二:用明确的负面表述(Negative Prompting)介入纠偏
直接在刚才的对话框里给出明确的批评意见和新的框架约束。这相当于触发模型的自我修正机制:
请重写。上一稿过于粗糙,读起来像在向老师派任务、催进度,不符合学生给导师写信的分寸。
【新的身份设定】
请扮演一位深谙中文学术语境、措辞谦和得体的高年级博士生,懂得如何在尊重导师的前提下,
把一个具体请求说清楚、把诚意和边界都交代到位。
【红线约束 (Negative Prompts)】
1. 不要使用“请尽快”“麻烦您今天发我”这类设定截止时间、催促对方的表达。
2. 不要用“把数据发我”这种像在派活的祈使句,改成征询、申请的口吻。
3. 不要超过 250 字,导师邮件通常只快速浏览前几行。
【核心要求】
开头要具体说明我用这份数据要做什么(交叉验证)、会如何使用与署名致谢,
让请求有来由、可评估,而不是一句空泛的“我想要数据”。🔬 原理插页:为什么"留在同一对话里收紧约束"会有效?
本节这套迭代法不是玄学,它的有效性可以用几条关于大模型行为的、确凿而通俗的事实来解释。理解了原理,你才知道它何时管用、何时一定失灵。
为什么多轮迭代比重开更有效——上下文窗口(context window)。 大模型在生成每一个字时,都是依据它当前"看得见"的全部文本(本轮对话的提问与回答)来预测下一个最可能的词。这段它能看见的文本,就是上下文窗口——可以理解为模型本轮对话的"工作记忆"。你留在同一对话里给出第二版、第三版指令时,初稿、你的批评、新的约束都还在窗口内,模型是在"已经读过前文"的基础上改写;一旦关窗重开,前文清空,模型又得从你那句话从零猜意图。这就是"迭代默认、重开最后"的底层原因:你是在往同一段工作记忆里持续追加约束,而不是每轮推倒重来。(注意:上下文窗口有长度上限,对话拉得过长、前文会被挤出窗口而"被遗忘"——这正是后文"边界与局限"要谈的失效点之一。)
为什么"绝不要…"这类负向约束能把模糊评价变成可执行边界——负向提示(negative prompting)。 模型的指令遵循能力来自训练:它在海量"指令—回应"语料上学会了"把用户写明的要求落到输出里"。但它能落实的,只是写明的、可被对照的要求。"写得太差"是一个评价,没有指向任何具体文本特征,模型无从把它转成动作,于是往往倾向于输出一版换汤不换药的稿子。而"绝不出现'把数据发我'""绝不超过 250 字"这类负向提示,把一个模糊的好恶切成了一条条可逐字核对的边界——模型在生成时更容易避开被点名的表达。一句话:可被你一眼核对的约束,通常也是模型更能执行的约束。
为什么最后要锁格式——输出锁定(output locking)。 模型默认会用它在训练语料里见得最多的方式来排版和措辞,这未必是你要的形态。输出锁定就是把终端产物的形态(纯 Markdown 文本块、占位符记号、附一张句式表)也写成明确指令,把这部分不确定性也收掉,让产出"复制即用"。
📦 术语小框(本节关键词,括注标准英文)
- 上下文窗口(context window):模型在本轮对话中"看得见"的全部文本范围,相当于它的工作记忆;超出上限的早期内容会被挤出而不再影响生成。
- 负向提示 / 负向纠偏(negative prompting):用"绝不…/不要…"的否定句,明确堵死你最不想出现的表达或行为,把模糊评价转成可核对的边界。
- 输出锁定(output locking):在指令中明确规定终端产物的格式、记号与结构,压缩排版与形态上的不确定性。
- 幻觉(hallucination):模型生成了看似合理、实则与事实不符或凭空捏造的内容(如不存在的日期、对方没说过的话)。因为它按语料概率预测文字、并未接入可信事实数据库,故而无法自行保证真伪。
- 中介(mediator):本课语境下,指你作为"人"在模型与最终用途之间承担把关与负责的角色——模型产出,你核对并对内容负责。
动作三:锁定一致的输出格式(Output Locking)
当模型经过反复纠偏、输出了得体的邮件后,在复制进邮箱之前,对排版做一次统一规整:
这一稿已经很接近要求。现在请基于上面这封成型的邮件,做最后的格式整理:
1. 把信中需要我手动填空的部分(例如:[我的姓名]、[我的研究方向]、[拟使用的数据范围]),
全部用醒目的 【⚠️注意替换】 标记高亮出来。
2. 以无边框的纯净 Markdown 文本块发给我。
3. 额外提取这封信中 5 个最体现“向师长得体提出请求”的实用句式,在信件下方单列一张句式表,
并简要说明各自适用的场合,作为我以后写正式邮件的个人模板库。💡 【纠偏前后对照】
到这一步,AI 的输出已经摆脱了明显的“催进度”口吻。它会输出诸如: “尊敬的王老师:您好!冒昧来信,是想就上学期组会中您课题组采集的那份问卷数据,向您提出一个请求……我计划用它对自己论文的核心结论做一次交叉验证,使用时将严格遵守您提出的任何条件,并在成果中充分致谢数据来源。” 信件下方不但高亮了你需要替换的地方,你还得到了 5 条例如 “冒昧来信,是想就……向您提出一个请求” 这样的句式积累,可以作为以后写正式邮件的模板库。这就是迭代引导带来的效果。
📑 完整对照:动作一初稿 vs 动作二纠偏稿(逐句 diff)
上面只贴了纠偏稿的开头两行,仅凭这两行很难看清“低约束初稿到底差在哪、纠偏到底改了什么”。下面把两版邮件全文并排贴出,并对每一处改动标注“从 X 改成 Y、为什么”。请对照着看——这是迭代效果的可见证据。
点开:动作一「低约束初稿」AI 原样输出全文(生硬)
主题:要数据
王老师:
您好!我是您带的学生。上学期组会您课题组做了一份问卷,我想要那份原始数据。
我需要它来给我的硕士论文做交叉验证。麻烦您今天有空把数据发我一下,谢谢。
盼回复。
学生 [我的姓名]
这就是“动作一低约束指令”常见的真实产物:主题行像在派任务、“我想要那份原始数据”是直白的索取、“您课题组做了一份问卷”说不清是哪份、“麻烦您今天……发我”在给导师设截止时间、“盼回复”略显催促。生硬,但先别关窗口——它正是动作二要修改的原料。
点开:动作二「纠偏稿」AI 原样输出全文(约 240 字,得体)
主题:关于借阅上学期组会问卷数据的请求([我的姓名])
尊敬的王老师:
您好!冒昧来信,是想就上学期组会上您课题组采集的那份问卷数据,向您提出一个请求。
我目前的硕士论文研究方向是 [我的研究方向],需要一份独立来源的数据对自己的核心结论做交叉验证。我想到您课题组那份问卷在测量维度上与我的研究高度契合,如蒙您应允,我希望能查阅其中 [拟使用的数据范围] 部分。我会严格遵守您提出的任何使用与署名条件,仅用于本人论文,并在成果中充分致谢数据来源;如需签署数据使用承诺,我也随时配合。
我知道您事务繁忙,这份请求不急,您方便时回复即可。若有任何不便,也请您直言,我完全理解。
顺颂 研祺!
学生 [我的姓名] [我的院系/专业] · [学号]
逐句对照改了什么、为什么:
| # | 动作一初稿(X) | 动作二纠偏稿(Y) | 为什么这样改 |
|---|---|---|---|
| 主题行 | 要数据 | 关于借阅上学期组会问卷数据的请求([我的姓名]) | 原标题像在派任务;新标题点明“具体是哪份数据 + 是谁”,导师一眼知道来意,也感到被郑重对待 |
| 开场 | 您课题组做了一份问卷 | 就上学期组会上您课题组采集的那份问卷数据,向您提出一个请求 | 含混指代换成具体、可识别的来源,并以“提出一个请求”定调,谦和而清楚 |
| 身份与来由 | 我是您带的学生 | 硕士论文研究方向是 [我的研究方向],需要一份独立来源的数据做交叉验证 | 补全研究背景与用途,让请求有可供评估的来由,而非含糊伸手 |
| 索取 | 我想要那份原始数据 | 如蒙您应允,我希望能查阅其中 [拟使用的数据范围] 部分 | 直白索取换成征询句式,把“给我”改成“在您应允下能否查阅”,且限定范围、不漫天要数据,正是红线 1、2 的体现 |
| 条件 | (无) | 严格遵守任何使用与署名条件……如需签署数据使用承诺也随时配合 | 主动给出使用边界与致谢承诺,降低导师共享数据的顾虑 |
| 催促 | 麻烦您今天有空把数据发我 | 这份请求不急,您方便时回复即可 | 删去给对方设定的截止时间;并补一句“若有不便请直言”,给对方留出婉拒的余地 |
| 落款 | 学生 [我的姓名] | 学生 [我的姓名] / 院系专业 / 学号 | 落款补全院系与学号,便于导师核实你的身份、定位你是哪一届的学生 |
注意:右栏的
[我的研究方向]、[拟使用的数据范围]、[我的姓名]等中括号占位符,正是动作三里要被高亮成 【⚠️注意替换】 的盲区。两个动作在这里接上了。
🚫 反例:纠偏“没起效”的一次失败对话(不要这样纠偏)
并不是“回去说一句重写就会变好”。负向纠偏起效的前提是:你给了新身份、给了可核对的红线。只表达不满、不给新约束,模型只能原地打转。下面是一次会失败的纠偏:
不行,写得太差了,重写一封好的。模型大概率回你一版换汤不换药的稿子——因为“好”对它没有任何可操作的定义:
主题:申请数据
尊敬的王老师:
您好,见信佳。我很想要您课题组那份问卷数据用于我的论文,麻烦您方便时发我一下,非常感谢!
对比一下:它只是把“要数据”换成“申请数据”、加了句客套的“见信佳”,直白索取(很想要 / 发我一下)、来源含混、无研究背景、无使用条件这些真问题一个没解决。这就叫“原地打转”。
失败的根因,对照着改就能补上:
| 失败纠偏缺了什么 | 有效纠偏怎么补(见动作二) |
|---|---|
| 没给新身份 | “你是措辞谦和得体、深谙中文学术语境的高年级博士生” |
| 没给可核对的红线 | “绝不用‘把数据发我’;绝不设截止时间催促;绝不超过 250 字” |
| 没说好在哪/坏在哪 | “要具体说明用途(交叉验证)与署名承诺,让请求有来由” |
| 没锁输出格式 | “Markdown 纯文本块;待填处用占位符标出”(动作三) |
一句话:“写得太差”是评价,不是指令。模型不能执行评价,只能执行约束。
🛠️ 逐要素「写砸 vs 写好」:每一行红线怎么写才有效
动作二里那几条负向约束,本身也有“写砸”和“写好”之分。同一个意思,写法不同,模型的执行效果天差地别。下面把这门手艺拆开看——左列是新手常写的、模型抓不住的版本,右列是可核对、可执行的版本:
| 要素 | ❌ 写砸(模糊、不可核对) | ✅ 写好(具体、可一眼核对) | 差在哪 |
|---|---|---|---|
| 身份设定 | “你是个专业的人” | “你是措辞谦和、深谙中文学术语境的高年级博士生” | 左边没给模型任何可模仿的语体;右边锁定了语气 + 身份 + 适用场景 |
| 语气红线 | “别太生硬” | “绝不用‘把数据发我’这类祈使句,改成征询、申请的口吻” | “生硬”是感受、无法执行;右边点名具体短语,模型能逐字规避 |
| 长度红线 | “短一点” | “绝不超过 250 字,导师通常只看前几行” | “短一点”没有标尺;右边给了可量的数字 + 理由,理由能帮模型判断取舍 |
| 称赞/铺垫 | “开头客气点” | “开头具体说明用途(交叉验证)与署名承诺,让请求有来由” | “客气”会换来空洞套话;右边要求内容上的具体,而非礼貌词堆砌 |
| 占位符 | “该填的地方留一下” | “待我手填处(姓名、研究方向、数据范围)用 【⚠️注意替换】 高亮” | 左边模型会自己瞎编一个名字;右边明确哪些字段留空、用什么记号标 |
| 输出形态 | “给我弄好看点” | “以无边框的纯净 Markdown 文本块输出” | “好看”因人而异;右边指定确定的文件形态,复制即用 |
读法:每条红线都应能通过“别人能不能照着这句话检查你的成品”这一测试。“别太生硬”没法检查,“没出现‘把数据发我’”一眼就能查。能被核对的约束,才是模型能执行的约束。
📧 英文版同款示例(写给外国学者,方法完全一致)
如果你的真实场景是给外国导师或期刊编辑写英文信,三步方法一字不改地照搬——只是把语种和礼貌惯例换成英文。下面是同一套流程的英文版加餐,帮你保留双语技能。
动作二·英文纠偏提示词(提示词仍用中文写,约束的是英文产出):
请重写。上一稿过于粗糙,通篇带有中式英语直译的痕迹,未达到学术沟通的标准。
【新的身份设定】
请扮演一位拥有 20 年常青藤名校实验室经验的双语研究者,擅长撰写措辞克制、谦逊、
同时保有学术平等对话感的英文信件。
【红线约束 (Negative Prompts)】
1. 不要使用 "I want your data" 或 "Give me" 这类带有强迫意味的生硬短语。
2. 不要超过 200 词,对方通常只会读前 3 行。
【核心要求】
第一段需要具体、内行地称赞对方的实验控制变量设计,体现出同为研究者的共鸣。动作一「英文低约束初稿」AI 原样输出(生硬):
Subject: Asking for your data
Dear Professor Smith,
I am a master student. I read your paper in Nature last year. It is very good and useful for me.
I want your dataset in the paper. I need it to do cross-validation for my master thesis. Please give me the data.
I hope you can send me the data soon. Thank you very much.
Best, [Your Name]
动作二「英文纠偏稿」AI 原样输出(约 180 词,得体):
Subject: Inquiry regarding the dataset from your 2025 Nature study
Dear Professor Smith,
I am writing to express my admiration for your 2025 Nature paper. I was particularly struck by the methodological elegance of your control-variable treatment, which has reshaped how I think about confounding in cross-sectional survey work.
I am a master's candidate at [我的研究机构名称], and my thesis examines [我的研究主题]. With your permission, I would be most grateful for the opportunity to consult the underlying multi-source survey dataset, which I hope to use for a cross-validation of my own findings. I would of course be glad to follow any conditions of use you deem appropriate, and to acknowledge the source fully in any resulting work.
I understand your time is limited, and I am happy to wait at your convenience. Thank you very much for considering this request.
With great respect, [我的真实姓名] [我的研究机构名称] · [我的院系/导师]
英文版逐句对照:
| # | 初稿(X) | 纠偏稿(Y) | 为什么这样改 |
|---|---|---|---|
| 主题行 | Asking for your data | Inquiry regarding the dataset from your 2025 Nature study | 原标题像在催促;新标题点明“具体哪篇研究” |
| 开场 | It is very good and useful for me. | the methodological elegance of your control-variable treatment | 空泛恭维换成内行、具体的赞叹 |
| 索取 | I want your dataset. Please give me the data. | With your permission, I would be most grateful for the opportunity to consult … | 祈使句换成请求句式,正是红线 1 |
| 催促 | I hope you can send me the data soon. | I am happy to wait at your convenience. | 删去给对方设定的截止时间 |
中英文唯一的差别在“礼貌惯例”:英文重
With your permission / at your convenience这类让渡主动权的措辞,中文重“冒昧来信 / 不急 / 您方便时”的谦辞与留白。三步骨架(低约束初稿 → 负向纠偏 → 格式锁定)完全相同。
🧩 换一个学科:经管面板数据的对外沟通(Case B 实例)
上面的例子是“心理/问卷”味的师生沟通。但同一套三步法,迁移到经管、理工、医学任何需要正式书面沟通的场景都成立。这里换一个完全不同的学科——经管面板数据——走一遍,让你看清“变的只是背景,方法没变”。
📋 模拟场景(紧扣课程 Case B):你在做一篇区域经济论文,用的是 30 个省 × 10 年的面板数据(核心列:数字经济指数 DigEcon_Index、每万人人力资本 HumanCap_per10k、创新指数 Innovation_Index)。你发现某省某年的 DigEcon_Index 缺失,需要写邮件向某省级统计/数据机构的对接人,咨询该指标的口径与可否补全。
动作一·低约束初稿提示词:
帮我写封邮件给省统计局对接的张老师,问一下 DigEcon_Index 这个指标某一年为什么缺了,能不能补给我。模型会给你一封含混的邮件(“想问下那个指标怎么没了,能不能发我”)。别关窗口,进入动作二。
动作二·负向纠偏提示词:
请重写。上一稿太随意,像同学间聊天,且没说清是哪个指标、哪一年、哪个省,对方无法核对。
【身份设定】
你是一位严谨、专业的经管领域研究者,熟悉与统计/数据机构的规范沟通。
【红线约束(绝不要)】
1. 绝不含混指代,必须写明【具体省份+具体年份+具体指标列名 DigEcon_Index】。
2. 绝不用“发我一下”这类祈使,改成咨询口径、申请协助的口吻。
3. 绝不超过 250 字。
【核心要求】
先说明用途(区域经济面板的实证研究)与该缺失值对分析的影响,再礼貌咨询:
该指标的统计口径是什么、该年份缺失是口径调整还是尚未发布、是否有可引用的替代来源。预期输出(动作二纠偏稿,得体且信息完整):
主题:关于 [某省] [某年] 数字经济指数(DigEcon_Index)口径的咨询
尊敬的张老师:
您好!我目前在做一项基于 30 省、近十年面板数据的区域经济实证研究,其中数字经济指数(DigEcon_Index)是核心解释变量之一。在整理数据时,我注意到 [某省] [某年] 的该指标暂缺,这会影响该省该年观测值的纳入。
想向您请教三点:一是该指标当前采用的统计口径;二是上述年份的缺失,是源于口径调整、数据尚未发布,还是其他原因;三是若暂无官方值,是否有可供引用的权威替代来源。任何信息我都会规范引用并致谢。
这一咨询不急,您方便时回复即可。十分感谢!
此致 敬礼!
[我的姓名] [我的院系/专业] · [联系方式]
动作三·格式锁定提示词(与中文主例完全一致,此处从略):要求把 [某省] [某年] [我的姓名] 等待填处用 【⚠️注意替换】 高亮、输出纯净 Markdown、并附 5 条“向机构规范咨询”的句式表。
看出来了吗?学科从心理换成经管、对象从导师换成机构对接人、内容从借数据换成咨询口径——但三步骨架一动没动。你真正带走的是“低约束初稿 → 负向纠偏 → 格式锁定”这套迁移能力,而不是某一封信的模板。
⚠️ 常见误区速查(本节技能最易踩的 5 个坑)
下面这 5 个错误,几乎是新手在“用对话逐步引导模型”时一定会遇到的。对照纠正方法逐条排查:
| # | 常见误区 | 后果 | 纠正方法 |
|---|---|---|---|
| 1 | 初稿不满意就关窗重开,每次从一句话开始 | 丢掉上下文,模型每轮都从零猜你的意图,永远到不了得体稿 | 留在同一对话窗口里接着纠偏,让模型记住前文(动作二) |
| 2 | 只会说“写得太差,重写”,不给新约束 | 模型换汤不换药、原地打转(见上文反例) | 把“评价”翻译成“可核对的约束”:新身份 + 红线 + 好在哪 |
| 3 | 负向约束写成“别太生硬”这类感受词 | 模型无法把感受落成动作,照样生硬 | 红线必须点名具体短语/数字(如“绝不用‘把数据发我’;绝不超 250 字”) |
| 4 | 让模型直接替你填姓名、机构、数据范围 | 模型瞎编一个,你不检查就发出去,闹笑话甚至出错 | 用 [占位符] 留空 + 【⚠️注意替换】 高亮,手填处自己核对(动作三) |
| 5 | 拿到得体稿就直接复制发送,不做事实核查 | 邮件里 AI 替你补的细节(如不存在的日期、老师没说过的话)可能失实 | 发送前用四维质检(事实/逻辑/格式/引用)过一遍,人对内容负责 |
这 5 条里,误区 2、3 是本节的核心命门:负向纠偏之所以失败,九成是因为给的是“评价”而非“可核对的约束”。
🔁 首版输出仍不满意?这样迭代
走完三步,偶尔还是会拿到一份“没踩到点”的稿子。这很正常——不要关窗重来,迭代成本远低于重开。按下面的顺序排查,通常一两轮就能收敛:
- 先定位是哪一步漏了:是动作二的红线不够具体(最常见),还是动作三的格式没锁死?回到上面的「写砸 vs 写好」表,逐条比对你给的约束属于哪一栏。
- 把不满意点翻译成新红线:如果它又写长了,就加“绝不超过 N 字”;如果它又开始空泛恭维,就加“绝不用‘很好/很有帮助’这类词,赞叹必须具体到某项研究设计”。每发现一个毛病,就补一条可核对的负向约束——这正是 第 2 课负向纠偏法 的复用。
- 仍不收敛,就给它一个范例:把上面中文主例的纠偏稿贴给它,说“照这个语气和结构重写我的场景”。给模型一个好样板,往往比再描述十句更有效。
- 最后才考虑重开:只有当对话被你前面的错误指令“带偏”到难以挽回时,才新开窗口——但这时请把已经打磨好的「填好的 3 步模板」一次性贴进去,而不是又从一句话开始。
一句话:迭代是默认动作,重开是最后手段。模型的“记性”(上下文窗口)是你最廉价的资源,用满它。
🧱 边界与局限:迭代法救不了什么
把这套迭代法讲透,也包括诚实地告诉你它不是万能的。下面几种情形,再多轮纠偏也收不回来——识别它们,能省下你大量原地打转的时间。
- 根本信息缺失,不是措辞问题。 迭代只能改进"怎么说",改不了"无米下锅"。如果连"是哪一年、哪个省、哪个指标列名"你自己都没告诉模型(如 Case B 里
DigEcon_Index的缺失年份),那它写出的任何"得体邮件"里的关键事实都是它替你补的——很可能是凭空生成的(即幻觉 hallucination)。这时该停下补信息,而不是再纠偏一轮。 - 任务本身需要可信外部事实,而模型并未接入数据库。 模型按训练语料的概率预测文字,没有接入一个可信的事实数据库,也无法核实它写下的数字、日期、引文是否为真。凡是邮件里出现具体数据、文献、对方说过的话,都属于你必须逐项核对的范围——这正是误区 5 与课程"四维质检"的红线所在。漂亮的措辞不等于属实的内容。
- 对话已被前面的错误指令带偏。 上下文窗口里若塞进了太多互相矛盾或被你否定过的版本,模型有时会倾向于在错误版本附近打转。此时正确动作不是继续在这条对话里加约束,而是新开窗口、把已经打磨好的"填好的 3 步模板"一次性贴进去(见上一节第 4 点)——这是"换条干净的工作记忆",而非"从一句话重来"。
- 对话过长、前文被挤出窗口。 上下文窗口有长度上限。一段对话拉得很长后,最早的设定(如最初的身份与红线)可能被挤出窗口而"被遗忘",于是模型像是"忘了"你前面的约束。现象是它又犯了你早就纠正过的毛病;对策是把关键约束重新贴一遍,或干脆用合并好的成品指令重启。
- 该换的是思路,不是提示词。 如果同一目标你已迭代四五轮仍不收敛,往往说明问题不在"约束写得不够细",而在任务框定本身——比如这件事根本不该靠一封邮件解决,或你要的产物超出了模型力所能及的范围。此时该退一步重新框定问题,而不是继续打磨措辞。
准确性与伦理提醒:模型可以替你起草,但署名、寄出、并对内容真伪负责的,始终是你这个"中介(mediator)"。把它生成的事实当作"待核查的草稿",而不是"可直接采信的结论"——这条红线贯穿全课程。
✅ 把方法落成 3 步可核对清单
本课的“深度增量干预法 / 定干添枝塑叶收束 / 逐层追问法”这些名称,记不住也没关系。真正要带走的,是下面这张自己就能逐条打勾核对的清单。任何一封要 AI 帮你写的邮件、审稿回复、合作申请,都可以按这 3 步进行:
| 步骤 | 你要做的事 | 自检标准(做到了打勾) |
|---|---|---|
| ① 交代背景与动机 | 说清你是谁、为什么写、要对方做什么 | [ ] 写明了身份与机构 [ ] 写明了请求的来由(不是匿名伸手) |
| ② 写 ≥2 条「绝不要」负向约束 | 用否定句堵死你最怕出现的表达 | [ ] 至少 2 条以 “绝不…” 开头 [ ] 每条都可被一眼核对(如“绝不用‘把数据发我’”) |
| ③ 锁定输出格式与占位符 | 指定文件形态,并把待填处留成占位符 | [ ] 指定了格式(如 Markdown 纯文本块) [ ] 用 [占位符] 标出所有待替换盲区 |
下面是把这 3 步填好的一个范例,可直接套用改写(这就是动作二+动作三合并后的“成品指令”长什么样):
① 背景与动机:
我是 [我的院系/专业] 的硕士生,研究方向是 [我的研究方向]。上学期组会上王老师
课题组采集过一份问卷数据,我希望能查阅其中 [拟使用的数据范围] 部分,
用于我毕业论文的交叉验证。请据此写一封中文邮件。
② 负向约束(绝不要):
- 绝不使用“把数据发我”“请尽快”“麻烦您今天发我”这类祈使或催促句式。
- 绝不超过 250 字。
- 绝不含混指代,须写清是哪份数据、用途、以及使用与署名承诺。
③ 输出格式与占位符:
- 以无边框的纯净 Markdown 文本块输出。
- 凡需我手填处(姓名、院系、研究方向、数据范围)一律用 【⚠️注意替换】 占位符高亮标出。
- 信末附 5 条本封信用到的得体请求句式 + 适用场合说明,单列一张句式表。把它存进你的工具箱:换数据场景时,只需替换 ① 里的研究背景即可。例如你处理的是课程数据集,①可写成“我在分析 Case A 的 AI 焦虑问卷(含反向题
Anxiety_4_R),需向数据提供方说明清洗口径”;或 Case B 的省级面板(核心自变量DigEcon_Index)、Case C 的模型评估(质量评分列Quality_GPT5)。②③ 两步原样照搬,约束和格式是通用的。
📦 本课交付物
按本节实操任务完成并提交以下内容(提交 AI 初审),按 Module_Rubrics.md 对应维度评分:
- [ ] 本节实操产出:本节任务区块要求的具体文件 / 文本 / 截图
- [ ] AI 协作日志:至少 1 段完整的"任务描述 → AI 输出 → 人工修正"对话记录
- [ ] 四维质检记录:用
Course_QA_Checklists.md(事实/逻辑/格式/引用)核查本节 AI 输出的笔记 - [ ] 沉淀模板:将本课关键 Prompt / 流程 / 检查清单加入你的个人工具箱
🏁 本章小结
把本节的要点凝练成下面几条,供你复习时据以回想;能用自己的话把每条讲清楚,本节就算掌握了。
- 核心方法是"三步迭代",不是"一句话生成"。 低约束初稿 → 负向纠偏 → 输出锁定。高质量学术产出来自多轮收紧约束的过程,而非单次提问。
- 三步之所以有效,各有其原理。 留在同一对话里迭代,是因为上下文窗口(context window)把前文当作模型的工作记忆;负向提示(negative prompting)有效,是因为模型只能落实"写明且可核对"的要求,把模糊评价("写得太差")转成可逐字核对的边界("绝不出现'把数据发我'")才能被执行;输出锁定(output locking)则把排版与形态的不确定性也收掉,让产出复制即用。
- 评价不是指令,约束才是。 衡量一条红线好坏的唯一标准,是"别人能不能照着这句话检查你的成品"。能被一眼核对的,模型通常也更能执行。
- 方法可跨学科迁移,模板不能。 心理问卷(Case A)、经管面板(Case B)、模型评估(Case C),变的只是背景,三步骨架一动没动。你带走的应是迁移能力,而非某一封信。
- 迭代有边界,人是最终中介。 根本信息缺失、需要可信外部事实、对话被带偏或拉过长时,迭代救不回来——该补信息、该重启、该换思路。模型可能产生幻觉(hallucination),事实真伪与署名责任,始终由你这个中介(mediator)承担。
自测清单(做到了打勾):
- [ ] 我已经完整体验了一次从“给出粗糙初稿”到“用负向批评引导它重新组织”,再到“锁定填充格式”的多轮迭代流程。
- [ ] 我明白以后即使第一次回答较为粗糙,也不必直接重开窗口,而是可以利用“上下文记忆纠错”和“负向校准”,引导模型逐步逼近准确结果。
- [ ] 我理解了熟练的 AI 使用者并不是用一句话“写文章”,而是在较长的对话过程中用框架逐步明确系统的边界。
- [ ] 我能用关于大模型行为的通俗事实,解释"为什么留在同一对话里迭代比重开有效""为什么负向约束比一句'写得太差'管用"。
- [ ] 我能说出至少两种"迭代也救不了"的情形,并知道那时该补信息、重启还是换思路。
🧠 思考与练习
下面四道题用于把本节概念真正用起来(区别于交付物的实操任务)。每题附有"好答案要点",自评时对照核对。
练习 1(原理辨析) 有同学说:"AI 第一次没写好,关掉重开一个新对话准没错。"请用本节学到的上下文窗口概念,说明这句话在多数情况下为何反而更低效;并指出一种"重开确实更优"的例外情形。
好答案要点:抓住"前文是模型的工作记忆,重开即清空、模型要从一句话重新猜意图"这一机制;例外应落在"对话已被错误指令带偏/拉得过长前文被挤出窗口",且重开时要把成品 3 步模板一次性贴入,而非从一句话重来。
练习 2(把评价改写成约束) 下面是一条无效的纠偏指令:"这封信写得太客气了,也太长,重写得专业一点。"请把它改写成至少 3 条可一眼核对的负向/具体约束,使模型能够执行。
好答案要点:每条都点名具体短语或可量数字、且可被第三方核对,例如"绝不超过 200 字""绝不使用'感激涕零''万分荣幸'这类过度客套词""开头第一句须直接说明来信用途"。凡仍是"专业一点""别太长"这种感受词,即未达标。
练习 3(跨学科迁移,扣 Case C) 你在做 Case C 的 LLM 评估数据集(300×3,列 Quality_GPT5/Quality_Claude47/Quality_Gemini25,由 3 名标注者按 1–5 分打分)。你发现三位标注者对同一批样本打分一致性偏低,需要写邮件向其中一位标注者澄清评分标准。请只写出动作二(负向纠偏)的提示词。
好答案要点:身份设定为严谨、尊重标注者劳动的研究者;红线须点名具体列名与评分量表(如"须写明是
Quality_Claude47这一列、1–5 分制""绝不质问对方'你怎么打这么低'这类指责口吻");核心要求应包含说明用途(评估标注一致性)、给出可对齐的评分锚点,而非笼统"请你打分准一点"。
练习 4(边界判断) 某同学就同一封求数据邮件已经和模型迭代了六轮,每轮都在加红线,信却始终"差口气"。请判断:他下一步最该做的是"再加一条更细的负向约束",还是别的?说明你的依据。
好答案要点:识别这已落入本节"边界与局限"——多轮不收敛往往不是约束不够细,而是根本信息缺失或任务框定有问题;正确动作是退一步检查"是不是有关键事实没给模型/这件事是否本就不该靠一封邮件解决",必要时换思路或补信息,而非继续打磨措辞。
