Skip to content

第 9 课:模块一综合实战与复盘

🎯 核心实操目标

学习目标:融会贯通。作为第一大章节的结业节点,由于后续进入第二、第三模块后需要进行较高强度的写作发表与数据处理,请确保你已经将【BROF 提示词法】、【费曼解析】和【四维漏斗校验】熟练掌握、内化为习惯。

📋 课前准备(5 分钟自检)

账号

  • [ ] 豆包(必备,国内零基础友好):doubao.com
  • [ ] 至少一个海外平台账号(任选其一):GPT-5 / Claude 4.8 / Gemini 2.5

工具/环境

  • [ ] 一台可上网的电脑(Windows / Mac / Linux 均可)
  • [ ] 任意浏览器(推荐 Chrome / Edge / Safari 最新版)
  • [ ] 一份用于记录提示词与对话的本地笔记(Markdown / Word / Notion)

数据/素材

  • [ ] 一段你自己工作/学习中真实卡住的文字问题(用作实操对象)

应急通道

  • 海外平台无法访问 → 用国产替代:Kimi K2 / DeepSeek V3 / 通义千问
  • 浏览器卡顿 → 关闭其他标签后重试,AI 网页对内存敏感
  • 不会注册 → 加入课程答疑群索取注册教程

场景导入:别让方法只停留在收藏夹里

“收藏提示词很容易,容易让人误以为收藏了就等于会用。但真正的水平差异,往往出现在遇到真实且复合型难题时——你能否迅速把多种方法组合调用。接下来的考核不提供任何可一键复制的完整提示词,需要你依靠前 8 节课积累下来的方法与判断来解决这套复合问题。”


模块一能力综合回顾

回顾我们在 Module 1 中学到的三大核心方法,它们将在这次综合考核中组合为一套完整的解题方案。

Step 1: BROF 搭骨架+Step 2: 费曼解释+Step 3: 四维校验

🔬 原理:这三个方法为什么能串成一条解题链

要理解为什么是"BROF 搭骨架 → 费曼解释 → 四维校验"这个顺序,得先回到一个关于大模型的基本事实:它本质上是在按训练语料里的统计规律,预测"下一个最可能出现的词"。由此可以推出三条可观察的行为,三大方法恰好各自对应其中一条:

  • 为什么需要 BROF(先约束):模型没有"任务边界"的内在概念,它只会顺着上文把"看起来该接下去的话"continue 下去。提示词约束得越松(如"帮我写份大纲"),它越倾向于补全成一篇信息量最大、最完整的长文——因为训练语料里"大纲"常与大段正文相伴出现。BROF(Role/Background/Objective/Format)的作用,可理解为在第一步就把输出空间收窄,让"最可能的下一段"从"长篇作文"变成"克制骨架"。这也解释了任务一里"提示词越松、废话越多"的现象。
  • 为什么需要费曼(再翻译):模型解释专业术语时,往往会复述训练语料中该术语周边最常共现的表达——而 HLM 这类术语在语料里几乎总是和"系数、方差、随机效应"绑定出现。于是不加约束时,它会给你一段"换成中文但仍是术语"的解释。费曼法通过显式压低身份、锁定单一生活比喻,把它引导到另一片语料分布(日常生活叙述),从而绕开术语堆叠。
  • 为什么需要四维校验(最后兜底):这是整条链最关键的一环。因为模型并没有接入一个可信的事实数据库,它生成"参考文献[1]-[6]"或某个统计量时,靠的是"这里出现一条文献/数字在统计上很合理",而非"我查到了这条文献"。这种与事实无关、却语法通顺的编造就是下文要定义的"幻觉"。它无法靠把提示词写得更好来根除——只能靠输出之后的人工核验拦截。所以四维校验必须放在链条末端,作为前两步无法覆盖的事实性兜底。

一句话原理:BROF 管"少说废话",费曼管"说人话",四维管"说真话"——三者分别针对模型"会过度补全、会堆术语、会一本正经编造"这三种倾向,缺一不可,且顺序不可随意调换。

📖 关键术语精确定义

本节反复用到下面几个术语,先给出标准定义与英文,便于你在后续模块中对照文献:

术语英文定义(本课用法)
幻觉hallucination模型生成的内容语法通顺、看似可信,但与事实不符或无法溯源(如凭空生成的文献、数据)。源于它预测"像样的下一个词"而非查证事实。
上下文窗口context window模型在本轮对话中能同时"看到"的全部文本范围。迭代纠偏之所以要在同一窗口内进行,正是因为换窗口会丢失之前积累的约束。
负向提示 / 负向纠偏negative prompting通过明确告诉模型"不要做什么"(如"删除全部正文""禁止出现某术语")来收窄输出,而非只表达"不满意"。
中介(变量)mediator自变量 X 通过它影响因变量 Y 的中间变量(如本课的"脱发感知""人力资本")。X→M→Y 是一条解释路径,非直接因果。

综合实战:课题组的三个真实障碍(期中综合练习)

📋 本节情境: 你正在牵头负责高校“大学生熬夜与脱发抑郁的跨学科纵向干预研究”课题组。下周就要提交开题经费审核以及申报书盲审。 目前你遇到了三个关键障碍,请打开你的 Kimi/ChatGPT/Claude,利用前八课的方法逐一解决:

任务一:用 BROF 搭起大纲框架

困境:你只有一个初步概念“熬夜掉发抑郁”,尚未形成课题申报书的目录框架。 任务动作:请你回忆 第 3 课第 5 课 提及的【BROF 要素法】与【骨架与填充增量写作法】,编写一段约束力较强的提示词,引导大模型只输出 5 个重点章节的树状课题大纲。

  • 验收要求:AI 返回的结果中不应包含冗余长文或虚构的段落,仅保留克制、专业的结构化骨架。
参考处理路径

Prompt 示例

text
【Role】严格的课题评审专家
【Background】仅有“熬夜与脱发抑郁的横向研究”模糊痛点
【Objective】帮我用BROF骨架法拆解5个章节的大纲,要求使用极简结构,仅保留章节标题与核心自变量、因变量,不要生成任何正文段落。

📊 合格答卷 vs 不合格答卷(任务一对照)

判分关键不在"AI 给没给大纲",而在你的提示词有没有约束住输出边界。下表对照同一题的两种提示词与各自真实输出:

维度❌ 不合格(提示词过松)✅ 合格(提示词克制)
提示词写法"帮我写一份熬夜掉发抑郁的课题申报书大纲"限定 Role / Objective / 输出格式,明确"只要 5 章树状骨架、只列标题与变量、禁止正文"
真实输出形态返回 1500+ 字正文,每章配两段背景论述,还自行虚构了"参考文献[1]-[6]"返回一棵 5 节点的纯标题树,每章只挂核心自变量/因变量
为什么不合格你拿到的是一篇半成品作文,删改成本比自己写还高;虚构文献是事实性污染骨架可直接复用,变量关系一眼可见,无需二次清洗
✅ 合格输出范例(克制骨架,可直接复用)
课题大纲(树状骨架,仅标题+核心变量)
├─ 1. 研究背景与问题提出
│     └ 现象:高校学生熬夜普遍化
├─ 2. 文献综述与理论框架
│     └ 自变量 X:睡眠剥夺(熬夜时长/规律性)
├─ 3. 研究假设与变量界定
│     ├ 中介 M:脱发感知/躯体化压力
│     └ 因变量 Y:抑郁倾向得分
├─ 4. 研究设计与数据采集
│     └ 设计:纵向追踪(多时点重复测量)
└─ 5. 数据分析与预期贡献
      └ 方法:纵向多层次线性轨迹模型(HLM)

全程零正文、零虚构文献——这才是 BROF "骨架与填充"要的交付物。

❌ 不合格输出片段(过松提示词的真实产物)

"第一章 绪论 随着当代高等教育竞争日益激烈,大学生群体的作息紊乱已成为不容忽视的公共健康议题。大量研究表明,长期熬夜不仅……(后续连续 6 段背景铺陈)。参考文献:[1] 张某某. 睡眠与情绪. 2021……"

问题诊断:① 输出了你没要的正文,把"列大纲"做成了"写论文";② [1]-[6] 文献是 AI 凭空生成、无法溯源的——这正是 BROF 要靠"约束力极强的提示词"在第一步就切断的污染源。

🔁 换一个学科再走一遍 BROF(经管面板 · Case B)

上面的示例是心理/纵向题材。BROF 的价值在于跨学科可迁移——同一套"骨架与填充"的约束,换到经管的省级面板研究上一字不改地照用即可。这里用课程配套的 Case B(30 省 × 10 年面板:核心自变量 DigEcon_Index 数字经济指数 → 中介 HumanCap_per10k 人力资本 → 因变量 Innovation_Index 区域创新能力)走一遍,让经管/统计方向的学员看到迁移路径。

参考提示词(经管版 BROF,仅换变量、约束结构不变)
text
【Role】严格的经济学申报书评审专家
【Background】研究"数字经济发展水平对区域创新能力的影响:人力资本的中介作用",数据为 30 省×10 年面板(2014–2023)
【Objective】用 BROF 骨架法拆解 5 个章节的开题大纲。要求极简结构:仅保留章节标题,并在对应章节挂出核心自变量(DigEcon_Index)、中介变量(HumanCap_per10k)、因变量(Innovation_Index)与计量方法。
【Format】纯树状结构,每章只列标题+变量,不写任何正文段落,不虚构任何文献。
✅ 预期输出(克制骨架 · 可直接复用)
课题大纲(树状骨架,仅标题+核心变量)
├─ 1. 研究背景与问题提出
│     └ 现象:区域间数字经济发展不均衡
├─ 2. 文献综述与理论假设
│     ├ 自变量 X:数字经济发展指数 DigEcon_Index
│     └ 中介 M:人力资本 HumanCap_per10k
├─ 3. 变量测量与数据来源
│     └ 因变量 Y:区域创新能力 Innovation_Index(面板 30省×10年)
├─ 4. 计量模型与识别策略
│     └ 方法:双向固定效应面板回归 + Bootstrap 中介检验
└─ 5. 实证结果与政策启示
      └ 稳健性:替换 Y 为 PatentApps_per10k 复核

对照心理学版本可以发现:变量名、方法名变了,但"只给标题、只挂变量、零正文、零虚构文献"的骨架约束完全一致——这就是 BROF 在学科间迁移的方式。换到你自己的医学/教育课题时,同样只需替换 Role 的学科与三类变量名。

任务二:用费曼方法把术语讲清楚

困境:在生成的课题大纲中,AI 建议你使用一种名为 “纵向多层次线性轨迹模型估计法 (HLM)” 的统计方法。你一时无从理解。 任务动作:请你回忆 第 6 课,写一句提示词,要求 AI 不使用数学公式,而是使用“在马路上记录汽车过闸打卡”或类似贴近日常的生活比喻,向你解释这种模型到底是在测什么。

  • 验收要求:你看完它的比喻后,能够清楚地理解“原来它测的就是这个”。
参考处理路径

Prompt 示例: 我是一个纯文科生,看不懂任何数学公式。请用“在马路上记录汽车过闸打卡”这种贴近生活的比喻,帮我通俗解释“纵向多层次线性轨迹模型估计法 (HLM)”到底是在测算什么。

✅ 把"是否真正理解"拆成可勾选的三条(任务二验收标准)

"是否理解"是主观的,不易评判。把它拆成三条客观可核对的指标——三条全部满足才算合格:

#合格费曼解释必须满足自检方式
1零公式:全程不出现任何数学符号、希腊字母、"系数/方差/估计量"等术语原词通读一遍,出现一个公式即判不合格
2一个生活场景贯穿到底:从头到尾只借用同一个比喻(如菜市场),不中途换喻体数一下喻体个数,>1 即扣分
3能一句话复述:你看完后能用自己的话,不看原文复述出"它到底在测什么"合上屏幕复述,卡壳即未达标
✅ 合格范例:HLM 的"菜市场摊位"比喻(零公式 · 单一场景贯穿)

把每个被追踪的学生想成菜市场里的一个摊位,连续几个月每天去记一次这个摊位的"抑郁分数"。

如果你只算全市场所有摊位的平均涨跌,会犯一个错:A 摊在菜场东头、人流大,B 摊在角落、本来就冷清——把它们的逐日数据混成一锅算平均,等于无视了"摊位之间天生不一样"。

HLM 干的事,就是分两层来看

  • 第一层(摊位内部):先单独盯住每个摊位,看它自己这几个月是越来越旺还是越来越淡——这是每个学生自己的变化轨迹
  • 第二层(摊位之间):再回过头比,为什么有的摊位一路走旺、有的一路走淡?是不是"靠门口"(熬夜多)的摊位普遍越走越淡?——这是用学生层面的差异去解释他们各自轨迹的不同。

所以一句话复述:HLM 是先量出每个人自己随时间怎么变,再去解释"人和人之间为什么变得不一样"——而不是把所有人搅成一杯平均水。

对照验收三条:① 全程无一个公式 ✅;② 从头到尾只用"菜市场摊位"一个喻体 ✅;③ 末尾那句加粗就是可复述的一句话 ✅。

❌ 不合格范例(看似讲解,实则未通俗化)

"HLM 即 Hierarchical Linear Model,它通过在 Level-1 估计个体随时间的斜率系数,再在 Level-2 用组间方差成分解释随机效应,从而……"

不合格点:出现了"斜率系数/方差成分/随机效应"——专业术语换成中文表述后依然难以理解,违反第 1 条;既没有生活场景,也无法一句话复述。这种回答说明你的提示词没有把"禁止术语 + 锁定单一生活比喻"的约束明确写入。

🛠️ 提示词写好 vs 写砸(逐要素对照)

任务二的成败,几乎全押在你怎么写那句提示词上。同一个意图,措辞差一点,输出就从"看完秒懂"滑到"换了壳的术语"。下面拆成四个要素,逐条给出 ❌ 写砸 / ✅ 写好的具体写法:

要素❌ 写砸的写法✅ 写好的写法差别为何致命
身份设定"解释一下 HLM""我是纯文科生,看不懂任何公式"不声明知识水平,AI 默认按"同行"讲,必然堆术语
比喻约束"用通俗的话讲讲""只用'马路过闸打卡'这一个比喻,从头到尾不许换""通俗"是模糊词;不锁定单一喻体,AI 会中途跳喻把人讲晕
术语红线(不提)"禁止出现系数、方差、估计量、Level-1 等任何术语原词"不画红线,AI 会把术语翻成中文照搬,等于没解释
验收钩子(不提)"最后用一句话总结'它到底在测什么'"不要求收尾的一句话,你就没有可复述的抓手

一句话记法:身份压低、喻体锁死、术语拉黑、结尾留一句——四个钩子都写进提示词,输出才稳定合格。

任务三:识别并防范学术伦理与数据合规风险

困境:在课题的数据收集计划一栏中,AI 给出了如下步骤:“为保证追踪精度,我们将利用辅导员权限收集各宿舍 500 名全体样本青年的学号、每日门禁人脸监控录像片段以及宿舍路由器抓包流痕,然后统一交给 ChatGPT 进行异常行为特征标记提取。”任务动作:作为课题的学术合规负责人,请你识别出这段话中可能违背学术伦理并引发严重后果的风险点。结合 第 8 课 的内容,写出正确的处理思路。

  • 验收要求:明确指出其中涉及过度追踪与隐私暴露的数据项,并要求实施本地“模糊脱敏(泛化标识法)”处理。
参考处理路径

关键风险:利用辅导员权限收集“学号、人脸监控、路由抓包”属于对隐私的严重侵犯。将这批实名数据上传给公有云大模型,会带来严重的数据泄露风险和科研伦理违规。 处理思路:必须在断网的本地环境进行隔离处理,删除学号和人脸数据,将高度敏感的行为数据泛化合并(例如计算总体活跃度评分),确认无害后再进行模型训练或辅助标记。

💡 工具印证:腾讯 Marvis(marvis.qq.com)提供的"隐私/端侧模式"正是这一原则的产品化体现——该模式下文件留在本地处理、可断网使用、敏感文件不上传云端,与本节"敏感数据先在本地脱敏、不上云"的思路一致。

⚠️ 一个常见但错误的处理反例(任务三反面教材)

很多人识别出风险后,会给出一个"看起来很负责"的方案,却仍然出错。请先判断下面这条思路错在哪,再看解析:

❌ 错误处理思路

"我让 AI 先帮我把人脸数据打码再上传——这样上传给云端模型的就是打过码的,应该就安全了。"

错在哪(三连问拆解)

  1. 谁来打码? 你说"让 AI 帮我打码"——可 AI 在云端。要让云端 AI 给人脸打码,你必须先把没打码的原始人脸传上去。脱敏动作发生在数据已经离开你电脑之后,等于先泄露再补救,顺序根本反了。
  2. 打码=脱敏吗? 打码只是遮挡像素,它不是合规意义上的脱敏。学号、宿舍门禁时间戳、路由抓包流痕这些身份关联字段只要还在,结合外部信息照样能反推到具体个人;只糊一张脸解决不了"可识别个人"的根本问题。
  3. 数据落地谁负责? 一旦原始片段进了公有云大模型的服务器,它是否被留存、被用于训练、传到了哪个司法辖区,你都失去控制。科研伦理审查看的是"原始敏感数据有没有出过你的可控环境",而这条思路从第一步就把答案变成了"出过"。
❌ 错误思路(先传后脱敏)✅ 正确思路(先脱敏后出门)
脱敏发生的位置云端(数据已离开本地)本地断网环境
原始人脸/学号是否上云(致命)否,本地即删除
给模型看到的打了码但仍含身份字段的原始片段已泛化的总体指标(如活跃度评分)
是否过审否,原始敏感数据出过可控环境

一句话纠正:脱敏的基本原则是"敏感数据离开本地之前,先在本地把它变得不敏感"——任何"先上传、再让云端帮我处理干净"的顺序,本质上都已经构成泄露。正确做法仍回到上面的"参考处理路径":本地隔离 → 删除学号与人脸 → 行为数据泛化合并 → 确认无害后才考虑交给模型。


⚠️ 三任务常见误区速查

下表汇总本节三项技能里学员最常踩的坑——每条都给出"为什么错"与"怎么改对",做最后一遍自查时对照即可。

任务常见误区纠正方法
一 · BROF提示词写成"帮我写一份大纲",把约束全交给 AI 自由发挥把 Role/Objective/Format 三段写死:限定学科身份、只要 5 章树状骨架、明文禁止正文与文献
一 · BROF拿到 AI 自带的"参考文献[1]-[6]"就直接抄进申报书这些是凭空生成、无法溯源的;BROF 阶段就该用"禁止虚构文献"切断,引用统一留到模块二真实检索
二 · 费曼提示词只说"通俗一点",没声明自己的知识水平显式压低身份("纯文科生、看不懂公式"),AI 才会真正降维,而非按同行讲
二 · 费曼没锁定单一比喻,AI 中途从"菜市场"跳到"工厂流水线"在提示词里写明"只用这一个比喻、不许换喻体",并要求结尾给一句可复述的总结
三 · 合规先把原始人脸/学号传上云,再让云端 AI"帮忙打码脱敏"顺序反了即已泄露;脱敏必须发生在数据离开本地之前,本地断网完成后才考虑上云
三 · 合规以为"打码遮脸"就等于脱敏,保留了学号/门禁时间戳等身份字段打码≠脱敏;只要身份关联字段还在就能反推个人,须删除或泛化所有可识别字段

🧭 解题链的系统用法:何时用哪一招、哪些题不适用

本节示范的是三招"按顺序全用"的标准链,但真实研究里你不会每次都从头跑完整条链。把它当成一套可按需调用的工具,而非固定流程。下表给出何时用何者、以及边界条件:

你面对的卡点主用方法是否需要其余两招
有想法、缺结构(要大纲/框架/分类)BROF 搭骨架若骨架里出现你不懂的术语→补费曼;只要 AI 生成了文献/数据→必上四维
看不懂某个术语/方法/公式费曼解释通常单独用即可;但若解释里又冒出新术语,可对新术语再走一次费曼
AI 给了具体事实(文献、数字、统计量、引文)四维校验永远单独都要做——这是不可省略的一招
涉及真人数据、隐私、上传敏感材料(不在三招内)合规前置判断先过合规红线,确认可上云后再谈用哪招

链的三种典型变体(按场景裁剪,不必都跑满):

  1. 完整链(本节考核形态):结构 + 术语 + 事实三类卡点同时存在 → BROF → 费曼 → 四维,逐步走完。
  2. 轻量链:只是想让 AI 帮忙搭个框架、且输出里没有任何事实声明 → 只用 BROF + 一次四维"格式/逻辑"快检即可,可跳过费曼。
  3. 纯校验链:你已有成稿,只想核查 AI 之前生成的内容是否可信 → 直接上四维,跳过前两招。

这条链不适用(或不够用)的边界

  • 需要最新、可溯源的真实文献时——本节明确禁止采信 AI 自带的"参考文献[1]-[6]"。三招都无法凭空变出真实文献,这件事要留到模块二:深度文献获取用真实检索完成。
  • 涉及真人敏感数据时——任何方法都不能替代合规判断。哪怕提示词写得再克制,把原始人脸/学号上云这一步本身就已违规(见任务三)。
  • 需要精确数值计算或定理证明时——模型按概率续写,对长链算术与严格推导并不可靠;这类任务应交给统计软件/计算工具,AI 只用于解释思路。

🚧 边界与局限:三招各自在什么情况下会失效

诚实地标出每一招的失效条件,比记住它"怎么用"更重要——下面每一条都扣住"模型按概率预测下一个词、且不接事实库"这一根因:

  • BROF 的局限:它能收窄"输出形态"(让 AI 只给骨架),但管不住"内容真假"。一个约束良好的提示词同样可能产出一棵结构漂亮、却把变量关系设定错误的大纲。骨架的学术正确性仍需你自己判断,BROF 不替你背书。
  • 费曼的局限:生活比喻是"近似翻译",天然有损。比喻讲清了直觉,但往往会牺牲精确性——"菜市场摊位"能让你懂 HLM 在分两层看数据,却不能让你据此正确设定模型或解读系数。比喻用于入门理解,不能用于方法实操;真要动手跑 HLM,仍需回到正式教材。
  • 四维校验的局限:它能拦截幻觉,但拦截能力取决于核验者的水平。AI 编一条格式完美、作者年份齐全的假文献,只有你真的去检索才能识破——光靠"看起来对不对"会漏判。四维不是让 AI 自查(它自查同样可能自圆其说),而是要求人去外部信源核对

共同的红线:以上三招都建立在"AI 是协作者、不是事实权威"之上。一旦你把任何一招的输出未经核验直接当成定稿,方法就失效了——这也是本节交付物为何强制要求"四维质检记录"的原因。

🔄 首版输出不满意?回到迭代法,而不是重开窗口

完成上面三任务时,你大概率会遇到"第一版输出不达标"的情况——这是常态,不是失败。此时不要关掉窗口另起炉灶,正确动作是在同一个上下文里做负向纠偏与逐层收紧约束,这正是 第 2 课【指令迭代漏斗】与【负向纠偏 Negative Prompting】教过的方法。把它套到本节三任务上:

  • 任务一(BROF)输出仍夹带正文 → 别重写提示词,直接追一句负向约束:「上一版仍有正文段落,请删除全部正文,只留标题与变量的树状结构」,逐轮收紧到纯骨架。
  • 任务二(费曼)解释仍带术语 → 指着具体词纠偏:「你这版又出现了'系数''随机效应',请把这两个词替换成马路过闸的说法,并保持同一个比喻」——第 2 课强调过,有效纠偏的前提是"给出可核对的红线",而不是只说"再通俗点"。
  • 任务三(合规)方案仍把敏感数据上云 → 让它重排顺序:「请把所有脱敏动作移到'数据离开本地之前',并列出哪些字段必须在本地删除/泛化」。

记住 第 2 课的核心判断:负向纠偏起效的前提,是你给了新身份或新红线,而不只是表达不满。只说"重写""不满意",模型只能原地打转。


📦 本课交付物

按本节实操任务完成并提交以下内容,提交 AI 初审,按 Module_Rubrics.md 对应维度评分:

  • [ ] 本节实操产出:本节任务区块要求的具体文件 / 文本 / 截图
  • [ ] AI 协作日志:至少 1 段完整的"任务描述 → AI 输出 → 人工修正"对话记录
  • [ ] 四维质检记录:用 Course_QA_Checklists.md(事实/逻辑/格式/引用)核查本节 AI 输出的笔记
  • [ ] 沉淀模板:将本课关键 Prompt / 流程 / 检查清单加入你的个人工具箱

🏁 本章小结:模块一能力全图

模块一到此收尾。把九节课的能力凝练成一张图:所有方法都指向同一个判断——AI 是按概率续写、不接事实库的协作者,不是事实权威。围绕这个根认知,你应已掌握三层能力:

第一层 · 会约束输出(让它少说废话)

  • BROF(Role/Background/Objective/Format)把输出空间收窄,从"长篇作文"逼到"克制骨架";
  • 理解为何提示词越松、废话越多——模型倾向补全成"信息量最大"的形态;
  • 这套约束跨学科可迁移:心理问卷题与经管面板题(Case B)只换变量、约束结构不变。

第二层 · 会翻译与降维(让它说人话)

  • 费曼法(压低身份 + 锁定单一比喻 + 拉黑术语 + 结尾留一句)把术语讲成直觉;
  • 清楚比喻是"有损翻译"——管入门理解,不管方法实操。

第三层 · 会核验与守界(让它说真话、守红线)

  • 四维校验(事实/逻辑/格式/引用)拦截幻觉,尤其是凭空生成的文献与数字;
  • 守住学术伦理与数据合规红线:敏感数据出本地之前先在本地脱敏,打码≠脱敏;
  • 首版不达标时回到负向纠偏 + 迭代漏斗,在同一上下文窗口内逐层收紧,而非重开窗口。

贯穿三层的一条链:结构 + 术语 + 事实三类卡点同时出现时,按 BROF → 费曼 → 四维 串起来解;卡点单一时按需裁剪(轻量链 / 纯校验链)。这套判断,就是你带进模块二的核心装备。

✅ 自测清单

完成本节后,你应当已经能够较为熟练地使用和调度通用语言模型。

  • [ ] 针对上述三项任务,我已经能较快地构思出相应的解决策略,并写出合格的 Prompt。
  • [ ] 我能说出三招分别对治模型的哪种倾向(过度补全 / 堆术语 / 编造),以及为什么顺序不可随意调换。
  • [ ] 我能准确说出"幻觉""上下文窗口""负向提示""中介"四个术语的含义。
  • [ ] 我已经认识到,不应对 AI 抱有“点一下就自动生成一篇高质量成稿”的不切实际的期待。
  • [ ] 【归档】:我已将常用 Prompt 保存在本地笔记或备忘录中,准备进入模块二:深度文献获取

🧠 思考与练习

下面的题目用于检验你能否迁移本节概念,而非复述任务。建议动手写出提示词或答案后再对照"好答案要点"。

  1. 裁剪解题链:你已经有一份写好的研究方法段落,只想确认其中提到的两条文献和一个 Cronbach's α 数值是否可信。这种情况下,BROF / 费曼 / 四维三招你会用哪几招、跳过哪几招?为什么? 好答案要点:识别出这是"纯校验"场景——只需四维(尤其"引用/事实"两维,去外部信源核对文献与数值),可跳过 BROF 与费曼;并能说明跳过的理由是"此处无结构与术语卡点,只有事实可信度问题"。

  2. 诊断一次失败:你写了"请用通俗的话解释一下信度分析",AI 回了一段仍带"方差""一致性系数"的解释。请只改提示词、不换模型,写出修正版,并指出原提示词违反了任务二四要素中的哪几条。 好答案要点:定位到违反"身份设定(未压低)+ 比喻约束(未锁单一喻体)+ 术语红线(未拉黑)"三条;修正版应显式声明知识水平、指定唯一生活比喻、明文禁止"方差/系数"等词、并要求结尾一句可复述总结。

  3. 把原理讲给同学:用你自己的话(不超过 80 字)解释——为什么"AI 自带的参考文献[1]-[6]"不能直接抄进申报书,且这个问题无法靠把提示词写得更好来解决好答案要点:能讲到"模型按概率续写、不接可信事实库,文献是统计上'像样'的编造(幻觉)而非查证结果",因此根因在生成机制、不在提示词;只能靠输出后的人工外部核验(四维)拦截。

  4. 合规迁移到新场景(结合 Case A):课题组想把 Case A 心理问卷(N=500,含 Age 及 12 项 Anxiety 条目)整表上传给公有云模型做"自动异常应答检测"。请指出风险,并给出一个让数据可安全使用的最小改造方案。 好答案要点:识别整表含可间接识别个人的字段,须在本地断网环境先处理;改造方案应是删除/泛化直接与准标识字段(如对 Age 分箱、剔除任何编号),仅上传去标识后的条目级或汇总指标,并说明脱敏必须发生在"数据离开本地之前"——与任务三"先脱敏后出门"原则一致。

助力学者在 AI 时代极速产出高质量学术成果 · 55 课时双轨制 · plan v3.3