第 29 课：统计分析（五）中介效应 Bootstrap 检验

🎯 本课目标

学习目标：理解中介效应的统计含义（X 是否通过 M 影响 Y）、掌握 Bootstrap 法检验间接效应、并能区分部分中介与完全中介。本课你将用 Jamovi 的 jAMM 模块（或 SPSS Process 宏 Model 4）在 Case A 上跑通中介模型——AI 焦虑 → 学习策略 → 自我效能感——并把输出写成符合 APA 规范的中介结果段落。

📐 一句话先讲清楚：中介在回答什么问题

回归告诉你"X 与 Y 有没有关系"，中介进一步追问"这个关系是怎么发生的"——X 是直接作用于 Y，还是先改变了某个中间变量 M、再由 M 传导到 Y？本课的核心检验对象就是这条传导路径的强度，即间接效应 a×b。需要强调：中介是一个因果假设，统计只能检验"数据是否与该假设一致"，能否真正下因果结论取决于研究设计与理论（详见【边界与局限】）。

📋 课前准备（10 分钟自检）

工具/账号

[ ] Jamovi 2.5+ + jAMM 模块（菜单 → Modules → 安装 jAMM）
[ ] 备选：SPSS 29 + Process 宏 v4.2（Hayes 提供，processmacro.org）

数据/素材

[ ] 第 23 课清洗后数据
[ ] 三个核心变量：Anxiety_Mean (X) / Strategy_Mean (M) / Efficacy_Mean (Y)

应急通道

jAMM 装不上 → 试 medmod / GAMLj 等 Jamovi 中介模块，或退回 SPSS Process Model 4
间接效应 CI 含 0（不显著）→ 先确认这是不是真结论（如实报告即可）；再查反向题与共线，并把重抽样 5000→10000 让 CI 更稳定（这只减小蒙特卡洛误差，不会把真不显著的效应抽成显著）
报错跑不出 → 检查变量是否都为连续型、自变量是否高度共线（详见下文"结果不显著/跑不出来"排查）

场景导入：相关背后，机制是什么？

一名学生跑完相关与回归，确认了 AI 焦虑与自我效能感呈负相关（r≈−.26）：越焦虑，效能感越低。论文写到这里，审稿人留下一句批注——"为什么？这种负向关系是通过什么传导的？"
只报"X 与 Y 负相关"，停留在"相伴变化"层面，没有讲清机制。于是这名学生提出一个理论假设：AI 焦虑未必直接削弱效能感，而很可能先破坏了学习策略（焦虑的人更少有计划地学习），再由失效的学习策略拖低效能感。这就把一条单线关系，改写成一条X → M → Y 的传导链。
跑中介检验后，三条路径各自说话：
AI 焦虑显著负向预测学习策略：a = −.34，p < .001
学习策略显著正向预测自我效能感：b = .42，p < .001
间接效应 a×b = −.14，95% CI [−.20, −.09]，区间不含 0 → 间接路径成立
控制学习策略后，直接路径 c' = −.15，95% CI [−.22, −.08]，区间也不含 0 → 直接路径依然在
结论是"部分中介"：AI 焦虑既直接压低效能感，又通过破坏学习策略间接压低效能感——两条路并存。机制讲清楚了，故事才完整。这就是中介分析要做的事：不止说"有关系"，而是拆开"关系是怎么走的"。
注意：上面全程用的是"预测/传导"而非"导致"。横断面问卷下能不能把这条链称作因果，要留到【边界与局限】再谈。

🗺️ 中介效应模型：三条路径与四个系数

路径	含义
a	X 对 M 的直接影响（AI 焦虑 → 学习策略）
b	M 对 Y 的直接影响（控制 X 后）
c'	X 对 Y 的直接路径（控制 M 后）
c	X 对 Y 的总效应 = c' + a×b
a × b	间接效应（中介路径）—— 本课的检验目标

完全中介 vs 部分中介

判断标准只看两件事：间接效应 a×b 显著不显著、直接效应 c' 显著不显著。

完全中介（full mediation）：a×b 显著，c'（直接路径）不显著 → X 对 Y 的影响几乎全部经由 M 传导。
部分中介（partial mediation）：a×b 和 c' 都显著 → X 一部分经 M 传导，另一部分仍直接作用于 Y。
无中介：a×b 不显著（95% CI 含 0）→ 中介假设不成立，无论 c' 如何。

本课 Case A 属于部分中介：a×b 的 95% CI [−.20, −.09] 不含 0（间接成立），同时 c' 的 95% CI [−.22, −.08] 也不含 0（直接仍在）。两条路并存，故为"部分"。

⚠️ "完全/部分"是程度描述，不是质量评判

"部分中介"并不比"完全中介"低级——它只是如实说明"还有一条直接路径没被 M 解释掉"。真实社科数据里部分中介远比完全中介常见。切忌为了得到"更干净"的完全中介，去删变量或挑样本——那是数据造假。完全中介在小样本下还常常是"c' 检验功效不足"的假象（样本一大，c' 又显著了）。

📐 原理：中介效应在测什么、为什么这样检验

在动手跑 jAMM 之前，先把四个问题想清楚——这决定了你能不能正确解读输出，以及哪些话能说、哪些话不能说。

1. 在测什么：把一条总效应"拆成两段"

中介分析的数学骨架是一组回归方程。设 X=AI 焦虑、M=学习策略、Y=自我效能感：

总效应 c：只用 X 预测 Y（Y = c·X + …），衡量"不区分路径时，X 对 Y 的整体影响"。
a 路径：用 X 预测 M（M = a·X + …），衡量"X 对中介变量的影响"。
b 路径与直接效应 c'：同时用 X 和 M 预测 Y（Y = c'·X + b·M + …）。此时 b 是"控制 X 后 M 对 Y 的影响"，c' 是"控制 M 后 X 对 Y 的残余直接影响"。

三者满足一个恒等关系（在标准线性中介里）：

总效应 c ＝直接效应 c' ＋间接效应 a×b

中介分析的全部意义，就是把一条总效应 c 拆成"绕过 M 的直接部分 c'"和"经过 M 的间接部分 a×b"，再去检验那个间接部分 a×b 到底是不是 0。

💡 为什么间接效应是 a 乘以 b（不是 a 加 b）

把它想成一条"传导链"：X 先把自己的变化以强度 a 推给 M，M 再把收到的变化以强度 b 推给 Y。两段是串联的，总传导率是两段相乘——就像两级齿轮，最终转速是各级传动比之乘积，而非相加。所以间接效应 = a × b；把它写成 a + b 是本课最常见的硬错误之一。

2. 为什么要用 Bootstrap，而不是 Sobel 检验

要判断 a×b 是否显著，需要知道它的抽样分布（即"如果反复抽样，a×b 会怎样波动")。难点在于：a 和 b 各自近似正态，但两个正态变量的乘积 a×b 通常不是正态分布——它往往是偏态的。

老办法 Sobel 检验：强行假设 a×b 服从正态、用公式算一个标准误再做 z 检验。当 a×b 实际偏态时，这个正态假设不成立，导致置信区间不准、检验功效偏低，容易把真实存在的中介判成不显著。
Bootstrap 法（现代主流）：不假设 a×b 是什么分布，而是直接从数据里把它的分布"重抽样"出来——有放回地反复抽样 5000 次，每次都重算一遍 a×b，得到 5000 个估计值，再用这堆估计值的分位数构造置信区间。分布偏不偏态，Bootstrap 都照实呈现，因此对中介检验更稳健。

一句话：间接效应的抽样分布天生偏态，Bootstrap 不靠正态假设、直接逼近这个分布，所以优于 Sobel。

3. 前提假设（用之前先确认）

中介模型不是把三个变量丢进去就能信的，它依赖以下前提：

前提	含义	不满足会怎样
理论与时序方向正确	X→M→Y 的方向必须有理论支撑，最好 X 在时间上先于 M、M 先于 Y	方向反了，模型照样能跑出"显著"，但结论是错的（统计救不了错误的因果设定）
各回归方程线性、误差独立同方差	中介建立在线性回归之上，继承回归的全部假设	严重非线性时 a、b 估计有偏，间接效应失真
M 与 Y 无未控混淆	影响 M 和 Y 的共同第三变量需被控制（放进 Confounders）	遗漏混淆变量会让 b 与 c' 虚高或虚低（内生性）
测量可靠	X/M/Y 信度低会衰减路径系数	M 测得不准会低估间接效应（向 0 偏）

4. 常见误用（先记住，后面误区表还会展开）

把相关方向当因果链：横断面数据里 X→M→Y 和 Y→M→X 在统计上往往同样"拟合得好"，方向只能由理论定，不能由数据定。
只看 a、b 都显著就宣布中介成立：必须直接检验 a×b 的置信区间，不能用"a 显著且 b 显著"替代。
用 c 不显著否定中介：即便总效应 c 不显著，间接效应 a×b 仍可能显著（这正是 Bootstrap 取代经典四步法的原因，见下文）。

📘 关键术语（首次出现，先对齐定义）

中介变量（mediator, M）：位于 X 与 Y 之间、传导 X 对 Y 影响的变量（本课为学习策略 Strategy_Mean）。区别于调节变量（moderator）——后者改变 X→Y 的强弱方向，而非充当传导通道。
总效应（total effect, c）：不区分路径时 X 对 Y 的整体影响，c = c' + a×b。
直接效应（direct effect, c'）：控制中介 M 后，X 对 Y 的残余影响（"绕过 M"的那部分）。读作 "c-prime"。
间接效应（indirect effect, a×b）：经由 M 传导的那部分效应，等于 a 路径系数与 b 路径系数之乘积——本课的核心检验目标。
Bootstrap（自助法）：从样本中有放回地重抽样、反复重算统计量，以经验方式逼近其抽样分布的方法。用于在不假设正态的前提下为 a×b 构造置信区间。
偏差校正置信区间（bias-corrected and accelerated, BCa）：Bootstrap 置信区间的一种，对重抽样分布的偏态与偏差做了校正，是中介检验的常用报告口径。本课 jAMM 与 Process 均选此口径。
Sobel 检验（Sobel test）：用正态近似为 a×b 构造检验的经典方法；因 a×b 常偏态，已被 Bootstrap 大幅取代。
部分中介 / 完全中介：a×b 显著时，c' 仍显著为部分中介、c' 不显著为完全中介（定义见上）。

🚀 拆解实战 A：经典法 vs Bootstrap 法

经典 Baron & Kenny 四步法（已不推荐单独使用）

Step 1: X → Y 显著(c)
Step 2: X → M 显著(a)
Step 3: 加入 M 后, M → Y 显著(b)
Step 4: 加入 M 后, X → Y 不显著(完全中介)或减弱(部分中介)

问题：步骤 1 要求 c 显著，但实际上间接效应可以在 c 不显著时仍然存在！现代研究直接跳到 Bootstrap。

Bootstrap 法（现代主流）

核心思想：从数据中有放回地重抽样 5000 次，每次都计算 a×b，得到 5000 个间接效应估计，构造 95% 置信区间。

判断标准：

✅ 95% CI 不含 0 → 间接效应显著
❌ 95% CI 含 0 → 不显著

🚀 拆解实战 B：Jamovi jAMM 操作

安装 jAMM

Jamovi → 右上角"+"（Modules）→ jamovi library
搜索 jAMM（Advanced Mediation Models）
Install → 重启 Jamovi

跑中介

Analyses → jAMM → GLM Mediation Model
Dependent Variable (Y): Efficacy_Mean
Mediator (M): Strategy_Mean
Covariates (X): Anxiety_Mean
Confounders（控制变量）: Gender, Grade
Bootstrap：
- Method: Bias-corrected (BCa) Bootstrap（与下文报告口径一致）
- Number of Bootstrap samples: 5000
- Confidence Interval: 95%
运行

关键输出

═══════════════════════════════════════════════════
 路径              Estimate  SE     95% CI         p
───────────────────────────────────────────────────
 a (X→M)            -.34    .04    [-.42, -.26]   .000
 b (M→Y)             .42    .03    [.36, .48]     .000
 c' (X→Y, direct)   -.15    .03    [-.22, -.08]   .002
 c (X→Y, total)     -.29    .04    [-.37, -.21]   .000
 a×b (间接效应)     -.143   .025   [-.20, -.09]   ⭐
───────────────────────────────────────────────────
 间接效应/总效应: 49.3%(中介效应占比)
═══════════════════════════════════════════════════

📐 这张表怎么读（逐行翻译）

a = −.34、b = .42：两段路径都显著，传导链的"上游"和"下游"都通——但这只是必要条件，不是中介成立的判据。
c' = −.15，CI [−.22, −.08]：控制学习策略后，AI 焦虑对效能感仍有直接影响（CI 不含 0）→ 这是"部分中介"的标志（若 c' 不显著才是完全中介）。
c = −.29：总效应，满足 c = c' + a×b 即 −.15 + (−.143) ≈ −.29，正是"总 = 直接 + 间接"的拆解。
a×b = −.143，CI [−.20, −.09]：本表的主角。它只报 CI、不报 p——因为 Bootstrap 的判据就是"CI 含不含 0"。此处 CI 不含 0 → 间接效应成立。⭐ 标的就是这一行。
49.3%：间接效应占总效应的比例，是效应量参考，不能用它判定完全/部分中介（类型只看 c' 显著性）。

🚀 拆解实战 C：报告（APA）

为检验 H2(学习策略在 AI 焦虑→自我效能感路径中起中介作用),
采用 jAMM 进行 Bootstrap 中介检验, 重抽样 5000 次,
报告 95% 偏差校正置信区间。

路径系数显示:
- AI 焦虑显著负向预测学习策略(a = -.34, p < .001)
- 学习策略显著正向预测自我效能感(b = .42, p < .001)
- 控制学习策略后, AI 焦虑对自我效能感的直接效应
  仍然显著(c' = -.15, p = .002)

Bootstrap 检验显示, 学习策略在 AI 焦虑与自我效能感之间的
**间接效应显著**, ab = -.143, SE = .025, 95% CI [-.20, -.09]
(置信区间不含 0)。

间接效应占总效应的 49.3%, 表明学习策略起**部分中介**作用。
H2 得到支持。

中介结果段落：写砸 vs 写好

同一份 Bootstrap 输出，写成段落可以"勉强合格"，也可以"可直接投稿"。下面把中介报告最常见的失分点逐项拆开并排对照——左列是学员高频写法，右列是把同一处"拧紧"后的写法。

维度	写砸 ❌	写好 ✅	为什么
检验方法交代	做了中介分析，结果显著	采用 jAMM 进行 Bootstrap 中介检验，重抽样 5000 次，报告 95% 偏差校正（BCa）置信区间	不写方法、重抽样次数与 CI 口径，结果无法被复现与评估
间接效应证据	间接效应显著（p<.05）	间接效应 ab = −.14，SE = .025，95% CI [−.20, −.09]，区间不含 0	Bootstrap 的判据是CI 不含 0，不是 p 值；必须报出 CI 区间本身
中介类型判定	存在中介作用	控制 M 后直接效应 c' = −.15 仍显著（CI [−.22, −.08]），故为部分中介	"存在中介"含糊；要点明部分/完全并给判断依据（c' 是否显著）
效应方向解读	学习策略导致效能提升	AI 焦虑通过削弱学习策略，间接预测更低的自我效能感	横断面数据只能说"预测/传导"，写"导致"是越界（相关≠因果）
占比的表述	中介占比 49.3%，所以是部分中介	间接效应占总效应 49.3%（占比仅作效应量参考，中介类型由 c' 显著性判定）	中介类型看 c' 显著性，不能用占比判定完全/部分
假设回应	（只堆数字，不回到假设）	上述结果支持 H2：学习策略在 AI 焦虑→自我效能路径中起部分中介作用	结果段要回应你提出的研究假设，而非孤立罗列系数

💡 一句话判据

检验一段中介报告写得好不好，问四件事：重抽样次数与 CI 口径写了没？间接效应的 CI 区间报了没？部分/完全的判定依据（c'）给了没？有没有把"传导"误写成"导致"？ 四者都过关，这一段才从"报数字"升级成"讲清机制"。

🚀 拆解实战 D：SPSS Process 宏（备选）

如果只有 SPSS：

下载 Process v4.2：processmacro.org
安装到 SPSS（Process.spd 文件）
Analyze → Regression → Process
Model number: 4（简单中介）
X: Anxiety_Mean / Y: Efficacy_Mean / M: Strategy_Mean
Covariates: Gender / Grade
Bootstrap: 5000 次, Bias-corrected 95% CI
运行

🚀 拆解实战 E：让 AI 把中介输出翻译成结果段落

到这一步，a、b、c'、a×b 和 Bootstrap 置信区间都已由你在 jAMM/Process 里算好。AI 的角色是翻译官而非计算器：把你粘贴进去的输出，转写成符合 APA 规范、含中介类型判定与解读的段落。它不重新计算、不改动任何数值、不替你判定显著性——这是本课乃至整个量化模块的红线。

中介输出 → APA 段落提示词（一键复制）

markdown

【角色】APA 第 7 版格式严谨、熟悉 Bootstrap 中介检验的论文编辑。

【任务】下面是我用 Jamovi 的 jAMM 模块跑出的 Bootstrap 中介检验输出（粘贴整张表）。
请帮我撰写论文中"中介效应检验"段落（约 300 字），按以下结构：

1. 第一句：交代检验方法——jAMM、Bootstrap 重抽样 5000 次、95% 偏差校正（BCa）置信区间。
2. 第二至四句：依次报告 a 路径、b 路径、直接效应 c' 的系数与显著性。
3. 第五句：报告间接效应 ab，必须写出其 SE 与 95% CI 区间，并指明"区间是否含 0"。
4. 第六句：根据 c' 是否显著，判定为部分中介或完全中介，并给出判断依据。
5. 末句：回应对应的研究假设（H2）是否得到支持。

【严格约束】
- 数字一律逐字照用我粘贴的输出，严禁改动、四舍五入或自行计算任何统计量。
- 判断中介是否显著只看"间接效应 95% CI 是否含 0"，不要用 p 值替代，也不要自创显著性。
- 全段使用"预测/传导/经由"等措辞，严禁出现"导致/证明/造成"等因果动词
  （本数据为横断面，不能下因果结论）。
- 中介类型（部分/完全）只依据 c' 的显著性判定，不得用"中介效应占比"来判定。

【粘贴 jAMM 输出】[贴入]

🔢 这一步只"翻译"不"代算"

段落里出现的每一个数字——a、b、c'、ab、SE、置信区间——都必须来自你在 jAMM/Process 里亲手跑出的输出。任何时候 AI 给出的数字与你的软件输出对不上，一律以软件输出为准，并视为 AI 出错（见下文红线与误区表）。

🚀 拆解实战 F：常见误区与红线自检

⚠️ 中介分析三大红线

横截面数据不能推因果——只能说"X 通过 M 预测 / 传导到 Y"，不能说"X 通过 M 导致 Y"。
方向性不能颠倒：X → M → Y 的方向必须有理论与（尽量）时序支撑，不能反着跑；统计上反向模型常常同样"显著"，方向只能由理论定。
AI 不能替你跑中介——它只能翻译你跑出来的统计输出，绝不代算 a×b 或编造置信区间。

下表把学员与 AI 在中介分析里最高频的错误集中列出，照着对号入座即可：

常见误区	错在哪	正确做法
把 a×b 算成 a + b	间接效应是两段路径的乘积，不是相加（见原理）	间接效应 = a × b；以软件直接输出的 ab 为准
只看 a、b 都显著就宣布中介成立	"a 显著且 b 显著"不等于 a×b 显著，二者不可互相替代	直接看间接效应 a×b 的 95% CI 是否含 0
用 c（总效应）不显著否定中介	即便总效应不显著，间接效应仍可能显著	直接检验 a×b，别拿 c 当门槛（这正是弃用经典四步法的原因）
用占比判定完全/部分中介	"中介占比 100% = 完全中介"是错的，类型只看 c' 显著性	c' 显著→部分中介；c' 不显著→完全中介；占比仅作效应量参考
"完全中介意味着 X 不影响 Y"	完全中介下 X 仍影响 Y，只是全部经由 M 传导、没有直接路径	表述为"X 通过 M 完全传导到 Y"
"95% CI 含 0 但 p < .05"	数学矛盾：Bootstrap 用 CI 判显著，不该再出现与之冲突的 p	统一用 CI 判据；出现自相矛盾必是 AI 出错，弃用
把"通过/传导"写成"导致"	横断面数据给不出因果方向	全程用"预测/传导/经由"，因果留给纵向或实验设计
让 AI 代算 a×b 或编置信区间	大模型不接入数据、不做可信计算，输出多为幻觉	所有系数与 CI 在 jAMM/Process 亲手跑，AI 只翻译

🔧 结果不显著 / 跑不出来？如何排查

中介跑完，常见三类"不对劲"：间接效应 CI 含 0（不显著）、软件报错跑不出、AI 段落不达标。逐类对症，不要推倒重来。

间接效应 95% CI 含 0（中介不成立）→ 先确认这是不是真结论，而非急着"救"。
- 首先接受"不显著"也是合法结论：数据不支持该中介假设，本身就是一个发现，如实报告即可，不要为了显著去改数据或挑样本。
- 再排查技术性原因：① 检查反向题是否已正确反向计分（第 23 课），M 的方向错了会让 a 或 b 失真；② 确认 X/M/Y 的均值变量算对、量纲一致；③ 适度提高重抽样次数（5000 → 10000）让 CI 更稳定——但这只减少蒙特卡洛误差，不会把真不显著的效应"抽"成显著，若 10000 次后 CI 仍含 0，就是不显著。
- 检查是否漏控关键混淆变量：遗漏同时影响 M 和 Y 的第三变量，可能把真实的间接效应"洗掉"。
jAMM/Process 报错、跑不出 → 多为模块或数据问题。
- jAMM 装不上 → 换 medmod / GAMLj 等 Jamovi 中介模块，或退回 SPSS Process Model 4。
- 报"奇异矩阵/不收敛" → 多半是自变量间高度共线（如把两个 r≈.9 的变量同时放进去），或样本量过小；检查相关矩阵与 VIF。
- 变量类型不对 → 确认 X/M/Y 都被识别为连续型（Continuous），分类变量需先转码。
AI 段落不达标（改了数值、写成因果、误判类型）→ 局部纠偏，永远以你的输出为准。
- 它改动或编造了数值 → 最危险，直接弃用该句，并在提示词补"严禁改动我粘贴的任何数字，逐字照用"。
- 它把"传导"写成"导致" → 追加"全段禁用因果动词，只用预测/传导/经由"。
- 它用占比判完全/部分 → 追加"中介类型只依据 c' 显著性判定，不得用占比"。

一句话

首版不理想，先分清是真不显著（如实报告，别硬救）、软件/数据问题（查反向题、共线、变量类型）、还是翻译问题（局部纠偏 AI 段落）。无论哪种，红线不变：统计量只能由你算出，AI 只能翻译，不能代算或篡改；CI 含 0 就是不成立，不能粉饰。

边界与局限：中介分析与 AI 在这一步的能与不能

中介是"拆解机制"的有力工具，但它有明确的能力边界；AI 在这一步的角色更要划清。把下面几条记牢，比多跑一个模型更重要。

边界 / 失效场景	为什么会这样	你应该怎么做
横断面数据慎称因果	同一时点测得的 X、M、Y，统计上 X→M→Y 与 Y→M→X 往往同样拟合得好，数据本身分不出方向	措辞止于"预测/传导"；要下因果须用纵向（X 先于 M 先于 Y 测量）或实验/准实验设计
中介依赖正确的理论与时序	统计只检验"数据是否与设定的路径一致"，不验证路径方向是否为真；方向设错照样出显著结果	路径方向先由理论与时间顺序定好，再交给统计检验，不能用数据反推方向
CI 含 0 即不成立，不能粉饰	间接效应的 95% CI 含 0，意味着"间接效应与 0 无法区分"，这是统计判据，不可商量	如实报告不显著；不要靠加重抽样次数、删样本、换变量去"凑"出不含 0 的区间
遗漏混淆 → 间接效应有偏	影响 M 与 Y 的共同第三变量若未控制，会让 b、c' 乃至 a×b 系统性偏高或偏低（内生性）	把已知混淆变量放进 Confounders/Covariates；并在局限里声明未控变量的可能影响
显著 ≠ 效应大	大样本下很小的 a×b 也可能 CI 不含 0（显著），但实际传导量可能微不足道	报告 CI 之外，结合间接效应大小、占总效应比例与实质意义判断，别只看"显不显著"
AI 只能翻译，不能代算	大模型不接入你的数据、不做可信计算，让它"算一下中介"只会得到看似合理实则编造的系数与 CI（幻觉）	a、b、c'、a×b、CI 全部在 jAMM/Process 亲手跑；AI 仅把你粘贴的输出转写成规范段落

⚠️ 本课红线：AI 翻译结果，绝不代算统计量

贯穿整个量化模块的硬规则：凡是路径系数 a/b/c'、间接效应 a×b、标准误、Bootstrap 置信区间——一律由你在统计软件里算出，AI 的唯一职责是把这些已经算好的数字翻译成符合 APA 的中文段落。任何时候 AI 给出的数字与软件输出不一致，以软件输出为准，并视为 AI 出错。把"算"留给软件、把"写"交给 AI、把"判断"（方向、因果、显著与否）留给自己——三者不可混淆。

跨案例迁移：把同一套中介流程搬到 Case B 经管面板（一个反面警示）

上面 Case A 是一条"干净"的部分中介。中介的流程在任何学科都一样——设定 X→M→Y、跑 jAMM/Process、看 a×b 的 Bootstrap CI。下面换一个完全不同的领域演示迁移，同时它恰好是一个前提不满足时该如何收手的反面案例。

Case B 经管面板数据，30 省 × 10 年（2014—2023）= 300 观测，含 DigEcon_Index（数字经济指数）、HumanCap_per10k（每万人专科以上人力资本）、Innovation_Index（创新指数）。一个常见的理论设想是：数字经济（X）→ 人力资本（M）→ 创新（Y）——数字经济发展吸引并培育高技能人才，再由人力资本推动创新。形式上，这正是一个中介模型。

第一步永远是先看前提，而不是先跑模型

在把三个变量丢进 jAMM 之前，回到第 24 课跑出的相关与共线性诊断：

═══════════════════════════════════════════════════════════
 变量对 / 指标                              数值
───────────────────────────────────────────────────────────
 DigEcon_Index ↔ HumanCap_per10k (X↔M)     r ≈ .86 **
 DigEcon_Index ↔ Innovation_Index (X↔Y)    r ≈ .94 **
 VIF: HumanCap_per10k                       ≈ 8
 VIF: DigEcon_Index                         ≈ 5.5
───────────────────────────────────────────────────────────
 注: N = 300（省 × 年）。**p < .01。
═══════════════════════════════════════════════════════════

这组数字在中介分析里是红灯。原因在原理里讲过：b 路径和直接效应 c' 来自"同时用 X 和 M 预测 Y"的那个回归。当 X 与 M 高达 r≈.86、VIF≈8 时，回归很难把"X 的独立贡献"和"M 的独立贡献"分开——这就是多重共线性。后果是：a×b 与 c' 的系数极不稳定、标准误膨胀、符号都可能反转，Bootstrap 重抽样下区间会剧烈晃动。此时即便软件吐出一个"漂亮"的间接效应，它也不可解释、不可信。

⚠️ 这里为什么不给 Case B 的 ab 数值

本课对 Case A 给出了确切的 ab≈−.14、CI [−.20, −.09]，是因为那条链前提满足、估计稳定。Case B 不给具体 ab 与 CI——不是疏漏，而是因为在 r≈.86、VIF≈8 的共线条件下，任何具体数字都会误导：换个设定或重抽一次就可能大变。课程坚持"不编造统计量"，正确的教学动作是到此收手，而不是硬凑一个看似精确的中介结果。况且 Case B 的 R²≈.95 是模拟数据的人为偏高值（见第 24 课警示），更不能当成"中介很强"的证据。

正确的处理：先解决共线，再谈中介

面对这种数据，规范流程不是"照跑中介、照报数字"，而是：

先判明共线来源：DigEcon 与 HumanCap 是否在测量上高度重叠？理论上谁先于谁？
调整模型再检验：可考虑剔除或合并高度共线的变量、改用更长滞后结构、或换识别策略；待 VIF 回落到可接受区间（经验上 < 5）后，中介估计才有意义。
若坚持原设定，必须如实声明局限：在论文里写明高共线导致中介路径估计不稳，结论需谨慎——而不是把不稳的 a×b 当确凿证据。

🔁 迁移要点

对比 Case A 与 Case B：中介的操作流程一字不变（设定 X→M→Y → 跑 Bootstrap → 看 a×b 的 CI），变的只是数据是否满足前提。Case A 前提满足，得到可信的部分中介；Case B 自变量与中介高度共线，正确做法是先治共线、否则不报具体中介量。这正呼应原理里那张"前提假设"表——统计方法的可信度，取决于前提是否被满足，而不是软件能不能跑出数字。把"角色/变量"换成你学科的，但"先验前提、再信结果"的次序对谁都一样。

📦 本课交付物

按本节实操任务完成并提交以下内容，提交 AI 初审，按 Module_Rubrics.md 对应维度评分：

[ ] 中介模型路径图：A4 大小，标注 a / b / c / c' 系数与显著性
[ ] Bootstrap 输出表：含间接效应 a×b 的 95% 偏差校正（BCa）置信区间
[ ] 中介报告段落（约 300 字）：完整 APA 格式，含间接效应 CI 与中介类型判定依据
[ ] 中介效应类型判定：完全 / 部分中介，写明判断依据（c' 是否显著）
[ ] 四维质检记录：用 Course_QA_Checklists.md（事实 / 逻辑 / 格式 / 引用）核查 AI 段落，重点查"数字是否被改动、是否出现因果措辞、中介类型是否用占比误判"
[ ] 沉淀模板：将本课中介翻译提示词加入个人工具箱

🏁 本章小结

把本课凝练成可据以复习的几条要点：

中介在测什么：把总效应 c 拆成"直接效应 c'"与"间接效应 a×b"，并满足 c = c' + a×b；核心检验对象是经由 M 传导的那部分 a×b。间接效应是 a 与 b 的乘积，不是相加。
为什么用 Bootstrap：间接效应 a×b 的抽样分布天生偏态，Bootstrap 不假设正态、直接重抽样逼近其分布，为 a×b 构造（偏差校正 BCa）置信区间，比正态近似的 Sobel 检验更稳健、功效更高。
判据只有一条：间接效应的 95% CI 不含 0 → 间接效应成立；含 0 即不成立。用 CI 判，不用 p 值；二者出现矛盾必是出错。
完全 vs 部分：a×b 显著的前提下，c' 仍显著为部分中介、c' 不显著为完全中介；类型只看 c' 显著性，不能用"中介占比"判定。Case A 为部分中介（ab CI [−.20,−.09] 与 c' CI [−.22,−.08] 均不含 0）。
前提决定可信度：中介依赖正确的理论与时序方向、线性、无未控混淆、各方程假设成立。Case B 因 X↔M 高度共线（r≈.86、VIF≈8），中介估计不稳，正确做法是先治共线、否则不报具体中介量。
红线：横断面数据慎称因果，措辞止于"预测/传导"；所有系数与 CI 由你在 jAMM/Process 算出，AI 只翻译、绝不代算或篡改——数字对不上时一律以软件输出为准，CI 含 0 不可粉饰。

自测清单（可保留逐项打勾）

[ ] 我理解 X→M→Y 三角链，能说清 a / b / c' / c / a×b 各是什么，并知道 c = c' + a×b。
[ ] 我能讲出"为什么用 Bootstrap 而非 Sobel"（间接效应抽样分布偏态、不假设正态）。
[ ] 我用 Bootstrap 5000 次（必要时 10000 次）重抽样跑出 a×b 的 95% BCa 置信区间。
[ ] 我清楚判断中介显著的唯一标准：95% CI 不含 0，且不会把 a×b 误算成 a+b。
[ ] 我能区分完全中介（c' 不显著）与部分中介（c' 显著），并知道不能用占比判定类型。
[ ] 我全程使用"预测/传导/经由"而非"导致"，理解横断面数据慎称因果。
[ ] 我能识别 AI 在中介解释中的常见错误（占比误读、CI/p 矛盾、代算编造），并以软件输出为准。

✍️ 思考与练习

下列练习用于把本节概念用起来（区别于"本课交付物"里的任务），建议写在你的本地笔记中。

练习 1（原理辨析）。 有同学说："我跑出 a = −.34（p<.001）、b = .42（p<.001），两条路径都显著，所以中介一定成立。"请用本课原理说明：为什么"a 显著且 b 显著"还不足以断定中介成立？正确的判据是什么？

好答案要点：指出中介是否成立要看间接效应 a×b 本身的抽样分布，而非 a、b 各自显著；a×b 的分布常偏态，须用 Bootstrap 95% CI 是否含 0 判定（不能用 a、b 分别显著替代，也不能用乘出来的点估计直接做正态检验）；并能补一句"间接效应是 a×b 乘积"。

练习 2（结果解读，紧扣 Case A）。 取 Case A 的中介输出：间接效应 ab = −.14，95% CI [−.20, −.09]；直接效应 c' = −.15，95% CI [−.22, −.08]。请判断这是完全中介还是部分中介，写出判断依据；并用一段规范文字报告该中介结果（注意措辞）。

好答案要点：两个 CI 均不含 0 → 间接成立且直接仍在 → 部分中介；判断依据是 c' 显著（CI 不含 0），不是看占比；报告须写明 Bootstrap/5000 次/BCa CI、报出 ab 的区间、点明部分中介，并全程用"AI 焦虑通过削弱学习策略间接预测/传导更低的自我效能感"而非"导致"。

练习 3（边界识别，紧扣 Case B）。 取 Case B 经管面板，设想中介链"数字经济 DigEcon → 人力资本 HumanCap → 创新 Innovation"。已知 DigEcon 与 HumanCap 相关 r≈.86、HumanCap 的 VIF≈8。请说明：在这种数据上直接跑中介、照报 a×b 会踩中本课哪条边界？正确的处理次序是什么？为什么不该硬凑一个具体的间接效应数值？

好答案要点：识别为多重共线性导致 b、c'、a×b 估计不稳、标准误膨胀、符号可能反转（"前提假设/无未控混淆—线性回归"边界）；正确次序是先诊断并处理共线（剔除/合并/换识别策略，使 VIF 回落到 <5 量级）再谈中介，或如实声明局限；不硬凑数值是因为共线下任何具体 a×b 都不可信、会误导，呼应"统计可信度取决于前提是否满足"与"不编造统计量"。

练习 4（红线识别）。 你把 Case A 的原始 CSV 直接发给 AI，让它"帮我算一下 AI 焦虑通过学习策略影响自我效能的中介效应，给出 a×b 和置信区间，并写成结果段落"。它很快回了一段格式完美、a×b 与 95% CI 俱全的文字。请指出这一操作踩中了本课哪条红线，以及正确做法。

好答案要点：踩中"AI 不能代算中介"红线——大模型不接入数据、不做可信计算与 Bootstrap 重抽样，给出的 a×b 与 CI 极可能是幻觉（看似合理实则编造）；正确做法是先在 jAMM/Process 亲手跑出全部路径系数与 Bootstrap CI，再把输出粘给 AI 让它仅做翻译，并逐一比对数字、以软件输出为准；同时记住 CI 是否含 0 的判定也只能依据软件输出，不能让 AI 自创显著性。

第 29 课：统计分析（五）中介效应 Bootstrap 检验 ​

📋 课前准备（10 分钟自检） ​

工具/账号 ​

数据/素材 ​

应急通道 ​

场景导入：相关背后，机制是什么？ ​

🗺️ 中介效应模型：三条路径与四个系数 ​

完全中介 vs 部分中介 ​

📐 原理：中介效应在测什么、为什么这样检验 ​

1. 在测什么：把一条总效应"拆成两段" ​

2. 为什么要用 Bootstrap，而不是 Sobel 检验 ​

3. 前提假设（用之前先确认） ​

4. 常见误用（先记住，后面误区表还会展开） ​

🚀 拆解实战 A：经典法 vs Bootstrap 法 ​

经典 Baron & Kenny 四步法（已不推荐单独使用） ​

Bootstrap 法（现代主流） ​

🚀 拆解实战 B：Jamovi jAMM 操作 ​

安装 jAMM ​

跑中介 ​

关键输出 ​

🚀 拆解实战 C：报告（APA） ​

中介结果段落：写砸 vs 写好 ​

🚀 拆解实战 D：SPSS Process 宏（备选） ​

🚀 拆解实战 E：让 AI 把中介输出翻译成结果段落 ​

🚀 拆解实战 F：常见误区与红线自检 ​

🔧 结果不显著 / 跑不出来？如何排查 ​

边界与局限：中介分析与 AI 在这一步的能与不能 ​

跨案例迁移：把同一套中介流程搬到 Case B 经管面板（一个反面警示） ​

第一步永远是先看前提，而不是先跑模型 ​

正确的处理：先解决共线，再谈中介 ​

📦 本课交付物 ​

🏁 本章小结 ​

自测清单（可保留逐项打勾） ​

✍️ 思考与练习 ​