Skip to content

第 29 课:统计分析(五)中介效应 Bootstrap 检验

🎯 本课目标

学习目标:理解中介效应的统计含义(X 是否通过 M 影响 Y)、掌握 Bootstrap 法检验间接效应、并能区分部分中介与完全中介。本课你将用 Jamovi 的 jAMM 模块(或 SPSS Process 宏 Model 4)在 Case A 上跑通中介模型——AI 焦虑 → 学习策略 → 自我效能感——并把输出写成符合 APA 规范的中介结果段落。

📐 一句话先讲清楚:中介在回答什么问题

回归告诉你"X 与 Y 有没有关系",中介进一步追问"这个关系是怎么发生的"——X 是直接作用于 Y,还是先改变了某个中间变量 M、再由 M 传导到 Y?本课的核心检验对象就是这条传导路径的强度,即间接效应 a×b。需要强调:中介是一个因果假设,统计只能检验"数据是否与该假设一致",能否真正下因果结论取决于研究设计与理论(详见【边界与局限】)。

📋 课前准备(10 分钟自检)

工具/账号

  • [ ] Jamovi 2.5+ + jAMM 模块(菜单 → Modules → 安装 jAMM)
  • [ ] 备选:SPSS 29 + Process 宏 v4.2(Hayes 提供,processmacro.org

数据/素材

  • [ ] 第 23 课清洗后数据
  • [ ] 三个核心变量:Anxiety_Mean (X) / Strategy_Mean (M) / Efficacy_Mean (Y)

应急通道

  • jAMM 装不上 → 试 medmod / GAMLj 等 Jamovi 中介模块,或退回 SPSS Process Model 4
  • 间接效应 CI 含 0(不显著)→ 先确认这是不是真结论(如实报告即可);再查反向题与共线,并把重抽样 5000→10000 让 CI 更稳定(这只减小蒙特卡洛误差,不会把真不显著的效应抽成显著
  • 报错跑不出 → 检查变量是否都为连续型、自变量是否高度共线(详见下文"结果不显著/跑不出来"排查)

场景导入:相关背后,机制是什么?

一名学生跑完相关与回归,确认了 AI 焦虑与自我效能感呈负相关(r≈−.26):越焦虑,效能感越低。论文写到这里,审稿人留下一句批注——"为什么?这种负向关系是通过什么传导的?"

只报"X 与 Y 负相关",停留在"相伴变化"层面,没有讲清机制。于是这名学生提出一个理论假设:AI 焦虑未必直接削弱效能感,而很可能先破坏了学习策略(焦虑的人更少有计划地学习),再由失效的学习策略拖低效能感。这就把一条单线关系,改写成一条X → M → Y 的传导链

跑中介检验后,三条路径各自说话:

  • AI 焦虑显著负向预测学习策略:a = −.34,p < .001
  • 学习策略显著正向预测自我效能感:b = .42,p < .001
  • 间接效应 a×b = −.14,95% CI [−.20, −.09],区间不含 0 → 间接路径成立
  • 控制学习策略后,直接路径 c' = −.15,95% CI [−.22, −.08],区间也不含 0 → 直接路径依然在

结论是"部分中介":AI 焦虑既直接压低效能感,又通过破坏学习策略间接压低效能感——两条路并存。机制讲清楚了,故事才完整。这就是中介分析要做的事:不止说"有关系",而是拆开"关系是怎么走的"。

注意:上面全程用的是"预测/传导"而非"导致"。横断面问卷下能不能把这条链称作因果,要留到【边界与局限】再谈。

🗺️ 中介效应模型:三条路径与四个系数

X (自变量)AI 焦虑M (中介)学习策略Y (因变量)自我效能a 路径b 路径c' 路径(控制 M 后的直接路径)间接效应 = a × b总效应 c = c' + a×b
路径含义
aX 对 M 的直接影响(AI 焦虑 → 学习策略)
bM 对 Y 的直接影响(控制 X 后)
c'X 对 Y 的直接路径(控制 M 后)
cX 对 Y 的总效应 = c' + a×b
a × b间接效应(中介路径)—— 本课的检验目标

完全中介 vs 部分中介

判断标准只看两件事:间接效应 a×b 显著不显著、直接效应 c' 显著不显著

  • 完全中介(full mediation):a×b 显著,c'(直接路径)不显著 → X 对 Y 的影响几乎全部经由 M 传导。
  • 部分中介(partial mediation):a×b 和 c' 显著 → X 一部分经 M 传导,另一部分仍直接作用于 Y。
  • 无中介:a×b 不显著(95% CI 含 0)→ 中介假设不成立,无论 c' 如何。

本课 Case A 属于部分中介:a×b 的 95% CI [−.20, −.09] 不含 0(间接成立),同时 c' 的 95% CI [−.22, −.08] 也不含 0(直接仍在)。两条路并存,故为"部分"。

⚠️ "完全/部分"是程度描述,不是质量评判

"部分中介"并不比"完全中介"低级——它只是如实说明"还有一条直接路径没被 M 解释掉"。真实社科数据里部分中介远比完全中介常见。切忌为了得到"更干净"的完全中介,去删变量或挑样本——那是数据造假。完全中介在小样本下还常常是"c' 检验功效不足"的假象(样本一大,c' 又显著了)。


📐 原理:中介效应在测什么、为什么这样检验

在动手跑 jAMM 之前,先把四个问题想清楚——这决定了你能不能正确解读输出,以及哪些话能说、哪些话不能说。

1. 在测什么:把一条总效应"拆成两段"

中介分析的数学骨架是一组回归方程。设 X=AI 焦虑、M=学习策略、Y=自我效能感:

  • 总效应 c:只用 X 预测 Y(Y = c·X + …),衡量"不区分路径时,X 对 Y 的整体影响"。
  • a 路径:用 X 预测 M(M = a·X + …),衡量"X 对中介变量的影响"。
  • b 路径 与 直接效应 c'同时用 X 和 M 预测 Y(Y = c'·X + b·M + …)。此时 b 是"控制 X 后 M 对 Y 的影响",c' 是"控制 M 后 X 对 Y 的残余直接影响"。

三者满足一个恒等关系(在标准线性中介里):

总效应 c = 直接效应 c' + 间接效应 a×b

中介分析的全部意义,就是把一条总效应 c 成"绕过 M 的直接部分 c'"和"经过 M 的间接部分 a×b",再去检验那个间接部分 a×b 到底是不是 0。

💡 为什么间接效应是 a 乘以 b(不是 a 加 b)

把它想成一条"传导链":X 先把自己的变化以强度 a 推给 M,M 再把收到的变化以强度 b 推给 Y。两段是串联的,总传导率是两段相乘——就像两级齿轮,最终转速是各级传动比之乘积,而非相加。所以间接效应 = a × b;把它写成 a + b 是本课最常见的硬错误之一。

2. 为什么要用 Bootstrap,而不是 Sobel 检验

要判断 a×b 是否显著,需要知道它的抽样分布(即"如果反复抽样,a×b 会怎样波动")。难点在于:a 和 b 各自近似正态,但两个正态变量的乘积 a×b 通常不是正态分布——它往往是偏态的。

  • 老办法 Sobel 检验:强行假设 a×b 服从正态、用公式算一个标准误再做 z 检验。当 a×b 实际偏态时,这个正态假设不成立,导致置信区间不准、检验功效偏低,容易把真实存在的中介判成不显著。
  • Bootstrap 法(现代主流):不假设 a×b 是什么分布,而是直接从数据里把它的分布"重抽样"出来——有放回地反复抽样 5000 次,每次都重算一遍 a×b,得到 5000 个估计值,再用这堆估计值的分位数构造置信区间。分布偏不偏态,Bootstrap 都照实呈现,因此对中介检验更稳健。

一句话:间接效应的抽样分布天生偏态,Bootstrap 不靠正态假设、直接逼近这个分布,所以优于 Sobel。

3. 前提假设(用之前先确认)

中介模型不是把三个变量丢进去就能信的,它依赖以下前提:

前提含义不满足会怎样
理论与时序方向正确X→M→Y 的方向必须有理论支撑,最好 X 在时间上先于 M、M 先于 Y方向反了,模型照样能跑出"显著",但结论是错的(统计救不了错误的因果设定)
各回归方程线性、误差独立同方差中介建立在线性回归之上,继承回归的全部假设严重非线性时 a、b 估计有偏,间接效应失真
M 与 Y 无未控混淆影响 M 和 Y 的共同第三变量需被控制(放进 Confounders)遗漏混淆变量会让 b 与 c' 虚高或虚低(内生性)
测量可靠X/M/Y 信度低会衰减路径系数M 测得不准会低估间接效应(向 0 偏)

4. 常见误用(先记住,后面误区表还会展开)

  • 把相关方向当因果链:横断面数据里 X→M→Y 和 Y→M→X 在统计上往往同样"拟合得好",方向只能由理论定,不能由数据定。
  • 只看 a、b 都显著就宣布中介成立:必须直接检验 a×b 的置信区间,不能用"a 显著且 b 显著"替代。
  • 用 c 不显著否定中介:即便总效应 c 不显著,间接效应 a×b 仍可能显著(这正是 Bootstrap 取代经典四步法的原因,见下文)。
📘 关键术语(首次出现,先对齐定义)
  • 中介变量(mediator, M):位于 X 与 Y 之间、传导 X 对 Y 影响的变量(本课为学习策略 Strategy_Mean)。区别于调节变量(moderator)——后者改变 X→Y 的强弱方向,而非充当传导通道。
  • 总效应(total effect, c):不区分路径时 X 对 Y 的整体影响,c = c' + a×b。
  • 直接效应(direct effect, c'):控制中介 M 后,X 对 Y 的残余影响("绕过 M"的那部分)。读作 "c-prime"。
  • 间接效应(indirect effect, a×b):经由 M 传导的那部分效应,等于 a 路径系数与 b 路径系数之乘积——本课的核心检验目标。
  • Bootstrap(自助法):从样本中有放回地重抽样、反复重算统计量,以经验方式逼近其抽样分布的方法。用于在不假设正态的前提下为 a×b 构造置信区间。
  • 偏差校正置信区间(bias-corrected and accelerated, BCa):Bootstrap 置信区间的一种,对重抽样分布的偏态与偏差做了校正,是中介检验的常用报告口径。本课 jAMM 与 Process 均选此口径。
  • Sobel 检验(Sobel test):用正态近似为 a×b 构造检验的经典方法;因 a×b 常偏态,已被 Bootstrap 大幅取代。
  • 部分中介 / 完全中介:a×b 显著时,c' 仍显著为部分中介、c' 不显著为完全中介(定义见上)。

🚀 拆解实战 A:经典法 vs Bootstrap 法

经典 Baron & Kenny 四步法(已不推荐单独使用)

Step 1: X → Y 显著(c)
Step 2: X → M 显著(a)
Step 3: 加入 M 后, M → Y 显著(b)
Step 4: 加入 M 后, X → Y 不显著(完全中介)或减弱(部分中介)

问题:步骤 1 要求 c 显著,但实际上间接效应可以在 c 不显著时仍然存在!现代研究直接跳到 Bootstrap

Bootstrap 法(现代主流)

核心思想:从数据中有放回地重抽样 5000 次,每次都计算 a×b,得到 5000 个间接效应估计,构造 95% 置信区间。

判断标准

  • 95% CI 不含 0 → 间接效应显著
  • ❌ 95% CI 含 0 → 不显著

🚀 拆解实战 B:Jamovi jAMM 操作

安装 jAMM

  1. Jamovi → 右上角"+"(Modules)→ jamovi library
  2. 搜索 jAMM(Advanced Mediation Models)
  3. Install → 重启 Jamovi

跑中介

  1. AnalysesjAMMGLM Mediation Model
  2. Dependent Variable (Y): Efficacy_Mean
  3. Mediator (M): Strategy_Mean
  4. Covariates (X): Anxiety_Mean
  5. Confounders(控制变量): Gender, Grade
  6. Bootstrap
    • Method: Bias-corrected (BCa) Bootstrap(与下文报告口径一致)
    • Number of Bootstrap samples: 5000
    • Confidence Interval: 95%
  7. 运行

关键输出

═══════════════════════════════════════════════════
 路径              Estimate  SE     95% CI         p
───────────────────────────────────────────────────
 a (X→M)            -.34    .04    [-.42, -.26]   .000
 b (M→Y)             .42    .03    [.36, .48]     .000
 c' (X→Y, direct)   -.15    .03    [-.22, -.08]   .002
 c (X→Y, total)     -.29    .04    [-.37, -.21]   .000
 a×b (间接效应)     -.143   .025   [-.20, -.09]   ⭐
───────────────────────────────────────────────────
 间接效应/总效应: 49.3%(中介效应占比)
═══════════════════════════════════════════════════

📐 这张表怎么读(逐行翻译)

  • a = −.34b = .42:两段路径都显著,传导链的"上游"和"下游"都通——但这只是必要条件,不是中介成立的判据
  • c' = −.15,CI [−.22, −.08]:控制学习策略后,AI 焦虑对效能感仍有直接影响(CI 不含 0)→ 这是"部分中介"的标志(若 c' 不显著才是完全中介)。
  • c = −.29:总效应,满足 c = c' + a×b 即 −.15 + (−.143) ≈ −.29,正是"总 = 直接 + 间接"的拆解。
  • a×b = −.143,CI [−.20, −.09]:本表的主角。它只报 CI、不报 p——因为 Bootstrap 的判据就是"CI 含不含 0"。此处 CI 不含 0 → 间接效应成立。⭐ 标的就是这一行。
  • 49.3%:间接效应占总效应的比例,是效应量参考不能用它判定完全/部分中介(类型只看 c' 显著性)。

🚀 拆解实战 C:报告(APA)

为检验 H2(学习策略在 AI 焦虑→自我效能感路径中起中介作用),
采用 jAMM 进行 Bootstrap 中介检验, 重抽样 5000 次,
报告 95% 偏差校正置信区间。

路径系数显示:
- AI 焦虑显著负向预测学习策略(a = -.34, p < .001)
- 学习策略显著正向预测自我效能感(b = .42, p < .001)
- 控制学习策略后, AI 焦虑对自我效能感的直接效应
  仍然显著(c' = -.15, p = .002)

Bootstrap 检验显示, 学习策略在 AI 焦虑与自我效能感之间的
**间接效应显著**, ab = -.143, SE = .025, 95% CI [-.20, -.09]
(置信区间不含 0)。

间接效应占总效应的 49.3%, 表明学习策略起**部分中介**作用。
H2 得到支持。

中介结果段落:写砸 vs 写好

同一份 Bootstrap 输出,写成段落可以"勉强合格",也可以"可直接投稿"。下面把中介报告最常见的失分点逐项拆开并排对照——左列是学员高频写法,右列是把同一处"拧紧"后的写法。

维度写砸 ❌写好 ✅为什么
检验方法交代做了中介分析,结果显著采用 jAMM 进行 Bootstrap 中介检验,重抽样 5000 次,报告 95% 偏差校正(BCa)置信区间不写方法、重抽样次数与 CI 口径,结果无法被复现与评估
间接效应证据间接效应显著(p<.05)间接效应 ab = −.14,SE = .025,95% CI [−.20, −.09],区间不含 0Bootstrap 的判据是CI 不含 0,不是 p 值;必须报出 CI 区间本身
中介类型判定存在中介作用控制 M 后直接效应 c' = −.15 仍显著(CI [−.22, −.08]),故为部分中介"存在中介"含糊;要点明部分/完全并给判断依据(c' 是否显著)
效应方向解读学习策略导致效能提升AI 焦虑通过削弱学习策略,间接预测更低的自我效能感横断面数据只能说"预测/传导",写"导致"是越界(相关≠因果)
占比的表述中介占比 49.3%,所以是部分中介间接效应占总效应 49.3%(占比仅作效应量参考,中介类型由 c' 显著性判定)中介类型看 c' 显著性,不能用占比判定完全/部分
假设回应(只堆数字,不回到假设)上述结果支持 H2:学习策略在 AI 焦虑→自我效能路径中起部分中介作用结果段要回应你提出的研究假设,而非孤立罗列系数

💡 一句话判据

检验一段中介报告写得好不好,问四件事:重抽样次数与 CI 口径写了没?间接效应的 CI 区间报了没?部分/完全的判定依据(c')给了没?有没有把"传导"误写成"导致"? 四者都过关,这一段才从"报数字"升级成"讲清机制"。

🚀 拆解实战 D:SPSS Process 宏(备选)

如果只有 SPSS:

  1. 下载 Process v4.2:processmacro.org
  2. 安装到 SPSS(Process.spd 文件)
  3. Analyze → Regression → Process
  4. Model number: 4(简单中介)
  5. X: Anxiety_Mean / Y: Efficacy_Mean / M: Strategy_Mean
  6. Covariates: Gender / Grade
  7. Bootstrap: 5000 次, Bias-corrected 95% CI
  8. 运行

🚀 拆解实战 E:让 AI 把中介输出翻译成结果段落

到这一步,a、b、c'、a×b 和 Bootstrap 置信区间都已由你在 jAMM/Process 里算好。AI 的角色是翻译官而非计算器:把你粘贴进去的输出,转写成符合 APA 规范、含中介类型判定与解读的段落。它不重新计算、不改动任何数值、不替你判定显著性——这是本课乃至整个量化模块的红线。

markdown
【角色】APA 第 7 版格式严谨、熟悉 Bootstrap 中介检验的论文编辑。

【任务】下面是我用 Jamovi 的 jAMM 模块跑出的 Bootstrap 中介检验输出(粘贴整张表)。
请帮我撰写论文中"中介效应检验"段落(约 300 字),按以下结构:

1. 第一句:交代检验方法——jAMM、Bootstrap 重抽样 5000 次、95% 偏差校正(BCa)置信区间。
2. 第二至四句:依次报告 a 路径、b 路径、直接效应 c' 的系数与显著性。
3. 第五句:报告间接效应 ab,必须写出其 SE 与 95% CI 区间,并指明"区间是否含 0"。
4. 第六句:根据 c' 是否显著,判定为部分中介或完全中介,并给出判断依据。
5. 末句:回应对应的研究假设(H2)是否得到支持。

【严格约束】
- 数字一律逐字照用我粘贴的输出,严禁改动、四舍五入或自行计算任何统计量。
- 判断中介是否显著只看"间接效应 95% CI 是否含 0",不要用 p 值替代,也不要自创显著性。
- 全段使用"预测/传导/经由"等措辞,严禁出现"导致/证明/造成"等因果动词
  (本数据为横断面,不能下因果结论)。
- 中介类型(部分/完全)只依据 c' 的显著性判定,不得用"中介效应占比"来判定。

【粘贴 jAMM 输出】[贴入]

🔢 这一步只"翻译"不"代算"

段落里出现的每一个数字——a、b、c'、ab、SE、置信区间——都必须来自你在 jAMM/Process 里亲手跑出的输出。任何时候 AI 给出的数字与你的软件输出对不上,一律以软件输出为准,并视为 AI 出错(见下文红线与误区表)。

🚀 拆解实战 F:常见误区与红线自检

⚠️ 中介分析三大红线

  1. 横截面数据不能推因果——只能说"X 通过 M 预测 / 传导到 Y",不能说"X 通过 M 导致 Y"。
  2. 方向性不能颠倒:X → M → Y 的方向必须有理论与(尽量)时序支撑,不能反着跑;统计上反向模型常常同样"显著",方向只能由理论定。
  3. AI 不能替你跑中介——它只能翻译你跑出来的统计输出,绝不代算 a×b 或编造置信区间。

下表把学员与 AI 在中介分析里最高频的错误集中列出,照着对号入座即可:

常见误区错在哪正确做法
把 a×b 算成 a + b间接效应是两段路径的乘积,不是相加(见原理)间接效应 = a × b;以软件直接输出的 ab 为准
只看 a、b 都显著就宣布中介成立"a 显著且 b 显著"不等于 a×b 显著,二者不可互相替代直接看间接效应 a×b 的 95% CI 是否含 0
用 c(总效应)不显著否定中介即便总效应不显著,间接效应仍可能显著直接检验 a×b,别拿 c 当门槛(这正是弃用经典四步法的原因)
用占比判定完全/部分中介"中介占比 100% = 完全中介"是错的,类型只看 c' 显著性c' 显著→部分中介;c' 不显著→完全中介;占比仅作效应量参考
"完全中介意味着 X 不影响 Y"完全中介下 X 仍影响 Y,只是全部经由 M 传导、没有直接路径表述为"X 通过 M 完全传导到 Y"
"95% CI 含 0 但 p < .05"数学矛盾:Bootstrap 用 CI 判显著,不该再出现与之冲突的 p统一用 CI 判据;出现自相矛盾必是 AI 出错,弃用
把"通过/传导"写成"导致"横断面数据给不出因果方向全程用"预测/传导/经由",因果留给纵向或实验设计
让 AI 代算 a×b 或编置信区间大模型不接入数据、不做可信计算,输出多为幻觉所有系数与 CI 在 jAMM/Process 亲手跑,AI 只翻译

🔧 结果不显著 / 跑不出来?如何排查

中介跑完,常见三类"不对劲":间接效应 CI 含 0(不显著)、软件报错跑不出、AI 段落不达标。逐类对症,不要推倒重来。

  1. 间接效应 95% CI 含 0(中介不成立)→ 先确认这是不是真结论,而非急着"救"。

    • 首先接受"不显著"也是合法结论:数据不支持该中介假设,本身就是一个发现,如实报告即可,不要为了显著去改数据或挑样本。
    • 再排查技术性原因:① 检查反向题是否已正确反向计分(第 23 课),M 的方向错了会让 a 或 b 失真;② 确认 X/M/Y 的均值变量算对、量纲一致;③ 适度提高重抽样次数(5000 → 10000)让 CI 更稳定——但这只减少蒙特卡洛误差,不会把真不显著的效应"抽"成显著,若 10000 次后 CI 仍含 0,就是不显著。
    • 检查是否漏控关键混淆变量:遗漏同时影响 M 和 Y 的第三变量,可能把真实的间接效应"洗掉"。
  2. jAMM/Process 报错、跑不出 → 多为模块或数据问题。

    • jAMM 装不上 → 换 medmod / GAMLj 等 Jamovi 中介模块,或退回 SPSS Process Model 4。
    • 报"奇异矩阵/不收敛" → 多半是自变量间高度共线(如把两个 r≈.9 的变量同时放进去),或样本量过小;检查相关矩阵与 VIF。
    • 变量类型不对 → 确认 X/M/Y 都被识别为连续型(Continuous),分类变量需先转码。
  3. AI 段落不达标(改了数值、写成因果、误判类型)→ 局部纠偏,永远以你的输出为准。

    • 改动或编造了数值 → 最危险,直接弃用该句,并在提示词补"严禁改动我粘贴的任何数字,逐字照用"。
    • 把"传导"写成"导致" → 追加"全段禁用因果动词,只用预测/传导/经由"。
    • 用占比判完全/部分 → 追加"中介类型只依据 c' 显著性判定,不得用占比"。

一句话

首版不理想,先分清是真不显著(如实报告,别硬救)、软件/数据问题(查反向题、共线、变量类型)、还是翻译问题(局部纠偏 AI 段落)。无论哪种,红线不变:统计量只能由你算出,AI 只能翻译,不能代算或篡改;CI 含 0 就是不成立,不能粉饰。


边界与局限:中介分析与 AI 在这一步的能与不能

中介是"拆解机制"的有力工具,但它有明确的能力边界;AI 在这一步的角色更要划清。把下面几条记牢,比多跑一个模型更重要。

边界 / 失效场景为什么会这样你应该怎么做
横断面数据慎称因果同一时点测得的 X、M、Y,统计上 X→M→Y 与 Y→M→X 往往同样拟合得好,数据本身分不出方向措辞止于"预测/传导";要下因果须用纵向(X 先于 M 先于 Y 测量)或实验/准实验设计
中介依赖正确的理论与时序统计只检验"数据是否与设定的路径一致",不验证路径方向是否为真;方向设错照样出显著结果路径方向先由理论与时间顺序定好,再交给统计检验,不能用数据反推方向
CI 含 0 即不成立,不能粉饰间接效应的 95% CI 含 0,意味着"间接效应与 0 无法区分",这是统计判据,不可商量如实报告不显著;不要靠加重抽样次数、删样本、换变量去"凑"出不含 0 的区间
遗漏混淆 → 间接效应有偏影响 M 与 Y 的共同第三变量若未控制,会让 b、c' 乃至 a×b 系统性偏高或偏低(内生性)把已知混淆变量放进 Confounders/Covariates;并在局限里声明未控变量的可能影响
显著 ≠ 效应大大样本下很小的 a×b 也可能 CI 不含 0(显著),但实际传导量可能微不足道报告 CI 之外,结合间接效应大小、占总效应比例与实质意义判断,别只看"显不显著"
AI 只能翻译,不能代算大模型不接入你的数据、不做可信计算,让它"算一下中介"只会得到看似合理实则编造的系数与 CI(幻觉)a、b、c'、a×b、CI 全部在 jAMM/Process 亲手跑;AI 仅把你粘贴的输出转写成规范段落

⚠️ 本课红线:AI 翻译结果,绝不代算统计量

贯穿整个量化模块的硬规则:凡是路径系数 a/b/c'、间接效应 a×b、标准误、Bootstrap 置信区间——一律由你在统计软件里算出,AI 的唯一职责是把这些已经算好的数字翻译成符合 APA 的中文段落。任何时候 AI 给出的数字与软件输出不一致,以软件输出为准,并视为 AI 出错。把"算"留给软件、把"写"交给 AI、把"判断"(方向、因果、显著与否)留给自己——三者不可混淆。


跨案例迁移:把同一套中介流程搬到 Case B 经管面板(一个反面警示)

上面 Case A 是一条"干净"的部分中介。中介的流程在任何学科都一样——设定 X→M→Y、跑 jAMM/Process、看 a×b 的 Bootstrap CI。下面换一个完全不同的领域演示迁移,同时它恰好是一个前提不满足时该如何收手的反面案例。

Case B 经管面板数据,30 省 × 10 年(2014—2023)= 300 观测,含 DigEcon_Index(数字经济指数)、HumanCap_per10k(每万人专科以上人力资本)、Innovation_Index(创新指数)。一个常见的理论设想是:数字经济(X)→ 人力资本(M)→ 创新(Y)——数字经济发展吸引并培育高技能人才,再由人力资本推动创新。形式上,这正是一个中介模型。

第一步永远是先看前提,而不是先跑模型

在把三个变量丢进 jAMM 之前,回到第 24 课跑出的相关与共线性诊断:

═══════════════════════════════════════════════════════════
 变量对 / 指标                              数值
───────────────────────────────────────────────────────────
 DigEcon_Index ↔ HumanCap_per10k (X↔M)     r ≈ .86 **
 DigEcon_Index ↔ Innovation_Index (X↔Y)    r ≈ .94 **
 VIF: HumanCap_per10k                       ≈ 8
 VIF: DigEcon_Index                         ≈ 5.5
───────────────────────────────────────────────────────────
 注: N = 300(省 × 年)。**p < .01。
═══════════════════════════════════════════════════════════

这组数字在中介分析里是红灯。原因在原理里讲过:b 路径和直接效应 c' 来自"同时用 X 和 M 预测 Y"的那个回归。当 X 与 M 高达 r≈.86、VIF≈8 时,回归很难把"X 的独立贡献"和"M 的独立贡献"分开——这就是多重共线性。后果是:a×b 与 c' 的系数极不稳定、标准误膨胀、符号都可能反转,Bootstrap 重抽样下区间会剧烈晃动。此时即便软件吐出一个"漂亮"的间接效应,它也不可解释、不可信

⚠️ 这里为什么不给 Case B 的 ab 数值

本课对 Case A 给出了确切的 ab≈−.14、CI [−.20, −.09],是因为那条链前提满足、估计稳定。Case B 不给具体 ab 与 CI——不是疏漏,而是因为在 r≈.86、VIF≈8 的共线条件下,任何具体数字都会误导:换个设定或重抽一次就可能大变。课程坚持"不编造统计量",正确的教学动作是到此收手,而不是硬凑一个看似精确的中介结果。况且 Case B 的 R²≈.95 是模拟数据的人为偏高值(见第 24 课警示),更不能当成"中介很强"的证据。

正确的处理:先解决共线,再谈中介

面对这种数据,规范流程不是"照跑中介、照报数字",而是:

  1. 先判明共线来源:DigEcon 与 HumanCap 是否在测量上高度重叠?理论上谁先于谁?
  2. 调整模型再检验:可考虑剔除或合并高度共线的变量、改用更长滞后结构、或换识别策略;待 VIF 回落到可接受区间(经验上 < 5)后,中介估计才有意义。
  3. 若坚持原设定,必须如实声明局限:在论文里写明高共线导致中介路径估计不稳,结论需谨慎——而不是把不稳的 a×b 当确凿证据。

🔁 迁移要点

对比 Case A 与 Case B:中介的操作流程一字不变(设定 X→M→Y → 跑 Bootstrap → 看 a×b 的 CI),变的只是数据是否满足前提。Case A 前提满足,得到可信的部分中介;Case B 自变量与中介高度共线,正确做法是先治共线、否则不报具体中介量。这正呼应原理里那张"前提假设"表——统计方法的可信度,取决于前提是否被满足,而不是软件能不能跑出数字。把"角色/变量"换成你学科的,但"先验前提、再信结果"的次序对谁都一样。


📦 本课交付物

按本节实操任务完成并提交以下内容,提交 AI 初审,按 Module_Rubrics.md 对应维度评分:

  • [ ] 中介模型路径图:A4 大小,标注 a / b / c / c' 系数与显著性
  • [ ] Bootstrap 输出表:含间接效应 a×b 的 95% 偏差校正(BCa)置信区间
  • [ ] 中介报告段落(约 300 字):完整 APA 格式,含间接效应 CI 与中介类型判定依据
  • [ ] 中介效应类型判定:完全 / 部分中介,写明判断依据(c' 是否显著)
  • [ ] 四维质检记录:用 Course_QA_Checklists.md(事实 / 逻辑 / 格式 / 引用)核查 AI 段落,重点查"数字是否被改动、是否出现因果措辞、中介类型是否用占比误判"
  • [ ] 沉淀模板:将本课中介翻译提示词加入个人工具箱

🏁 本章小结

把本课凝练成可据以复习的几条要点:

  1. 中介在测什么:把总效应 c 成"直接效应 c'"与"间接效应 a×b",并满足 c = c' + a×b;核心检验对象是经由 M 传导的那部分 a×b。间接效应是 a 与 b 的乘积,不是相加。
  2. 为什么用 Bootstrap:间接效应 a×b 的抽样分布天生偏态,Bootstrap 不假设正态、直接重抽样逼近其分布,为 a×b 构造(偏差校正 BCa)置信区间,比正态近似的 Sobel 检验更稳健、功效更高。
  3. 判据只有一条:间接效应的 95% CI 不含 0 → 间接效应成立;含 0 即不成立。用 CI 判,不用 p 值;二者出现矛盾必是出错。
  4. 完全 vs 部分:a×b 显著的前提下,c' 仍显著为部分中介、c' 不显著为完全中介;类型只看 c' 显著性,不能用"中介占比"判定。Case A 为部分中介(ab CI [−.20,−.09] 与 c' CI [−.22,−.08] 均不含 0)。
  5. 前提决定可信度:中介依赖正确的理论与时序方向、线性、无未控混淆、各方程假设成立。Case B 因 X↔M 高度共线(r≈.86、VIF≈8),中介估计不稳,正确做法是先治共线、否则不报具体中介量。
  6. 红线:横断面数据慎称因果,措辞止于"预测/传导";所有系数与 CI 由你在 jAMM/Process 算出,AI 只翻译、绝不代算或篡改——数字对不上时一律以软件输出为准,CI 含 0 不可粉饰。

自测清单(可保留逐项打勾)

  • [ ] 我理解 X→M→Y 三角链,能说清 a / b / c' / c / a×b 各是什么,并知道 c = c' + a×b。
  • [ ] 我能讲出"为什么用 Bootstrap 而非 Sobel"(间接效应抽样分布偏态、不假设正态)。
  • [ ] 我用 Bootstrap 5000 次(必要时 10000 次)重抽样跑出 a×b 的 95% BCa 置信区间。
  • [ ] 我清楚判断中介显著的唯一标准:95% CI 不含 0,且不会把 a×b 误算成 a+b。
  • [ ] 我能区分完全中介(c' 不显著)与部分中介(c' 显著),并知道不能用占比判定类型。
  • [ ] 我全程使用"预测/传导/经由"而非"导致",理解横断面数据慎称因果。
  • [ ] 我能识别 AI 在中介解释中的常见错误(占比误读、CI/p 矛盾、代算编造),并以软件输出为准。

✍️ 思考与练习

下列练习用于把本节概念用起来(区别于"本课交付物"里的任务),建议写在你的本地笔记中。

练习 1(原理辨析)。 有同学说:"我跑出 a = −.34(p<.001)、b = .42(p<.001),两条路径都显著,所以中介一定成立。"请用本课原理说明:为什么"a 显著且 b 显著"还不足以断定中介成立?正确的判据是什么?

好答案要点:指出中介是否成立要看间接效应 a×b 本身的抽样分布,而非 a、b 各自显著;a×b 的分布常偏态,须用 Bootstrap 95% CI 是否含 0 判定(不能用 a、b 分别显著替代,也不能用乘出来的点估计直接做正态检验);并能补一句"间接效应是 a×b 乘积"。

练习 2(结果解读,紧扣 Case A)。 取 Case A 的中介输出:间接效应 ab = −.14,95% CI [−.20, −.09];直接效应 c' = −.15,95% CI [−.22, −.08]。请判断这是完全中介还是部分中介,写出判断依据;并用一段规范文字报告该中介结果(注意措辞)。

好答案要点:两个 CI 均不含 0 → 间接成立直接仍在 → 部分中介;判断依据是 c' 显著(CI 不含 0),不是看占比;报告须写明 Bootstrap/5000 次/BCa CI、报出 ab 的区间、点明部分中介,并全程用"AI 焦虑通过削弱学习策略间接预测/传导更低的自我效能感"而非"导致"。

练习 3(边界识别,紧扣 Case B)。 取 Case B 经管面板,设想中介链"数字经济 DigEcon → 人力资本 HumanCap → 创新 Innovation"。已知 DigEcon 与 HumanCap 相关 r≈.86、HumanCap 的 VIF≈8。请说明:在这种数据上直接跑中介、照报 a×b 会踩中本课哪条边界?正确的处理次序是什么?为什么不该硬凑一个具体的间接效应数值?

好答案要点:识别为多重共线性导致 b、c'、a×b 估计不稳、标准误膨胀、符号可能反转("前提假设/无未控混淆—线性回归"边界);正确次序是先诊断并处理共线(剔除/合并/换识别策略,使 VIF 回落到 <5 量级)再谈中介,或如实声明局限;不硬凑数值是因为共线下任何具体 a×b 都不可信、会误导,呼应"统计可信度取决于前提是否满足"与"不编造统计量"。

练习 4(红线识别)。 你把 Case A 的原始 CSV 直接发给 AI,让它"帮我算一下 AI 焦虑通过学习策略影响自我效能的中介效应,给出 a×b 和置信区间,并写成结果段落"。它很快回了一段格式完美、a×b 与 95% CI 俱全的文字。请指出这一操作踩中了本课哪条红线,以及正确做法。

好答案要点:踩中"AI 不能代算中介"红线——大模型不接入数据、不做可信计算与 Bootstrap 重抽样,给出的 a×b 与 CI 极可能是幻觉(看似合理实则编造);正确做法是先在 jAMM/Process 亲手跑出全部路径系数与 Bootstrap CI,再把输出粘给 AI 让它仅做翻译,并逐一比对数字、以软件输出为准;同时记住 CI 是否含 0 的判定也只能依据软件输出,不能让 AI 自创显著性。

助力学者在 AI 时代极速产出高质量学术成果 · 55 课时双轨制 · plan v3.3