模块导语:零恐惧进入量化数据分析
⚠️ 本模块开始之前,请先阅读以下边界说明
本模块进入本课程量化统计强度最高的阶段。学习者在此阶段常见的困难集中在三处:统计软件安装与配置失败、数据报错信息难以解读、以及检验结果不显著时不知如何处理。这些都是正常的研究过程,本模块会逐一给出处置路径。
本模块的教学法可以概括为一句话:"数据软件负责算出真实的图表,语言大模型只负责把这些结果翻译成学术语言。"
换言之,二者分工明确:统计软件(Jamovi / Python)是唯一的计算来源,大模型仅承担翻译与解释职能,绝不参与任何统计量的生成。
核心禁忌:把原始数据直接交给大模型,让它"算出" p 值、均值或回归系数,属于学术造假。大模型并未接入你的实际数据文件,它只能依据语言概率"生成"一组看似合理、实则虚构的数字。这条红线贯穿本模块全部课时。
本模块学什么?
本模块覆盖从问卷设计到数据清洗,再到统计分析与结果解释的完整研究链条:
| 课时 | 主题 | 核心技能 |
|---|---|---|
| 第18课 | 工具选型 | 安装与配置 Jamovi / Python 环境 |
| 第19-21课 | 量表与问卷设计 | 借助大模型把"焦虑"等构念操作化为可测量、可作答的题项 |
| 第22-23课 | 数据编码与清洗 | 规范编码与变量类型、剔除无效样本、处理反向计分题 |
| 第24-29课 | 统计分析 | 描述统计、t 检验/ANOVA、相关与回归、信效度、EFA、中介 |
| 第30-31课 | 结果解释与综合实战 | 借助大模型将统计结果翻译为规范学术表述,并跑通全流程 |
正确使用 AI 的边界是什么?
❌ vs ✅:识别"让 AI 算数据"的危险指令
- ❌ 危险:
这是我的问卷数据,帮我算 AI 焦虑对自我效能的回归系数→ 大模型并未接入你的数据,会虚构一组 β 与 p 值。 - ✅ 正确:
这是我在 Jamovi 跑出的输出:β=-.34, p=.002, R²=.21,帮我翻译成符合 APA 规范的方法/结果段→ 大模型只翻译你已经算出的真实数字。
判据:凡是要求大模型"算 / 推 / 估"一个你没有提供结果的数字,都是造假;要求它"翻译 / 解释"你已有的结果,才是合规用法。
开始之前,你需要准备
安装 Jamovi(文科/商科生首选):免费下载 → jamovi.org
课程配套模拟数据集:三条主线案例数据集均可用于本模块演示,主用 Case A(问卷研究):
案例 类型 样本量 适用 Case A(心理问卷) 大学生 AI 焦虑问卷 540 行 → 清洗后 500 主用,跑通 EFA / 信度 / 中介全流程 Case B(经管面板) 30 省 × 10 年面板 300 观测 备选,做面板回归 / 多重共线性 / 稳健性检验 Case C(LLM 评估) 300 篇 × 3 模型实验 300 行 进阶轨备选,做配对 t / ANOVA / ICC / 交互效应 Case A 下载(本模块主用):
Case B / C 下载(可选):
准备大模型对话窗口:打开 Claude 4.8 / GPT-5 / Gemini 2.5 等通用助手中的一款,承担本模块的"结果翻译"职能(把已算出的统计输出转写为规范学术语言)。
💡 预期统计结果(若你的数字与下表差距过大,应回头检查数据清洗步骤)
以下为基于课程配套数据集(Case A)应得到的参考结果,可用于自检计算是否正确:
- Cronbach's α(信度系数):Anxiety ≈ 0.83,Strategy ≈ 0.88,Efficacy ≈ 0.89
- 探索性因子分析(EFA):Anxiety 呈清晰的三因子结构,KMO > 0.8
- 多元回归 R² ≈ 0.20
- Bootstrap 中介(BCa 法):间接效应 ab ≈ −0.14,95% CI ≈ [−0.20, −0.09],不含 0(部分中介成立)
💡 本模块学习心态
遇到报错不必慌张,结果不显著也不要修改数据——这些都是真实研究中的常态。把报错信息或截图交给大模型分析原因(而非让它代算结果),是本模块最重要的实战技能之一。
