第 38 课:图表制作与正文嵌入
🎯 核心实操目标
本课目标:把统计软件(SPSS / Jamovi)默认导出的、不合投稿规范的图表,升级为达到主流期刊版式要求的学术配图。你将掌握三类核心学术图表的规范——概念模型图 / 统计结果图 / 三线表,学会借助 AI 生成 Python(Seaborn)或 R(ggplot2)作图代码把图做规范,并建立正文图表的交叉引用与编号规范。
本课位于论文成稿的"版式打磨"阶段:前面几课完成了数据分析(第 25–29 课)与正文写作(第 33–37 课),到这一步,任务是把分析结果转译成审稿人一眼能读懂的规范图表,并把它们正确地嵌进正文。需要先记住一条贯穿全课的底线:图表是数据的如实呈现,"美化"只允许作用于版式(配色、字号、线条),绝不允许作用于数据本身——这条在本课【学术红线】里会专门展开。
📋 课前准备(5 分钟自检)
工具/账号
- [ ] PowerPoint 或 Keynote(概念模型图绘制)
- [ ] Jamovi / SPSS(统计图直出)
- [ ] Python + Seaborn / matplotlib 或 R + ggplot2(进阶轨:高质量统计图)
- [ ] Excel / Word(三线表精修)
- [ ] AI 平台:Claude 4.8 / GPT-5 / Gemini 2.5(用于生成作图代码、解读图表规范)
数据/素材
- [ ] 你的统计输出(来自第 25–29 课的回归/中介分析)
- [ ] 你的概念模型(理论框架图,可手绘草稿)
- [ ] 目标期刊的图表规范文档
应急通道
- Python 配色调不出来 → 让 AI 直接生成 Seaborn 代码
- 学校无 PowerPoint → 用免费 Google Slides 或 LibreOffice Impress
- 三线表格式不会 → 用 Word 表格 → 右键 → 边框 → 仅留上下两条 + 表头下方一条
场景导入:为什么图表质量会影响初筛
两篇选题相近的稿件同期投出。A 稿正文分析扎实,但所有图表都是统计软件直出的默认样式——深红底、黑粗框、坐标轴字号大小不一、热力图没有图注。B 稿正文体量更小,但图 1 是一幅清晰的概念模型图,图 2 是配色规范、标注完整的相关矩阵热力图。
编辑做初筛时,往往没有时间逐字读完每一篇,会先快速翻看图表来判断这篇研究的框架和严谨程度:概念模型图能不能让人一眼看懂变量关系?统计图的标注是否专业?表格是不是三线表?图表给出的"第一印象",直接影响一篇稿件是被优先送审,还是被搁置。
这里要先厘清一个容易被误解的因果链,否则会把这一课学歪:
⚠️ 先说清楚:图表是"研究质量的窗口",不是"质量本身"
规范的图表之所以有用,是因为它忠实、清晰地把你已经做对的分析呈现了出来,让审稿人更快读懂、更少误判。它的作用是"减少沟通损耗",不是"用好看的图替研究质量加分"。
反过来必须警惕:如果分析本身有问题,再漂亮的图也救不了,而且更危险——一张规范精致却建立在错误数据或错误设定上的图,只会让审稿人更快地、更确信地发现问题。所以本课教的是"把对的结果呈现规范",绝不是"用视觉效果掩盖薄弱的研究"。图表能做的,是让好研究不被差版式拖累;它做不到、也不该被用来让差研究看起来像好研究。
原理:图表在投稿流程里到底承担什么、审稿人看什么
动手画图之前,先弄清楚学术图表为什么有那么多"规矩"。这些规范不是审美洁癖,而是从"图表要被谁、在什么条件下读到"反推出来的硬约束。理解了来由,你就不必死记每一条,而能自己判断一张图哪里不合格。
图表是"被快速扫读"的,所以必须自解释。 编辑初筛、审稿人通读,常常是先看图表、再回正文核对。一张合格的学术图必须脱离正文也能基本看懂:看图就知道这是什么变量、什么关系、样本多大、哪些显著。这就是为什么图注(caption)要完整——它替代了"读者此刻不在读的那段正文"。图注缺数据来源、缺显著性符号说明、缺样本量,等于让审稿人带着疑问去翻正文,体验和印象都会扣分。
图表会被缩印、被黑白打印,所以有分辨率与"黑白友好"的硬线。 投稿图最终会被排版系统缩到单栏或双栏宽度,还可能被审稿人黑白打印。分辨率(resolution)不足(低于约 300 dpi)缩印后会糊;只靠颜色区分类别的图一旦黑白打印就完全无法分辨。所以"图内字号 ≥ 8pt""不能仅靠颜色区分"这些规则,本质是在保证图"在最差的呈现条件下仍可读"。
表格用三线表,是学科共识下的"无歧义格式"。 社科与多数理工期刊统一要求三线表(three-line table):只有顶线、表头下分隔线、底线三条横线,无竖线。它不是某本期刊的偏好,而是长期形成的排版规范——竖线和花哨边框会干扰数据阅读,三线表把视觉噪声降到最低。表格不符合三线表,是审稿人一眼能看出的"不熟悉学术规范"的信号。
图表编号与交叉引用,决定读者能不能"按图索骥"。 正文说"如表 1 所示",读者就要能立刻定位到那张表;图表必须按正文出现顺序编号、且每张图表都在正文被引用至少一次。出现"孤儿图表"(放了图却没在正文引用)或编号错乱,会让审稿人怀疑稿件的细致程度。
💡 审稿人快速扫图时,最常挑出的硬伤
- 图注信息不全(没写 N、没写显著性符号含义、没写数据来源);
- 图内字号过小或大小不一,缩印后读不清;
- 用了竖线表格 / 默认网格底纹,不是三线表;
- 图表只靠颜色区分类别,黑白打印后无法分辨;
- 坐标轴无标签或无单位、图例缺失;
- 图表与正文编号对不上,或有图无引用(孤儿图表)。
这些都不是"小节问题"——它们共同构成审稿人对"作者是否熟悉学术规范"的判断。
📘 关键术语(首次出现,先对齐定义)
- 三线表(three-line table):学术表格的标准格式,全表仅保留三条横线——顶线、表头下分隔线、底线,无竖线。用于呈现数据时把视觉噪声降到最低,是社科与多数理工期刊的强制要求。
- 图注 / 表注(caption / note):附在图下方、表下方的说明文字。规范的图注在图下方、表标题在表上方而表注在表下方;内容应含编号、标题、必要时的数据来源、样本量 N 与显著性符号(如 *p < .05)说明,目的是让图表脱离正文也能读懂。
- 分辨率 / dpi(resolution / dots per inch):每英寸像素点数,衡量图像精细度。投稿位图通常要求 ≥ 300 dpi;矢量图(PDF / EPS / SVG)无固定 dpi、可无损缩放,故学术图优先用矢量格式输出。
- 箱线图(box plot):用"箱体 + 须 + 离群点"展示一组数据中位数、四分位距与分布范围的统计图,常用于比较多组数据的集中趋势与离散程度(如 Case C 三个模型的质量评分分布对比)。
- 交叉引用(cross-reference):正文用"如表 1 所示""见图 2"等方式指向特定图表的写法。要求编号按出现顺序、每张图表至少被引用一次,不写"如下表所示"这类依赖排版位置的表述。
- 概念模型图(conceptual model):论文的"图 1",用变量框 + 路径箭头展示研究假设的理论框架(自变量 → 中介 → 因变量、调节路径等)。
🗺️ 学术图表三大金标准
把上面的原理落到可执行的检查项上,所有学术图表都要同时过以下三关(表格部分另加三线表规范):
| 标准 | 要求 |
|---|---|
| 分辨率(resolution / dpi) | 位图 ≥ 300 dpi(投稿要求;网络出版 ≥ 150 dpi);能用矢量格式(PDF / EPS / SVG)则优先,可无损缩放 |
| 黑白友好 | 即使打印为黑白也能清晰区分(不能只靠颜色区分类别;必要时叠加形状 / 线型 / 灰度) |
| 字号 | 图内字号 ≥ 8pt(缩印到单栏后仍可读),且全图字号统一 |
| 图注完整(caption) | 图下方注明:图编号、标题、数据来源(如适用)、样本量 N、显著性符号说明 |
| 三线表规范(three-line table) | 仅 3 条横线:表顶 / 表头下 / 表底;无竖线 |
🚀 拆解实战 A:概念模型图(PowerPoint)
概念模型图通常是论文的"图 1",用来一图说清研究的理论框架——有哪些变量、它们之间假设了什么关系。审稿人常据此快速判断研究设计是否清晰,因此它的"可读性"比"美观度"更重要。
标准元素:
- 长方形 = 变量(自变量/因变量/中介/调节)
- 实线箭头 = 假设的影响路径(H1/H2/...)
- 虚线箭头 = 调节作用
- 文字标注 = 假设编号(H1+ 表示正向预测)
操作步骤:
- 打开 PowerPoint → 插入 → 形状 → 圆角矩形
- 拖出 4–6 个变量框,按"自变量 → 中介 → 因变量"水平排列
- 加箭头连接:实线表示主路径,标注 H1/H2
- 调节变量在路径上方虚线下连
- 字体统一为 Times New Roman 12pt 或 微软雅黑 12pt
- 全选 → 右键 → 另存为图片(PNG,DPI 300)
🚀 拆解实战 B:统计图规范化(核心 Prompt + 配图 Prompt)
统计软件的默认图往往不符合投稿规范(灰底网格、配色刺眼、字号不一)。与其手动逐项调参,更高效的做法是把数据交给 AI,让它生成一段符合期刊规范的 Seaborn / ggplot2 作图代码。下面这条提示词把"金标准"翻译成了对 AI 的具体要求,可直接复制使用。
【角色】你是一位精通学术数据可视化的 Python / Seaborn 专家。
【任务】我跑出了下面这份相关矩阵数据(粘贴 CSV 或 DataFrame),
请生成一段可直接运行的 Python 代码,把它画成符合主流期刊投稿规范的相关性热力图。
【版式规范】
1. 配色: 使用 'coolwarm' 或 'RdBu_r' 发散调色板(冷色负相关,暖色正相关),保证黑白打印仍可区分方向
2. 样式: sns.set_style('whitegrid'),去掉刺眼灰底纹
3. 数值标注: 在每个单元格显示相关系数(保留 2 位小数),p < .05 的格子加 *
4. 字体: 全图统一 Times New Roman,标题 12pt,数值 9pt(满足"字号 ≥ 8pt")
5. 色条: 右侧色条标注 "Pearson r"
6. 分辨率: dpi=300,同时保存为 PDF(矢量) + PNG 两种格式
【红线】只对相关矩阵做可视化呈现,不得改动、平滑或挑选任何系数数值
【输出要求】完整可运行代码 + 注释说明每段的功能
[在此处粘贴你的相关矩阵数据]⚠️ 用 AI 生成作图代码的一条底线
让 AI 写作图代码,作用范围只限于版式(配色、字号、线条、保存格式)。提示词里那条"不得改动任何系数数值"不是客套——绝不能让 AI"把不显著的相关改成显著""把不好看的离群点去掉""把趋势抹平得更漂亮"。图必须如实反映你跑出的数据;任何对数据本身的"美化"都属于篡改数据(见本课【学术红线】)。AI 生成代码后,务必核对图上的数值与你的统计输出逐一对得上。
你应该得到的样例代码
import seaborn as sns
import matplotlib.pyplot as plt
import pandas as pd
# 设置符合投稿规范的样式
sns.set_style('whitegrid')
plt.rcParams['font.family'] = 'Times New Roman'
plt.rcParams['font.size'] = 11
# 你的数据
corr_matrix = pd.read_csv('correlations.csv', index_col=0)
# 画热力图
fig, ax = plt.subplots(figsize=(8, 6), dpi=300)
sns.heatmap(corr_matrix,
annot=True, fmt='.2f',
cmap='coolwarm', vmin=-1, vmax=1,
center=0,
square=True,
linewidths=0.5,
cbar_kws={'shrink': 0.8, 'label': 'Pearson r'})
plt.title('Figure 2. Correlation Matrix of Key Variables',
fontsize=12, pad=15)
plt.tight_layout()
plt.savefig('fig2_corr.pdf', dpi=300, bbox_inches='tight')
plt.savefig('fig2_corr.png', dpi=300, bbox_inches='tight')
plt.show()🚀 拆解实战 C:三线表规范(学术表格的标准格式)
学术期刊统一要求三线表:仅三条横线(顶线 / 表头下 / 底线),无竖线,简洁无歧义。下面以 Case A(心理问卷:N=500,AI 焦虑 → 学习策略 → 自我效能感) 的描述统计 + 相关矩阵为例,给出一张规范三线表的样式(最外两条粗线代表表顶与表底,中间细线为表头下分隔线):
═══════════════════════════════════════════
变量 M SD 1 2 3
───────────────────────────────────────────
1. AI 焦虑 3.21 0.78 —
2. 学习策略 3.85 0.65 -.30** —
3. 自我效能 3.92 0.70 -.26** .42** —
───────────────────────────────────────────
注: N = 500. **p < .01, *p < .05.
═══════════════════════════════════════════读这张表时注意三个规范细节:表标题在表上方(如"表 1 主要变量的描述统计与相关矩阵",此处省略)、表注在表下方(写明 N 与显著性符号含义)、对角线用"—"占位、相关系数下三角呈现且与正文 / 三线表里的统计输出完全一致(不得为了好看而改数)。
Word 制作步骤:
- 插入表格 → 选中整表 → 右键 → 表格属性 → 边框和底纹
- 先全部去掉边框 → 再单独添加:顶线(粗) + 表头下方(细) + 表底(粗)
- 不加任何竖线、不加底纹
- 表标题放表上方;表注放表下方,小一号字体,左对齐
🚀 拆解实战 D:正文中嵌入图表的规范
图做好了,还要"嵌得对"。下面这些是审稿人一眼会注意、却最容易被新手忽略的版式规范:
| 规范 | 写法 |
|---|---|
| 图表位置 | 紧跟第一次引用的段落之后(不要全部堆在文章末尾) |
| 文中引用(交叉引用) | "如表 1 所示……""见图 2",不写"如下表所示"(依赖排版位置,排版一变就错) |
| 编号顺序 | 表 1 / 表 2 / 表 3 按正文出现顺序编;图与表各自独立编号 |
| 图注 / 表注位置 | 图注在图下方;表注在表下方;表标题在表上方 |
| 孤儿图表 | 每张图表都要在正文被引用至少一次;放了图却不引用即"孤儿图表",须删或补引用 |
| 跨页处理 | Word 表格属性中勾选"允许跨页断行",跨页时表头标题重复,保持连贯 |
🧰 图表四件套:一篇规范论文的最小图表配置
把本课四个实战收束成一份"出门清单"——一篇标准实证论文,通常至少要备齐这四件:
- 概念模型图(图 1):变量框 + 假设路径箭头 + 假设编号,一图说清理论框架(实战 A)。
- 统计结果图(≥ 1 张):相关矩阵热力图 / 中介路径图 / 趋势图 / 箱线图等,按金标准规范化(实战 B)。
- 三线表(≥ 2 张):描述统计与相关矩阵表 + 主回归结果表,仅三条横线无竖线(实战 C)。
- 规范的正文嵌入:编号有序、交叉引用到位、图注 / 表注位置正确、无孤儿图表(实战 D)。
四件齐备且各自达标,论文的"版式关"才算过。
🚀 拆解实战 E:第二个 Worked Example——把作图规范迁移到 Case B / Case C
热力图只是统计图的一种。换了数据和图型,"金标准 + 如实呈现数据 + 完整图注"的骨架不变,变的只是图型选择和坐标设定。下面各取一个不同学科的案例,演示同一套规范怎么迁移。
Case B(经管面板:30 省 × 10 年,数字经济指数 → 区域创新指数)——趋势折线图
面板数据常用的展示,是画核心变量随年份变化的趋势图。下面这段配图 Prompt 把金标准翻译成了对 AI 的要求:
【角色】你是精通学术数据可视化的 Python / Seaborn 专家。
【任务】我有一份省级面板数据(30 省 × 10 年, 2014—2023),列含
year、province、DigEcon_Index(数字经济指数)、Innovation_Index(创新指数)。
请生成可直接运行的 Python 代码,画一张"数字经济指数与创新指数逐年均值趋势"折线图,
供经管类期刊投稿使用。
【版式规范】
1. 双折线: 横轴 year, 纵轴为两变量的全国年度均值, 用线型 + 标记区分两条线(保证黑白可分)
2. 图例: 标注两条线含义, 置于不遮挡数据的位置
3. 坐标轴: 写清轴标签与单位; 年份刻度完整
4. 字体: 全图统一 Times New Roman, 字号 ≥ 8pt
5. 分辨率: dpi=300, 同时存 PDF + PNG
【红线】只对真实计算出的逐年均值作图; 不得平滑、外推或修改任何数据点
【输出】完整可运行代码 + 注释
[在此处粘贴你的面板数据]⚠️ Case B 的图注里必须写清"数据性质"
Case B 用的是教学用模拟数据。这张趋势图的图注里必须注明"数据为教学用模拟数据",绝不能让读者误以为它反映真实的中国区域经济。把模拟数据画成不加说明的趋势图,等同于让图替你做出"数字经济真的提升了创新"的现实主张——这与第 37 课"模拟数据不冒充真实发现"的红线是同一条。图注规范在这里不只是格式,更是诚实披露。
Case C(LLM 评估:300 篇 × 3 模型,配对比较摘要质量,Quality_ 为 1–5 分)——箱线图*
要比较三个模型的质量评分分布,箱线图(box plot) 比柱状图更合适——它能同时展示中位数、四分位距与离群点,而不是只给一个均值。
📐 这张箱线图该长什么样(Worked Example 拆解)
对照金标准,逐项落到 Case C 这张图上:
| 规范项 | 在 Case C 箱线图上的具体做法 |
|---|---|
| 图型选择 | 横轴为三个模型(Claude 4.7 / GPT-5 / Gemini 2.5),纵轴为 Quality 评分(1–5);每个模型一个箱体 |
| 黑白友好 | 三个箱体用不同灰度 / 填充纹理区分,不只靠彩色;离群点用统一标记 |
| 如实呈现 | 箱体的中位数、上下四分位、须与离群点直接由 300 条评分数据算出,不得手动调整箱体高度 |
| 图注完整 | 注明 N=300、评分范围 1–5、三模型为特定版本(基准 Claude 4.7)、标注者人数与一致性指标 |
| 不过度解读 | 图只呈现分布;"谁显著更高"要靠正文的配对检验结果说话,不能让视觉差替代统计检验 |
⚠️ Case C 的图注必须标清"模型版本"
Case C 比较的是特定版本的三个模型,且模型迭代很快。箱线图的图注必须写清评测针对的具体版本(基准为 Claude 4.7、GPT-5、Gemini 2.5),不能含糊成"GPT vs Claude vs Gemini"。否则读者会把"某版本在本数据上的得分"误读为"该模型整体更强"——这是过度外推(呼应第 37 课 Case C 红线)。涉及模型口径,图注宁可标得啰嗦。
🔁 迁移要点
对比三案例:图型全变了(热力图 / 趋势折线图 / 箱线图),但规范骨架一致——先按数据特征选对图型,再用金标准把它规范化,配一条完整图注,并确保图与数据逐一对得上。把"图型与数据"换成你学科的,三大金标准、如实呈现、完整图注这三条照样适用。特别注意:每个案例都有图注里必须诚实交代的那一项(模拟数据要标、模型版本要标、样本量与显著性符号要标),迁移作图规范时把这条诚实义务一起带走。
写好 vs 写砸:同一张图的逐项对照
同一份统计结果,配出来的图可以"勉强能看",也可以"让审稿人放心"。下表把最常见的失分点逐项拆开并排——左列是学员高频写法,右列是把同一处"拧紧"后的写法。素材取自 Case A 的相关矩阵热力图。
| 维度 | 写砸 ❌ | 写好 ✅ | 为什么 |
|---|---|---|---|
| 分辨率 | 直接截屏 SPSS 窗口贴进 Word(约 72 dpi) | 代码导出 300 dpi PNG + 矢量 PDF | 截屏缩印即糊;投稿位图须 ≥ 300 dpi,矢量更佳 |
| 配色 / 黑白 | 红绿对比区分正负相关 | 冷暖发散色板 + 数值标注,黑白也能读 | 红绿对色盲与黑白打印都不友好;本课金标准要求黑白可分 |
| 字号 | 标题 18pt、刻度 6pt,大小不一 | 全图统一、刻度 ≥ 8pt | 字号不一显粗糙;过小缩印后读不清 |
| 图注 | 只写"图 2" | "图 2. 主要变量相关矩阵。N=500,*p<.05,**p<.01" | 图注要让图脱离正文也能读懂 |
| 数据呈现 | 把不显著的 r 也标星号让图"更满" | 如实标注显著性,不显著就不标 | 改动显著性标注是篡改结果,触红线 |
| 表格形态 | 带竖线和灰底纹的 Excel 默认表 | 仅三条横线的三线表 | 竖线 / 底纹是"不熟悉规范"的信号 |
| 正文嵌入 | 所有图堆在文末,正文不引用 | 紧跟首次引用段落,"如图 2 所示" | 孤儿图表 + 文末堆图会被审稿人扣印象分 |
| 编号 | 图表顺序与正文引用顺序对不上 | 按正文出现顺序编号、一一对应 | 编号错乱让审稿人怀疑稿件细致程度 |
💡 一句话判据
检验一张学术图做得好不好,问五件事:缩印后清楚吗?黑白打印还分得清吗?图注脱离正文能看懂吗?图上的每个数都和统计输出对得上吗?它在正文被正确引用了吗? 五项都过,这张图才从"能看"升级成"让审稿人放心"。
常见误区与纠正
学员做图表时的问题高度集中在几处,下表对号入座即可:
| 常见误区 | 症状 | 纠正方法 |
|---|---|---|
| 截屏直出 | 把软件窗口截屏贴进文档,缩印即糊 | 用代码 / 导出功能存 300 dpi 位图 + 矢量 PDF |
| 只靠颜色区分 | 黑白打印或色盲读者无法区分类别 | 叠加线型 / 形状 / 灰度,做到黑白友好 |
| 图注残缺 | 只写编号,缺 N、缺显著性符号说明 | 图注补全:编号 + 标题 + N + 数据来源 + 符号含义 |
| 表格带竖线 / 底纹 | 用 Excel / Word 默认表格样式 | 改三线表:仅顶线 / 表头下 / 底线,无竖线无底纹 |
| 图表位置 / 注位置错 | 表标题放表下方、图注放图上方、图全堆文末 | 表标题在上、图注在下、图表紧跟首次引用 |
| 孤儿图表 | 放了图却没在正文引用 | 每张图表正文至少引用一次,或删去 |
| "如下表所示" | 用依赖排版位置的指代 | 改为"如表 1 所示""见图 2"等带编号的交叉引用 |
| 为美观改数(红线) | 让 AI / 自己把离群点删掉、把趋势抹平、把系数改显著 | 图必须如实反映数据;发现问题回到分析环节,不在作图阶段动数据 |
AI 把图做得不达标?如何正当处理
让 AI 生成作图代码很省力,但首版常常不达标——这很正常,关键是带着金标准去把关,而不是直接采用。按下面顺序做小步纠偏:
- 先对照金标准定位问题在哪一项:糊 → 分辨率 / 导出格式;黑白分不清 → 配色 / 线型;读不懂 → 图注缺项;表格不对 → 三线表没设对。哪项不达标就只改哪项。
- 用一句话追加要求让 AI 重改该项:例如"刚才的图只靠颜色区分类别,请改成线型 + 灰度,保证黑白打印可分""图注缺 N 和显著性符号说明,请补全"。比重发整段更省力。
- 核对数据一致性(这一步不可省):AI 生成代码后,把图上的每个数值 / 趋势与你的统计输出逐一比对。AI 可能因误解数据或代码 bug 让图与真实结果不符——以你的统计输出为准,图必须服从数据。
- 图与数据冲突时,改图不改数:如果图"不好看"是因为数据本身如此(离群点多、趋势不显著、相关弱),那是研究的真实样貌,只能如实呈现。绝不能为了让图好看去删点、平滑或改数——那不是"美化图表",是篡改数据。
- 最后一道人工关:你来负责。图是否如实、图注是否完整、引用是否到位,最终由你逐项确认并署名担责;AI 只是助手,不对数据真实性负责。
一句话
AI 能把图做规范,但不能替你保证图与数据一致。版式可以交给 AI 调,数据真实性必须你自己守——首版不达标就对照金标准局部纠偏,唯独"数据"这一项只能改图迁就数据,绝不能改数迁就图。
边界与局限:AI 在"图表制作"这一步能做什么、不能做什么
AI 在作图环节是高效的"代码助手",但它的能力边界必须划清。把下面几条记牢,比多记一个参数更重要。
| 边界 / 失效场景 | 为什么会这样 | 你应该怎么做 |
|---|---|---|
| AI 能写作图代码,不能替你核对数据 | 它看不到你的原始数据是否被正确读入,可能因代码 bug 让图与真实结果不符 | 图上每个数值 / 趋势都回到统计输出逐一核对,以数据为准 |
| AI 不知道你学科 / 目标期刊的具体版式 | 不同期刊对配色、字号、图注格式有细化要求,AI 给的是通用规范 | 拿目标期刊的作者须知 / 范文校准,必要时把规范贴给 AI |
| AI 可能"自作主张"美化数据 | 模型倾向于让图"好看",可能平滑曲线、隐去离群点 | 提示词写明"不得改动数据",并人工核对;发现改数立即推翻 |
| AI 生成的代码可能跑不通 / 依赖缺失 | 环境、库版本、数据格式差异都会导致报错 | 把报错回贴让 AI 修;不盲目相信"一次成功" |
| AI 起草图表属正常协作,但需据实披露 | 用 AI 生成作图代码是合规的工具使用,但隐瞒使用或让 AI 为数据真实性背书不合规 | 按所投期刊 / 学校要求如实披露 AI 使用;数据与图表真实性由作者负责 |
⚠️ 本课学术红线:图表可"美化版式",绝不可"美化数据"
图表制作里有一条不可逾越的界线,必须和"把图做漂亮"严格区分开:
- 允许的"美化"只作用于版式:调配色、统一字号、改线型、去网格底纹、导出高分辨率、排成三线表——这些改变的是呈现方式,不改变任何一个数据点。这正是本课教的内容。
- 绝对禁止的是"美化数据":删改离群点让图更整齐、平滑或外推曲线让趋势更漂亮、把不显著的结果标成显著、P 值凑星号、截断坐标轴夸大差异、用模拟数据冒充真实数据作图——这些都是篡改 / 伪造数据,属于严重学术不端,与第 37 课"模拟数据不冒充真实""硬伤不掩盖"是同一条红线。
- 图注要据实、AI 使用要披露:图注里如实写清 N、数据来源、模型版本、数据是否为模拟;用 AI 生成作图代码要按要求据实披露。对图表所呈现数据真实性负责的,始终是作者本人,不是 AI。
一句话:让图忠实地、清楚地呈现你真实跑出的结果——这是图表制作的全部正当目标;任何越过版式、动到数据的"美化",都越过了红线。
📦 本课交付物
按本节实操任务完成并提交以下内容,提交 AI 初审,按 Module_Rubrics.md 对应维度评分:
- [ ] 概念模型图(PNG / PDF,300 dpi):含变量框 + 假设箭头 + 假设编号标注
- [ ] 统计结果图(至少 1 张):相关矩阵热力图 / 中介路径图 / 趋势图 / 箱线图任选,符合三大金标准
- [ ] 三线表(至少 2 张):描述统计与相关矩阵表 + 主回归结果表(仅三条横线,无竖线)
- [ ] 图表清单:列出本文所有图表的编号、标题、所在页码,核对编号与正文引用一一对应
- [ ] 数据一致性自查记录:勾选确认每张图 / 表的数值都与统计输出对得上,无任何为美观而改数
🏁 本章小结
把本课凝练成可据以复习的几条要点:
- 为什么图表质量影响初筛:编辑 / 审稿人常先扫图表再读正文,据此快速判断研究框架与严谨程度;规范的图表减少沟通损耗,让好研究不被差版式拖累——但它不能替薄弱研究加分。
- 三大金标准:分辨率(位图 ≥ 300 dpi,矢量优先)、黑白友好(不只靠颜色)、字号(≥ 8pt 且统一),外加图注完整与表格三线表化。
- 图表四件套:概念模型图(图 1)+ 统计结果图(≥ 1 张)+ 三线表(≥ 2 张)+ 规范的正文嵌入(编号有序、交叉引用到位、无孤儿图表)。
- 正文嵌入规范:图表紧跟首次引用、按出现顺序编号、表标题在上 / 图注在下、用"如表 1 所示"而非"如下表所示"、不留孤儿图表。
- 跨案例可迁移:换数据和图型,"金标准 + 如实呈现 + 完整图注"骨架不变——Case A 热力图、Case B 趋势图、Case C 箱线图同一套规范;每个案例都有图注里必须诚实交代的那一项(模拟数据、模型版本、N 与显著性)。
- AI 是助手、你担责:AI 能高效生成符合规范的作图代码,但不能替你核对数据、不懂你的具体期刊版式;版式可交给 AI 调,数据真实性必须你自己守。
- 本课红线:图表只允许"美化版式",绝不允许"美化数据"——删改离群点、平滑趋势、凑显著、截断坐标轴、模拟数据冒充真实,都是篡改 / 伪造数据的学术不端;用 AI 作图要据实披露。
自测清单(可保留逐项打勾)
- [ ] 我的所有图表都符合三大金标准:≥ 300 dpi(或矢量)/ 黑白友好 / 字号 ≥ 8pt 且统一。
- [ ] 我的概念模型图清晰展示自变量 → 中介 → 因变量路径与假设编号。
- [ ] 我的统计图用 Seaborn / ggplot2 等规范化输出,替代了软件默认样式。
- [ ] 我的所有表格都是三线表(无竖线、无底纹、仅 3 条横线)。
- [ ] 我的图注在图下方、表注在表下方、表标题在表上方,且图注信息完整(N / 来源 / 符号 / 版本)。
- [ ] 正文中每个图表都被引用至少 1 次(无孤儿图表),编号按出现顺序、跨页表格标题重复。
- [ ] 我已逐张核对图 / 表的数值与统计输出一致,没有为美观而改动任何数据;如用 AI 作图已按要求据实披露。
✍️ 思考与练习
下列练习用于把本节概念用起来(区别于"本课交付物"里的任务),建议写在你的本地笔记中。图表示例若涉及具体数据来源或文献,一律用占位(如 [作者, 年])或标注"示意",不得编造看似真实的来源。
练习 1(金标准辨析,紧扣 Case A)。 有同学把 SPSS 的相关矩阵窗口直接截屏贴进论文,图里红绿配色区分正负相关、标题 16pt 而刻度 6pt、图下只写了"图 2"。请对照三大金标准,指出这张图的三处不达标,并说明各自正确做法。
好答案要点:① 分辨率——窗口截屏约 72 dpi,缩印即糊,应用代码导出 300 dpi 位图 + 矢量 PDF;② 黑白友好——红绿对色盲与黑白打印不友好,应换冷暖发散色板并加数值标注;③ 字号 / 图注——字号不统一且过小(刻度 6pt < 8pt),图注残缺(缺 N=500、缺 */** 显著性说明),应统一字号 ≥ 8pt 并补全图注。能点明这些是"在最差呈现条件下仍可读"的要求即更好。
练习 2(如实呈现 vs 美化数据,守红线)。 AI 为 Case B 趋势图生成代码后,你发现某一年数字经济指数有个明显偏低的点,使折线"不好看"。你想让 AI"把这个点平滑掉,让趋势更漂亮"。请说明这个想法为什么触碰红线,正确做法是什么。
好答案要点:把真实数据点平滑 / 删除以"让趋势好看",改变的是数据本身而非版式,属于篡改数据,是本课红线(与第 37 课同一条)。正确做法是如实保留该点;若怀疑是录入错误,应回到数据清洗环节核查(呼应第 23 课),确认无误则照实呈现,并可在正文 / 图注说明。图只能忠实反映数据,"不好看"是研究真实样貌的一部分。
练习 3(图注诚实义务,紧扣 Case B / Case C)。 现要为 Case B(教学用模拟面板数据)的趋势图、Case C(特定版本三模型评分)的箱线图各写一条合格图注。请分别指出这两条图注最不能省略的诚实信息是什么,为什么。
好答案要点:Case B 图注必须注明"数据为教学用模拟数据",否则读者会误以为图反映真实中国区域经济,等于让图替你做出未经证实的现实主张(模拟数据不冒充真实);Case C 图注必须写清三模型的具体版本(基准 Claude 4.7、GPT-5、Gemini 2.5)与 N、标注者一致性,否则把"某版本在本数据上的得分"误读成"该模型整体更强",属过度外推。能点出"图注不只是格式,更是诚实披露"即达标。
练习 4(正文嵌入与交叉引用)。 某稿件把全部 5 张图统一堆在参考文献前,正文里只有图 3 被"如下图所示"提到一次,且表格全部带竖线和灰色底纹。请按本课规范指出三处问题并改正。
好答案要点:① 孤儿图表 + 位置错——图不应堆在文末,应紧跟各自首次被引用的段落之后,且每张图表都要在正文至少引用一次(其余 4 张是孤儿图表,须补引用或删去);② 交叉引用写法错——"如下图所示"依赖排版位置,应改为"如图 3 所示"等带编号的交叉引用,并保证编号按出现顺序;③ 表格非三线表——带竖线和底纹不符合规范,应改为仅顶线 / 表头下 / 底线三条横线、无竖线无底纹的三线表。
