第 11 课:选题来源与题目优化
🎯 核心实操目标
学习目标:在双盲评审(double-blind review)流程中,标题往往是评审专家最先、有时也是唯一通读的部分,因此它在很大程度上决定了一篇稿件被认真对待的概率。本课结束时,你需要掌握实证论文的标准标题构件 X + M + Y(自变量 + 中介 + 因变量)(调节变量记为 W),理解"规范标题为何同时具备可检索、可定位、可评判三重功能",并能借助大模型把一段口语化的研究设想,改写为符合学术期刊体例的规范标题。
📋 课前准备(5 分钟自检)
账号
- [ ] Claude 4.8 / GPT-5 / Gemini 2.5(任一作为标题改写的主力模型)
- [ ] Kimi K2(用于长篇 PDF 文献的批量阅读)
- [ ] Zotero:本课暂不需要(第 12 课会首次配置)
工具/环境
- [ ] 知网 / Web of Science 高级检索访问通道(校园网或代理)
- [ ] Google Scholar / Semantic Scholar(免费替代)
- [ ] Word / Markdown 编辑器(用于记录产出)
数据/素材
- [ ] 第 10 课产出的 1-2 个候选研究题目
- [ ] 与你研究方向相关的 5-10 篇近年文献 PDF(如已下载)
应急通道
- WOS 不可用 → 用 CNKI 或 Semantic Scholar 替代
- 文献不够 → 先用 Google Scholar 搜补足
- AI 提示词没思路 → 参考课程模板包
Course_QA_Checklists.md
场景导入:从口语化研究设想到规范标题
假设你经由第 10 课的漏斗法,收敛出了一个具有实操价值的研究设想,可用一句口语化的因果疑问表述:"员工如果长期担心被 AI 替代,会不会导致离职倾向上升或工作投入下降?如果领导给予足够的支持,这种影响会不会减弱?"
这个设想本身的研究价值是成立的——它隐含了自变量、因变量与一个可能的边界条件。但若直接把这句口语作为开题报告或论文的标题,它无法承担学术标题应有的功能:变量不可被检索系统准确索引,研究的理论归属不明,评审专家也难以一眼判断研究设计是否严谨。
因此,从研究设想到正式标题之间,需要一道术语化与结构化的转换:把口语中的模糊情绪、混合概念,逐一对应到可测量的变量,并把它们的因果关系用规范结构显式呈现出来。本课就聚焦这道转换,以及如何借助大模型高效完成它。
原理:为什么"规范标题"是一项硬要求
把标题做规范,并非学术圈的修辞偏好,而是由学术成果的流通方式决定的。一个规范的实证论文标题,需要同时满足三项功能,缺一不可。
📐 规范标题的三重功能:可检索、可定位、可评判
① 可检索(retrievable)。 学术数据库(知网、Web of Science、Scopus 等)主要依据标题、关键词与摘要建立索引;检索系统按词匹配,并不理解口语化的隐喻。"心理按摩""摸鱼"这类表述不会被任何学科主题词表收录,标题里若用它们,同行在做文献综述时几乎检索不到你的研究。把变量写成学科内通用的规范术语(如"组织支持感""反生产力行为"),等于把论文挂到了正确的检索节点上。
② 可定位(locatable in the literature)。 标题里的术语同时标明了研究的理论归属。当你用"组织退缩行为(organizational withdrawal)"而非"想离职又想摸鱼",读者立刻知道这项研究接入的是哪一支文献谱系、与哪些既有结论对话。标题因此从"描述一个现象"升级为"在某条研究脉络中占据一个位置"——这正是评审判断研究是否"有对话对象"的依据。
③ 可评判(evaluable at a glance)。 实证研究的标题应当让人在不读正文的情况下,就能还原出研究设计的骨架:谁是原因(X)、谁是结果(Y)、是否存在传导路径(M)或边界条件(W)。评审专家阅读量极大,会先用标题快速判断"变量是否清晰、因果方向是否单一、设计是否可行"。一个读不出 X→Y 的标题,往往在这一步就被判定为设计模糊。
把三者合起来:规范术语解决"被检索到、被定位到",规范结构解决"被读懂、被评判"。 这也解释了为什么本课的方法分两条腿——先把口语词换成术语(下文"词→术语对照"),再把术语装进 X/M/Y/W 结构(下文标题公式)。
标题公式:X / M / Y / W 四个构件
实证论文的标题,可以拆解为四个功能明确的构件。下图给出这套结构的标准形态——主标题点出研究的理论命题,副标题用规范术语写清"X 通过/在何种条件下作用于 Y"。
中介变量 M 在标题中常以"……的中介路径""通过……"等形式出现(X→M→Y);调节变量 W 则以"……的调节作用""在……情境下"等形式出现(W 改变 X→Y 的强弱)。一个标题不必四个构件齐备,但 X 与 Y 必须显式可读,否则它就不是一个合格的实证研究标题。下面先给出这四个构件的精确定义。
📘 关键术语(首次出现,先对齐定义)
- 自变量 / 解释变量(independent variable,X):研究中被设定为"原因"的变量,研究者关心它的变化如何引起结果的变化。在标题里它是因果箭头的起点。
- 因变量 / 被解释变量(dependent variable,Y):被设定为"结果"的变量,是研究真正想解释或预测的对象,是因果箭头的终点。一个标题应只指向一个核心 Y,混入两个并列结果会造成"一题双因变量"。
- 中介变量(mediator,M):位于 X 与 Y 之间、承担传导作用的变量,刻画"X 为什么会影响 Y"的内在机制(X→M→Y)。它回答的是机制问题。
- 调节变量(moderator,W):改变 X→Y 这一关系强弱或方向的变量,刻画"X 的影响在什么条件下更强 / 更弱"(即边界条件),但它本身不在 X 与 Y 的传导链上。它回答的是边界问题。
- 三段式标题(two-part / colon title):以冒号分隔"主标题 + 副标题"的标题体例。主标题点出理论命题或研究旨趣,副标题用规范术语写清变量与关系。中英文实证期刊普遍采用,便于在有限字数内同时传达"理论站位"与"研究设计"。
- 可证伪性(falsifiability):一个研究命题能够被经验数据证否的性质。标题读得出单向的 X→Y,才意味着背后有一个可被数据检验(从而可能被推翻)的假设。
中介与调节的辨析,与第 3 课经管面板示例里给出的定义一致:用中介还是调节,取决于研究者的理论判断,不是由数据或模型替你决定。下文 worked example 会在具体题目里再演示一次如何取舍。
Worked Example 一:把口语设想改写成规范标题(Case A 心理问卷)
本节用一个完整的改写流程,演示如何借助大模型把场景导入里那句口语化设想,转换为符合期刊体例的标题。该设想正对应课程的 Case A 心理问卷数据集(N=500,含 Anxiety_1..12、Strategy_1..8、Efficacy_1..7、反向计分题 Anxiety_4_R、Age)。
第一步:选择模型
标题改写本质是一项受约束的语言改写任务,对模型的综合语言能力与学科术语储备有一定要求。建议使用当前综合能力较强的通用助手,如 Claude 4.8 / GPT-5 / Gemini 2.5 中的任意一个。下面的提示词以中文给出,可直接复制。
第二步:用一段结构化提示词驱动改写
提示词的关键不在辞藻,而在于把三个结构锚点(X / Y / W)显式交代给模型,并要求它用规范术语和三段式结构产出。
【角色】你是一位长期在管理学核心期刊(如《管理世界》《心理学报》)担任审稿人的资深学者,
熟悉组织行为学的标准术语,对不规范、不可检索的标题会直接指出问题。
【任务】
我有一个口语化的研究设想,请你据此起草 5 个符合学术期刊体例的规范论文标题,
供我在开题报告中选用。
【结构与格式要求】
1. 每个标题必须显式包含以下三个构件,并让因果方向可读:
X = AI 替代焦虑(对应量表 Anxiety_1..12,反向题 Anxiety_4_R 已重编码)
Y = 反生产力行为 / 离职倾向(择一作为核心因变量,不要并列两个结果)
W = 组织支持感 / 包容型领导(作为调节变量或边界条件)
2. 采用"主标题:副标题"的三段式结构,副标题写清 X 与 Y 的关系。
3. 使用组织行为学的规范术语,避免口语化表述;但不要堆砌生僻词,
以"同行能据此准确检索"为准。
【口语化研究设想】
"员工如果长期担心被 AI 替代,会不会导致离职倾向上升或工作投入下降?
如果领导给予足够支持,这种影响会不会减弱?"第三步:审读模型产出
模型通常会返回若干候选,把口语中的"害怕替代""摸鱼""心理按摩"替换为可检索、可定位的规范术语。以下为典型的产出形态:
💡 预期产出(示例)
- 《AI 替代焦虑对员工反生产力行为的影响:组织支持感的调节作用》
- 《技术性失业担忧与组织退缩行为:基于包容型领导调节效应的实证研究》
- 《当替代焦虑遇上组织支持:AI 替代焦虑对离职倾向的影响及其边界条件》
这些候选都满足三重功能:术语可被组织行为学主题词表检索(可检索)、"组织退缩行为""组织支持感"标明了理论谱系(可定位)、副标题读得出单向的 X→Y 与调节项 W(可评判)。下一节我们把第 1 个候选逐词拆开,验证它到底改对了哪几处。
词→术语对照:标题改对了哪几处
仅判断"产出看上去专业"是不够的——你需要能逐词说明它替换了原句的哪个口语词、对应结构里的哪个构件。这是验证一个标题是否合格的核心动作。下面取上一节第 1 个候选标题,把承担指认功能的改动拆成三列。
候选标题:《AI 替代焦虑对员工反生产力行为的影响:组织支持感的调节作用》
| 原句口语词 | 换成的规范术语 | 为什么这样换(对应结构构件) |
|---|---|---|
| "害怕被 AI 替代" | AI 替代焦虑(X) | 把模糊情绪锁定为可测量的自变量;对应 Case A 中 Anxiety_1..12(反向题 Anxiety_4_R 重编码后取均值得 Anxiety_Mean),评审一看即知测量来源。术语化才使其可检索、可评判。 |
| "离职或摸鱼" | 反生产力行为(Y) | "离职/摸鱼"是两个混在一起的口语结果;收敛为单一因变量(反生产力行为,离职倾向亦属同一组织退缩谱系),避免"一题双因变量"。 |
| "领导给的心理按摩" | 组织支持感(W) | 把口语化的"安抚"替换为组织行为学的标准构念,并明确其在标题中的调节身份——它改变 X→Y 的强弱,而非传导路径。 |
⚠️ 只标"承担指认功能"的改动
标题里的"影响""调节作用"等措辞是结构连接词,不承担 X / Y / W 的指认功能——不要把它们算作"改动点"。交付物要求的"改了哪几点",指的正是上表这种能落到具体构件、能对应到数据列的实质替换,而非辞藻的多少。能把每一处改动都对应到一个变量与一列数据,这个标题才算真正"立住"。
逐要素对照:写砸 vs 写好
标题不是术语越多越好。下面把一个不合格的标题与其修复版逐要素对照,落点全部对应到课程的 Case B 经管面板数据集(30 省 × 10 年,含 DigEcon_Index、HumanCap_per10k、Innovation_Index)。
❌ 写砸:《数智化时代赋能视域下的组织韧性多维耦合机制研究》 ✅ 写好:《数字经济的创新红利从何而来:产业结构升级在"数字经济发展水平→区域创新能力"中的中介路径》
| 构件 | 写砸版的问题 | 写好版的做法 |
|---|---|---|
| X(自变量) | "数智化时代""赋能视域"是背景性的修饰,不是一个可测量的自变量——读者无法回答"原因变量是什么"。 | X = 数字经济发展水平,直接对应数据列 DigEcon_Index,可测、可检索。 |
| Y(因变量) | "组织韧性"勉强是一个结果,但被"多维耦合机制"包裹,指向变得模糊。 | Y = 区域创新能力,对应 Innovation_Index,是单一、明确的核心因变量。 |
| X→Y(因果方向) | "耦合"是双向词,没有交代谁影响谁;实证标题必须读得出单向关系。 | 副标题用箭头直接写出 数字经济发展水平 → 区域创新能力,方向唯一、可证伪、可上回归。 |
| M / W(机制或边界) | 既无中介也无调节,更无副标题,放弃了呈现研究创新点的位置。 | M = 产业结构升级(如以第三产业占比度量),构成 X→M→Y 的中介路径,恰是研究的贡献所在。 |
| 整体可读性 | 描述了一片"场域",却没有一条可被数据检验的因果链,评审难以判断设计。 | 三段式结构 + 单向链条,读者不读正文即可还原研究骨架。 |
❌ 写砸版的根本症结
它用术语描述了一个宽泛的"研究场域",却没有指出一条可证伪的因果链。无论术语多专业,只要标不出从 X 指向 Y 的单向箭头,就通不过实证标题的最低及格线。
Worked Example 二:方法学类题目的术语化(Case C 模型评估)
并非所有实证研究都是"X 影响 Y"的因果型。比较型 / 方法学型研究同样需要规范标题,只是构件的填法略有不同。这里用课程的 Case C 模型评估数据集(300×3,三列 Quality_GPT5 / Quality_Claude47 / Quality_Gemini25,1–5 分,3 名标注者)演示这一变体——它对应一个常见的口语设想:"几个大模型谁写得更好,打分能不能信得过?"
【角色】你是一位在计算语言学 / 人工智能评测方向发表过基准研究的审稿人,
熟悉评分者信度(inter-rater reliability)等测量学术语,对不规范表述会直接指出。
【任务】
我有一个口语化的研究设想,请据此起草 4 个符合学术体例的规范标题。
本研究为模型质量的人工评测,不是因果研究,请按"比较 + 测量"而非"X 影响 Y"来组织标题。
【结构与格式要求】
1. 标题应让人读出:被比较对象(GPT-5 / Claude 4.7 / Gemini 2.5 三个模型的生成质量,
对应 Quality_GPT5 / Quality_Claude47 / Quality_Gemini25),
以及测量层面的关注点(多标注者评分的一致性 / 信度)。
2. 采用"主标题:副标题"三段式;以 Claude 4.7(Quality_Claude47)作为对照基准。
3. 使用测量学与评测领域的规范术语,避免口语化表述,确保同行可检索。
【口语化研究设想】
"几个大模型谁写得更好?三个人各打 1 到 5 分,这个打分到底信不信得过?"💡 预期产出(示例)
- 《生成质量谁更优:GPT-5、Claude 4.7 与 Gemini 2.5 的人工评测及评分者信度分析》
- 《以 Claude 4.7 为基准的大模型文本质量比较:多标注者一致性视角下的评测研究》
- 《大语言模型生成质量的可靠测量:三模型对比中的评分者间信度(inter-rater reliability)检验》
🔁 变体要点
对比 Worked Example 一,可以看到标题公式的适用边界:因果型研究填 X / M / Y / W;比较型 / 方法学型研究则把"X 对 Y 的影响"替换为"对若干对象的比较",并把"调节 / 边界"替换为"测量层面的关注点"(此处是评分者信度)。三段式结构与"术语化、可检索"的要求不变——变的只是中段表达的是因果关系还是比较关系。判断你的题目属于哪一类,再决定中段怎么填。
🦴 小练习:去掉修辞,只看骨架(X / Y / W 标注法)
诊断一个标题合不合格,最快的方法是把修辞与连接词全部蒙住,只用方括号标出 X、Y、W。标不出从 X 指向 Y 的那条单向箭头,直接判不合格。
标注规则:[X] 自变量、[Y] 因变量、[M] 中介、[W] 调节;标完检查是否存在 [X] → [Y]。
点击展开:3 个候选标题的骨架标注(含 2 个合格 / 1 个不合格示范)
① 合格 —《AI 替代焦虑对员工反生产力行为的影响:组织支持感的调节作用》
骨架:[X] AI 替代焦虑(
Anxiety_Mean)→ [Y] 反生产力行为,[W] 组织支持感 判定:合格。能读出[X]→[Y],且 W 有明确落点(对应 Case A 的组织支持感构念)。
② 合格 —《技术性失业担忧与组织退缩行为:基于包容型领导调节效应的实证研究》
骨架:[X] 技术性失业担忧 → [Y] 组织退缩行为,[W] 包容型领导 判定:合格。X、Y 均为可检索的规范术语,副标题点明调节项,方向清晰。
③ 不合格 —《数智化时代赋能视域下的组织韧性多维耦合机制研究》
骨架:[X] ? → [Y] 组织韧性(方向被"耦合"抹平),[W] 无 判定:不合格。标不出
[X],也读不出单向箭头——卡在第一道关。
🧪 现在轮到你:拿你自己的候选标题,照下面这一行填,填不满
[X] → [Y]就回去改,别交。text我的标题:________________________________________ [X] = ____________(对应数据列:__________,如 Quality_GPT5 / DigEcon_Index / Anxiety_Mean) [Y] = ____________(对应数据列:__________) [W] = ____________(没有可留空,但 X、Y 必须有) 自检:[X] → [Y] 这条单向箭头读得通吗? □ 通 → 合格 □ 不通 → 打回重写
常见误区与纠正
学员把口语设想改写成标题时,问题高度集中在少数几类。下表逐条给出症状与纠正办法。
| 常见误区 | 症状(标题会怎样) | 纠正方法 |
|---|---|---|
| 术语越生僻越好 | 堆砌冷门词以显高深,反而无法被主题词表检索,同行查不到 | 以"同行能据此准确检索"为准;用学科通用规范术语,而非生造或罕见词 |
| 一题双因变量 | "离职或摸鱼""创新与绩效"并列两个结果,研究焦点分散 | 收敛为单一核心 Y,其余结果留待后续研究或作为子维度 |
| 因果方向不明 | 用"耦合""关系""互动"等双向词,读不出谁影响谁 | 在副标题用单向箭头或"对……的影响"等明确方向的表达 |
| 混淆中介与调节 | 把边界条件写成传导路径,或反之 | 先判断该变量回答的是"为什么(M)"还是"何种条件下(W)",再落笔(定义见上文术语表) |
| 背景词冒充自变量 | "数智化时代""新发展格局"当作 X,但它不可测量 | X 必须能对应到一个可测变量 / 一列数据;时代背景只能进引言,不能当 X |
| 错把比较型套成因果型 | 模型评测、横向对比类研究硬写成"X 影响 Y" | 比较 / 方法学型研究按"比较 + 测量"组织标题(见 Worked Example 二) |
输出仍不满意?如何迭代
即便提示词里 X / Y / W 都交代清楚了,模型首版产出也未必直接可用——这是正常的,规范标题往往是改出来的。不要推倒重来,按下面顺序做小步纠偏:
- 先定位是哪个构件的问题:术语不可检索 → 多半是没约束"以可检索为准";方向读不出 → 副标题缺单向表达;题目太泛 → X 或 Y 仍停留在背景词。哪个构件出问题就只针对它追加要求。
- 用一句负向纠偏追加指令:在同一对话里直接补"第 2 个标题的 Y 是两个结果的并列,请收敛为单一因变量后只重做该条",比重发整段更高效——这正是 第 2 课 讲的负向纠偏 / 迭代法。
- 把改好的写法沉淀回模板:一旦得到满意版本,把该构件的措辞(如某个规范术语、某种副标题句式)存进个人模板,下次同类题目直接复用。
一句话
首版不理想不代表方法失灵,而是某个构件还没"拧紧"。定位到构件 → 局部纠偏 → 回填模板,三步即可把一个粗糙标题迭代到可交付。
边界与局限:标题公式管到哪里、不管哪里
X / M / Y / W 是一套针对实证研究标题的结构工具,用好它能显著提升标题的规范度与可读性,但它有明确的适用边界。把以下几条记牢,比多套一个公式更重要。
| 边界 / 适用限制 | 说明 | 你应该怎么做 |
|---|---|---|
| 只适用于实证研究 | 理论思辨、文献综述、纯方法论文不以"变量关系"为主轴,硬套 X→Y 反而别扭 | 综述型用"对……研究的系统梳理"等体例;本公式留给有变量、有数据的实证题 |
| 规范 ≠ 有价值 | 公式只保证标题"读得出设计",不保证研究问题本身重要、有创新 | 选题价值由理论缺口与现实意义决定(见第 10 课);公式是必要条件,非充分条件 |
| 术语是为检索,不是为唬人 | 过度生僻的术语损害可检索性,与公式目标相悖 | 以学科通用词为先,宁可朴素准确,不要艰深难检 |
| 模型给的是候选,判断在你 | 大模型擅长把口语改写成规范措辞,但它不替你判断该用中介还是调节、X/Y 选得是否合理 | 把模型产出当作候选池,逐条用上文标注法自检;变量的理论身份由你定夺 |
| 模型可能编造术语或张冠李戴 | 模型有时会生成看似专业、实则非学科标准的"伪术语",或误用构念 | 对不熟悉的术语,回到学科文献核实其确为通用构念,再写进标题 |
🚧 一句提醒
让模型"扮演审稿人"帮你打磨标题非常有用,但标题是否真正成立——X / Y 选得对不对、研究值不值得做、术语是不是学科通用——最终判断责任始终在你本人,不在被赋予人设的模型。规范的外形不能替代研究设计的内功。
📦 本课交付物
按本节实操任务完成并提交以下内容,提交 AI 初审,按 Module_Rubrics.md 对应维度评分:
- [ ] 选题生成清单:≥5 个候选标题(用 X + M + Y 结构 + 规范术语,区分因果型 / 比较型)
- [ ] 题目优化对照:选 1 个标题,给出"口语版 → 规范版"改写,并逐条标注改动对应的构件与数据列
- [ ] AI 协作日志:题目改写提示词的"指令 → AI 输出 → 你的修正"完整记录
- [ ] 沉淀模板:把改写提示词与标注法清单存入个人工具箱
🏁 本章小结
把本课凝练成可据以复习的几条要点:
- 核心命题:规范标题是一项硬要求,因为它同时承担可检索(规范术语才能被数据库主题词表索引)、可定位(术语标明理论归属)、可评判(结构让人不读正文即可还原研究设计)三重功能。
- 标题公式:实证标题由 X(自变量)/ M(中介)/ Y(因变量)/ W(调节) 四个构件组成,采用"主标题:副标题"三段式。X 与 Y 必须显式可读,且能读出单向的 X→Y。
- 改写两条腿:先把口语词换成学科规范术语(解决可检索、可定位),再把术语装进 X/M/Y/W 结构(解决可评判)。两步缺一,标题都不合格。
- 借助模型高效改写:用中文结构化提示词,把 X / Y / W 三个锚点显式交代给 Claude 4.8 / GPT-5 / Gemini 2.5,让其产出规范候选;模型给的是候选池,取舍与判断在你。
- 验证靠标注法:把修辞蒙住,只用
[X] [Y] [W]标骨架,检查是否存在[X] → [Y];标不出即打回。每处改动都应能对应到一个变量与一列数据。 - 公式有边界:它只适用于实证研究,且"规范"不等于"有价值";比较型 / 方法学型题目按"比较 + 测量"组织(见 Worked Example 二);术语是为检索而非为唬人;研究是否成立的最终判断在你本人。
自测清单(可保留逐项打勾)
- [ ] 我能说清"规范标题"为何同时具备可检索、可定位、可评判三重功能。
- [ ] 我能准确区分 X / M / Y / W 四个构件,并说出中介与调节的差别。
- [ ] 我已用中文
[一键复制]提示词在模型端跑通至少一个学科的标题改写,并拿到可进入"标注自检"的候选。 - [ ] 我能用标注法判定一个标题是否合格,并把每处改动落到具体变量与数据列。
- [ ] 我清楚标题公式的边界:只适用于实证题、规范不等于有价值、最终判断责任在我。
✍️ 思考与练习
下列练习用于把本节概念用起来(区别于"本课交付物"里的任务),建议写在你的本地笔记中。
练习 1(功能辨析)。 有同学认为"标题写得越文学、越有冲击力越好"。请用本课"可检索 / 可定位 / 可评判"三重功能,说明为什么一个文学性强但变量含糊的标题,在学术流通中往往是减分的。
好答案要点:能指出文学化表述多不在学科主题词表内(损害可检索)、不标明理论谱系(损害可定位)、读不出 X→Y(损害可评判);并说明学术标题的首要目标是被同行准确找到和判断,而非修辞感染力。
练习 2(术语化改写)。 取 Case A 心理问卷数据集(列含 Anxiety_1..12、反向题 Anxiety_4_R、Strategy_1..8、Efficacy_1..7、Age)。把口语设想"压力大的人是不是更爱用各种办法应对,这样心里会不会更有底"改写成一个规范标题,并标出 [X] [Y] [M] 各对应哪一组量表。
好答案要点:X 取焦虑(
Anxiety_1..12,注意Anxiety_4_R需反向重编码)、M 取应对策略(Strategy_1..8)、Y 取自我效能感(Efficacy_1..7);能写出"焦虑通过应对策略影响自我效能感"这类单向 X→M→Y 结构,且术语规范、可检索。
练习 3(变体判断)。 取 Case C 模型评估数据集(Quality_GPT5 / Quality_Claude47 / Quality_Gemini25,1–5 分、3 名标注者,基准为 Claude 4.7)。同学给出标题《GPT-5 的替代焦虑对 Gemini 2.5 生成质量的影响研究》。请指出它错在哪、属于本课哪个误区,并改成合格标题。
好答案要点:识别为"错把比较型套成因果型"——三个模型质量之间不存在 X 影响 Y 的因果关系,本研究是横向比较 + 信度测量;应改为"以 Claude 4.7 为基准的三模型生成质量比较及评分者信度分析"一类,按比较型组织标题。
练习 4(标注自检)。 从你自己第 10 课的候选题目中任取一个,先按本课标注法填出 [X] [Y] [W] 与对应数据列;若填不满 [X] → [Y],说明缺口在哪个构件,并给出一版修复后的标题。
好答案要点:能诚实暴露原标题的缺口(如 X 是背景词、Y 是双因变量、方向用了双向词),并针对该构件做最小修复,而非整句重写;修复后能读出单向 X→Y 且术语可检索。
