文献阅读

记录我的文献阅读系统搭建。

系统搭建

明确目标:

  • 如何搜集相关领域文献
  • 如何阅读文献
    • 如何笔记/提取关键内容
  • 如何整理文献

文献搜集

  • Google Scholar: 主要用于查找学术论文和引用。
  • arXiv: 预印本论文,尤其是计算机科学和数学领域。
  • ResearchGate: 学术社交网络,可以直接联系作者获取论文。
  • IEEE Xplore: 电子和计算机科学领域的文献。
  • ACM Digital Library: 计算机科学领域的文献。

搜索策略

  • 关键词组合: 使用同义词、相关术语组合搜索
  • 引用链追踪: 从核心论文出发,向前追踪引用,向后查看被引用
  • 作者追踪: 关注领域内知名学者的最新工作
  • 定期订阅: 设置Google Scholar alerts,关注特定关键词的新论文

文献阅读

李沐老师的三流程

按照李沐老师推荐的流程,读三遍论文:略读 -> 通读 -> 精读

第一遍

title -> abstraction -> conclusion

可选:experiment, method

第一遍的目的是判断这篇论文的价值,是不是自己需要的论文,相当于快速了解这篇论文的核心内容。

第二遍

在第一遍判断这篇论文有价值之后,开始进行通读。

通读过程中,遇到一些引用的文献,记录下来,同时着重关注图和表。

判断是否需要读第三遍,即精读。

第三遍

了解每一句什么意思,同时思考/脑补如果自己做这个研究/写这篇论文是如何表现

这一遍会对整篇论文的细节有更深入的理解。


GPT5老师的四层拆解+三步输出

四层拆解法 —— 深度阅读的路线图

一篇经典论文,你要分四个维度啃透,不只是看懂方法。

宏观定位 → 方法拆解 → 实验设计 → 批判与迁移

宏观定位

明白这篇论文在领域中的位置

  • 研究背景(这个问题为什么重要?)
  • 所属任务(多模态对齐、生成、融合…)
  • 当时的技术背景 & 已有方法的缺陷
  • 该论文的核心贡献(用一句话概括)

产出:一句话“论文电梯演讲”

例如:CLIP 是第一个用大规模图文对进行跨模态对齐并实现零样本任务的通用模型。

方法拆解

像“剖开机器”一样看清楚每个零件

  • 模型整体结构(画 Pipeline 图
  • 核心模块(数据预处理、编码器、融合、损失函数)
  • 数学公式推导(自己从零推一次,确保能解释符号含义)
  • 模块之间的数据流(输入、输出维度变化)

技巧

  • 公式推不通 → 用 GPT 或教材检查
  • 每个模块要能用白话+公式两种方式讲出来
实验设计

看它是怎么证明自己方法有效的

  • 数据集选择(规模、特点、难点)
  • 对比实验(baseline 是什么)
  • 消融实验(哪些模块/超参是关键)
  • 评估指标(为什么用这些指标)

思考

  • 有没有实验设计上的偏差?
  • 如果我来复现,有什么可以改进的?
批判与迁移

展现你不只是“会看”,还会“思考”

  • 局限性(数据依赖?计算成本?泛化能力?)
  • 可能的改进方向(结合你方向的设想)
  • 是否能迁移到其他任务/模态?

三步输出法 —— 在讨论中“显得很懂”

你跟老师/同组讨论时,尽量按以下逻辑汇报,这样能让人快速判断你是否研究透了:

高层总结(3–5 句)

表明你抓到了精髓

  • 任务背景 + 核心方法 + 最主要的贡献
  • 如果能用一句话点出论文的“亮点”和“短板”,老师会立刻觉得你看得很透
结构化细节

用可视化和列表,让别人一眼明白你啃了细节

  • 自己画的 Pipeline 图
  • 核心公式 + 数据流解释
  • 实验对比表格(baseline → 本文 → 提升幅度)
批判性思考

老师最看重的部分

  • 说出 1–2 个论文的潜在问题(不要只夸)
  • 给出改进设想(哪怕很初步)
  • 结合自己研究方向提迁移思路

文献整理

采用zotero + obsidian的方式进行文献整理。

配置了obsidian的zotero integration插件,具体过程借助网上教程。

其中我只使用zotero进行文献导入与管理,对于重要论文进行精读,大部分论文借助gpt辅助阅读,之后导出到obsidian借助gpt进行阅读和笔记。

笔记模板:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
# {{title}} 
Authors: {{authors}}{{directors}}
{% if date %}Date: {{date | format("YYYY-MM-DD")}}{% endif %}
**来源:** {{url}}
**Zotero 位置:** {{pdfZoteroLink}}
**Tags :** {{hashTags}}

>[!abstract]+
>*« {{abstractNote}} »*

> [!Annotations]+
>{% for annotation in annotations -%}
>>[!Annotation|{{annotation.color}}]+
>>{%- if annotation.annotatedText -%}*« {{annotation.annotatedText}} »*([{{annotation.page}}](zotero://open-pdf/library/items/{{annotation.attachment.itemKey}}?page={{annotation.page}}&annotation={{annotation.id}})){% endif %}{% if annotation.comment %}
>>{{annotation.comment}}{%- endif %}
>>
>{% endfor %}

---

## 🔍 简要概述
- **研究问题**:该论文试图解决什么问题?
- **核心思想**:最关键的创新点和方法是什么?
- **主要贡献**
1.
2.

---

## 📊 通读分析
### 🧠 背景与动机
- 领域背景:
- 动机与研究价值:

### 🧩 方法框架
- 整体结构:
- 算法流程:
- 损失函数:

### 📈 实验设计
- 数据集:
- 评价指标:
- 消融实验:
- 与SOTA比较:

### 📌 图表分析
- Figure 1:
- Table 1:

> (记录图表中的关键数据或现象)

---

## 🧬 精读记录

### 🔬 逐段理解与注释
> 建议使用 block reference 或嵌入原文段落,并添加逐段理解与问题

- 引言:
> 逐句总结、记录不清楚的术语
- 方法部分:
> 公式推导 + 网络结构图重构
- 实验部分:
> 是否复现?是否通用?

---

## 💡 个人思考与评价

- 有哪些方法值得借鉴?
- 是否可以应用到我的研究中?
- 有哪些可以改进/拓展的点?
- 和哪些我读过的论文相关?

---

## 🔗 相关文献与引用

- 引用了哪些关键论文:
- [ ] Paper A
- [ ] Paper B
- 本文被以下论文引用(自动填充或手动补充):
- [ ] Paper X
- [ ] Paper Y

---

## 🧠 阅读状态追踪
- [ ] 第一遍阅读完成
- [ ] 第二遍阅读完成
- [ ] 第三遍精读完成
- [ ] 衍生思考记录完成

思考

文献/论文阅读的目的是什么?

目前而言,在入门阶段,主要是了解领域内的研究现状和方法,积累知识。
在深入研究阶段,主要是了解具体的研究方法和实验设计,积累经验。

阅读的过程中一定要思考,这篇论文的目的/初衷是什么?换言之,产生这样一篇论文的动机是什么,也就是一个好的故事背景。以及延申开来的解决了什么问题,达到了什么效果。这是从宏观上整体把握论文的核心内容,其次才是细节上的模型架构、数据通路、实验方法等等。