对于2025暑假的一些安排与规划
计划
目前时间:7.26 ~ 9.18 共55天
时间节点:
- 8.20 TOEFL考试
- 9.18 ICASSP的ddl
任务清单
- [ ] 准备TOEFL考试
- [ ] 完成ICASSP论文投稿
- [ ] BPPV医学影像处理
- [ ] MOE应用到语音分离任务
- [ ] 锻炼身体
- [ ] 健身
- [ ] 游泳
- [ ] 羽毛球、网球
- [ ] 阅读
- [ ] 学习
- [ ] 计算机网络知识
- [ ] 计算机视觉相关知识(需要用到的)
- [ ] 经济学入门研究
- [ ] 网页制作(生日贺卡等)
- [ ] 打理发型
OUTLINE
TOEFL
备考计划仅剩25天,三周不到,重点在于听力、口语和写作
每天保证一篇听力的训练,同时根据各种总结的方法准备口语和写作
确保每日2h以上的备考
ICASSP
前期先针对BPPV的医学影像处理进行研究,后期再针对MOE在语音分离任务中的应用进行研究
BPPV
目前来看任务难点在于数据质量太差,开始训练不能收敛
现有方案:
数据清洗 -》 数据增强 -》 模型训练
模型打算采用预训练resnet提取特征,再输入时序模型(lstm等)进行建模
MOE
目前导师已经写好代码,处于调参阶段,理论来说这个想法应该是能够work的,并且解决了计算性能瓶颈,感觉很promising
总结
我应该利用暑假这50多天的科研,了解科研各个环节的工作。目前我的两个任务,一个全部由我自己lead,要学会搜集信息,自己设计实验方案,自己分析数据,自己进行论文写作。虽然这是一个没有很多创新点的项目,但基本确定可以通过这个项目锻炼我对于全链路的掌控能力。
另一个跟着导师做的项目,熟悉一些调参手法,熟悉如何与他人进行合作?
总之有没有中论文不是最重要的,最重要的是在这个过程中熟悉科研,提高科研的能力,对于一个idea产出到论文产出的全流程。
日程
July
7.25
写下这篇记录的时间,昨晚研读导师提供的两篇论文,以及对自己的任务进行资料搜集,到三点睡,睡到下午一点,之后去实验室找导师谈。他自己想到了一个idea,利用moe的框架套到语音分离的任务上,减少计算开销,我认为是一个promising的项目。但同时能感受到他对于我BPPV项目的停滞表示不满,催促我先完成那个项目。
下午打羽毛球,发现退步很多,主要体能跟不上,动作也很奇怪。原定的去致远游泳馆考察没有实现。
注:四餐的辣椒炒肉也不辣
晚上打算进行数据集准备,以及规划这快两个月的安排,老爹帮我联系到一位做医学影像处理的老师,打算找他请教请教。
7.26
十点爬起来和倪老师打电话沟通,现在核心问题应该就在于数据处理,数据质量太差,标签太少等等。对于模型训练策略反而不是最重要的问题。他建议我多找找相关资料研究,比如肠胃息肉的处理,搜索关键词:半监督、视频分类、样本不均衡。此外还提议使用现有标签直接跑病症的baseline,可以试试,虽然肯定结果很差。以及类似于moe的方法迁移,选取一段视频中top-k的帧进行训练。
昨晚做梦,梦到我身处纽约,纽约的雪很大,我第一次在梦中见到那么多雪。
下午尝试清洗数据,发现数据标签做的真的太烂了……本来打算通过肉眼进行视频切分,使得数据质量高一点,尝试一会发现根本不行,现在走入了一个僵局。
如果用五种类型的眼震作为标签的话,我只有十来个样本,不然就只能从病症结果反推具有哪些眼震,但根据某些视频的说明文档,存在多种眼震的情况,使得这种反向推理可信度不高。
如果直接使用病症作为标签,很多数据质量并不高,最离谱的是有些标签让我无法确定到具体六种病症中的哪一种。
打算用原有思路跑一个baseline,最好还是采用第一批数据算了。同时多查找相关资料,看其他人怎么做的。
7.27
昨晚十二点半上床,早上九点不到就起来了
第一个到实验室,现在十一点了仍旧只有我一个人,些许是周日的缘故。与ssh斗智斗勇一小时终于把问题解决了。
其实相当于重开。之前的问题是我有两套.ssh的目录,分别位于root和windows的Users目录下,生成的密钥对都在root下,但是vscode的config配置使用的是Users目录下的.ssh目录,导致无法连接。
现在的情况是统一使用Users目录下的.ssh目录,生成新的密钥对,配置vscode的config文件,但是无法在wsl中通过命令行连接服务器,因为root目录下的.ssh目录下没有配置文件,尝试使用软链接但是权限一直出问题,遂放弃。这意味着之后连接服务器要么手动指定密钥对实现免密登录,要么就只能vscode打开窗口,而不能实现本地ssh命令行连接?
晚上跑了一个baseline,按照最初的想法,切片+resnet预训练模型提取特征+blstm建模,数据集勉强达到百分之二十的正样本,最后学习到结果还行
7.28
改善训练模型,想清楚最后的模型输入是什么,输出是什么;还可以采取哪些策略来改善性能,能不能再加入一些数据等问题
下午开始炼丹,最后炼了两小时炼出来一个还行的结果,不过前提是在我自己的数据集上跑的,不太确定泛化性,算作是一个简单的baseline了。但是归根结底还是数据太少,难免会过拟合,采取各种策略调节,好在样本小的好处是训练也快,两分钟可以跑二十轮。
明天可以加上MIL等策略试试,或者先分类是否有眼震,再分类什么类型。
7.29
上午睡觉,中午去开组会,第一次发言。
和小导讨论,决定先数据增强后再试试,以及尝试用第二份数据直接训练一个判定病症的模型
晚上看长安的荔枝,比较烂,不过抢到了8.29周深贵阳的票!!!去年的约定,刚好去玩一圈
7.30
台风天待在寝室里,睡到中午,下午做贺卡,对于html/css/json的实操经验又增加了,再次感叹还是在他人的基础上改进比较香
下午读了会博弈论,晚上接着做生日贺卡,依旧是情感复杂……不过又似乎看到了希望,至少我要努力成为我希望的样子,那么这段时间就做好手头的工作,认真科研,认真锻炼身体,认真学英语,尝试养成良好作息。
7.31
本来想熬通宵但失败了,起来和公司、医院沟通直接天塌了……这么大的任务量基本上不太能是我一个本科生能做到的
晚上和雷bro约饭,以及独自疯狂歌唱,很喜欢孙燕姿《半句再见》
8.1
早起和小导开会沟通,下午打球,晚上《南京照相馆》
8.2
昨晚开始追《进击的巨人》,今天中午起来,背了会单词把第一季看完了,又室内锻炼会
决心打造自己的工作流,相当于一个通用的问题解决/学习模板
比如说,我现在有几个任务,分别是:
- TOEFL备考(词汇,听力,口语与写作)
- BPPV项目(目前需要论文查阅,模型加强与运用mil等方法)
- 从上个项目引申而来的,个人论文阅读系统的pipeline搭建
- MOE项目(目前需要调参,了解moe的原理与应用)
- 锻炼身体(目前需要每天坚持锻炼,游泳、羽毛球等)
- 阅读(目前需要每天坚持阅读,经济学、计算机网络等)
学习工作流:
- 明确任务目标,最重要的想清楚你做这件事的动机是什么
- 任务分解,给出明确的操作方法
- 按照计划去完成
- 记录与复盘
今日实操:搭建论文阅读系统
- 目标:依靠已有软件资源搭建自己的论文阅读系统,即有一套自己的对任何主题的论文信息检索知识库
- 分解
- 查找互联网已有资料
- 融合各家所长进行选择,总结要点
- 依葫芦画瓢,逐步搭建论文阅读pipeline和知识库