Audiocc

记录在sjtu Audiocc Lab 的科研规划与经历

前言

进组已有半年，因大二上过摆，搁置了科研任务，同时也耽搁了论文投稿，甚至于目前还处于入门上手阶段，实为惭愧。于3月13日与lcd老师详谈，决定调整科研规划。整体计划先熟悉espnet的使用，后续根据idea开始着手准备九月初ddl的ICASSP投稿。

今天lcd老师向我演示了espnet的大致使用流程，介绍了整体结构框架，以及vscode远程debug的方法。他说可以想想有什么idea能够投九月份的ICASSP(应该是还太早他们也没开始准备)

那么我这一周左右的任务是在wsj0上跑通整个enh部分的流程，从stage1到stage11左右，并且手写一个separator(推荐transformer)。

注意stage1不需要matlab的数据处理部分，通过一些操作去掉。

给自己定下ddl，下周三之前完成，也就是3.19号，这期间晚上可以多去电院3-520，听听学长学姐们的讨论，更多了解这个方向。

以下记录每日科研投入。

第一天到实验室工作，但是似乎晚上没什么人……一开始不太记得要做什么，研究了一会有了些眉目，详见从零开始跑espnet语音分离

工作快三小时，卡在配环境上面，碰到了一个bug感觉像是环境的问题，但导还没回我，悲

竟然十点不到就只剩我一个人了，想必师兄师姐们的博士生活都很丰富吧

目前卡在stage1，数据准备尚未完成……

后续手动安装，成功开跑，跑完数据准备前四个stage

在实验室待了一个下午，总算是完全解决环境问题，从espnet到espnet3，搞坏了两个环境，成功跑完stage5，明天或者后天在开始training部分的调试。