Audiocc

记录在sjtu Audiocc Lab 的科研规划与经历

前言

进组已有半年,因大二上过摆,搁置了科研任务,同时也耽搁了论文投稿,甚至于目前还处于入门上手阶段,实为惭愧。于3月13日与lcd老师详谈,决定调整科研规划。整体计划先熟悉espnet的使用,后续根据idea开始着手准备九月初ddl的ICASSP投稿。

科研规划

熟悉espnet

今天lcd老师向我演示了espnet的大致使用流程,介绍了整体结构框架,以及vscode远程debug的方法。他说可以想想有什么idea能够投九月份的ICASSP(应该是还太早他们也没开始准备)

那么我这一周左右的任务是在wsj0上跑通整个enh部分的流程,从stage1到stage11左右,并且手写一个separator(推荐transformer)。

注意stage1不需要matlab的数据处理部分,通过一些操作去掉。

给自己定下ddl,下周三之前完成,也就是3.19号,这期间晚上可以多去电院3-520,听听学长学姐们的讨论,更多了解这个方向。

以下记录每日科研投入。

3-17

第一天到实验室工作,但是似乎晚上没什么人……一开始不太记得要做什么,研究了一会有了些眉目,详见从零开始跑espnet语音分离

工作快三小时,卡在配环境上面,碰到了一个bug感觉像是环境的问题,但导还没回我,悲

竟然十点不到就只剩我一个人了,想必师兄师姐们的博士生活都很丰富吧

目前卡在stage1,数据准备尚未完成……

后续手动安装,成功开跑,跑完数据准备前四个stage

3-19

在实验室待了一个下午,总算是完全解决环境问题,从espnet到espnet3,搞坏了两个环境,成功跑完stage5,明天或者后天在开始training部分的调试。