非常感谢您们的工作,这是一个非常具有时代意义的研究! 我是一名在读研究生,最近因为兴趣了解到了本项目。在阅读源码时发现一个问题: 在cross-attention计算中,spk_emb只拼接到了矩阵K中,而并没有拼接到矩阵V,那么在实际的等效计算后spk_emb并没有参与到计算当中,这应该算是一个小小的bug?不知道这会对模型有什么影响。
非常感谢您们的工作,这是一个非常具有时代意义的研究!
我是一名在读研究生,最近因为兴趣了解到了本项目。在阅读源码时发现一个问题:
在cross-attention计算中,spk_emb只拼接到了矩阵K中,而并没有拼接到矩阵V,那么在实际的等效计算后spk_emb并没有参与到计算当中,这应该算是一个小小的bug?不知道这会对模型有什么影响。