人声分离是将混合音频中的人声和背景音乐分离的过程。目前比较流行的人声分离算法模型包括:

  1. 音频分解技术:NMF (Non-negative Matrix Factorization)、Sparse Coding、DICT
  2. 统计方法:GMM (Gaussian Mixture Model)、HMM (Hidden Markov Model)
  3. 基于神经网络的方法:Deep Learning、CNN (Convolutional Neural Network)、RNN (Recurrent Neural Network)
  4. 基于深度学习的方法:U-Net、Wave-U-Net、
Logo

Agent 垂直技术社区,欢迎活跃、内容共建。

更多推荐