リンクをクリップボードにコピー
コピー完了
iuputとしてきたオーディオを解析し、BGMを削除したいです。
具体的にいいますと、オーディオにはBGMと人のボイスが流れています。
そのボイスの中で、人の音声だけを抽出したいのですが、やり方がわかりません。
別の言い方をしますと、BGMを消音にして、人の声だけを残したいです。
周波数から人の声、BGMに分けて抽出するのか?
波形から抽出するのか?
またはこの抽出は不可能なのか?
具体的にどのようにやるのかわかりません。
ネットを調べてみると、センターチャンネルからボーカルなどに分ける方法や、各チャンネルをモノラルファイルに抽出などがありましたができませんでした。
例を挙げた動画のURLを貼り付けます。
この動画のBGMを消音にして、実況者の声や観客の声を残したいです。
リンクをクリップボードにコピー
コピー完了
I'm afraid that this extraction simply won't work at all - the source is effectively mono, so there is no mechanism for separating the voice from the background.
この抽出はまったく機能しないのではないかと心配しています。ソースは事実上モノなので、音声を背景から分離するメカニズムはありません。