リアルタイム音能力拡張

スモールデータ機械学習に基づくリアルタイム音コミュニケーション能力拡張システム

References

2024

  1. SRC4VC: Smartphone-Recorded Corpus for Voice Conversion Benchmark
    Yuki Saito ,  Takuto Igarashi ,  Kentaro Seki ,  Shinnosuke Takamichi ,  Ryuichi Yamamoto ,  Kentaro Tachibana ,  and  Hiroshi Saruwatari
    In Proceedings of Interspeech , Mar 2024
  2. Spatial Voice Conversion: Voice Conversion Preserving Spatial Information and Non-target Signals
    Kentaro Seki ,  Shinnosuke Takamichi ,  Norihiro Takamune ,  Yuki Saito ,  Kanami Imamura ,  and  Hiroshi Saruwatari
    In Proceedings of Interspeech , Mar 2024
  3. SRC4VCデータセット:多話者音声変換モデルのベンチマークを目的とした実デバイス収録音声コーパス
    齋藤 佑樹 ,  五十嵐 琢斗 ,  関 健太郎 ,  高道 慎之介 ,  山本 龍一 ,  橘 健太郎 ,  and  猿渡 洋
    In 電子情報通信学会 音声研究会 , Mar 2024
  4. Real-Time Noise Estimation for Lombard-Effect Speech Synthesis in Human–Avatar Dialogue Systems
    Yuto Ishikawa ,  Osamu Take ,  Tomohiko Nakamura ,  Norihiro Takamune ,  Yuki SaitoShinnosuke Takamichi ,  and  Hiroshi Saruwatari
    In Asia Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA ASC) , Mar 2024
  5. 人間とアバターとの対話システムにおける拡散性雑音下リアルタイム推定雑音を用いたLombard効果模擬音声合成のための検討
    石川 悠人 ,  武 伯寒 ,  中村 友彦 ,  高宗 典玄 ,  齋藤 佑樹 ,  高道 慎之介 ,  and  猿渡 洋
    In 日本音響学会秋季研究発表会 , Mar 2024