アバター共生社会

誰もが自在に活躍できるアバター共生社会の実現

Title / タイトル

誰もが自在に活躍できるアバター共生社会の実現(2020-2025, 内閣府ムーンショット型研究開発制度 研究参加者)

Projects / プロジェクト

(TBA)

Member / メンバ

  • (TBA)

Acknowledgement / 謝辞

  • Moonshot R&D Grant Number JPMJPS2011 (English)
  • JST ムーンショット型研究開発事業 JPMJMS2011 (日本語)

Website / ウェブサイト

  • https://avatar-ss.org/

Reference / 発表文献

References

2024

  1. SaSLaW: Dialogue Speech Corpus with Audio-visual Egocentric Information Toward Environment-adaptive Dialogue Speech Synthesis
    Osamu Take ,  Shinnosuke Takamichi ,  Kentaro Seki ,  Yoshiaki Bando ,  and  Hiroshi Saruwatari
    In Proceedings of Interspeech , Mar 2024
  2. 最先端の予測性能を持つ合成音声品質の自動評価システム UTMOS について
    佐伯 高明 ,  and  高道 慎之介
    日本音響学会誌, Mar 2024
    (Invited article / 招待記事)
  3. Text-Inductive Graphone-Based Language Adaptation for Low-Resource Speech Synthesis
    Takaaki Saeki ,  Soumi Maiti ,  Xinjian Li ,  Shinji Watanabe ,  Shinnosuke Takamichi ,  and  Hiroshi Saruwatari
    IEEE/ACM Transactions on Audio, Speech, and Language Processing, Mar 2024
  4. テキスト生成の自動評価尺度に基づく音声生成の自動評価
    佐伯 高明 ,  マイティ ソウミ ,  高道 慎之介 ,  渡部 晋治 ,  and  猿渡 洋
    In 電子情報通信学会 音声研究会 , Mar 2024
  5. インターネット時代の音声コーパスの作成
    高道 慎之介
    日本音響学会誌, Mar 2024
    (Invited article / 招待記事)
  6. 環境音に対する日本語自由記述文コーパスとベンチマーク分析
    岡本 悠希 ,  高道 慎之介 ,  森松 亜依 ,  渡邊 亞椰 ,  井本 桂右 ,  and  山下 洋一
    In 言語処理学会 全国大会 , Mar 2024
  7. YODAS:YouTube 動画から構築される多言語大規模音声データセット
    Xinjian Li ,  高道 慎之介 ,  佐伯 高明 ,  William Chen ,  塩田さやか ,  and  渡部 晋治
    In 日本音響学会春季研究発表会 , Mar 2024
  8. NecoBERT:音声合成のために事前学習された自己教師あり学習モデル
    中田 亘 ,  佐伯 高明 ,  齋藤 佑樹 ,  高道 慎之介 ,  and  猿渡 洋
    In 日本音響学会春季研究発表会 , Mar 2024
  9. Diversity-based core-set selection for text-to-speech with linguistic and acoustic features
    Kentaro Seki ,  Shinnosuke TakamichiTakaaki Saeki ,  and  Hiroshi Saruwatari
    In Proceedings of IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP) , Mar 2024
  10. 音環境に適応するテキスト音声合成のための一人称視点コーパス構築
    武 伯寒 ,  高道 慎之介 ,  関 健太郎 ,  坂東 宜昭 ,  and  猿渡 洋
    In 情報処理学会 音声言語処理研究会 , Mar 2024
  11. Do learned speech symbols follow Zipf’s law?
    Shinnosuke Takamichi ,  Hiroki Maeda ,  Joonyong Park ,  Daisuke Saito ,  and  Hiroshi Saruwatari
    In Proceedings of IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP) , Mar 2024
  12. Cocktail Machine Speech Chain: 重複あり音声を用いた音声認識・音声合成モデルの統一的学習
    松永 裕太 ,  高道 慎之介 ,  上乃 聖 ,  and  猿渡 洋
    In 日本音響学会春季研究発表会 , Mar 2024
  13. Emotion-controllable Speech Synthesis using Emotion Soft Label, Utterance-level Prosodic Factors, and Word-level Prominence
    APSIPA Transactions, Mar 2024
  14. 複数のオーディオエフェクトが適用された楽音に対するエフェクトチェイン推定と原音復元
    武 伯寒 ,  渡邉 研斗 ,  中塚 貴之 ,  Tian Cheng ,  中野 倫靖 ,  後藤 真孝 ,  高道 慎之介 ,  and  猿渡 洋
    In 日本音響学会春季研究発表会 , Mar 2024
  15. Audio Effect Chain Estimation and Dry Signal Recovery from Multi-Effect-Processed Musical Signals
    Osamu Take ,  Kento Watanabe ,  Takayuki Nakatsuka ,  Tian Cheng ,  Tomoyasu Nakano ,  Masataka Goto ,  Shinnosuke Takamichi ,  and  Hiroshi Saruwatari
    In Proceedings of International Conference on Digital Audio Effects (DAFx) , Mar 2024
  16. Real-Time Noise Estimation for Lombard-Effect Speech Synthesis in Human–Avatar Dialogue Systems
    Yuto Ishikawa ,  Osamu Take ,  Tomohiko Nakamura ,  Norihiro Takamune ,  Yuki SaitoShinnosuke Takamichi ,  and  Hiroshi Saruwatari
    In Asia Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA ASC) , Mar 2024
  17. NecoBERT: Self-Supervised Learning Model Trained by Masked Language Modeling on Rich Acoustic Features Derived from Neural Audio Codec
    Wataru Nakata ,  Takaaki SaekiYuki SaitoShinnosuke Takamichi ,  and  Hiroshi Saruwatari
    In Asia Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA ASC) , Mar 2024
  18. J-CHAT: 音声言語モデルのための大規模日本語対話音声コーパス
    中田 亘 ,  関 健太郎 ,  谷中 瞳 ,  齋藤 佑樹 ,  高道 慎之介 ,  and  猿渡 洋
    In 日本音響学会秋季研究発表会 , Mar 2024
  19. 人間とアバターとの対話システムにおける拡散性雑音下リアルタイム推定雑音を用いたLombard効果模擬音声合成のための検討
    石川 悠人 ,  武 伯寒 ,  中村 友彦 ,  高宗 典玄 ,  齋藤 佑樹 ,  高道 慎之介 ,  and  猿渡 洋
    In 日本音響学会秋季研究発表会 , Mar 2024

2023

  1. Coco-Nut: Corpus of Japanese Utterance and Voice Characteristics Description for Prompt-based Control
    Aya Watanabe ,  Shinnosuke TakamichiYuki Saito ,  Wataru Nakata ,  Detai Xin ,  and  Hiroshi Saruwatari
    In IEEE Automatic Speech Recogiton and Understanding Workshop (ASRU) , Mar 2023
  2. Coco-Nut: 自由記述文による声質制御に向けた多話者音声・声質自由記述ペアデータセット
    渡邊 亞椰 ,  高道 慎之介 ,  齋藤 佑樹 ,  辛 徳泰 ,  and  猿渡 洋
    In 日本音響学会秋季研究発表会 , Mar 2023
  3. 深層学習で獲得される音声シンボルは自然言語シンボルと同様に Zipf 則に従うか?
    前田 紘希 ,  高道 慎之介 ,  朴 浚鎔 ,  and  猿渡 洋
    In 日本音響学会秋季研究発表会 , Mar 2023
  4. 学習・評価ループを用いたデータ選択によるダークデータからの音声合成
    関 健太郎 ,  高道 慎之介 ,  佐伯 高明 ,  and  猿渡 洋
    In 日本音響学会春季研究発表会 , Mar 2023
  5. Mid-attribute Speaker Generation using Optimal-Transport-based Interpolation of Gaussian Mixture Models
    Aya Watanabea ,  Shinnosuke TakamichiYuki SaitoDetai Xin ,  and  Hiroshi Saruwatari
    In Proceedings of IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP) , Mar 2023
  6. vTTS: visual-text to speech
    Yoshifumi Nakano ,  Takaaki SaekiShinnosuke Takamichi ,  Katsuhito Sudoh ,  and  Hiroshi Saruwatari
    In Proceedings of IEEE Spoken Language Technology Workshop (SLT) , Mar 2023
  7. How Generative Spoken Language Model Encodes Noisy Speech: Investigation from Phonetics to Syntactics
    Joonyong Park ,  Shinnosuke TakamichiTomohiko Nakamura ,  Kentaro Seki ,  Detai Xin ,  and  Hiroshi Saruwatari
    In Proceedings of Interspeech , Mar 2023
  8. Text-to-speech synthesis from dark data with evaluation-in-the-loop data selection
    Kentaro Seki ,  Shinnosuke TakamichiTakaaki Saeki ,  and  Hiroshi Saruwatari
    In Proceedings of IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP) , Mar 2023
  9. Improving robustness of spontaneous speech synthesis with linguistic speech regularization and pseudo-filled-pause insertion
    In Proceedings of Speech Synthesis Workshop (SSW) , Mar 2023