アバター共生社会

誰もが自在に活躍できるアバター共生社会の実現

Title / タイトル

誰もが自在に活躍できるアバター共生社会の実現(2020-2025, 内閣府ムーンショット型研究開発制度 研究参加者)

Projects / プロジェクト

(TBA)

Member / メンバ

  • (TBA)

Acknowledgement / 謝辞

  • Moonshot R&D Grant Number JPMJPS2011 (English)
  • JST ムーンショット型研究開発事業 JPMJMS2011 (日本語)

Website / ウェブサイト

  • https://avatar-ss.org/

Reference / 発表文献

References

2024

  1. SaSLaW: Dialogue Speech Corpus with Audio-visual Egocentric Information Toward Environment-adaptive Dialogue Speech Synthesis
    Osamu Take ,  Shinnosuke Takamichi ,  Kentaro Seki , and 2 more authors
    In Proceedings of Interspeech , Mar 2024
  2. 最先端の予測性能を持つ合成音声品質の自動評価システム UTMOS について
    佐伯 高明 ,  and  高道 慎之介
    日本音響学会誌, Mar 2024
    (Invited article / 招待記事)
  3. Text-Inductive Graphone-Based Language Adaptation for Low-Resource Speech Synthesis
    Takaaki Saeki ,  Soumi Maiti ,  Xinjian Li , and 3 more authors
    IEEE/ACM Transactions on Audio, Speech, and Language Processing, Mar 2024
  4. テキスト生成の自動評価尺度に基づく音声生成の自動評価
    佐伯 高明 ,  マイティ ソウミ ,  高道 慎之介 , and 2 more authors
    In 電子情報通信学会 音声研究会 , Mar 2024
  5. インターネット時代の音声コーパスの作成
    高道 慎之介
    日本音響学会誌, Mar 2024
    (Invited article / 招待記事)
  6. 環境音に対する日本語自由記述文コーパスとベンチマーク分析
    岡本 悠希 ,  高道 慎之介 ,  森松 亜依 , and 3 more authors
    In 言語処理学会 全国大会 , Mar 2024
  7. YODAS:YouTube 動画から構築される多言語大規模音声データセット
    Xinjian Li ,  高道 慎之介 ,  佐伯 高明 , and 3 more authors
    In 日本音響学会春季研究発表会 , Mar 2024
  8. NecoBERT:音声合成のために事前学習された自己教師あり学習モデル
    中田 亘 ,  佐伯 高明 ,  齋藤 佑樹 , and 2 more authors
    In 日本音響学会春季研究発表会 , Mar 2024
  9. Diversity-based core-set selection for text-to-speech with linguistic and acoustic features
    Kentaro Seki ,  Shinnosuke TakamichiTakaaki Saeki , and 1 more author
    In Proceedings of IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP) , Mar 2024
  10. 音環境に適応するテキスト音声合成のための一人称視点コーパス構築
    武 伯寒 ,  高道 慎之介 ,  関 健太郎 , and 2 more authors
    In 情報処理学会 音声言語処理研究会 , Mar 2024
  11. Do learned speech symbols follow Zipf’s law?
    Shinnosuke Takamichi ,  Hiroki Maeda ,  Joonyong Park , and 2 more authors
    In Proceedings of IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP) , Mar 2024
  12. Cocktail Machine Speech Chain: 重複あり音声を用いた音声認識・音声合成モデルの統一的学習
    松永 裕太 ,  高道 慎之介 ,  上乃 聖 , and 1 more author
    In 日本音響学会春季研究発表会 , Mar 2024
  13. Emotion-controllable Speech Synthesis using Emotion Soft Label, Utterance-level Prosodic Factors, and Word-level Prominence
    Xuan Luo ,  Shinnosuke TakamichiYuki Saito , and 2 more authors
    APSIPA Transactions, Mar 2024
  14. 複数のオーディオエフェクトが適用された楽音に対するエフェクトチェイン推定と原音復元
    武 伯寒 ,  渡邉 研斗 ,  中塚 貴之 , and 5 more authors
    In 日本音響学会春季研究発表会 , Mar 2024
  15. Audio Effect Chain Estimation and Dry Signal Recovery from Multi-Effect-Processed Musical Signals
    Osamu Take ,  Kento Watanabe ,  Takayuki Nakatsuka , and 5 more authors
    In Proceedings of International Conference on Digital Audio Effects (DAFx) , Mar 2024

2023

  1. Coco-Nut: Corpus of Japanese Utterance and Voice Characteristics Description for Prompt-based Control
    Aya Watanabe ,  Shinnosuke TakamichiYuki Saito , and 3 more authors
    In IEEE Automatic Speech Recogiton and Understanding Workshop (ASRU) , Mar 2023
  2. Coco-Nut: 自由記述文による声質制御に向けた多話者音声・声質自由記述ペアデータセット
    渡邊 亞椰 ,  高道 慎之介 ,  齋藤 佑樹 , and 2 more authors
    In 日本音響学会秋季研究発表会 , Mar 2023
  3. 深層学習で獲得される音声シンボルは自然言語シンボルと同様に Zipf 則に従うか?
    前田 紘希 ,  高道 慎之介 ,  朴 浚鎔 , and 1 more author
    In 日本音響学会秋季研究発表会 , Mar 2023
  4. 学習・評価ループを用いたデータ選択によるダークデータからの音声合成
    関 健太郎 ,  高道 慎之介 ,  佐伯 高明 , and 1 more author
    In 日本音響学会春季研究発表会 , Mar 2023
  5. Mid-attribute Speaker Generation using Optimal-Transport-based Interpolation of Gaussian Mixture Models
    Aya Watanabea ,  Shinnosuke TakamichiYuki Saito , and 2 more authors
    In Proceedings of IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP) , Mar 2023
  6. vTTS: visual-text to speech
    Yoshifumi Nakano ,  Takaaki SaekiShinnosuke Takamichi , and 2 more authors
    In Proceedings of IEEE Spoken Language Technology Workshop (SLT) , Mar 2023
  7. How Generative Spoken Language Model Encodes Noisy Speech: Investigation from Phonetics to Syntactics
    Joonyong Park ,  Shinnosuke TakamichiTomohiko Nakamura , and 3 more authors
    In Proceedings of Interspeech , Mar 2023
  8. Text-to-speech synthesis from dark data with evaluation-in-the-loop data selection
    Kentaro Seki ,  Shinnosuke TakamichiTakaaki Saeki , and 1 more author
    In Proceedings of IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP) , Mar 2023
  9. Improving robustness of spontaneous speech synthesis with linguistic speech regularization and pseudo-filled-pause insertion
    Yuta MatsunagaTakaaki SaekiShinnosuke Takamichi , and 1 more author
    In Proceedings of Speech Synthesis Workshop (SSW) , Mar 2023