ビスポーク音声デザイン
ビスポーク音声デザインの骨格形成と体系化
Title / タイトル
ビスポーク音声デザインの骨格形成と体系化(2021-2025, 科研費基盤A 分担)
Projects / プロジェクト
State-of-the-art text-to-speech synthesis is capable of synthesizing speech that is nearly equivalent to that of humans, and is already in use in smart speakers. On the other hand, technologies that enable flexible processing of the same text according to the situation are in demand mainly in the area of content production. As a new direction in speech synthesis research, this research aims to develop technology that allows a computer to collaborate with a user as if it were a craftsman and assist the user’s speech design. In collaboration with the field of psychology, we will identify psychological parameters for voice control suitable for text-to-speech synthesis and voice quality conversion. The aim is to systematize a series of techniques for fine-tuning the user’s rough design and synthesizing natural sound as “Bespoke Speech Design”.
最先端のテキスト音声合成は人間とほぼ等価な音声を合成可能であり,すでにスマートスピーカなどで利用されている.一方,同じテキストでも状況により表現を柔軟に加工できる技術は,主にコンテンツ制作の領域において需要がある.本研究は,音声合成研究の新たな方向性として,計算機があたかも職人のようにユーザと共同し,ユーザの音声デザインを助ける技術開発を目指す.心理学分野と連携し,テキスト音声合成や声質変換に適した音声制御のための心理パラメータを明らかにする.ユーザが大まかにデザインした結果を計算機が微調整し,自然な音声を合成する一連の技術を「ビスポーク音声デザイン」として体系化することが狙いである.
Member / メンバ
- Masanori Morise / 森勢 将雅(明治大学,代表)
- Akihiro Tanaka / 田中 章浩(東京女子大学)
- Daisuke Saito / 齋藤 大輔(東京大学)
- Shinnosuke Takamichi / 高道 慎之介(慶應義塾大学)
Acknowledgement / 謝辞
- JSPS KAKENHI 21H04900 (English)
- JSPS 科研費 21H04900 (日本語)
Website / ウェブサイト
- https://kaken.nii.ac.jp/ja/grant/KAKENHI-PROJECT-21H04900/
Reference / 発表文献
- (高明 佐伯 & 慎之介 高道, 2024)
- (Suda et al., 2024)
- (慎之介 高道, 2024)
- (緋慧 大中 et al., 2024)
- (Li et al., 2024)
- (亘 中田 et al., 2024)
- (亞椰 渡邊 et al., 2024)
- (Takamichi et al., 2024)
- (Watanabe et al., 2023)
- (Ueda et al., 2023)
- (亞椰 渡邊 et al., 2023)
- (Takamichi et al., 2024)
- (Luo et al., 2024)
- (健太郎 関 et al., 2023)
- (Nakamura et al., 2023)
- (Watanabea et al., 2023)
- (Ohnaka et al., 2023)
- (Nakano et al., 2023)
- (仁志 須田 et al., 2024)
- (伯寒 武 et al., 2024)
- (Take et al., 2024)
- (嶺佑 松下 et al., 2025)
- (仁志 須田 & 慎之介 高道, 2025)
- (Suda et al., 2025)
- (仁志 須田 & 慎之介 高道, 2025)
- (瞭介 阪井 et al., 2025)
- (凜佳 信川 et al., 2025)
- (Nobukawa et al., 2025)
- (嶺佑 松下 et al., 2025)
- (missing reference)
- (Nobukawa et al., 2025)
- (嶺佑 松下 et al., 2026)