多元自動通訳

多元自動通訳システムと評価法に関する研究とその応用展開 (2022-2026, 科研費基盤S 分担)

Title / タイトル

多元自動通訳システムと評価法に関する研究とその応用展開

Projects / プロジェクト

In this research, we will focus on the following issues: 1) Multiple simultaneous interpretation methods: multiple simultaneous interpretation using paralinguistic speech translation, video, prior and external knowledge, interpretation output optimization, and progressive voice interpretation method advancement; 2) Evaluation methods and real-time evaluation techniques for interpretation quality: interpretation process analysis, interpreter support techniques, common methods for interpreters and automatic interpretation systems, and the establishment of an objective automatic evaluation method for interpretation quality using sensing, including brain activity; and 3) Establishment of a real-time interpretation quality evaluation method using a real-time interpretation quality evaluation system. Establishment of an objective automatic evaluation method for interpreting quality using sensing including brain activity. Task 3: Corpus construction and systems: Establishment of corpus alignment, quality annotation, corpus augmentation, construction of operational systems, construction of an ecosystem for data collection and improvement, and establishment of active learning and life-long learning methods.

本研究では,課題1:多元同時通訳方式:パラ言語音声翻訳およびビデオ・事前・外部知識の利用による多元同時通訳,通訳出力最適化,漸進的音声通訳方式高度化,課題2:通訳品質の評価法とリアルタイム評価技術:通訳プロセス分析,通訳者支援技術,通訳者・自動通訳システム共通の通訳品質の評価法,脳活動を含むセンシングによる通訳品質客観的自動評価法の確立.課題3:コーパス構築とシステム:通訳時間アライメント・品質アノテーション,コーパス増強,実運用システムの構築とデータ収集・改良のエコシステムの構築とアクティブラーニング,ライフロングラーニング法の確立を実施する.

Member / メンバ

  • 中村 哲(奈良先端科学技術大学院大学)
  • 河原 達也(京都大学)
  • 戸田 智基(名古屋大学)
  • 森島 繁生(早稲田大学)
  • 猿渡 洋(東京大学)
  • SAKTI Sakriani(北陸先端科学技術大学院大学)
  • 松下 佳世(立教大学)
  • 山田 優(立教大学)
  • 高道 慎之介(東京大学)
  • 渡辺 太郎(奈良先端科学技術大学院大学)
  • 須藤 克仁(奈良先端科学技術大学院大学)
  • 田中 宏季(奈良先端科学技術大学院大学)
  • 品川 政太朗(奈良先端科学技術大学院大学)

Acknowledgement / 謝辞

  • JSPS KAKENHI 21H05054 (English)
  • JSPS 科研費 21H05054 (日本語)

Website / ウェブサイト

  • https://kaken.nii.ac.jp/ja/grant/KAKENHI-PROJECT-21H05054/

Reference / 発表文献

References

2024

  1. 日本語音声合成における対話行為情報の利用による韻律改善
    佐藤 匡紀 ,  高道 慎之介 ,  and  猿渡 洋
    In 日本音響学会春季研究発表会 , Mar 2024
  2. 環境音に対する日本語自由記述文コーパスとベンチマーク分析
    岡本 悠希 ,  高道 慎之介 ,  森松 亜依 ,  渡邊 亞椰 ,  井本 桂右 ,  and  山下 洋一
    In 言語処理学会 全国大会 , Mar 2024
  3. JVNV: A Corpus of Japanese Emotional Speech with Verbal Content and Nonverbal Expressions
    Detai Xin ,  Junfeng Jiang ,  Shinnosuke TakamichiYuki Saito ,  Akiko Aizawa ,  and  Hiroshi Saruwatari
    IEEE Access, Mar 2024
  4. JNV Corpus: A Corpus of Japanese Nonverbal Vocalizations with Diverse Phrases and Emotions
    Speech Communication, Mar 2024
  5. 大規模な日本語笑い声コーパスを用いたテキストレス笑い声合成
    辛 徳泰 ,  高道 慎之介 ,  森松 亜依 ,  and  猿渡 洋
    In 日本音響学会春季研究発表会 , Mar 2024
  6. Emotion-controllable Speech Synthesis using Emotion Soft Label, Utterance-level Prosodic Factors, and Word-level Prominence
    APSIPA Transactions, Mar 2024
  7. Text-Inductive Graphone-Based Language Adaptation for Low-Resource Speech Synthesis
    Takaaki Saeki ,  Soumi Maiti ,  Xinjian Li ,  Shinji Watanabe ,  Shinnosuke Takamichi ,  and  Hiroshi Saruwatari
    IEEE/ACM Transactions on Audio, Speech, and Language Processing, Mar 2024
  8. テキスト生成の自動評価尺度に基づく音声生成の自動評価
    佐伯 高明 ,  マイティ ソウミ ,  高道 慎之介 ,  渡部 晋治 ,  and  猿渡 洋
    In 電子情報通信学会 音声研究会 , Mar 2024
  9. Cocktail Machine Speech Chain: 重複あり音声を用いた音声認識・音声合成モデルの統一的学習
    松永 裕太 ,  高道 慎之介 ,  上乃 聖 ,  and  猿渡 洋
    In 日本音響学会春季研究発表会 , Mar 2024

2023

  1. vTTS: visual-text to speech
    Yoshifumi Nakano ,  Takaaki SaekiShinnosuke Takamichi ,  Katsuhito Sudoh ,  and  Hiroshi Saruwatari
    In Proceedings of IEEE Spoken Language Technology Workshop (SLT) , Mar 2023
  2. Learning to Speak from Text: Zero-Shot Multilingual Text-to-Speech with Unsupervised Text Pretraining
    Takaaki Saeki ,  Soumi Maiti ,  Xinjian Li ,  Shinji Watanabe ,  Shinnosuke Takamichi ,  and  Hiroshi Saruwatari
    In Proceedings of the International Joint Conference on Artificial Intelligence (IJCAI) , Mar 2023