音声処理

音声認識

音声認識時の書き言葉への整形

研究のポイント

フィラー（「あの」「えー」等の表現）を音声認識時に自動的に除去
大規模音声認識モデルOWSMを追加学習（ファインチューニング）
フィラーを出力しないように追加学習することでフィラー除去を実現
今後の課題: フィラー以外も対象にした広範な文字起こしの整形

(2025年人工知能学会全国大会, 音学シンポジウム)

2025年人工知能学会全国大会, 音学シンポジウム

音声合成

音楽的制約による音声合成制御

研究のポイント

テキスト音声合成の際に部分的に音の高さをコントロール
入力テキストに音の高さを指定する記号を追加
日本語の歌声コーパス (PJS) を利用して記号と音の高さの関係を学習
今後の課題: より広い音高の制御、音高以外の音楽的制約の付与

2025年人工知能学会全国大会, 音学シンポジウム