音声処理
音声認識
音声認識時の書き言葉への整形
研究のポイント
- フィラー(「あの」「えー」等の表現)を音声認識時に自動的に除去
- 大規模音声認識モデルOWSMを追加学習(ファインチューニング)
- フィラーを出力しないように追加学習することでフィラー除去を実現
- 今後の課題: フィラー以外も対象にした広範な文字起こしの整形
(2025年 人工知能学会全国大会, 音学シンポジウム)
音声合成
音楽的制約による音声合成制御
研究のポイント
- テキスト音声合成の際に部分的に音の高さをコントロール
- 入力テキストに音の高さを指定する記号を追加
- 日本語の歌声コーパス (PJS) を利用して記号と音の高さの関係を学習
- 今後の課題: より広い音高の制御、音高以外の音楽的制約の付与