アブストラクト |
本発表では,「工学的アプローチによる音声音響情報処理」と題して,演者が取り組んでいる研究課題を中心に,音声音響情報処理に関するいくつかの話題について提供することを予定している.
(1)VoIPにおけるパケット損失の隠蔽
VoIP(Voice over Internet Protocol)は,本来リアルタイム通信に不向きなベストエフォート型のパケット通信により音声通話を実現するため,パケットの消失や遅延といった通信上のエラーが通話品質を低下させるという原理的な問題を抱えている.本研究ではreceiver-basedのエラー隠蔽手法である2-side PWR(pitch waveform replication)法を基に,sender-basedの補助情報を追加することで,より効果的にエラー隠蔽を行う方法を提案する.提案法はステガノグラフィにより補助情報を伝送するため,従来のVoIP伝送フォーマットを変更する必要がないという利点を有する.
(2)最適化処理に基づくギタータブ譜の自動作成
ギターは隣り合う弦の音域が互いに重なり合うように調律されるため,同一のピッチを複数のポジションで発音させることができる.そのため,ピッチを記述した五線譜だけでなく,ポジションを記述したタブ譜も併用するほうが,ポジションの選択に不慣れな初心者の演奏支援に有効であると考えられる.本研究では,遺伝的アルゴリズムを適用することで五線譜からタブ譜を自動作成する手法について検討している.本研究では,実際にクラシックギターの楽曲に対して提案法を適用し,その有効性に関する評価実験を行った.
(3)音声データベースを利用した音声の合成
近年,インターネットのブロードバンド化とともに,インターネットを巨大な計算機環境として利用するアプリケーションの開発が本格化しつつある.一方,インターネットをインフラとして世界中からボランティアを募り,共同でアプリケーションの開発を推進するオープンソースの考え方も定着しつつある.本研究は,このような背景を鑑み,音声合成システムの開発を効率的に推進するためのインフラ整備を目的として,XML(eXtensible Markup Language )による音声データベースのオープンコンテンツ化に関する検討を行っている. |