• NEW

武田 龍/共著 -- コロナ社 -- 2024.11 -- 007.13

所蔵

所蔵件数は 1 件です。現在の予約件数は 0 件です。

所蔵場所 請求記号 資料コード 資料区分 帯出区分 状態
閲覧室 /007.1/タ/ 117470344 成人一般 可能 iLisvirtual

資料詳細

タイトル 音源分離・音声認識
タイトルカナ オンゲン ブンリ オンセイ ニンシキ
叢書名 メディアテクノロジーシリーズ
著者 武田 龍 /共著, 高島 遼一 /共著, 大淵 康成 /編  
著者カナ タケダ リュウ,タカシマ リョウイチ,オオブチ ヤスナリ
出版者 コロナ社
出版年 2024.11
ページ数 10,221p
大きさ 21cm
一般件名 音声処理 , 音声認識
ISBN13桁 978-4-339-01379-5 国立国会図書館 カーリル GoogleBooks WebcatPlus
言語 jpn
分類記号 007.13
内容紹介 音声処理の初学者に向けて、音声の信号処理の基本知識や機械学習の基礎、音源分離技術、音声認識技術、音源分離と音声認識の両方にまたがる技術を解説する。補足情報をダウンロードできるQRコード付き。
著者紹介 京都大学大学院情報学研究科博士課程修了。博士(情報学)。大阪大学准教授。

目次

第1章 序論:音源分離・音声認識へのいざない
  1.1 音源分離・音声認識とは
  1.2 本書でカバーする状況
  1.3 本書の構成
第2章 音声信号処理の基本
  2.1 データ表現と音源分離・音声認識の入出力
  2.2 機械学習技術を用いたアプローチ
  2.3 音声信号の伝達モデルと基本的な分析・特徴量
  2.4 ディープニューラルネットワークとは
  2.5 データの準備・生成
第3章 音源分離:音を聞き分ける
  3.1 音の聞き分け処理の概要
  3.2 基本的な枠組みと技術
  3.3 参照信号を用いる音源分離:適応フィルタ
  3.4 モノラル信号に対する音源分離
  3.5 マルチチャネル信号に対する音源分離
  3.6 音源分離技術の実装例
  3.7 その他のトピック
  3.8 本章のまとめ
第4章 音声認識:発話内容を認識する
  4.1 音声認識の基礎知識
  4.2 DNNとHMMによる音声認識
  4.3 End‐to‐End音声認識
  4.4 End‐to‐End音声認識ツールESPNet
  4.5 事前学習済みモデル
  4.6 本章のまとめ
第5章 音源分離と音声認識にまたがる技術
  5.1 データ拡張
  5.2 ダイアリゼーション
  5.3 音声認識と音源分離の統合