『徳島大学 教育・研究者情報データベース (EDB)』---[学外] /
ID: Pass:

登録内容 (EID=370057)

EID=370057EID:370057, Map:0, LastModified:2020年8月24日(月) 17:47:29, Operator:[西村 良太], Avail:TRUE, Censor:0, Owner:[西村 良太], Read:継承, Write:継承, Delete:継承.
種別 (必須): 国際会議 [継承]
言語 (必須): 英語 [継承]
招待 (推奨):
審査 (推奨): Peer Review [継承]
カテゴリ (推奨): 研究 [継承]
共著種別 (推奨): 国内共著 (徳島大学内研究者と国内(学外)研究者との共同研究 (国外研究者を含まない)) [継承]
学究種別 (推奨): 博士前期課程学生による研究報告 [継承]
組織 (推奨): 1.徳島大学 [継承]
著者 (必須): 1. (英) Yuya Obashi (日) 小橋 優矢 (読) おばし ゆうや
役割 (任意): 第1著者(主著者) [継承]
貢献度 (任意): 60 [継承]
学籍番号 (推奨):
[継承]
2.西村 良太 ([徳島大学.大学院社会産業理工学研究部.理工学域.知能情報系.情報工学分野]/[徳島大学.理工学部.理工学科.知能情報コース.情報工学講座]/[徳島大学.先端技術科学教育部.システム創生工学専攻.知能情報システム工学コース.基礎情報工学講座])
役割 (任意):
貢献度 (任意):
学籍番号 (推奨):
[継承]
3.北岡 教英
役割 (任意):
貢献度 (任意):
学籍番号 (推奨):
[継承]
題名 (必須): (英) Automatic Conversion of Written Language into Spoken Language Using a Sequence-to-Sequence Model Trained with a Parallel Corpus  (日) パラレルコーパスを用いて学習されたシーケンスからシーケンスへの変換モデルを用いた書き言葉から話し言葉への自動変換   [継承]
副題 (任意):
要約 (任意): (英) In this study we proposed using a sequence-to-sequence,RNN based model to convert Japanese written language intoa text representation of Japanese spoken language. If thisprocess could be accomplished accurately and efficiently, itwould become possible to create a large, spoken languagetext corpus for improving the accuracy of speech recognition.We first created a written language-spoken language parallelcorpus based on the Nagoya University Conversation Corpusand the Transcribed Corpus of Elderly Dialog. Using thismanually constructed parallel corpus, we devised conversionmodel and converted the BCCWJ corpus into spoken languagetext. Although conversion accuracy was not impressive overall,some short sentences were converted accurately. Moreover,even if whole sentences could not be converted accurately,the statistics of the spoken language were well expressed inthe converted sentences. Thus, a language model trained witha corpus of spoken language, created by converting writtenlanguage into spoken language, was shown to be effectivefor speech recognition. Because of an insufficient amount oftraining data, we were only able to accurately convert someof the shorter sentences in the BCCWJ corpus, accounting foronly a small percentage of the data. This prevented the creationof a large corpus of spoken language text data. Therefore,it will be necessary to devise a method which can correctlyconvert longer sentences as well. As a solution to this problem,we plan to introduce an attention mechanism to our sequenceto-sequence model.  (日) 本研究では,RNNをベースとしたシーケンスツーシーケンスモデルを用いて,日本語の書き言葉を日本語の話し言葉のテキスト表現に変換することを提案した.このプロセスを正確かつ効率的に行うことができれば,音声認識の精度を向上させるための大規模な音声言語テキストコーパスを作成することが可能になると考えられる.この並列コーパスを用いて,変換モデルを考案し,BCCWJコーパスを音声テキストに変換した.その結果,全体的には変換精度は高くなかったが,一部の短文は正確に変換されていた.また,文全体が正確に変換できなくても,変換された文には音声言語の統計量がよく表現されていた.このように,書き言葉を口語に変換して作成した口語コーパスを用いて学習した言語モデルが音声認識に有効であることが示された.しかし,訓練データ量が不足していたため,BCCWJコーパスの中の短い文の一部しか正確に変換できず,データの割合はわずかであった.このため,大規模な音声言語テキストデータのコーパスを作成することができなかった.そのため,長文も正しく変換できる方法を考案する必要がある.この問題を解決するために,我々は,このような問題を解決するために,注目機構を導入することを計画しています.   [継承]
キーワード (推奨):
発行所 (推奨):
誌名 (必須): (英) Proceedings of The 22nd Conference of the Oriental COCOSDA (Oriental-COCOSDA2019) (日) オリエンタルココスダ (読) おりえんたるここすだ
ISSN (任意):
[継承]
(必須):
(必須):
(必須): 1 5 [継承]
都市 (必須): (英) Sebu (日) セブ (読) せぶ [継承]
年月日 (必須): 西暦 2019年 10月 25日 (令和 元年 10月 25日) [継承]
URL (任意):
DOI (任意):
PMID (任意):
CRID (任意):
WOS (任意):
Scopus (任意):
評価値 (任意):
被引用数 (任意):
指導教員 (推奨): 1.北岡 教英 [継承]
備考 (任意):

標準的な表示

和文冊子 ● Obashi Yuya, Ryota Nishimura and Norihide Kitaoka : Automatic Conversion of Written Language into Spoken Language Using a Sequence-to-Sequence Model Trained with a Parallel Corpus, Proceedings of The 22nd Conference of the Oriental COCOSDA (Oriental-COCOSDA2019), (巻), (号), 1-5, Sebu, Oct. 2019.
欧文冊子 ● Obashi Yuya, Ryota Nishimura and Norihide Kitaoka : Automatic Conversion of Written Language into Spoken Language Using a Sequence-to-Sequence Model Trained with a Parallel Corpus, Proceedings of The 22nd Conference of the Oriental COCOSDA (Oriental-COCOSDA2019), (巻), (号), 1-5, Sebu, Oct. 2019.

関連情報

Number of session users = 0, LA = 0.35, Max(EID) = 392241, Max(EOID) = 1059776.