徳島大学 教育・研究者情報データベース(EDB)

Education and Research Database (EDB), Tokushima University

徳島大学ウェブサイトへのリンク

著作: 劉 茂博/[松本 和幸]/[吉田 稔]/[北 研二]/Construction of Annotated TOBYO Blog Corpus for Lifestyle Disease Analysis of Diabetic Patient/Proceedings of The 15th International Conference on Natural Language Processing and Knowledge Engineering (NLP-KE20)/[松本 和幸]

ヘルプを読む

「著作」(著作(著書,論文,レター,国際会議など))は,研究業績にかかる著作(著書,論文,レター,国際会議など)を登録するテーブルです. (この情報が属するテーブルの詳細な定義を見る)

  • 項目名の部分にマウスカーソルを置いて少し待つと,項目の簡単な説明がツールチップ表示されます.

この情報をEDB閲覧画面で開く

EID
372379
EOID
995901
Map
0
LastModified
2020年11月16日(月) 12:31:01
Operator
松本 和幸
Avail
TRUE
Censor
0
Owner
松本 和幸
Read
継承
Write
継承
Delete
継承
種別 必須 国際会議
言語 必須 英語
招待 推奨
審査 推奨 Peer Review
カテゴリ 推奨 研究
共著種別 推奨 単独著作(徳島大学内の単一の研究グループ(研究室等)内の研究 (単著も含む))
学究種別 推奨 修士課程学生による研究報告
組織 推奨
著者 必須
  1. (英) Mopuaa Ryu / (日) 劉 茂博 / (読) りゅう もぱあ
    役割 任意
    貢献度 任意 50
    学籍番号 推奨 ****
  2. 松本 和幸([徳島大学.大学院社会産業理工学研究部.理工学域.知能情報系.情報工学分野]/[徳島大学.理工学部.理工学科.情報光システムコース.情報工学講座])
    役割 任意
    貢献度 任意 30
    学籍番号 推奨
  3. 吉田 稔([徳島大学.大学院社会産業理工学研究部.理工学域.知能情報系.情報工学分野]/[徳島大学.理工学部.理工学科.情報光システムコース.情報工学講座])
    役割 任意
    貢献度 任意 10
    学籍番号 推奨
  4. 北 研二([徳島大学.大学院社会産業理工学研究部.理工学域.知能情報系.情報工学分野]/[徳島大学.理工学部.理工学科.情報光システムコース.情報工学講座])
    役割 任意
    貢献度 任意 10
    学籍番号 推奨
題名 必須

(英) Construction of Annotated TOBYO Blog Corpus for Lifestyle Disease Analysis of Diabetic Patient

副題 任意
要約 任意

(英) In this study, we target to analyze weblogs authored by diabetes patients describing their struggle against their disease. In order to build a corpus for analysis, we annotate tags to the important keywords/key phrases such as blood glucose level, diet and emotions in collected weblog data. We aim at constructing a labeled lifestyle disease weblog corpus (called as TOBYO weblog corpus) to extract useful information from patients' weblogs of against illness. For example, to improve our lifestyle, it would be very useful to know how we should live every day, what kind of diet we should eat, how much exercise is appropriate, and so on. In our study, we organize the tagged data and take statistics on part-of-speech combinations. We set the top N thresholds in the rank of the frequency of the part-of-speech and create a system to exclusively pre-process the key phrases that are ranked as more frequent part of speech combinations. The extracted key phrase information is vectorized by a model of BERT (bidirectional encoder representation from a transformer), then the key phrases are sorted out by making a model for category prediction that uses two inputs (BERT vector and character frequency vector). To evaluate our proposed method, we conduct cross validation test and open test by using several machine learning algorithms. In comparison with the baseline classification method, which is a simple and ordinal neural network method, our method can achieve higher performance.

キーワード 推奨
  1. (英) Tobyo corpus / (日) 闘病コーパス
  2. (英) neural networks / (日) ニューラルネットワーク
  3. (英) weblog / (日) ブログ
  4. 生活習慣病(lifestyle-related disease)
  5. 糖尿病(diabetes/->キーワード[糖尿病])
発行所 推奨
誌名 必須 (英) Proceedings of The 15th International Conference on Natural Language Processing and Knowledge Engineering (NLP-KE20)
ISSN 任意
必須 ---
必須 ---
必須 77 77
都市 必須
年月日 必須 2020年 10月 初日
URL 任意
DOI 任意
PMID 任意
NAID 任意
WOS 任意
Scopus 任意
評価値 任意
被引用数 任意
指導教員 推奨
  1. 松本 和幸([徳島大学.大学院社会産業理工学研究部.理工学域.知能情報系.情報工学分野]/[徳島大学.理工学部.理工学科.情報光システムコース.情報工学講座])
備考 任意