徳島大学 教育・研究者情報データベース(EDB)

Education and Research Database (EDB), Tokushima University

徳島大学ウェブサイトへのリンク

著作: [松本 和幸]/秋田 恭佑/甫古 克然木/[吉田 稔]/[北 研二]/文字種と画数に基づくWeblogデータからの日本語俗語の抽出/[Procedia Computer Science]

ヘルプを読む

「著作」(著作(著書,論文,レター,国際会議など))は,研究業績にかかる著作(著書,論文,レター,国際会議など)を登録するテーブルです. (この情報が属するテーブルの詳細な定義を見る)

  • 項目名の部分にマウスカーソルを置いて少し待つと,項目の簡単な説明がツールチップ表示されます.

この情報をEDB閲覧画面で開く

EID
284571
EOID
903047
Map
0
LastModified
2018年5月4日(金) 21:42:41
Operator
大家 隆弘
Avail
TRUE
Censor
0
Owner
松本 和幸
Read
継承
Write
継承
Delete
継承
種別 必須 学術論文(審査論文)
言語 必須 英語
招待 推奨
審査 推奨 Peer Review
カテゴリ 推奨 研究
共著種別 推奨
学究種別 推奨
組織 推奨
著者 必須
  1. 松本 和幸([徳島大学.大学院社会産業理工学研究部.理工学域.知能情報系.情報工学分野]/[徳島大学.理工学部.理工学科.情報光システムコース.情報工学講座])
    役割 任意

    (日) 筆頭著者として研究手法の提案及び論文執筆を担当した.

    貢献度 任意
    学籍番号 推奨
  2. (英) Akita Kyosuke / (日) 秋田 恭佑 / (読) あきた きょうすけ
    役割 任意

    (日) 共著者として,研究手法に関する実験及び論文執筆の一部を担当した.

    貢献度 任意
    学籍番号 推奨 ****
  3. (英) Keranmu Xielifuguli / (日) 甫古 克然木 / (読) キラム シリプグリ
    役割 任意
    貢献度 任意
    学籍番号 推奨 ****
  4. 吉田 稔([徳島大学.大学院社会産業理工学研究部.理工学域.知能情報系.情報工学分野]/[徳島大学.理工学部.理工学科.情報光システムコース.情報工学講座])
    役割 任意

    (日) 共著者として,関連文献の調査,論文執筆の一部を担当した.

    貢献度 任意
    学籍番号 推奨
  5. 北 研二([徳島大学.大学院社会産業理工学研究部.理工学域.知能情報系.情報工学分野]/[徳島大学.理工学部.理工学科.情報光システムコース.情報工学講座])
    役割 任意

    (日) 共著者として,研究総括および,論文執筆の一部を担当した.

    貢献度 任意
    学籍番号 推奨
題名 必須

(英) Extraction Japanese Slang from Weblog Data Based on Script Type and Stroke Count

(日) 文字種と画数に基づくWeblogデータからの日本語俗語の抽出

副題 任意
要約 任意

(英) Young people commonly use slang in the texts for weblogs or Social Networking Sites. How to treat such slang words properly is one of the problems in the field of text mining. In this paper, we examined several methods to extract Japanese slang called Wakamono Kotoba, which is particularly used by young people, by focusing on its script type and stroke count. In the evaluation experiment, a high precision was obtained when we adopted script type for extraction.

(日) 若者はWeblogやSNSにおいてよく俗語を用いる.こうした語をどう扱うかが,テキストマイニングなどの分野において,一つの問題となっている.本論文では,若者にとくに用いられる若者言葉と呼ばれる日本語俗語を文字種と画数に着目することにより抽出する手法を提案した.評価実験の結果,文字種を適用した場合に高い抽出精4度が得られることが分かった.

キーワード 推奨
  1. (英) Japanese slang / (日) 日本語俗語
  2. (英) Conditional Random Fields / (日) 条件付き確率場
  3. (英) unknown word / (日) 未知語
  4. (英) stroke count / (日) 画数
  5. (英) script type / (日) 文字種
発行所 推奨 Elsevier Science B.V.
誌名 必須 Procedia Computer Science([Elsevier])
(eISSN: 1877-0509)
ISSN 任意 1877-0509
ISSN: 1877-0509 (eISSN: 1877-0509)
Title: Procedia computer science
Title(ISO): Procedia Comput Sci
Publisher: Elsevier
 (NLM Catalog  (Scopus  (CrossRef (Scopus information is found. [need login])
必須 35
必須 2014
必須 464 473
都市 任意
年月日 必須 2014年 9月 15日
URL 任意
DOI 任意 10.1016/j.procs.2014.08.127    (→Scopusで検索)
PMID 任意
NAID 任意
WOS 任意
Scopus 任意 2-s2.0-84924135505
評価値 任意
被引用数 任意
指導教員 推奨
備考 任意