徳島大学 教育・研究者情報データベース(EDB)

Education and Research Database (EDB), Tokushima University

徳島大学ウェブサイトへのリンク

著作: [吉田 稔]/[松本 和幸]/[肖 清梅]/Keranmu Xielifuguli/[北 研二]/Nakagawa Hiroshi/接尾辞配列を用いたコーパス特有文字列の抽出/Proceedings of the 10th Asia Information Retrieval Society Conference (AIRS 2014), LNCS 8870

ヘルプを読む

「著作」(著作(著書,論文,レター,国際会議など))は,研究業績にかかる著作(著書,論文,レター,国際会議など)を登録するテーブルです. (この情報が属するテーブルの詳細な定義を見る)

  • 項目名の部分にマウスカーソルを置いて少し待つと,項目の簡単な説明がツールチップ表示されます.

この情報をEDB閲覧画面で開く

EID
285658
EOID
760764
Map
0
LastModified
2014年12月8日(月) 12:33:28
Operator
吉田 稔
Avail
TRUE
Censor
0
Owner
吉田 稔
Read
継承
Write
継承
Delete
継承
種別 必須 国際会議
言語 必須 英語
招待 推奨
審査 推奨 Peer Review
カテゴリ 推奨
共著種別 推奨
学究種別 推奨
組織 推奨
著者 必須
  1. 吉田 稔([徳島大学.大学院社会産業理工学研究部.理工学域.知能情報系.情報工学分野]/[徳島大学.理工学部.理工学科.情報光システムコース.情報工学講座])
    役割 任意
    貢献度 任意
    学籍番号 推奨
  2. 松本 和幸([徳島大学.大学院社会産業理工学研究部.理工学域.知能情報系.情報工学分野]/[徳島大学.理工学部.理工学科.情報光システムコース.情報工学講座])
    役割 任意
    貢献度 任意
    学籍番号 推奨
  3. 肖 清梅
    役割 任意
    貢献度 任意
    学籍番号 推奨
  4. (英) Keranmu Xielifuguli
    役割 任意
    貢献度 任意
    学籍番号 推奨
  5. 北 研二([徳島大学.大学院社会産業理工学研究部.理工学域.知能情報系.情報工学分野]/[徳島大学.理工学部.理工学科.情報光システムコース.情報工学講座])
    役割 任意

    (日) 研究手法に対する助言

    貢献度 任意
    学籍番号 推奨
  6. (英) Nakagawa Hiroshi
    役割 任意
    貢献度 任意
    学籍番号 推奨
題名 必須

(英) Extracting Corpus-Specific Strings by Using Suffix Arrays Enhanced with Longest Common Prefix

(日) 接尾辞配列を用いたコーパス特有文字列の抽出

副題 任意
要約 任意

(英) We propose a new term extraction algorithm that considers all of the substrings as term candidates.Our algorithm uses a suffix array as the data structure that emulates the suffix tree of the corpus.We use two scoring functions, one of which is used to detect good substring boundaries as linguistic chunksand the other is to find domain-specific phrases and combine them with a re-ranking approach.Experiments show that the proposed all-substring term extraction algorithm shows good performancefor highly-frequent terms compared with the baseline algorithm that uses a morphological analyzer in the preprocessing step.

(日) すべての部分文字列を候補とする新しい用語抽出手法を提案する.提案手法は,接尾辞配列を用いることにより,接尾辞木の節点を辿る操作をエミュレートする.言語的切れ目の良さを表すスコアと,分野特有度を表すスコアの2種のスコアを,リランキング手法により組み合わせて,候補のランキングを行う.実験により,頻度の高い用語に関しては,前処理で形態素解析を行う従来手法よりも高い精度で用語抽出が行えることを示す.

キーワード 推奨
発行所 推奨
誌名 必須 (英) Proceedings of the 10th Asia Information Retrieval Society Conference (AIRS 2014), LNCS 8870
ISSN 任意
必須 ---
必須 ---
必須 360 370
都市 必須 (英) Kuching
年月日 必須 2014年 12月 5日
URL 任意
DOI 任意
PMID 任意
NAID 任意
WOS 任意
Scopus 任意
評価値 任意
被引用数 任意
指導教員 推奨
備考 任意