徳島大学 教育・研究者情報データベース(EDB)

Education and Research Database (EDB), Tokushima University

徳島大学ウェブサイトへのリンク

著作: 持橋 大地/菊井 玄一郎/[北 研二]/言語表現のベクトル空間モデルにおける最適な計量距離/[電子情報通信学会論文誌(D-II)]

ヘルプを読む

「著作」(著作(著書,論文,レター,国際会議など))は,研究業績にかかる著作(著書,論文,レター,国際会議など)を登録するテーブルです. (この情報が属するテーブルの詳細な定義を見る)

  • 項目名の部分にマウスカーソルを置いて少し待つと,項目の簡単な説明がツールチップ表示されます.

この情報をEDB閲覧画面で開く

EID
142417
EOID
754180
Map
0
LastModified
2014年11月6日(木) 14:17:38
Operator
北 研二
Avail
TRUE
Censor
0
Owner
北 研二
Read
継承
Write
継承
Delete
継承
種別 必須 学術論文(審査論文)
言語 必須 日本語
招待 推奨
審査 推奨
カテゴリ 推奨
共著種別 推奨
学究種別 推奨
組織 推奨
著者 必須
  1. (日) 持橋 大地
    役割 任意
    貢献度 任意
    学籍番号 推奨
  2. (日) 菊井 玄一郎
    役割 任意
    貢献度 任意
    学籍番号 推奨
  3. 北 研二([徳島大学.大学院社会産業理工学研究部.理工学域.知能情報系.情報工学分野]/[徳島大学.理工学部.理工学科.情報光システムコース.情報工学講座])
    役割 任意

    (日) 研究テーマの考案,研究指導

    貢献度 任意
    学籍番号 推奨
題名 必須

(日) 言語表現のベクトル空間モデルにおける最適な計量距離

副題 任意
要約 任意

(日) 自然言語処理の手法にはコサイン距離, すなわち単純なユークリッド距離に依存しているものが多いが, この距離は素性間の相関を考慮しないこと, また素性に恣意的な重みづけを必要とするという問題をもっている.本論文ではこれに代わり, 訓練データより導かれる最適な計量距離を提案し, 二つの問題を同時に解決する.この計量は訓練データのクラスタ構造のひずみを最小化する二次最適化問題の解として導くことができる.提案する計量距離の効果を, 同義文検索, 文書検索, 及び機械学習用一般ベクトルデータのクラスタリングタスクによって確認し, ユークリッド距離に対し常に精度の改善が見られた.特にクラスタ化の強い同義文検索タスクにおいて精度の改善が大きく, ベースラインと比較して11点平均精度で33%の向上があった.

キーワード 推奨
  1. (英) tf.idf / (日) 距離計量
  2. (日) コサイン距離
  3. (日) 素性空間
  4. (日) カーネル法
発行所 推奨 (英) The Institute of Electronics, Information and Communication Engineers / (日) 一般社団法人電子情報通信学会
誌名 必須 電子情報通信学会論文誌(D-II)([電子情報通信学会])
(pISSN: 0915-1923)
ISSN 任意 0915-1923
ISSN: 0915-1923 (pISSN: 0915-1923)
Title: 電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理
Supplier: 一般社団法人電子情報通信学会
 (Webcat Plus  (Webcat Plus  (医中誌Web (No Scopus information.)
必須 J88-D-II
必須 4
必須 747 756
都市 任意
年月日 必須 2005年 4月 1日
URL 任意 http://ci.nii.ac.jp/naid/10016598666/
DOI 任意
PMID 任意
NAID 任意 10016598666
WOS 任意
Scopus 任意
評価値 任意
被引用数 任意
指導教員 推奨
備考 任意