2010年8月22日日曜日

機械学習による自動辞書引きを利用した英文の読解支援システム

読解支援に関する論文[1]を読んだので,メモしておきます.

本論文では,英文読解を支援するために,自動的に辞書を引いて語義のアノテーションを行うシステムを提案している.本システムでは,二値分類を行う識別器であるRBFカーネルを使ったSVMを用いて,ユーザが語義を知っているかどうかを判定している.識別器の学習に用いる素性の組み合わせに対して,判定精度と学習データ量の関係を調査した結果,100語程度語彙の有無を調査すれば,80%の精度でそのユーザの語彙の有無を判定することが可能であること分かった.また,CAVOCAシステムのユーザの語彙に関するデータのみ用いても,判定精度が向上することが分かった.

注目フレーズ
  • 英語学習者の英文読解を支援する方法として語義のアノテーションが有効であることは,CALL分野において示唆されてきた.
  • CALL分野における語義のアノテーションに関する研究では,アノテーションの教育効果を確認することに焦点が当てられている.
  • 英語学習者のレベルに応じて自動的に語義のアノテーションを行うシステムの研究は少ない
  • マウスカーソルでテキスト中の単語を選択することにより辞書を自動的に引く方法がある.
    • 自動的に語義のアノテーションを与える方法
    • ユーザは常にコンピュータを必要とする.
    • 紙に印刷した場合には利用できない.
  • iKnow→smart.fm
  • SVL単語難易度→レベル別語彙リストSVL12000
  • Googleコーパス
  • コンピュータ支援語彙習得, CAVOCA, Computer Assisted VOCabulary Acquisition
    • 語学学習者が一定期間にできるだけ多くの語彙を学習することが目的
    • 語学学習者の忘却を考慮しながら単語を繰り返し提示し,語彙の習得を促すシステム
  • 英語力の低いグループでは,辞書を使用した学生のほうが,辞書を使用しなかった学生と比較して優位に高い文章の理解度を示した一方,英語力の高いグループでは,有意な差は見られなかった.
[1] 江原 遥, 二宮 崇, 中川 裕志: 機械学習による自動辞書引きを利用した英文の読解支援システム, 言語処理学会第15回年次大会発表論文集, pp. 885-888, 2009-03

0 件のコメント: