第90回

LLMの学習メカニズムの解明

磯沼 大 国立情報学研究所 大規模言語モデル研究開発センター / 東北大学言語AI研究センター 特任助教

講演概要

大規模言語モデル

学習メカニズム

逆学習

大規模言語モデルはいつ何を学習したことで高い知的能力を獲得しているだろうか。学習データの組み合わせや順序を試行錯誤することで、知的能力獲得に重要なデータや最適な学習順序を明らかにできるかもしれないが、大規模言語モデルの学習データは膨大なため現実にはそうした試行錯誤は困難である。本研究では逆学習といった技術を用いることで、大規模言語モデルの学習メカニズムを解明する取り組みについて紹介する。これらの取り組みにより、将来的に人の知的能力獲得プロセスの理解につながることを目指している。

講演映像

講演資料

講演資料ダウンロード(PDF)