第73回

教師ありインストラクション学習を中心とした大規模言語モデルの作り方〜国語教師や日本語教育者が大活躍〜

関根 聡 理化学研究所 革新知能統合研究センター 言語情報アクセス技術チーム チームリーダー

講演概要

大規模言語モデル

インストラクション

データ構築

GPTを始めとする大規模言語モデルで特に重要だと考えられている教師付きファインチューニングに利用される日本語インストラクションデータの構築とそれを利用したモデルの精度向上について紹介する。データー作成は日本語教育者に広く手伝っていただいており、その状況についても紹介する。

講演映像

講演資料

講演資料ダウンロード(PDF)