第65回

大規模言語モデルの原理と可能性

宮尾 祐介 東京大学大学院情報理工学系研究科 教授

講演概要

さまざまな課題

ツール・環境

ChatGPT に代表される大規模言語モデルを実現している理論・技術や応用について概説し、教育や社会に対する影響や可能性を議論します。理論・技術として言語モデルの基礎やTransformerなどの代表的なニューラルネットワークを解説し、機械翻訳や対話システム、その他最近の大規模言語モデルの応用技術について紹介します。また、現在の大規模言語モデルのしくみやその問題点について説明し、今後の言語モデルの発展の可能性や教育・社会に対する影響について議論します。

講演映像

講演資料

講演資料ダウンロード(PDF)