対話エージェントの評価フレームワークとマルチターン会話の評価手法
ARISE analyticsの秋元です.本記事では,チャットボットに代表される人間との会話に特化したAIシステムである対話エージェントの評価方法について紹介します. 特に,エージェントとユーザが複数回のやり取りを行うようなケースを想定したマルチターンの対話を対象にした性能評価に注目します. 対話エージェント 対話エージェントは,ユーザがテキストまたは音声でAI等のシステムと会話を行う場面において,AI側のシステムを指します....