NEWS
NEWS
ARISE analytics 内の実例を交えながら、いま世の中で盛り上がっている技術について発信していく「ARISE TECH BLOG」を更新しました。
第108回目となる今回は、RAG評価フレームワーク「Ragas」の紹介という記事を当社データサイエンティストの和久田が執筆いたしました。
検索拡張生成(RAG)は、LLMのハルシネーションを抑制する技術として注目されていますが、その性能を客観的に測定・評価することが実用化の鍵となります。しかし、人手による評価は膨大な時間とコストを要します。
本記事では、この課題を解決するオープンソースの自動評価フレームワーク「Ragas」について、実際のプロジェクトへの導入経験を基に、その特徴から具体的な実装、そして評価結果をどう解釈すべきかという実務上のポイントまでを詳しく解説しています。
ぜひご覧ください。