技術情報

ARISE analyticsの技術関連活動


生成AI

  • ⼤規模⾔語モデル (LLM) による新規データ⽣成、合成データの活⽤

    ARISE analytics の澁⾕です。本記事では⼤規模⾔語モデル (LLM) 開発においてよく使われるようになってきた合成データについて紹介していきます。 合成データとは⼈間が直接作成しないデータ、最近では特に LLM が⽣成したデータを合成データと呼びます。データサイエンスでは例えば、LLM を含む機械学習モデル⽤の学習データの⽣成や、性能評価のための正解データの⽣成などへの活⽤が考えられます。 背景として、昨年の中頃までは⼀部疑問視されていた[1] LLM などで⽣成された合成データの活⽤は、昨今のオープンソース LLM の⾼性能化を受けて急速に進んでいます。合成データは AI...

  • 論文から実装へ:スクラッチ開発者のためのAIエージェント入門

    はじめに こんにちは、データサイエンティストの芹澤です。 最近は生成AIに関する案件に取り組んでいます。 2022年にChatGPTが登場してから今日まで、生成AIや大規模言語モデル (Large Language Model; LLM) に関する話題は盛り上がりを見せ続けていますね。その中でも、2025年はAIエージェント元年になると言われるなど、AIエージェントが一つホットワードになりつつあります。MicrosoftのAzure AI Agent ServiceやAWSのAgents for Amazon...

  • 【JSAI2024】「J-NER:大規模言語モデルのための固有表現認識における拡張固有表現階層を考慮したベンチマークデータセット」についてポスター発表しました

    はじめに こんにちは、ARISE analyticsの渋谷と澁谷です。 弊社では、自己研鑽の一環として一部有志が研究活動を行っており、今年は人工知能学会 全国大会(JSAI2024)でポスター発表を行いました。本記事では私たちが行った「大規模言語モデルのための豊富な 固有表現を含んだ固有表現認識用データセットの構築」に関する研究内容を紹介します。 ・データセット sergicalsix/Japanese_NER_Data_Hub · Datasets at Hugging Face 背景...

  • 生成AIを用いたコードレビュー

    はじめに 初めまして。ARISEでWeb系の開発、モデルのソリューション組み込みを主に行う「ソリューションエンジニア」というキャリアトラックに所属しているエンジニアの坂本です。 先日から当社のブログでGitHub Copilotを利用したコード開発について触れてきました。 新人エンジニアがGitHub Copilotを使ってみた。 GitHub Copilotと一緒にTerraformを書いた体験談 初めてのインフラ構築 RAGアプリの作成でGitHub Copilotを使ってみた しかし、生成AIを用いた開発補助ツールはコード生成だけにとどまらず、様々模索されています。...

  • 【JSAI2024】「ブラックボックス大規模言語モデルのHallucination検出手法の提案」についてポスター発表しました

    はじめに こんにちは、ARISE analyticsの小山と山里です。 弊社では、自己研鑽の一環として一部有志が研究活動を行っており、今年は人工知能学会 全国大会(JSAI2024)でポスター発表を行いました。本記事では私たちが行った研究内容を紹介します。 研究背景 私たちは「ブラックボックス大規模言語モデルのHallucination検出手法の提案」というテーマで研究を行いました。 近年、Chat-GPTをはじめとする大規模言語モデル(以下、LLM)が脚光を浴びており、今後も私たちの生活において重要な役割を担う場面が増えてくると予想されます。...

  • 【JSAI2024】「LLM エージェントの人間との対話における 反芻的返答の親近感向上効果」についてポスター発表しました

    はじめに こんにちは、ARISE analyticsの芹澤です。 弊社では、自己研鑽活動の一環として有志が研究を行っており、今年の人工知能学会 全国大会 (JSAI2024) でポスター発表を行いました。本記事はその報告になります。私は以前、「LLM時代に人は対話AIを信頼できるか?Human Agent Interactionの視点から考える 」という記事を書きましたが、今回はそこで行っていた研究の成果を報告させていただきます。 ポスター発表の紹介 LLMエージェントが反芻的 (オウム返し) 対話を行った際に人間が感じる印象をテーマに、ポスター発表を行いました。 信頼の獲得について...

  • AzureのLLMプロダクト開発支援ツール!プロンプトフローの入門

    はじめに こんにちは。ARISE analytics(以下ARISE)のInnovation & Growth Divisionに所属するエンジニアの渋谷です。 今回は大規模言語モデル(LLM)のシステム開発に役立つプロンプトフローというツールとその使い方、実際にARISE内でプロンプトフローを活用するイベントを開催した際にARISEメンバーがプロンプトフローで作成したプロダクトの一部を紹介します。 プロンプトフローとは プロンプトフローとはLLMの処理を含む開発をローコードで実現できるツールです。...

  • RAGアプリの作成でGitHub Copilotを使ってみた

    はじめに 皆さんこんにちは。 CAD/AGU所属のAIエンジニアの伊藤と申します。 早速本題ですが、皆さんはGitHub Copilotを使っていますか? リリースからしばらく経ちましたが、ARISEでもトライアル運用が始まり、周りから色々な感想が聞こえてきます。 私もトライアルで使うことができたので、今回はAIエンジニアの業務観点からGitHub Copilotをレビューしてみようと思います。 ※このレビューは2024年2月時点での内容です。今はさらに性能向上しているかもしれません。 レビュー方法について...

  • 層に着目したLLMの口調の学習について

    こんにちは。Innovation & Growth Divisionの渋谷です。今回は3月10日に行われた【第3回】生成AIなんでもLT会の登壇内容の記事です。 ▼登壇資料はこちら 【第3回】生成AIなんでもLT会 2024_0304なんでも生成AI_sergicalsix.pptx from ARISE analytics はじめに LLMのファインチューニングをしていると、ふと「学習した情報ってどこに保存されているんだろう?」と思うことはありませんか? LLMの知識がどこに保存されているのかというお話は、議論されていて「全結合層に知識が保存されている」という仮説などあります。...

  • 動画生成AIによるシミュレーション動画は物理法則を満たしているのか?

    はじめに こんにちは。Customer Analytics Divisionの奥井です。 今回は3月10日に行われた【第3回】生成AIなんでもLT会で登壇した内容をまとめます。 登壇内容について 発表資料のリンクはこちら (諸事情により、冒頭に会社説明の資料を含みます) 【第3回生成AIなんでもLT会資料】_動画生成AIと物理法則_v0.2.pptx from ARISE analytics テーマを選んだ理由 動画生成AI「Sora」がリリースされ、巷で話題になっていました。その中でも特に気になっていたのは、次のコメントです。 We’re teaching AI to understand...

ご質問・お問い合わせは
こちらよりお送りください
採用
ARISE analyticsとは

PAGE TOP