技術情報

ARISE analyticsの技術関連活動


データサイエンス

  • JSAI2025参加レポート:対話AIとPhysical AIの最前線を追う

    はじめに こんにちは、AIエンジニアの芹澤です。 この記事は、2025年5月27日 (火) 〜 2025年5月30日 (金) に開催された第39回 人工知能学会全国大会 (JSAI2025) の参加レポートとなります。私自身の関心に基づき、特に印象的だった発表をピックアップしてご紹介します。 今年のJSAIは万博も開催されている大阪にあるグランキューブ大阪で開催され、過去最多となる4,922名が参加、1,178件の発表があったそうです。生成AIを中心とした盛り上がりを背景に、AI分野への関心の高さを肌で感じる大会となりました。...

  • ⼤規模⾔語モデル (LLM) による新規データ⽣成、合成データの活⽤

    ARISE analytics の澁⾕です。本記事では⼤規模⾔語モデル (LLM) 開発においてよく使われるようになってきた合成データについて紹介していきます。 合成データとは⼈間が直接作成しないデータ、最近では特に LLM が⽣成したデータを合成データと呼びます。データサイエンスでは例えば、LLM を含む機械学習モデル⽤の学習データの⽣成や、性能評価のための正解データの⽣成などへの活⽤が考えられます。 背景として、昨年の中頃までは⼀部疑問視されていた[1] LLM などで⽣成された合成データの活⽤は、昨今のオープンソース LLM の⾼性能化を受けて急速に進んでいます。合成データは AI...

  • TEPデータに変化点検知アルゴリズムをいくつか適用してみた

    初めまして。Customer Analytics Divisionの加藤と申します。普段の業務では、電力に関するデータの分析を行っています。 本記事では、変化点検知やスタンダードなアルゴリズムについていくつか説明したあと、Tennessee Eastman Process(TEP)のデータに各アルゴリズムを簡単に適用した結果を紹介します。 変化点検知とは 変化点検知とは、異常検知の一種です。異常検知は以下の3つに大別されます。 外れ値検知:データの正常時の分布から大きく外れたデータを検知する 変化点検知:データの傾向が変化した点を検知する 異常部位検知:データの傾向が異常な区間を検知する...

  • 論文から実装へ:スクラッチ開発者のためのAIエージェント入門

    はじめに こんにちは、データサイエンティストの芹澤です。 最近は生成AIに関する案件に取り組んでいます。 2022年にChatGPTが登場してから今日まで、生成AIや大規模言語モデル (Large Language Model; LLM) に関する話題は盛り上がりを見せ続けていますね。その中でも、2025年はAIエージェント元年になると言われるなど、AIエージェントが一つホットワードになりつつあります。MicrosoftのAzure AI Agent ServiceやAWSのAgents for Amazon...

  • 【後編】2位入賞!アトランタ開催データコンペティションHuMob'24参加記

    こんにちは、ARISE analyticsでデータ分析支援業務を中心に行う「データコンサル」キャリアトラックに所属している徳元です。本記事では、前回の記事に続き、ACM SIGSPATIAL 2024本会議への参加内容についてご紹介します。 ACM SIGSPATIALとは? ACM SIGSPATIALは、ACM(Association for Computing Machinery:...

  • 【前編】2位入賞!アトランタ開催データコンペティションHuMob'24参加記

    みなさん、はじめまして。ARISE analytics の今井裕貴と申します。 普段は弊社が開発しているOMO(Online Merges with Offline)データを集約したプラットフォームを活用し、位置情報やサービス利用ログを組み合わせたデータ分析業務を行っています。 今回はアトランタで開催された国際会議のデータ分析コンペティションに有志メンバーで参加し、銀賞を獲得しました。その経緯についてご紹介します。この記事を通して、どんどんコンペに参加できる弊社ARISE analyticsに興味を持っていただければ嬉しいです。 HuMob’2024概要 参加したコンペティションはHuMob...

  • IoT系通信データを時系列×GNNで扱う方法

    データサイエンティストの秋元です。 今回は通信データを時系列データとして扱う場合のGNN (Graph Neural Network) について紹介します。 異常通信検知×GNNの現在地 異常通信検知はIP通信のネットワークを対象として,サイバー攻撃や機器の故障などによる通信データの異常を検知するタスクです。 ほぼ生の通信データであるPCAPやある程度情報を集約したIPFIXといった形式の通信の系列データを入力として,通信量の不自然な増減や想定外のホストからの通信などを検出します。 異常通信検知とは...

  • 【kaggle部活動記】商品パッケージコンペ参加レポート

    ARISE analytics kaggle部の越智です。 昨年度SIGNATEにて開催されたテクノプロ・デザイン社 商品パッケージ画像解析(上級部門)に参加し銅メダル(14位/41チーム・209人)を獲得することができました。そこで今回は、このコンペの取り組み内容、解法の解説を行いたいと思います。 コンペ概要 コンペの目的 まずは今回のコンペの概要について説明します。 本コンペは、食料や飲料などのパッケージ画像に対して、その栄養成分表示からエネルギーの項目を自動的に抽出して読み取るアルゴリズムの作成をするというとてもシンプルなタスクです。(図はコンペの概要ページより抜粋) データセット...

  • 【kaggle部活動記】USPTOコンペ参加レポート

    ARISE analytics kaggle部の越智です。 今年の7月25日まで開催されていた「USPTO - Explainable AI for Patent Professionals」にソロで参加し銀メダル(44位/571チーム)を獲得できました。 そこで今回はコンペの概要と私が取り組んだアプローチ、上位陣のアプローチを紹介したいと思います。 コンペ概要 コンペの内容 本コンペは、ある特許に対して類似した50件の特許を取得する検索クエリを生成することを目的としています。...

  • P値の収束に関する数学的考察

    CADの西村と石橋です。この記事では、数理統計のトピックの中でも、仮説検定におけるP値の振る舞いについて考察しようと思います。ただし、著者は数理統計学の専門家ではなく、誤りを見つけられた場合はご指摘いただけると幸いです。 みなさんは、「サンプルサイズが大きければ、統計的仮説検定において有意差を検出しやすい」といった議論を目にしたことはありますでしょうか?例えば統計ライブラリー サンプルサイズの決め方  |朝倉書店 (asakura.co.jp)のまえがきや、統計的有意性と P 値に関する ASA 声明などで言及されています。...

ご質問・お問い合わせは
こちらよりお送りください
採用
ARISE analyticsとは

PAGE TOP