データサイエンスコンペ用に特化した環境構築事例の紹介
はじめに こんにちは、ARISE analyticsでデータ分析支援業務を中心に行う「データコンサル」キャリアトラックに所属している徳元です。今回は、データ分析コンペにおける環境構築の工夫点をご紹介いたします。 データ分析コンペのプラットフォームとしてKaggleが有名ですが、企業や研究者がデータを投稿し、世界中の統計家やデータ分析家がモデル精度を競い合うコンテストであり、自らのデータ分析の技術をはかることができます。...
ARISE analyticsの技術関連活動
2025-02-28
データサイエンスコンペ用に特化した環境構築事例の紹介
はじめに こんにちは、ARISE analyticsでデータ分析支援業務を中心に行う「データコンサル」キャリアトラックに所属している徳元です。今回は、データ分析コンペにおける環境構築の工夫点をご紹介いたします。 データ分析コンペのプラットフォームとしてKaggleが有名ですが、企業や研究者がデータを投稿し、世界中の統計家やデータ分析家がモデル精度を競い合うコンテストであり、自らのデータ分析の技術をはかることができます。...
TEPデータに変化点検知アルゴリズムをいくつか適用してみた
初めまして。Customer Analytics Divisionの加藤と申します。普段の業務では、電力に関するデータの分析を行っています。 本記事では、変化点検知やスタンダードなアルゴリズムについていくつか説明したあと、Tennessee Eastman Process(TEP)のデータに各アルゴリズムを簡単に適用した結果を紹介します。 変化点検知とは 変化点検知とは、異常検知の一種です。異常検知は以下の3つに大別されます。 外れ値検知:データの正常時の分布から大きく外れたデータを検知する 変化点検知:データの傾向が変化した点を検知する 異常部位検知:データの傾向が異常な区間を検知する...
論文から実装へ:スクラッチ開発者のためのAIエージェント入門
はじめに こんにちは、データサイエンティストの芹澤です。 最近は生成AIに関する案件に取り組んでいます。 2022年にChatGPTが登場してから今日まで、生成AIや大規模言語モデル (Large Language Model; LLM) に関する話題は盛り上がりを見せ続けていますね。その中でも、2025年はAIエージェント元年になると言われるなど、AIエージェントが一つホットワードになりつつあります。MicrosoftのAzure AI Agent ServiceやAWSのAgents for Amazon...
【前編】2位入賞!アトランタ開催データコンペティションHuMob'24参加記
みなさん、はじめまして。ARISE analytics の今井裕貴と申します。 普段は弊社が開発しているOMO(Online Merges with Offline)データを集約したプラットフォームを活用し、位置情報やサービス利用ログを組み合わせたデータ分析業務を行っています。 今回はアトランタで開催された国際会議のデータ分析コンペティションに有志メンバーで参加し、銀賞を獲得しました。その経緯についてご紹介します。この記事を通して、どんどんコンペに参加できる弊社ARISE analyticsに興味を持っていただければ嬉しいです。 HuMob’2024概要 参加したコンペティションはHuMob...
IoT系通信データを時系列×GNNで扱う方法
データサイエンティストの秋元です。 今回は通信データを時系列データとして扱う場合のGNN (Graph Neural Network) について紹介します。 異常通信検知×GNNの現在地 異常通信検知はIP通信のネットワークを対象として,サイバー攻撃や機器の故障などによる通信データの異常を検知するタスクです。 ほぼ生の通信データであるPCAPやある程度情報を集約したIPFIXといった形式の通信の系列データを入力として,通信量の不自然な増減や想定外のホストからの通信などを検出します。 異常通信検知とは...
【kaggle部活動記】商品パッケージコンペ参加レポート
ARISE analytics kaggle部の越智です。 昨年度SIGNATEにて開催されたテクノプロ・デザイン社 商品パッケージ画像解析(上級部門)に参加し銅メダル(14位/41チーム・209人)を獲得することができました。そこで今回は、このコンペの取り組み内容、解法の解説を行いたいと思います。 コンペ概要 コンペの目的 まずは今回のコンペの概要について説明します。 本コンペは、食料や飲料などのパッケージ画像に対して、その栄養成分表示からエネルギーの項目を自動的に抽出して読み取るアルゴリズムの作成をするというとてもシンプルなタスクです。(図はコンペの概要ページより抜粋) データセット...
【kaggle部活動記】USPTOコンペ参加レポート
ARISE analytics kaggle部の越智です。 今年の7月25日まで開催されていた「USPTO - Explainable AI for Patent Professionals」にソロで参加し銀メダル(44位/571チーム)を獲得できました。 そこで今回はコンペの概要と私が取り組んだアプローチ、上位陣のアプローチを紹介したいと思います。 コンペ概要 コンペの内容 本コンペは、ある特許に対して類似した50件の特許を取得する検索クエリを生成することを目的としています。...
P値の収束に関する数学的考察
CADの西村と石橋です。この記事では、数理統計のトピックの中でも、仮説検定における
Good Code, Bad Codeの擬似コードをDart(Flutter)でリライトして理解を深める 〜エラー編〜
IGDのテックチームに所属するエンジニアの江澤です。 本記事はGood Code, Bad Codeを正しく深く理解するために、書籍内で登場する擬似コードをDartでリライトして要点を解説する記事です。 ※書籍名:Good Code, Bad Code ~持続可能な開発のためのソフトウェアエンジニア的思考 - 秀和システム あなたの学びをサポート! 本記事は3記事目で、過去記事は以下になります。 1記事目:Good Code, Bad Codeの擬似コードをDart(Flutter)でリライトして理解を深める 〜抽象化レイヤー編〜 2記事目:Good Code, Bad...