技術情報

ARISE analyticsの技術関連活動


TECH BLOG

  • データサイエンスコンペ用に特化した環境構築事例の紹介

    はじめに こんにちは、ARISE analyticsでデータ分析支援業務を中心に行う「データコンサル」キャリアトラックに所属している徳元です。今回は、データ分析コンペにおける環境構築の工夫点をご紹介いたします。 データ分析コンペのプラットフォームとしてKaggleが有名ですが、企業や研究者がデータを投稿し、世界中の統計家やデータ分析家がモデル精度を競い合うコンテストであり、自らのデータ分析の技術をはかることができます。...

  • TEPデータに変化点検知アルゴリズムをいくつか適用してみた

    初めまして。Customer Analytics Divisionの加藤と申します。普段の業務では、電力に関するデータの分析を行っています。 本記事では、変化点検知やスタンダードなアルゴリズムについていくつか説明したあと、Tennessee Eastman Process(TEP)のデータに各アルゴリズムを簡単に適用した結果を紹介します。 変化点検知とは 変化点検知とは、異常検知の一種です。異常検知は以下の3つに大別されます。 外れ値検知:データの正常時の分布から大きく外れたデータを検知する 変化点検知:データの傾向が変化した点を検知する 異常部位検知:データの傾向が異常な区間を検知する...

  • 論文から実装へ:スクラッチ開発者のためのAIエージェント入門

    はじめに こんにちは、データサイエンティストの芹澤です。 最近は生成AIに関する案件に取り組んでいます。 2022年にChatGPTが登場してから今日まで、生成AIや大規模言語モデル (Large Language Model; LLM) に関する話題は盛り上がりを見せ続けていますね。その中でも、2025年はAIエージェント元年になると言われるなど、AIエージェントが一つホットワードになりつつあります。MicrosoftのAzure AI Agent ServiceやAWSのAgents for Amazon...

  • 【後編】2位入賞!アトランタ開催データコンペティションHuMob'24参加記

    こんにちは、ARISE analyticsでデータ分析支援業務を中心に行う「データコンサル」キャリアトラックに所属している徳元です。本記事では、前回の記事に続き、ACM SIGSPATIAL 2024本会議への参加内容についてご紹介します。 ACM SIGSPATIALとは? ACM SIGSPATIALは、ACM(Association for Computing Machinery:...

  • 【前編】2位入賞!アトランタ開催データコンペティションHuMob'24参加記

    みなさん、はじめまして。ARISE analytics の今井裕貴と申します。 普段は弊社が開発しているOMO(Online Merges with Offline)データを集約したプラットフォームを活用し、位置情報やサービス利用ログを組み合わせたデータ分析業務を行っています。 今回はアトランタで開催された国際会議のデータ分析コンペティションに有志メンバーで参加し、銀賞を獲得しました。その経緯についてご紹介します。この記事を通して、どんどんコンペに参加できる弊社ARISE analyticsに興味を持っていただければ嬉しいです。 HuMob’2024概要 参加したコンペティションはHuMob...

  • IoT系通信データを時系列×GNNで扱う方法

    データサイエンティストの秋元です。 今回は通信データを時系列データとして扱う場合のGNN (Graph Neural Network) について紹介します。 異常通信検知×GNNの現在地 異常通信検知はIP通信のネットワークを対象として,サイバー攻撃や機器の故障などによる通信データの異常を検知するタスクです。 ほぼ生の通信データであるPCAPやある程度情報を集約したIPFIXといった形式の通信の系列データを入力として,通信量の不自然な増減や想定外のホストからの通信などを検出します。 異常通信検知とは...

  • 【kaggle部活動記】商品パッケージコンペ参加レポート

    ARISE analytics kaggle部の越智です。 昨年度SIGNATEにて開催されたテクノプロ・デザイン社 商品パッケージ画像解析(上級部門)に参加し銅メダル(14位/41チーム・209人)を獲得することができました。そこで今回は、このコンペの取り組み内容、解法の解説を行いたいと思います。 コンペ概要 コンペの目的 まずは今回のコンペの概要について説明します。 本コンペは、食料や飲料などのパッケージ画像に対して、その栄養成分表示からエネルギーの項目を自動的に抽出して読み取るアルゴリズムの作成をするというとてもシンプルなタスクです。(図はコンペの概要ページより抜粋) データセット...

  • 【kaggle部活動記】USPTOコンペ参加レポート

    ARISE analytics kaggle部の越智です。 今年の7月25日まで開催されていた「USPTO - Explainable AI for Patent Professionals」にソロで参加し銀メダル(44位/571チーム)を獲得できました。 そこで今回はコンペの概要と私が取り組んだアプローチ、上位陣のアプローチを紹介したいと思います。 コンペ概要 コンペの内容 本コンペは、ある特許に対して類似した50件の特許を取得する検索クエリを生成することを目的としています。...

  • P値の収束に関する数学的考察

    CADの西村と石橋です。この記事では、数理統計のトピックの中でも、仮説検定におけるP値の振る舞いについて考察しようと思います。ただし、著者は数理統計学の専門家ではなく、誤りを見つけられた場合はご指摘いただけると幸いです。 みなさんは、「サンプルサイズが大きければ、統計的仮説検定において有意差を検出しやすい」といった議論を目にしたことはありますでしょうか?例えば統計ライブラリー サンプルサイズの決め方  |朝倉書店 (asakura.co.jp)のまえがきや、統計的有意性と P 値に関する ASA 声明などで言及されています。...

  • Good Code, Bad Codeの擬似コードをDart(Flutter)でリライトして理解を深める 〜エラー編〜

    IGDのテックチームに所属するエンジニアの江澤です。 本記事はGood Code, Bad Codeを正しく深く理解するために、書籍内で登場する擬似コードをDartでリライトして要点を解説する記事です。 ※書籍名:Good Code, Bad Code ~持続可能な開発のためのソフトウェアエンジニア的思考 - 秀和システム あなたの学びをサポート! 本記事は3記事目で、過去記事は以下になります。 1記事目:Good Code, Bad Codeの擬似コードをDart(Flutter)でリライトして理解を深める 〜抽象化レイヤー編〜 2記事目:Good Code, Bad...

ご質問・お問い合わせは
こちらよりお送りください
採用
ARISE analyticsとは

PAGE TOP