技術情報

ARISE analyticsの技術関連活動


TECH BLOG

  • 【前編】2位入賞!アトランタ開催データコンペティションHuMob'24参加記

    みなさん、はじめまして。ARISE analytics の今井裕貴と申します。 普段は弊社が開発しているOMO(Online Merges with Offline)データを集約したプラットフォームを活用し、位置情報やサービス利用ログを組み合わせたデータ分析業務を行っています。 今回はアトランタで開催された国際会議のデータ分析コンペティションに有志メンバーで参加し、銀賞を獲得しました。その経緯についてご紹介します。この記事を通して、どんどんコンペに参加できる弊社ARISE analyticsに興味を持っていただければ嬉しいです。 HuMob’2024概要 参加したコンペティションはHuMob...

  • IoT系通信データを時系列×GNNで扱う方法

    データサイエンティストの秋元です。 今回は通信データを時系列データとして扱う場合のGNN (Graph Neural Network) について紹介します。 異常通信検知×GNNの現在地 異常通信検知はIP通信のネットワークを対象として,サイバー攻撃や機器の故障などによる通信データの異常を検知するタスクです。 ほぼ生の通信データであるPCAPやある程度情報を集約したIPFIXといった形式の通信の系列データを入力として,通信量の不自然な増減や想定外のホストからの通信などを検出します。 異常通信検知とは...

  • 【kaggle部活動記】商品パッケージコンペ参加レポート

    ARISE analytics kaggle部の越智です。 昨年度SIGNATEにて開催されたテクノプロ・デザイン社 商品パッケージ画像解析(上級部門)に参加し銅メダル(14位/41チーム・209人)を獲得することができました。そこで今回は、このコンペの取り組み内容、解法の解説を行いたいと思います。 コンペ概要 コンペの目的 まずは今回のコンペの概要について説明します。 本コンペは、食料や飲料などのパッケージ画像に対して、その栄養成分表示からエネルギーの項目を自動的に抽出して読み取るアルゴリズムの作成をするというとてもシンプルなタスクです。(図はコンペの概要ページより抜粋) データセット...

  • 【kaggle部活動記】USPTOコンペ参加レポート

    ARISE analytics kaggle部の越智です。 今年の7月25日まで開催されていた「USPTO - Explainable AI for Patent Professionals」にソロで参加し銀メダル(44位/571チーム)を獲得できました。 そこで今回はコンペの概要と私が取り組んだアプローチ、上位陣のアプローチを紹介したいと思います。 コンペ概要 コンペの内容 本コンペは、ある特許に対して類似した50件の特許を取得する検索クエリを生成することを目的としています。...

  • P値の収束に関する数学的考察

    CADの西村と石橋です。この記事では、数理統計のトピックの中でも、仮説検定におけるP値の振る舞いについて考察しようと思います。ただし、著者は数理統計学の専門家ではなく、誤りを見つけられた場合はご指摘いただけると幸いです。 みなさんは、「サンプルサイズが大きければ、統計的仮説検定において有意差を検出しやすい」といった議論を目にしたことはありますでしょうか?例えば統計ライブラリー サンプルサイズの決め方  |朝倉書店 (asakura.co.jp)のまえがきや、統計的有意性と P 値に関する ASA 声明などで言及されています。...

  • Good Code, Bad Codeの擬似コードをDart(Flutter)でリライトして理解を深める 〜エラー編〜

    IGDのテックチームに所属するエンジニアの江澤です。 本記事はGood Code, Bad Codeを正しく深く理解するために、書籍内で登場する擬似コードをDartでリライトして要点を解説する記事です。 ※書籍名:Good Code, Bad Code ~持続可能な開発のためのソフトウェアエンジニア的思考 - 秀和システム あなたの学びをサポート! 本記事は3記事目で、過去記事は以下になります。 1記事目:Good Code, Bad Codeの擬似コードをDart(Flutter)でリライトして理解を深める 〜抽象化レイヤー編〜 2記事目:Good Code, Bad...

  • 【JSAI2024】学術論文の定量的評価と効果的な活用についてポスター発表しました

    はじめに こんにちは、ARISE analyticsの秋元・太田・奥井です。 2024年6月に浜松市で行われた人工知能学会 全国大会(JSAI2024)でポスター発表を行いました。 本記事は、我々が発表した研究内容を報告します。 ポスターはこちら↓ 背景 研究開発にあたって、特定の分野の研究内容や技術の潮流を把握するため、広く論文をサーベイすることはよくあると思います。 重要な論文・質の高い論文から重点的に読み進めたいところですが、どの論文を読むか判断するにあたって、引用数などの論文を評価する指標を参考にするでしょう。...

  • MESHSTATSアプリケーションアイデアソン2024参加記

    はじめに Customer Analytics Divisionに所属するデータサイエンティストの森智之と、今井裕貴です。 私たちは、弊社が開発しているOMO(Online Merges with...

  • 【JSAI2024】「J-NER:大規模言語モデルのための固有表現認識における拡張固有表現階層を考慮したベンチマークデータセット」についてポスター発表しました

    はじめに こんにちは、ARISE analyticsの渋谷と澁谷です。 弊社では、自己研鑽の一環として一部有志が研究活動を行っており、今年は人工知能学会 全国大会(JSAI2024)でポスター発表を行いました。本記事では私たちが行った「大規模言語モデルのための豊富な 固有表現を含んだ固有表現認識用データセットの構築」に関する研究内容を紹介します。 ・データセット sergicalsix/Japanese_NER_Data_Hub · Datasets at Hugging Face 背景...

  • 生成AIを用いたコードレビュー

    はじめに 初めまして。ARISEでWeb系の開発、モデルのソリューション組み込みを主に行う「ソリューションエンジニア」というキャリアトラックに所属しているエンジニアの坂本です。 先日から当社のブログでGitHub Copilotを利用したコード開発について触れてきました。 新人エンジニアがGitHub Copilotを使ってみた。 GitHub Copilotと一緒にTerraformを書いた体験談 初めてのインフラ構築 RAGアプリの作成でGitHub Copilotを使ってみた しかし、生成AIを用いた開発補助ツールはコード生成だけにとどまらず、様々模索されています。...

ご質問・お問い合わせは
こちらよりお送りください
採用
ARISE analyticsとは

PAGE TOP