エンジニアブログ– category –
-
エンジニアブログ
RAG自動評価〜Synthetic DataとLLMで効率化〜
記事の要点 手作業でコストのかかるRAG精度評価を、Synthetic DataとLLM-as-a-Judgeで半自動化し、工数を劇的に削減できる。 gemini-3-flash-previewなどの高性能かつ安価なLLMを活用することで、低コストで実用的な評価パイプラインを構築できる。 評... -
エンジニアブログ
Kaggle NFL 2026奮闘記
記事の要点 深層学習モデルに自作の物理特徴量を学習させたが、予測精度は向上しなかった 深層学習モデルは生の座標データから高度な物理概念を学習する能力を持っている 小手先の技術より、AIが持つ学習能力を利用し、そのポテンシャルを最大限に引き... -
エンジニアブログ
工場の画像認識技術の推移とこれから
記事の要点 画像認識技術の進化と「意味理解」へのシフト 現場適用における各手法の強み・弱みの明確化と使い分け指針の提示 マルチモーダルLLMの強みとFA領域における課題はじめに株式会社エスタイルのガッキーです。 私は以前勤めていた会社にて製造... -
エンジニアブログ
Gemini in BigQueryで作る自己管理ダッシュボード
記事の要点 Markdownの日記をBigQueryとLooker Studioで可視化するパイプラインを構築した。 BigQuery とGeminiを連携させ、日記の内容から「翌日の行動指針」や「週末のプラン」をAIに自動提案させる機能を実装した。 iPhoneのショートカット機能を使... -
エンジニアブログ
マルチLLMエージェントシステムの設計指針
記事の要点 マルチエージェント設計は、エージェントロール設計とオーケストレーション設計の両輪で考えることが重要。 エージェントロールを切り分けるメリットは「自己バイアスの軽減」と「プロンプト最適化」にある。 オーケストレーション手法であ... -
エンジニアブログ
AI(Genie)と探る人気アニメヒットの法則
記事の要点 Databricks Genieは、SQLを書かずに分析の初速を大きく高められるツールである。 検証により、作品の人気の波やジャンルの盛衰を自然言語の指示だけで可視化できることが確認できた。 AIは人の代わりに結論を出すのではなく、意思決定の材料... -
エンジニアブログ
LLMは味覚を理解できるか?新ベンチマーク「カレーベンチ」
記事の要点 既存のLLM評価手法は、味覚のような官能的・創造的領域を十分にカバーできていない。 新ベンチマーク「カレーベンチ」は、レシピ生成能力と味覚推論能力を実食により評価する。 モデル間で性能差が大きく、特に創造性が求められるタスクでは... -
エンジニアブログ
もう散らからない!スクショ自動整理AIを作ってみた
記事の要点 日々溜まるスクリーンショットをAIが理解し、自動で該当のフォルダに分類するプログラムを作成した。 機密情報が外部に漏れないよう、手元のPC内で完全に動作するローカルLLMを採用した。 Pythonスクリプトと設定ファイルのシンプルな構成で... -
エンジニアブログ
超快適、AI駆動×Pythonのオススメ開発環境
記事の要点 PythonはAIによるコーディングとの相性がよく、ClineやAppMapのようなAIツールを活用するのがオススメ。要件定義や開発、コード理解の速度を何倍も速くすることができる。 GitHub Copilot定額プランのAPIキーを使うことで、Clineの課金体系を...
1









