OpenAI と Broadcom が推論特化型AIチップ「Jalapeño」を発表
米国時間6月24日、OpenAI と Broadcom は、大規模言語モデル(LLM)の推論に特化したカスタムAIチップ「Jalapeño」を発表した。本プロジェクトは、OpenAI が進めるフルスタック戦略の一環であり、AIモデルの実行環境を最適化することで、推論処理の高速化、コスト削減、信頼性の向上を目指すものである。開発には Broadcom および Celestica がパートナーとして参画し、チップの実装からボード、ラックシステムの統合までを共同で推進した。
「Jalapeño」は、従来の汎用的なAIアクセラレーターを流用するのではなく、LLMの推論処理のみに焦点を当ててゼロから設計されたものである。設計から製造に至るテープアウトまでの期間がわずか9ヶ月という短期間で完了した。開発プロセスには OpenAI 自身のモデルが活用され、アーキテクチャはカーネルやメモリ移動、ネットワーク、サービングパターンを最適化する設計が施されている。すでに OpenAI のラボでは GPT-5.3-Codex-Spark などのワークロードを実行しており、理論上の限界に近い効率的な動作が確認されている。
本チップの導入により、ワットあたりの性能が現在の最高水準の技術よりも大幅に向上し、ChatGPT や Codex、API、あるいは将来的なエージェント製品における計算効率を高めることができる。この自社設計チップへの移行は、高性能なAIサービスをより広範で安価に提供するための基盤となる。これにより、学生から企業まで、より多くのユーザーがAIの恩恵を享受できる環境整備が進む見込みである。
今後の展開として、本チップは単発の製品ではなく、複数世代にわたるコンピューティングプラットフォームの第一歩として位置づけられている。2026年後半には初期導入が予定されており、Microsoft や他のパートナーとともに、大規模データセンターへの展開を視野に入れている。現時点で最終的な性能測定は継続中であり、詳細な技術レポートについては数ヶ月以内に公開される予定である。
OpenAI and Broadcom unveil LLM-optimized inference chip|OpenAI
openai.com
