top of page

0315 NVIDIA、推論専用AIチップで次世代競争へ

  • Guest
  • 19 時間前
  • 読了時間: 1分

NVIDIAの年次イベント「GTC」が米国時間3月16日に開幕し、CEOのジェンスン・フアン(黄仁勳)の基調講演で幕を開ける。競争が激化する中で同社がどのように優位性を維持するかに市場の関心が集まっており、AIモデルの「学習」ではなく「推論(運用)」に特化した、Groqの技術を統合した新製品が発表される見込みである。


NVIDIAはGTCで、AIの「学習」ではなく実運用を担う推論向け半導体を発表する可能性が高く、GroqのLPU技術を取り込んだ新製品が焦点となっている。Groqは高速応答に特化した言語処理ユニットを開発しており、SRAMを用いることで推論処理の速度向上とコスト効率を実現できるとされる。新製品は次世代GPU「Vera Rubin」と連携し、サーバーやネットワーク技術を含む統合システムとして提供される見通しである。AIの競争軸が「より強いモデルの開発」から「能力をリアルタイムに提供する運用」へ移行する中、推論は新たな主戦場となっている。既存データセンターでは最新GPUを支える液冷設備が不足している場合も多く、導入しやすい推論専用チップには実用面での利点もある。こうした背景から、NVIDIAは単一GPU万能戦略を修正し、多様なAI用途に対応する専用ハードウェア路線を強化している。




NVIDIA Shifts to Inference-Focused AI Chips at GTC

bottom of page