Nvidia Siapkan Platform Chip Inferensi Baru di GTC, Mampukah Jadi Katalis Saham NVDA?
Info Tekno> Nvidia platform chip inferensi baru menjadi sorotan setelah laporan menyebut perusahaan tersebut berencana meluncurkan arsitektur chip generasi berikutnya yang dirancang khusus untuk beban kerja inferensi kecerdasan buatan (AI). Langkah ini dinilai sebagai potensi katalis positif bagi saham NVDA yang sepanjang tahun ini masih tertinggal dibandingkan indeks semikonduktor.
Laporan yang dimuat Wall Street Journal pada Jumat malam menyebut Nvidia akan memperkenalkan platform chip berorientasi inferensi yang menggabungkan desain teknologi dari Groq, perusahaan rintisan yang sebelumnya menjalin kesepakatan lisensi besar dengan Nvidia. Platform tersebut disebut-sebut akan diumumkan dalam ajang tahunan Nvidia GTC pada bulan Maret mendatang.
Rencana Nvidia Luncurkan Platform Chip Inferensi Baru
Apa yang Dilaporkan dan Kapan Akan Diumumkan?
Menurut laporan Wall Street Journal, Nvidia berencana meluncurkan platform chip yang secara spesifik difokuskan pada kebutuhan inferensi AI, yakni tahap ketika model kecerdasan buatan menarik kesimpulan berdasarkan data baru. Platform ini diperkirakan akan diumumkan dalam acara pengembang tahunan Nvidia, yakni GTC (GPU Technology Conference), yang dijadwalkan berlangsung pada bulan Maret.
Jika terealisasi, peluncuran ini akan menjadi langkah strategis Nvidia dalam merespons perubahan lanskap industri AI yang kini mulai bergeser dari fase pelatihan model (training) ke fase inferensi.
Hingga laporan tersebut beredar, Nvidia belum memberikan tanggapan resmi atas permintaan komentar dari media.
Mengapa Fokus ke Inferensi AI?
Selama ini, Nvidia dikenal sebagai produsen unit pemrosesan grafis (GPU) yang mendominasi revolusi AI global. GPU Nvidia menjadi tulang punggung pelatihan model AI skala besar, termasuk model bahasa besar (LLM) dan sistem generatif lainnya.
Namun, tren pasar menunjukkan pergeseran kebutuhan. Pelanggan kini semakin membutuhkan chip AI yang lebih murah dan efisien untuk inferensi—proses di mana model AI yang sudah dilatih digunakan dalam aplikasi nyata untuk menghasilkan respons secara real-time.
Inferensi menjadi tahap krusial karena digunakan dalam berbagai aplikasi komersial, seperti chatbot, sistem rekomendasi, robotika, hingga sistem otonomi. Beban kerja inferensi menuntut latensi rendah dan efisiensi energi tinggi, dua aspek yang menjadi fokus utama pengembangan chip generasi baru.
Peran Groq dalam Strategi Baru Nvidia
Kesepakatan Lisensi Senilai 20 Miliar Dolar
Pada akhir tahun lalu, Nvidia mencapai kesepakatan lisensi senilai 20 miliar dolar dengan Groq. Melalui kesepakatan tersebut, Nvidia juga merekrut sejumlah karyawan Groq, termasuk pendirinya, Jonathan Ross.
Groq dikenal sebagai pengembang unit pemrosesan bahasa (Language Processing Unit/LPU), yang berbeda dari GPU tradisional. LPU dirancang untuk beban kerja inferensi dengan pendekatan yang lebih deterministik dan hemat daya.







