Arsip  

OpenAI Rilis GPT-5.5 ke API, Harga Mulai $5 per Juta Token Input

OpenAI luncurkan GPT-5.5 dengan skor coding 82,7% dan efisiensi token lebih tinggi. Tersedia di API mulai $5/juta token, ungguli rival di 10 benchmark utama.

OpenAI luncurkan GPT-5.5 dengan skor coding 82,7% dan efisiensi token lebih tinggi.
OpenAI luncurkan GPT-5.5 dengan skor coding 82,7% dan efisiensi token lebih tinggi.

GPT-5.5 OpenAI Resmi Hadir, Unggul di Coding dan Riset Ilmiah Sekaligus

INFO TEKNO> OpenAI merilis GPT-5.5, model kecerdasan buatan paling canggih yang pernah mereka hadirkan, dengan kemampuan agentic yang mampu menyelesaikan tugas kompleks secara mandiri dari awal hingga akhir. Per 24 April 2026, GPT-5.5 dan GPT-5.5 Pro telah tersedia pula di API.

Model ini dirancang untuk menangani pekerjaan nyata di komputer — mulai dari menulis dan men-debug kode, riset online, analisis data, hingga berpindah antara berbagai alat secara otomatis tanpa harus dipandu setiap langkahnya.

Cerdas Setara Level Baru, Latensi Tetap Sama

Salah satu klaim paling menonjol dari GPT-5.5 adalah efisiensi inferensinya. Model yang lebih besar dan lebih mampu umumnya bekerja lebih lambat. GPT-5.5 justru menyamai latensi per-token GPT-5.4 dalam pelayanan dunia nyata, sambil beroperasi pada tingkat kecerdasan yang jauh lebih tinggi.

Lebih dari itu, GPT-5.5 menggunakan token yang lebih sedikit untuk menyelesaikan tugas yang sama. Di Indeks Pengkodean Artificial Analysis — rata-rata tertimbang dari 10 evaluasi eksternal — model ini diklaim memberikan kecerdasan mutakhir dengan biaya setengah dari model pengkodean terdepan kompetitif.

Baca Juga  Kolaborasi GPT dan Claude Ubah Lanskap AI, Microsoft dan Developer Terapkan Sistem Ganda

Pencapaian efisiensi ini sebagian datang dari kolaborasi dengan infrastruktur NVIDIA. GPT-5.5 dirancang bersama, dilatih dengan, dan diimplementasikan pada sistem NVIDIA GB200 dan GB300 NVL72. Codex bahkan digunakan untuk membantu menemukan optimasi kunci dalam tumpukan infrastruktur itu sendiri — termasuk algoritma heuristik baru untuk penyeimbangan beban yang meningkatkan kecepatan pembuatan token lebih dari 20%.

Benchmark Coding: Expert-SWE 73,1%, Terminal-Bench 82,7%

Expert SWE Internal Terminal Bench 2.0

GPT-5.5 mengklaim posisi terkuat OpenAI di ranah pengkodean agentic. Pada Terminal-Bench 2.0, yang menguji alur kerja baris perintah kompleks, model ini mencapai akurasi 82,7% — melampaui Claude Opus 4.7 di angka 69,4% dan Gemini 3.1 Pro di 68,5%.

Pada SWE-Bench Pro, evaluasi penyelesaian masalah GitHub di dunia nyata, GPT-5.5 mencetak 58,6%. Sementara pada Expert-SWE, evaluasi internal untuk tugas pengkodean jangka panjang dengan estimasi waktu penyelesaian manusia rata-rata 20 jam, GPT-5.5 juga mengungguli GPT-5.4.

Penguji awal memberikan testimoni langsung. Dan Shipper, Pendiri dan CEO Every, menyebut, “Ini adalah model pengkodean pertama yang pernah saya gunakan yang memiliki kejelasan konseptual yang serius.” Ia menguji GPT-5.5 dengan skenario nyata: memutar balik kondisi sistem yang rusak dan memeriksa apakah model bisa menghasilkan jenis penulisan ulang yang sama seperti yang diputuskan seorang insinyur senior. GPT-5.4 tidak bisa. GPT-5.5 bisa.

Baca Juga  Alibaba Cloud Rilis AI Video dengan Input Teks, Gambar, Audio

Pietro Schirano, CEO MagicPath, melihat perubahan serupa ketika GPT-5.5 menggabungkan cabang dengan ratusan perubahan frontend dan refaktor ke cabang utama dalam waktu sekitar 20 menit. “Rasanya sungguh seperti saya bekerja dengan kecerdasan yang lebih tinggi, dan hampir ada rasa hormat,” katanya.

Seorang insinyur di NVIDIA bahkan mengungkapkan, “Kehilangan akses ke GPT-5.5 rasanya seperti kehilangan sebagian anggota tubuh.”

Pekerjaan Berbasis Pengetahuan dan Komputer

Keunggulan GPT-5.5 tidak berhenti di pengkodean. Model ini juga mengklaim lompatan signifikan dalam kemampuan mengoperasikan komputer secara mandiri. Pada OSWorld-Verified, yang mengukur apakah model dapat beroperasi di lingkungan komputer nyata secara otonom, GPT-5.5 mencapai 78,7% — setara dengan Claude Opus 4.7 di 78,0%.

Baca Juga  Tim Cook Mundur dari CEO Apple September 2026, John Ternus Ambil Alih Kendali

Pada GDPval, yang menguji kemampuan agen menghasilkan pekerjaan berbasis pengetahuan di 44 bidang, GPT-5.5 mencetak 84,9%. Pada Tau2-bench Telecom untuk alur kerja layanan pelanggan kompleks, model ini mencapai 98,0% tanpa penyetelan prompt sama sekali.

Penerapan internal di OpenAI sendiri sudah berjalan. Lebih dari 85% tim perusahaan menggunakan Codex setiap minggu. Tim Keuangan menggunakannya untuk meninjau 24.771 formulir pajak K-1 dengan total 71.637 halaman, mempercepat pekerjaan hingga dua minggu dibanding tahun sebelumnya. Tim Go-to-Market mengotomatiskan pembuatan laporan bisnis mingguan, menghemat 5–10 jam per minggu.

Tinggalkan Balasan

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *