Ranking AI Paling Pintar 2026: Grok dan GPT-5.4 Pro Raih IQ 145
INFO TEKNO> Dua model kecerdasan buatan berbagi takhta sebagai AI paling cerdas di dunia berdasarkan pengujian terbaru: Grok-4.20 Expert Mode buatan xAI milik Elon Musk dan OpenAI GPT-5.4 Pro (Vision). Keduanya sama-sama mencetak skor 145 dalam tes yang mengacu pada standar IQ Mensa Norway, melampaui semua model lain yang diuji pada periode yang sama.
Data ini bersumber dari lembaga pemeringkat independen TrackingAI, dipublikasikan dalam laporan AI Week oleh Visual Capitalist per April 2026.
Daftar Lengkap Ranking IQ Model AI (April 2026)
Berikut peringkat seluruh model yang diuji, dari skor tertinggi hingga terendah:
| Peringkat | Model AI | Skor IQ |
|---|---|---|
| 1 | Grok-4.20 Expert Mode | 145 |
| 2 | OpenAI GPT-5.4 Pro (Vision) | 145 |
| 3 | Gemini 3.1 Pro Preview | 141 |
| 4 | OpenAI GPT-5.4 Thinking (Vision) | 139 |
| 5 | OpenAI GPT-5.3 | 136 |
| 6 | Grok-4.20 Expert Mode (Vision) | 133 |
| 7 | OpenAI GPT-5.4 Thinking | 133 |
| 8 | Meta Muse Spark | 133 |
| 9 | Gemini 3.1 Pro Preview (Vision) | 132 |
| 10 | Qwen 3.5 | 130 |
| 11 | Claude 4.6 Opus | 130 |
| 12 | Kimi K2.5 | 127 |
| 13 | Manus | 115 |
| 14 | DeepSeek R1 | 112 |
| 15 | DeepSeek V3 | 111 |
| 16 | Gemini 3.1 Flash | 110 |
| 17 | Llama 4 Maverick | 110 |
| 18 | GPT-5.3 (Vision) | 109 |
| 19 | Claude 4.6 Sonnet | 106 |
| 20 | Bing Copilot | 101 |
| 21 | Perplexity | 97 |
| 22 | Mistral Medium 3.1 | 96 |
| 23 | Claude 4.6 Sonnet (Vision) | 94 |
| 24 | Claude 4.6 Opus (Vision) | 82 |
| 25 | Llama 4 Maverick (Vision) | 79 |
| 26 | GPT-5.4 Pro (non-vision) | 73 |
Metode Pengujian: Tes IQ Mensa Norway
TrackingAI menggunakan standar tes IQ Mensa Norway, salah satu tes penalaran non-verbal paling terpercaya secara global. Tes ini terdiri dari 35 soal teka-teki pola visual — peserta harus mengidentifikasi pola, hubungan logis, dan kelanjutan urutan bentuk atau gambar.
Kemampuan yang diukur mencakup penalaran abstrak, pemecahan masalah, dan pemahaman hubungan antarkonsep — yang dianggap sebagai inti kecerdasan umum.
Cara penyampaian soal dibedakan berdasarkan kemampuan model. Model berbasis Vision menerima soal dalam bentuk gambar asli persis seperti yang dikerjakan manusia. Model non-Vision menerima soal yang sama namun diterjemahkan ke dalam deskripsi teks tertulis.
Visi vs Non-Visi: Kesenjangan Skor yang Mengejutkan
Hasil pengujian mengungkap temuan menarik: kemampuan “melihat” gambar tidak otomatis menjamin skor lebih tinggi. Bahkan perbedaannya bisa sangat dramatis pada model yang sama.
GPT-5.4 Pro versi Vision mencatat skor 145, sedangkan versi non-Vision-nya hanya meraih 73 — selisih 72 poin dari model yang pada dasarnya identik. Ini membuktikan bahwa kemampuan mengolah informasi visual secara langsung menjadi faktor penentu utama kecerdasan logis AI generasi terbaru.
Pola serupa terlihat pada Claude 4.6 Opus: versi teks meraih skor 130, sementara versi Vision-nya justru lebih rendah di angka 82. Fenomena ini mengindikasikan bahwa integrasi kemampuan visual ke dalam model tertentu masih dalam tahap optimasi.
Lompatan 10 Poin dalam Kurang dari 12 Bulan
Perkembangan paling signifikan bukan hanya pada siapa yang menang, melainkan seberapa cepat kemampuan AI meningkat. Pada 2025, skor IQ tertinggi yang pernah dicapai model AI terbaik dunia berada di angka 135.
Dalam waktu kurang dari satu tahun, batas itu sudah ditembus dan naik 10 poin menjadi 145 di 2026. Lompatan ini mencerminkan terobosan di level arsitektur machine learning, peningkatan kapasitas pemrosesan data, dan penyempurnaan metode pelatihan secara bersamaan.
Sebagai perbandingan, rata-rata skor IQ manusia berada di kisaran 85–115. Skor di atas 130 dikategorikan sebagai kecerdasan luar biasa atau jenius. Secara teori, AI papan atas kini memiliki kemampuan penalaran logis yang melampaui mayoritas manusia.
Grok-4.20 vs GPT-5.4 Pro: Skor Sama, Karakter Berbeda
Meskipun sama-sama meraih 145, Grok-4.20 Expert Mode dan GPT-5.4 Pro memiliki pendekatan yang berbeda.
Grok-4.20 Expert Mode dikenal dengan akses data real-time dan cara berpikir yang lugas serta sangat terstruktur. Dalam tes pola, Grok terbukti sangat cepat mengenali hubungan sebab-akibat dan pola tersembunyi.
GPT-5.4 Pro (Vision) unggul dalam pemahaman konteks panjang dan analisis visual yang matang — tidak hanya melihat gambar, tetapi mampu menguraikan detail terkecil, membaca diagram, grafik, hingga tulisan tangan. Kekuatannya terletak pada kemampuan menghubungkan informasi visual dengan basis pengetahuan umum yang sangat luas.
Gemini 3.1 Pro Preview di posisi ketiga dengan skor 141 memiliki keunggulan di pemrosesan data multi-modal dan integrasi ekosistem Google, meski sedikit tertinggal dalam kecepatan penalaran abstrak murni.
Skor IQ Bukan Segalanya
TrackingAI sendiri menegaskan bahwa angka IQ bukan ukuran mutlak kualitas sebuah AI. Sejumlah kemampuan krusial tidak tercakup dalam tes ini, di antaranya: akurasi penulisan kode (coding), tingkat halusinasi atau kekeliruan fakta, kemampuan menggunakan alat eksternal (tool use), kreativitas dan nuansa bahasa, serta konsistensi jawaban ketika mendapat pertanyaan serupa berulang kali.
Model dengan skor IQ lebih rendah, seperti Claude atau DeepSeek, kerap lebih diunggulkan dalam tugas-tugas coding dan akurasi faktual dibandingkan model dengan skor IQ lebih tinggi.
FAQ
Q: AI mana yang memiliki IQ tertinggi di dunia pada 2026?
A: Berdasarkan data TrackingAI per April 2026, dua AI dengan skor IQ tertinggi adalah Grok-4.20 Expert Mode (xAI) dan OpenAI GPT-5.4 Pro (Vision), keduanya sama-sama meraih skor 145 dalam tes berbasis standar IQ Mensa Norway.
Q: Tes apa yang digunakan untuk mengukur IQ model AI?
A: TrackingAI menggunakan standar tes IQ Mensa Norway yang terdiri dari 35 soal teka-teki pola visual. Tes ini mengukur penalaran abstrak, pemecahan masalah, dan kemampuan mengenali hubungan logis antarpola — kemampuan yang dianggap sebagai inti kecerdasan umum.
Q: Berapa skor IQ rata-rata manusia dibandingkan AI terbaik saat ini?
A: Rata-rata IQ manusia berada di kisaran 85–115. Skor di atas 130 dikategorikan jenius. AI terbaik saat ini seperti Grok-4.20 dan GPT-5.4 Pro meraih skor 145, yang secara teori melampaui kemampuan penalaran logis mayoritas manusia.
Q: Mengapa varian Vision bisa mendapat skor lebih rendah dari non-Vision?
A: Tidak selalu lebih tinggi. Pada model tertentu seperti Claude 4.6 Opus, varian non-Vision (130) justru lebih tinggi dari varian Vision (82). Ini mengindikasikan integrasi kemampuan visual pada model tertentu masih dalam tahap optimasi dan belum sepenuhnya sinergis dengan kemampuan penalaran teks.
Q: Seberapa cepat skor IQ AI meningkat dalam setahun terakhir?
A: Sangat signifikan. Pada 2025, skor IQ tertinggi AI hanya mencapai 135. Pada April 2026, angka itu sudah melonjak 10 poin menjadi 145 — dalam waktu kurang dari 12 bulan, mencerminkan lompatan besar dalam arsitektur machine learning dan metode pelatihan model.

Aaf Afiatna (Aura OS) adalah seorang WordPress Developer, Administrator IT, dan penggerak di balik infrastruktur berbagai portal media digital PT Arina Duta Sehati. Ia memiliki ketertarikan mendalam pada rekayasa sistem tingkat rendah, implementasi AI on-device, dan pengembangan proyek open-source seperti Neural Standby Kernel (NSK). Saat tidak sedang berurusan dengan server atau kode, ia aktif mengeksplorasi ekosistem Web3 dan berbagi wawasan melalui channel YouTube CryptoFansWorld.






