AI Belum Mampu Pecahkan Soal Penelitian Konkret, Proyek First Proof Ungkap Batas Teknologi
Info Tekno> Matematikawan dunia buktikan AI belum mampu pecahkan soal penelitian konkret melalui sebuah eksperimen ilmiah yang dilakukan oleh sejumlah akademisi dari universitas ternama. Penelitian ini menunjukkan bahwa meskipun kecerdasan buatan atau Artificial Intelligence (AI) telah berkembang pesat dalam beberapa tahun terakhir, teknologi tersebut masih memiliki keterbatasan ketika dihadapkan pada persoalan matematika yang benar-benar baru dan belum pernah dipublikasikan sebelumnya.
Eksperimen tersebut dilakukan melalui sebuah proyek penelitian bernama First Proof, yang digagas oleh sejumlah matematikawan terkemuka dari berbagai universitas dunia. Tujuan utama dari proyek ini adalah untuk menguji sejauh mana sistem AI modern benar-benar memahami konsep matematika tingkat lanjut, bukan sekadar meniru pola atau mengulang solusi yang sudah tersedia di sumber data publik.
Proyek ini melibatkan para peneliti dari beberapa institusi akademik bergengsi seperti Harvard University, Stanford University, Yale University, University of California Berkeley, serta Columbia University. Mereka merancang metode pengujian yang cukup unik dengan menantang sistem AI memecahkan persoalan matematika yang baru saja mereka selesaikan sendiri, tetapi belum dipublikasikan di jurnal ilmiah.
Pendekatan ini dipilih agar AI tidak dapat mengakses solusi melalui sumber data yang mungkin telah digunakan dalam proses pelatihannya. Dengan demikian, para peneliti dapat menilai secara objektif apakah kecerdasan buatan benar-benar mampu melakukan penalaran matematika tingkat tinggi secara mandiri.
Proyek First Proof: Eksperimen Menguji Pemahaman AI dalam Matematika
Bagaimana Penelitian Ini Dilakukan
Proyek First Proof dipimpin oleh sejumlah matematikawan yang memiliki reputasi kuat di bidang penelitian matematika. Salah satu tokoh yang terlibat dalam proyek ini adalah Lauren Williams, profesor matematika dari Harvard University yang juga dikenal sebagai penerima penghargaan bergengsi MacArthur Genius Grant.
Dalam proyek tersebut, Williams bersama sepuluh matematikawan lainnya menyusun sepuluh persoalan matematika yang berasal dari berbagai cabang ilmu matematika tingkat lanjut. Masalah yang disusun tidak hanya berasal dari satu bidang tertentu, tetapi mencakup berbagai disiplin, mulai dari teori bilangan hingga topologi.
Setiap persoalan yang digunakan dalam pengujian ini merupakan masalah yang benar-benar baru dan belum dipublikasikan dalam jurnal ilmiah mana pun. Solusi dari persoalan tersebut kemudian disimpan dalam bentuk terenkripsi untuk memastikan bahwa sistem AI tidak memiliki akses terhadap jawabannya.
Setelah itu, para peneliti menantang berbagai sistem AI publik untuk mencoba menyelesaikan persoalan tersebut secara mandiri.
Metode ini dirancang untuk menguji kemampuan AI dalam melakukan penalaran matematis tanpa bantuan data pelatihan yang relevan.
Hasil Uji Awal: AI Mengalami Kesulitan
Hasil pengujian awal menunjukkan bahwa sistem AI yang tersedia secara publik mengalami kesulitan dalam menjawab sebagian besar pertanyaan yang diajukan oleh para peneliti.
Menurut para matematikawan yang terlibat dalam proyek tersebut, kegagalan AI dalam menjawab persoalan ini menunjukkan bahwa teknologi tersebut belum memiliki kemampuan untuk memahami konsep matematika tingkat tinggi secara mendalam.
Salah satu penggagas proyek ini, Mohammed Abouzaid, profesor matematika dari Stanford University, menjelaskan bahwa sistem AI terbaik yang tersedia saat ini belum mampu memberikan solusi yang memadai terhadap sebagian besar persoalan yang diuji.
Ia menyatakan bahwa hasil pengujian ini memberikan gambaran realistis mengenai kemampuan AI dalam bidang penelitian matematika.
Mengapa AI Kesulitan Menyelesaikan Soal Penelitian Matematika
Perbedaan Antara Soal Algoritmik dan Penemuan Konseptual
Menurut para peneliti, terdapat perbedaan mendasar antara persoalan matematika yang bersifat algoritmik dengan penelitian matematika yang benar-benar baru.
AI dikenal memiliki kemampuan yang sangat baik dalam menyelesaikan tugas-tugas yang mengikuti pola tertentu atau dapat dipecahkan menggunakan algoritma yang jelas. Contohnya termasuk soal-soal matematika dalam kompetisi atau olimpiade yang biasanya memiliki struktur penyelesaian yang relatif terdefinisi.







