OpenAI Mengklaim ChatGPT Mampu Menyaingi Ahli Manusia di 44 Profesi
OpenAI mengumumkan bahwa model kecerdasan buatan (AI) mereka, ChatGPT, kini mampu menyaingi para ahli manusia dalam 44 profesi berbeda. Pengumuman ini dilakukan bersamaan dengan peluncuran fitur baru yang memungkinkan pengguna untuk membeli produk langsung dari Etsy dan Shopify tanpa harus meninggalkan antarmuka chat.
Klaim ini didasarkan pada tolok ukur baru bernama GDPval. Benchmark ini dirancang untuk menguji performa AI pada tugas-tugas pekerjaan nyata yang mencakup sembilan industri utama penyumbang Produk Domestik Bruto (PDB) Amerika Serikat. Dalam evaluasi tersebut, model Anthropic’s Claude Opus 4.1 justru mencatat hasil lebih baik dibandingkan GPT-5 high milik OpenAI. Claude berhasil meraih tingkat kemenangan dan hasil imbang sebesar 47,6%, sementara GPT-5 high hanya meraih 38,8%.
Benchmark GDPval
GDPval dinilai sebagai kerangka kerja paling ambisius yang pernah dilakukan OpenAI untuk mengukur nilai ekonomi AI. Model diuji pada 1.320 hasil kerja otentik dari berbagai profesi, mulai dari pengembang perangkat lunak, pengacara, perawat, penasihat keuangan, hingga pekerja sosial. Para profesional dengan rata-rata pengalaman 14 tahun dilibatkan untuk merancang tugas-tugas tersebut sekaligus bertindak sebagai penilai. Mereka membandingkan keluaran AI dengan hasil kerja manusia.
“Kami akhirnya memiliki cara untuk mengukur bagaimana model kami bekerja di dunia nyata — bukan hanya pada tes akademis — yang merupakan cara penting bagi kami untuk mengukur kemajuan menuju tujuan AGI,” ujar peneliti OpenAI, Tejal Patwardhan, kepada Axios.
Hasil pengujian menunjukkan peningkatan signifikan dari waktu ke waktu. GPT-4o yang dirilis pada musim semi 2024 hanya mencatat skor 13,7%. GPT-5 berhasil meningkatkan performa hampir tiga kali lipat. OpenAI mengklaim model AI mereka mampu menyelesaikan tugas 100 kali lebih cepat dan 100 kali lebih murah dibandingkan para ahli manusia.
Fitur Instant Checkout
Selain laporan GDPval, OpenAI juga meluncurkan fitur “Instant Checkout” pada Senin. Fitur ini memungkinkan pengguna ChatGPT di Amerika Serikat membeli barang langsung di dalam percakapan. Awalnya, fitur ini mendukung pembelian satu barang dari penjual Etsy. Selanjutnya, lebih dari satu juta merchant Shopify, termasuk Glossier, Skims, dan Spanx, akan segera bergabung.
Integrasi perdagangan ini menggunakan Agentic Commerce Protocol yang dikembangkan OpenAI bersama Stripe dan kini telah di-open source-kan untuk adopsi lebih luas. Pengguna bisa mencari produk dengan kueri bahasa alami seperti “hadiah untuk pecinta keramik” lalu menyelesaikan pembelian menggunakan kartu kredit, Apple Pay, atau Google Pay, tanpa meninggalkan aplikasi ChatGPT.
Pengumuman ini memicu lonjakan harga saham. Etsy tercatat naik hampir 16% dan Shopify meningkat lebih dari 6% setelah fitur baru diumumkan. OpenAI menegaskan biaya hanya dibebankan kepada merchant untuk setiap transaksi berhasil. Sementara itu, pengguna tidak dikenai biaya tambahan dan peringkat produk tidak dipengaruhi oleh status pembayaran.