OpenAI dan firma investasi kripto Paradigm meluncurkan EVMbench, sebuah benchmark keamanan yang dirancang untuk menguji kemampuan AI dalam mendeteksi, memperbaiki dan mengeksploitasi kerentanan pada kontrak pintar berbasis Ethereum Virtual Machine (EVM).
Inisiatif ini bertujuan menciptakan standar baru untuk mengevaluasi efektivitas AI dalam keamanan blockchain, terutama di tengah meningkatnya nilai aset digital yang bergantung pada kontrak pintar di jaringan Ethereum dan ekosistem terkait.
Benchmark tersebut dikembangkan dari 120 kerentanan berisiko tinggi yang dikurasi dari 40 audit keamanan profesional.
Kerentanan ini berasal dari kasus nyata yang sebelumnya ditemukan dalam berbagai proyek blockchain, termasuk skenario audit yang berkaitan dengan Tempo chain, sebuah jaringan layer-1 yang dirancang untuk mendukung infrastruktur pembayaran digital.
Dataset tersebut kemudian diuji dalam lingkungan blockchain lokal berbasis sandbox untuk memastikan setiap eksploitasi yang dilakukan AI dapat diverifikasi secara objektif dan aman.
Hasil pengujian awal menunjukkan peningkatan signifikan dalam kemampuan AI untuk mengeksploitasi kerentanan kontrak pintar. Model GPT-5.3-Codex mencatat skor keberhasilan eksploitasi sebesar 72,2 persen, meningkat tajam dibandingkan GPT-5 yang hanya mencapai 31,9 persen dalam pengujian yang sama.
Peningkatan ini menunjukkan bahwa AI kini semakin mampu memahami struktur kontrak pintar secara mendalam dan mengidentifikasi jalur eksploitasi yang sebelumnya memerlukan keahlian teknis tinggi dari auditor keamanan manusia.
Benchmark Baru untuk Ukur Kemampuan AI dalam Keamanan Blockchain
EVMbench dirancang untuk menguji AI dalam tiga skenario utama, yaitu mendeteksi kerentanan, memperbaiki kode yang rentan dan mengeksploitasi kelemahan tersebut.
Dalam mode deteksi, AI diminta mengidentifikasi bug atau kelemahan keamanan dalam kode kontrak pintar. Sementara itu, mode patch menguji kemampuan AI untuk memperbaiki kerentanan tanpa merusak fungsi utama kontrak.
Mode exploit menjadi pengujian paling kompleks, karena AI harus menghasilkan transaksi eksploitasi yang dapat dijalankan untuk memanfaatkan kerentanan tersebut secara nyata dalam lingkungan simulasi blockchain.
Seluruh pengujian dilakukan menggunakan lingkungan EVM lokal berbasis sandbox, yang memungkinkan setiap tindakan AI direplikasi dan diverifikasi tanpa risiko terhadap jaringan blockchain publik.
Infrastruktur ini memungkinkan pengembang mengukur efektivitas AI secara langsung dalam kondisi yang menyerupai dunia nyata, termasuk bagaimana AI merespons kerentanan kompleks yang biasanya ditemukan dalam sistem keuangan terdesentralisasi.
OpenAI menekankan bahwa pengembangan benchmark ini bertujuan memastikan AI dapat digunakan untuk memperkuat keamanan, bukan hanya mengidentifikasi kelemahan.
“Seiring dengan peningkatan kemampuan AI agent dalam membaca, menulis dan mengeksekusi kode, semakin penting untuk mengukur kemampuan mereka dalam lingkungan yang bermakna secara ekonomi dan untuk mendorong penggunaan sistem AI secara defensif guna mengaudit dan memperkuat kontrak yang telah diterapkan,” ungkap OpenAI.
Temuan Awal Ungkap Kesenjangan antara Eksploitasi dan Pertahanan
Meskipun kemampuan eksploitasi AI menunjukkan peningkatan signifikan, hasil benchmark juga mengungkap bahwa kemampuan AI dalam mendeteksi dan memperbaiki seluruh kerentanan masih belum sepenuhnya optimal.
Dalam beberapa kasus, AI berhasil mengeksploitasi bug tertentu tetapi tidak mampu mengidentifikasi semua kelemahan dalam kontrak yang sama atau menghasilkan perbaikan yang sepenuhnya aman. Temuan ini menunjukkan adanya kesenjangan antara kemampuan AI dalam menyerang dan mempertahankan sistem.
Paradigm menyatakan bahwa benchmark ini dirancang untuk membantu industri memahami perkembangan kemampuan AI secara lebih objektif, sekaligus mendorong pengembangan sistem keamanan yang lebih kuat.
Dengan menyediakan dataset yang berasal dari audit nyata dan lingkungan pengujian terisolasi, EVMbench memungkinkan evaluasi yang transparan terhadap kemampuan AI dalam menghadapi tantangan keamanan blockchain modern.
Itulah rangkuman berita kripto hari ini yang bisa kamu simak untuk mengikuti perkembangan dunia aset digital dan teknologi blockchain. Tetap pantau Blockchain Media Indonesia untuk update terbaru seputar pasar kripto, berita bitcoin, hingga panduan belajar crypto untuk kamu yang masih pemula. [st]
Disclaimer: Konten di Blockchainmedia.id hanya bersifat informatif, bukan nasihat investasi atau hukum. Segala keputusan finansial sepenuhnya tanggung jawab pembaca.



