شرکت اوپنایآی (OpenAI) با همکاری پارادایم (Paradigm)، سامانهای به نام ایویام بنچ (EVMbench) معرفی کرده که توانایی هوش مصنوعی در کشف و اصلاح نقصهای امنیتی قراردادهای هوشمند را ارزیابی میکند. این چارچوب بر قراردادهای مبتنی بر ماشین مجازی اتریوم (EVM) تمرکز دارد و عملکرد مدلها را در سناریوهای مالی واقعی میسنجد. اهمیت این موضوع از آنجا ناشی میشود که قراردادهای هوشمند در حال حاضر بیش از ۱۰۰ میلیارد دلار دارایی رمزارزی متنباز را محافظت میکنند. EVMbench عاملها را در سه بخش تشخیص، اصلاح و بهرهبرداری آزمایش میکند.
دادههای آزمون شامل ۱۲۰ آسیبپذیری پرریسک استخراجشده از ۴۰ ممیزی امنیتی است و سناریوهای تکمیلی نیز از بررسیهای بلاکچین تمپو (Tempo)، شبکهای متمرکز بر پرداختهای مبتنی بر استیبل کوین، اضافه شدهاند. در نتایج اولیه، مدل GPT-5.3-Codex در حالت بهرهبرداری امتیاز 72.2٪ کسب کرد، در حالی که GPT-5 امتیاز 31.9٪ داشت. عملکرد مدلها در تشخیص و اصلاح آسیبپذیریها پایینتر گزارش شد. اوپنایآی تأکید کرده این معیار بازتاب کامل شرایط واقعی نیست، اما هدف آن تقویت کاربرد دفاعی هوش مصنوعی در امنیت سایبری است. همچنین ۱۰ میلیون دلار اعتبار API برای حمایت از پروژههای متنباز اختصاص یافته و ابزارهای ایویامبنچ بهصورت عمومی منتشر شدهاند.

نظرات کاربران