مجید قربانی نژاد

نهاية عصر "النقر"؛ تسريب مشروع OpenAI السري "Operator" الذي يريد السيطرة على حاسوبك!

كنا جميعاً نظن أن الثورة القادمة في الذكاء الاصطناعي ستكون GPT-5، وهو نموذج ببساطة "يتحدث بشكل أفضل" أو "يهلوس أقل". لكننا كنا مخطئين. تكشف التقارير السرية التي سربتها بلومبرج و The Information قبل ساعات أن سام ألتمان وفريقه في OpenAI يراهنون على مشروع يغير القواعد الأساسية للحوسبة: **مشروع "Operator"**. هذا النموذج الجديد ليس روبوت دردشة مهذباً؛ إنه "وكيل" (Agent) كامل الصلاحيات. هو لا يريد كتابة قصيدة لك؛ إنه يريد اختطاف مؤشر الفأرة الخاص بك، وفتح متصفحك، وتسجيل الدخول إلى حسابك المصرفي، وإتمام عمليات الشراء. يصف الخبراء شهر يناير 2026 بأنه تاريخ وفاة واجهة المستخدم الرسومية (GUI) بالشكل الذي نعرفه. لكن السؤال المرعب يظل قائماً: إذا ارتكب "Operator" خطأً وحول مدخرات حياتك إلى الحساب الخاطئ، فمن المسؤول؟

١. المقدمة: ما وراء الكلمات، نحو "الفعل" منذ تقديم ChatGPT في عام 2022، اعتدنا على "الدردشة" مع الذكاء الاصطناعي. نطرح الأسئلة، وهو يولد النصوص. لكن "التنفيذ" كان دائماً مسؤوليتنا. كان الذكاء الاصطناعي

يكتب الكود، لكن كان علينا نسخه ولصقه في VS Code والضغط على تشغيل. كان يكتب البريد الإلكتروني، لكن كان علينا الضغط على إرسال. مشروع Operator ، الذي يُشاع أنه سيتم إطلاقه للجمهور في يناير 2026 (الشهر المقبل)،

يكسر هذا الجدار بين "التفكير" و"العمل". تعتزم OpenAI تحويل الذكاء الاصطناعي من "مستشار واسع المعرفة" إلى "موظف تنفيذي". ٢. ما هو مشروع Operator بالضبط؟ وفقاً للوثائق المسربة، فإن Operator عبارة عن طبقة

برمجية على مستوى النظام تمتلك "وصولاً عالي المستوى" (High-Level Access) إلى جهاز الكمبيوتر الخاص بك. إنه ليس مجرد إضافة للمتصفح؛ بل يمكنه "رؤية" نظام التشغيل والتفاعل معه تماماً مثل الإنسان. ٢.١. الفرق

بين "روبوت الدردشة" و "الوكيل" (Agent) روبوت الدردشة (مثل ChatGPT الحالي) سلبي. لا يفعل شيئاً حتى يُطلب منه، وتقتصر مخرجاته على النصوص أو الصور. أما الوكيل (Agent) فهو نشط. لديه هدف، ويتلاعب بالأدوات لتحقيق

هذا الهدف. مثال: روبوت الدردشة: تسأل، "كيف أطلب الطعام؟" -> يسرد لك الخطوات. الوكيل (Operator): تقول، "اطلب لي بيتزا بيبروني." -> يفتح تطبيق التوصيل، ويجد مطعمك المفضل، ويتحقق من العنوان، ويضغط على زر

الدفع. ٢.٢. بنية CUA: عيون ترى، وأيدٍ تنقر في العالم الهندسي، تُعرف هذه التقنية باسم وكيل استخدام الكمبيوتر (Computer Use Agent - CUA) . يتكون النظام من مكونين رئيسيين: ١. الرؤية (Vision): يلتقط الوكيل

لقطات شاشة (Screenshots) مستمرة لشاشتك ويحللها باستخدام نماذج الرؤية. إنه يفهم أن المستطيل الأزرق في الأسفل هو "إرسال" والمربع الأبيض في الأعلى هو "بحث". ٢. الفعل (Action): يتصل الوكيل بواجهة برمجة تطبيقات

اقرأ المزيد على الموقع