اليوم، الوكلاء يستخدمون البرمجيات. غدًا، سيستخدمون كل شيء.

نحن نبني عالمًا حيث لا يكتفي الذكاء الاصطناعي بالنقر على الأزرار على الشاشات — بل يشغّل الآلات، ويتنقل في المساحات المادية، ويعمل جنبًا إلى جنب مع البشر في العالم الحقيقي.

الآن

Computer-use

وكلاء يرون الشاشات، وينقرون على الأزرار، ويشغّلون أي برنامج تمامًا كما يفعل الإنسان. لا حاجة لـ APIs. هذا هو Deck اليوم — وهو يغيّر بالفعل طريقة عمل الشركات.

تعظيم LLMs ضمن حدود اليوم

النماذج الحالية قوية لكنها مقيدة — نوافذ السياق، الهلوسة، التكلفة. نحن نبحث في كيفية المضي قدمًا: تنسيق الوكلاء المتعددين، ذاكرة المهام الطويلة، سير العمل ذاتي الإصلاح، والتفكير المنظم عبر سير عمل يتجاوز 100 خطوة.

المستقبل

Robotic-use

نفس المبادئ التي تمكّن الوكيل من التنقل في موقع ويب يمكن أن تمكّنه من التنقل في مستودع. نحن نستكشف كيف يمتد Computer Use إلى ما وراء الشاشات — إلى الكاميرات والمستشعرات والأذرع الروبوتية والبيئات المادية.

أسئلة مفتوحة نعمل عليها

تغطي APIs نسبة 1٪ من برمجيات العالم. الـ 99٪ المتبقية لديها واجهة مستخدم فقط. كيف تبني وكيلًا يمكنه تشغيل كل شيء — بدون سطر واحد من كود التكامل؟

إذا كانت الحلقة المعرفية للتنقل في موقع ويب هي نفسها للتنقل في مستودع — أدرك، قرر، نفذ — فما البنية التحتية التي تسد الفجوة بين البيئات الرقمية والمادية؟

في سير عمل من 200 خطوة حيث كل خطوة موثوقة بنسبة 98٪، ينخفض معدل النجاح الشامل إلى ~2٪. كيف تصمم تصحيح الأخطاء الذي يحافظ على الموثوقية فوق 95٪ بدون تكلفة تربيعية؟

كل مؤسسة لديها آلاف بيانات الاعتماد وكل وكيل يحتاج للوصول. كيف تبني بنية اعتماد حيث لا يؤدي اختراق VM واحد إلى كشف الرسم البياني بأكمله؟

يغيّر البرنامج واجهته أسرع مما يمكن لأي نموذج إعادة التدريب. كيف تبني وكلاء يتعاملون مع كل واجهة على أنها جديدة — ومع ذلك يشغّلونها بشكل صحيح في المحاولة الأولى؟

ما هو السؤال الكبير الذي تحاول الإجابة عليه؟