Aujourd'hui, les agents utilisent des logiciels. Demain, ils utiliseront tout.
Nous construisons un monde où l'IA ne se contente pas de cliquer sur des boutons à l'écran — elle opère des machines, navigue dans des espaces physiques et travaille aux côtés des humains dans le monde réel.
Computer-use
Des agents qui voient les écrans, cliquent sur les boutons et opèrent n'importe quel logiciel exactement comme un humain. Pas d'API nécessaire. C'est là où Deck en est aujourd'hui — et ça change déjà la façon dont les entreprises travaillent.
Maximiser les LLMs dans les limites actuelles
Les modèles actuels sont puissants mais limités — fenêtres de contexte, hallucination, coût. Nous recherchons comment aller plus loin : orchestration multi-agents, mémoire de tâches longues, workflows auto-réparateurs et raisonnement structuré sur des workflows de plus de 100 étapes.
Robotic-use
Les mêmes principes qui permettent à un agent de naviguer sur un site web peuvent lui permettre de naviguer dans un entrepôt. Nous explorons comment le Computer Use s'étend au-delà des écrans — aux caméras, capteurs, bras robotiques et environnements physiques.
Questions ouvertes sur lesquelles nous travaillons
Les APIs couvrent 1% des logiciels du monde. Les 99% restants n'ont qu'une interface utilisateur. Comment construire un agent capable de tout opérer — sans une seule ligne de code d'intégration ?
Si la boucle cognitive pour naviguer sur un site web est la même que pour naviguer dans un entrepôt — percevoir, décider, agir — quelle infrastructure comble le fossé entre les environnements numériques et physiques ?
Dans un workflow de 200 étapes où chaque étape est fiable à 98%, le taux de succès de bout en bout tombe à environ 2%. Comment concevoir une correction d'erreur qui maintient la fiabilité au-dessus de 95% sans coût quadratique ?
Chaque entreprise a des milliers de credentials et chaque agent a besoin d'accès. Comment construire une architecture de credentials où la compromission d'une seule VM n'expose pas l'ensemble du graphe ?
Les logiciels changent leur interface plus vite qu'un modèle ne peut se réentraîner. Comment construire des agents qui traitent chaque interface comme nouvelle — et l'opèrent correctement dès la première tentative ?
Quelle est la grande question à laquelle vous essayez de répondre ?