Aujourd'hui, les agents utilisent des logiciels. Demain, ils utiliseront tout.

Nous construisons un monde où l'IA ne se contente pas de cliquer sur des boutons à l'écran — elle opère des machines, navigue dans des espaces physiques et travaille aux côtés des humains dans le monde réel.

Maintenant

Computer-use

Des agents qui voient les écrans, cliquent sur les boutons et opèrent n'importe quel logiciel exactement comme un humain. Pas d'API nécessaire. C'est là où Deck en est aujourd'hui — et ça change déjà la façon dont les entreprises travaillent.

Ensuite

Maximiser les LLMs dans les limites actuelles

Les modèles actuels sont puissants mais limités — fenêtres de contexte, hallucination, coût. Nous recherchons comment aller plus loin : orchestration multi-agents, mémoire de tâches longues, workflows auto-réparateurs et raisonnement structuré sur des workflows de plus de 100 étapes.

Futur

Robotic-use

Les mêmes principes qui permettent à un agent de naviguer sur un site web peuvent lui permettre de naviguer dans un entrepôt. Nous explorons comment le Computer Use s'étend au-delà des écrans — aux caméras, capteurs, bras robotiques et environnements physiques.

Questions ouvertes sur lesquelles nous travaillons

Les APIs couvrent 1% des logiciels du monde. Les 99% restants n'ont qu'une interface utilisateur. Comment construire un agent capable de tout opérer — sans une seule ligne de code d'intégration ?

Si la boucle cognitive pour naviguer sur un site web est la même que pour naviguer dans un entrepôt — percevoir, décider, agir — quelle infrastructure comble le fossé entre les environnements numériques et physiques ?

Dans un workflow de 200 étapes où chaque étape est fiable à 98%, le taux de succès de bout en bout tombe à environ 2%. Comment concevoir une correction d'erreur qui maintient la fiabilité au-dessus de 95% sans coût quadratique ?

Chaque entreprise a des milliers de credentials et chaque agent a besoin d'accès. Comment construire une architecture de credentials où la compromission d'une seule VM n'expose pas l'ensemble du graphe ?

Les logiciels changent leur interface plus vite qu'un modèle ne peut se réentraîner. Comment construire des agents qui traitent chaque interface comme nouvelle — et l'opèrent correctement dès la première tentative ?

Quelle est la grande question à laquelle vous essayez de répondre ?