Aujourd'hui, les agents utilisent des logiciels. Demain, ils utiliseront tout.
Nous construisons un monde où l'IA ne se contente pas de cliquer sur des boutons à l'écran — elle opère des machines, navigue dans des espaces physiques et travaille aux côtés des humains dans le monde réel.
Computer-use
Des agents qui voient les écrans, cliquent sur les boutons et utilisent n'importe quel logiciel exactement comme un humain le ferait. Aucune API nécessaire. C'est là où Deck en est aujourd'hui — et cela change déjà la façon dont les entreprises travaillent.
Maximiser les LLM dans les limites actuelles
Les modèles actuels sont puissants mais limités — fenêtres de contexte, hallucinations, coût. Nous explorons comment aller plus loin : orchestration multi-agents, mémoire pour les tâches de longue durée, workflows auto-réparateurs qui récupèrent des erreurs sans intervention humaine, et raisonnement structuré qui maintient les agents sur la bonne voie à travers des workflows de plus de 100 étapes.
Robotic-use
Les mêmes principes qui permettent à un agent de naviguer sur un site web peuvent lui permettre de naviguer dans un entrepôt. Le même modèle de vision qui lit un tableau de bord peut lire un atelier. Nous explorons comment le Computer Use s'étend au-delà des écrans — vers les caméras, les capteurs, les bras robotiques et les environnements physiques.
Questions ouvertes sur lesquelles nous travaillons
Les API couvrent 1 % des logiciels dans le monde. Les 99 % restants n'ont qu'une interface utilisateur. Comment construire un agent capable de tous les utiliser — sans une seule ligne de code d'intégration ?
Si la boucle cognitive pour naviguer sur un site web est la même que pour naviguer dans un entrepôt — percevoir, décider, agir — quelle infrastructure comble le fossé entre les environnements numériques et physiques ?
Dans un workflow de 200 étapes où chaque étape est fiable à 98 %, le taux de réussite de bout en bout chute à environ 2 %. Comment concevoir une correction d'erreurs qui maintient la fiabilité au-dessus de 95 % sans coût quadratique ?
Chaque entreprise possède des milliers d'identifiants et chaque agent a besoin d'y accéder. Comment construire une architecture de gestion des identifiants où aucune compromission d'une VM n'expose l'ensemble du graphe ?
Les logiciels changent d'interface plus vite qu'aucun modèle ne peut se réentraîner. Comment construire des agents qui traitent chaque interface comme inédite — et l'utilisent correctement dès la première tentative ?
Quelle est la grande question à laquelle vous essayez de répondre ?
Si ces questions vous passionnent