Dans cette conversation, Vladyslav LarinLe co-fondateur et CTO de quarantwo, retrace son parcours de la fascination de l’enfance pour l’IA à un pionnier d’un laboratoire de recherche sur l’IA visant à atteindre l’AGI grâce à l’intelligence en réseau.
Commençant par les influences de science-fiction et les premières explorations académiques, Larin explique comment son scepticisme des modèles d’IA centralisés a conduit à des solutions innovantes dans l’informatique distribuée.
Cette interview explore comment l’approche unique de Fortytwo à l’IA reflète les systèmes naturels et pourrait remodeler l’avenir de l’intelligence artificielle.
Inspirations et influences
Qu’est-ce qui a suscité votre intérêt pour l’IA et qui ont été vos modèles qui façonnaient votre réflexion?
L’IA a attiré mon attention au début de l’école. J’ai considéré la programmation et même le développement de jeux comme des tremplins vers l’IA. Le film Matrix a été une influence, qui a introduit l’idée que l’IA pouvait non seulement atteindre l’intelligence au niveau de l’homme, mais finalement devenir beaucoup plus puissante.
Mes modèles étaient principalement des textes académiques. Je me souviens avoir lu un article sur le Perceptron, le premier modèle de neurones artificiels. La compréhension de cela et de l’algorithme d’apprentissage rétropropt a été un moment déterminant – cela m’a montré comment les neurones artificiels pouvaient permettre le raisonnement, la logique et même la logique floue, leur permettant de calculer et de résoudre des problèmes complexes.
Comment votre doctorat en mathématiques appliqués a-t-il façonne votre approche de l’IA?
La route vers mon doctorat était directement liée à l’IA. Quand j’ai lu pour la première fois sur le rétroécrose, j’ai vu un énorme goulot d’étranglement en ayant une entité centralisée régissant l’apprentissage. Même à l’époque, je ne pouvais pas accepter l’idée d’un seul «modèle de Dieu». C’était inefficace, même contre nature.
Cela m’a conduit vers des algorithmes décentralisés. Pendant mon doctorat, j’ai travaillé sur des systèmes d’agents distribués qui utilisent cent pour cent des ressources disponibles grâce à une coordination décentralisée. Avec la centralisation, nous sacrifions la robustesse pour résoudre les problèmes; L’algorithme gagne l’efficacité mais perd son adaptabilité, la flexibilité. Bien qu’il soit plus facile pour les problèmes ouverts, il est préférable d’avoir une concurrence avec plusieurs pièces qui y travaillent indépendamment.
La naissance de l’intelligence de l’essaim
En quoi la déférence de l’essaim de Fortytwo diffère-t-elle fondamentalement de la mise à l’échelle traditionnelle de l’IA?
La principale différence est que nous ne divisons pas un seul modèle à travers les nœuds ou ne reproduisons pas les données entre eux. Au lieu de cela, nous traitons chaque nœud AI comme une boîte noire qui produit indépendamment son inférence. Chaque nœud peut exécuter des outils personnalisés. Une fois que les participants ont généré des réponses, un sous-ensemble effectue une revue par les pairs pour classer ces réponses, nous aidant à trouver les meilleures achèvement.
Avec cette configuration, des milliers de modèles uniques peuvent coexister et atteindre un consensus. Cette architecture signifie que tout le monde peut participer à l’essaim d’IA. QuartyTwo fonctionne comme un laboratoire de recherche sur l’IA, en développant des protocoles où les nœuds décentralisés contribuent à une intelligence collective, améliorant les capacités globales de l’IA.
Envisagez de créer une application: certains nœuds génèrent de l’art, d’autres écrivent du code, certaines exigences de mise en œuvre, tandis que d’autres vérifient en exécutant des résultats dans des machines virtuelles. Nous avons une architecture super hétérogène trouvant un consensus à différents points de raisonnement, unissant des éléments forts pour fournir des réponses finales.
Quels défis vous ont poussé à créer cette approche basée sur des essaims?
Mes projets antérieurs ont mis les défis à l’échelle nettement mis en évidence. Avec l’IA conversationnelle, les coûts ont rapidement augmenté lorsqu’ils essaient de rendre les interactions naturelles. Avec les systèmes multimodaux, l’ajout de dimensions signifiait exponentiellement plus de calcul. Il est devenu clair que pour que l’IA réalise son potentiel, nous avions besoin d’une approche fondamentalement différente pour organiser et distribuer un calcul de l’IA. C’est là que les idées de Fortytwo ont commencé à prendre forme.
L’avenir de l’IA décentralisée
Pensez-vous que l’inférence décentralisée fournit un chemin supérieur à AGI?
L’inférence décentralisée déverrouille le calcul presque illimité en distribuant la charge sur toutes les ressources disponibles, y compris les appareils de consommation qui s’opportent. En tirant parti de la calcul contribué à l’utilisateur, l’approche décentralisée de quarantewo vise à déverrouiller des voies évolutives et efficaces vers l’AGI, en utilisant un réseau de modèles interconnectés.
Une solution décentralisée offre une sécurité algorithmique, ainsi que l’évolutivité et les prix bien inférieurs aux centres de données centralisés. Pour la plupart des tâches, l’inférence décentralisée est le meilleur chemin. Les approches centralisées peuvent encore servir les utilisateurs de niche, mais leur pertinence diminuera probablement à mesure que nous relevons des défis de coordination décentralisés, sur lesquels nous travaillons à quaranton.
Où voyez-vous une IA décentralisée dans cinq ans?
Cinq ans suffit pour lancer une adoption généralisée de modèles décentralisés et une inférence. Espérons que cela surpassera les approches centralisées. L’IA décentralisée exploitera le calcul latent partout – dans les mains ou les centres de données des utilisateurs quotidiens non optimisés pour les charges de travail de l’IA.
En utilisant cette puissance de calcul cachée, nous pouvons rendre l’IA plus abordable et précis, déploiement plus de calcul dans l’examen par les pairs pour chaque requête. Il est réaliste de s’attendre à ce que l’IA décentralisée capture finalement la majorité du marché de l’inférence de l’IA.
Quelle est la contribution ultime de quarante-wo à l’avenir de l’IA?
Le laboratoire de recherche de quarantwo est dédié au développement d’architectures d’IA décentralisées qui exploitent un calcul contribué aux utilisateurs, visant à atteindre AGI comme une propriété émergente d’un réseau de modèles. Il fournit un calcul presque illimité en tirant parti des ressources mondiales sous-utilisées, améliore la précision grâce à l’examen par les pairs pour aborder les hallucinations et démocratise la propriété de l’IA, passant du contrôle des entreprises à un système où des milliers ou des millions peuvent contribuer.
Cette approche évolue économiquement tout en améliorant la précision et la participation. Alors que l’IA devient plus ancrée dans nos vies, les limites des modèles centralisées deviendront plus claires. L’architecture de quarantewo est une étape évolutive, transformant l’IA en une intelligence distribuée à l’échelle mondiale qui peut vraiment répondre aux besoins divers de l’humanité.
En savoir plus Entretiens ici.