Meta met à disposition en open source son grand modèle de langage étendu en partenariat avec Microsoft pour venir concurrencer le modèle GPT-4 d’OpenAI.
Le géant des réseaux sociaux Meta a annoncé mettre à disposition en open source son grand modèle de langage baptisé LLaMA 2. Ce dernier devient donc accessible gratuitement pour la recherche et d’éventuelles utilisations commerciales, entrant directement en concurrence avec le modèle IA GPT-4 d’OpenAI qui alimente les chatbots comme ChatGPT et Bing Chat.
Meta fait le pari de l’open source pour démocratiser son dernier modèle IA
Meta a annoncé rendre open source LLaMA 2 lors de l’évènement Inspire de Microsoft, soulignant au passage un partenariat « grandissant » avec le géant de Redmond. En parallèle, Microsoft a révélé plus de détails sur les outils IA qui seront intégrés à sa plateforme Microsoft 365. Lors de l’évènement, Qualcomm a également annoncé collaborer avec Meta pour amener le grand modèle de langage sur les PC portables, les smartphones et les casques AR/VR à partir de 2024 (pour les applications IA qui fonctionnent sans dépendre de services Cloud).
Dans un communiqué de presse, Meta explique sa décision d’ouvrir LLaMA comme un moyen de donner aux entreprises, aux startups et aux chercheurs l’accès à davantage d’outils d’IA. Selon la société, le modèle LLaMA 2 a été entraîné sur 40 % de données en plus par rapport à son prédécesseur LLaMA 1. Meta affirme également que son dernier modèle IA « surpasse » d’autres grands modèles de langage comme Falcon LLM et MPT-7B en matière de raisonnement, de codage, de compétences et de tests de connaissances.
En ouvrant LLaMA, Meta déclare vouloir améliorer la sécurité et la transparence de son modèle IA. L’entreprise a testé LLaMA 2 pour la sécurité en « générant des messages contradictoires pour faciliter l’ajustement du modèle », à la fois en interne et en externe. Le modèle sera disponible sur la plateforme Microsoft Azure, ainsi que d’autres services comme AWS (Amazon Web Services) et Hugging Face.
Dans son communiqué, Meta indique : « Nous pensons qu’une approche ouverte est bonne pour le développement des modèles IA d’aujourd’hui, en particulier les IA génératives où la technologie progresse rapidement. […] Cela signifie qu’une génération de développeurs et de chercheurs peut les tester, identifier et résoudre les problèmes rapidement, en tant que communauté ».
Maintenant que LLaMA 2 est open source, nous devrions voir arriver de nouveaux outils IA basés sur le modèle de Meta. La société affirme avoir reçu plus de 100 000 demandes de la part de chercheurs pour son premier modèle LLaMA 1, mais son dernier modèle aura probablement une portée bien plus grande.