Meta a récemment dévoilé LLaMA 2, une version améliorée de son LLM open source. Une version gratuite pour la recherche et qui permet une utilisation commerciale, une première pour la société. L’initiative vise à favoriser l’innovation et à résoudre les problèmes connus des LLMs, tels que les biais et la désinformation. Llama 2 est également pris en charge par Azure et Windows, grâce à un partenariat élargi entre Meta et Microsoft.
Il y a cinq mois, Meta présentait LLaMA, son LLM (large Language Model) en open source. Hier, la société américaine a annoncé la mise à disposition de LLaMA 2, gratuitement pour la recherche et l’utilisation commerciale. Cette démarche vise à donner aux entreprises et aux chercheurs l’accès à des outils développés à une échelle qu’il leur serait difficile de construire eux-mêmes. Meta a déclaré : « En mettant les modèles d’IA à la disposition de tous, ils peuvent profiter à tout le monde. »
Meta et Microsoft ont annoncé la prise en charge des modèles de langage (LLM) LLaMA 2 sur Azure et Windows. Cette disponibilité des modèles Llama 2 sur Azure AI permet aux développeurs de tirer parti des puissants outils de Microsoft. Pour gérer le “fine tuning”, l’inférence et en particulier les fonctionnalités qui prennent en charge la sécurité de l’IA. LLaMA 2 a été optimisé pour fonctionner localement sur Windows, offrant aux développeurs un flux de travail transparent pour créer des expériences d’IA adaptées aux besoins de leurs clients.
LLaMA 2 : un concurrent à GPT-4 ?
Pour une meilleure compréhension, de meilleures prédictions et une génération de texte plus adaptée, Meta a doublé la « context lenght », la longueur de contexte de LLaMA 2, élément qui détermine les performances des résultats. De même, Meta aurait utilisé 40% de données en plus pour entraîner cette seconde version de LLaMA. Les modèles pré-entraînés de Llama 2 l’ont été sur 2 billions de tokens.
D’après Meta, LLaMA 2 surpasse d’autres modèles de langage open source sur de nombreux benchmarks externes, notamment en matière de raisonnement, d’écriture de code, de compétence et de tests de connaissances. Il n’atteint toutefois pas les performances de GPT-4 d’OpenAI.
En mettant son modèle de langage à la disposition du grand public, Meta se veut transparent en communiquant les éventuels défauts, les façons d’y remédier ainsi que les évaluations du modèle. De cette manière, la plateforme assure que son nouveau modèle est gratuit mais sécurisé. Un modèle tel que celui-ci, offrant davantage de personnalisation et de transparence, peut permettre aux entreprises de développer plus rapidement des produits et des services.