Interview BFM Business Hugging Face 04 2023

April 05, 2023
Interview with François Sorel (BFM Business, Tech & Co) at the AWS Summit in Paris (04/04/2023).

Transcript

Le grand live du numérique avec François Sorel. Allez, le retour de Tech & Co sur BFA Business. Nous sommes jusqu'à 22h ici, Porte Maillot, Palais des Congrès, à l'occasion de cette 10e édition de l'AWS Summit. Et j'accueille maintenant avec plaisir Julien Simon. Bonsoir Julien. Bonsoir François. Vous êtes évangéliste technique chez Hugging Face et vous êtes l'une des stars de ce salon parce que c'est vrai que Hugging Face, une pépite de l'intelligence artificielle créée par trois Français, Julien Chaumont, Clément Delongue et Thomas Wolff, est aujourd'hui à la tête de rouages essentiels quand on parle d'intelligence artificielle. C'est vrai que c'est un sujet qui a pris vraiment énormément d'ampleur aujourd'hui. Tous les médias, même mainstream, évoquent l'intelligence artificielle. ChatGPT, vous êtes sur ce segment avec Bloom notamment. Est-ce que vous pouvez nous présenter Hugging Face, s'il vous plaît Julien ? Bien sûr, Hugging Face a été créé en 2016 et aujourd'hui nous sommes le site qui regroupe la plus grande collection de modèles d'IA et de jeux de données en open source. Le mot-clé pour nous, c'est l'open source. Pour vous donner un ordre de grandeur, nous avons plus de 160 000 modèles disponibles sur étagère que les développeurs peuvent utiliser, déployer, entraîner avec nos outils open source. Souvent, on fait l'analogie avec un app store de l'intelligence artificielle, c'est-à-dire que sur étagère, je vais pouvoir prendre le modèle d'IA qui m'intéresse selon mon business. Est-ce que vous pouvez nous donner quelques exemples ? Bien sûr. Imaginons que vous soyez une entreprise qui souhaite traiter des documents à grande échelle avec des modèles d'IA. Un problème que tout le monde a. On a tous trop de documents à lire et on n'y arrive pas. Par exemple, vous voulez les traduire, les résumer, en extraire les entités les plus importantes, les noms de sociétés, les noms de produits, etc. Vous allez trouver sur Hugging Face des modèles, probablement dans la langue qui vous conviendra ou dans les langues, puisque de nombreux modèles sont multilingues. Et vous allez en quelques lignes de code pouvoir télécharger ces modèles. Et quand je dis quelques lignes, ce n'est pas une tournure de style, c'est vraiment en deux lignes de code. Vous allez pouvoir les télécharger sur votre infrastructure, sur votre laptop, sur le cloud AWS et les mettre en œuvre pour prototyper très rapidement des applications. Vraiment, les deux choses qui nous tiennent à cœur, c'est l'open source, donc la capacité à utiliser des modèles à l'état de l'art, que vous soyez un développeur individuel ou un expert, et la rapidité, l'agilité. Le machine learning pendant trop longtemps, et encore malheureusement dans certains cas, est trop lent, c'est un tunnel dans lequel on s'engage sans avoir trop de certitudes, on met trop de temps à avoir du feedback. Grâce à notre approche, qui est vraiment une approche de software engineering et d'itération rapide, on arrive à avoir des résultats en quelques heures, en quelques jours, et on travaille avec beaucoup de clients qu'on amène en production en l'espace de deux ou trois semaines, pas deux ou trois mois, et encore moins trois ans. Est-ce que vous collaborez avec OpenAI, par exemple, avec Google, avec Microsoft, ou chacun a sa chasse gardée en matière d'IA ? Sur les 160 000 modèles que j'ai mentionnés, beaucoup viennent de la communauté, d'individus, etc. Donc open source. Mais nous avons aussi des centaines de modèles Microsoft, des centaines de modèles Google, des centaines de modèles Meta. Et donc ces sociétés contribuent énormément à avancer l'état de l'art, elles publient énormément d'articles de recherche qui généralement amènent à la publication du modèle dans les minutes parfois qui suivent la publication de l'article chez nous. Mais évidemment, en parallèle, ces entreprises ont des activités qu'elles préfèrent garder pour elles-mêmes pour des raisons de compétition. On peut le comprendre. Nous, ce qu'on souhaite, c'est que finalement les clients, les développeurs aient le choix de travailler avec des ouverts qui ont notre préférence, vous l'avez bien compris, mais il y a aussi des modèles fermés. On le regrette un peu parfois et on travaille nous-mêmes à la création d'alternatives à ces modèles fermés. Vous avez mentionné le modèle Bloom, on peut dire sans se tromper qu'il y en aura d'autres. Est-ce que vous pouvez nous expliquer ce qu'est Bloom ? Bien sûr, Bloom est un modèle issu d'un projet qui s'appelle Big Science, mené l'année dernière, auquel Hugging Face a participé en rassemblant plus de 1000 développeurs et chercheurs dans le monde entier. C'est un modèle qui a été entraîné sur 43 langues, des langues européennes, des langues asiatiques, des langues africaines, et 16 langages de programmation que les développeurs reconnaîtront comme des langues à proprement parler. La première étape était de constituer cet énorme jeu de données, puis d'entraîner le modèle. On l'a entraîné sur un cluster public qui s'appelle Jean Zay, un cluster français du CNRS, qui a donné naissance à ce modèle, donc Bloom, qui fait la même taille que le fameux GPT-3, et que nous espérons être une alternative ouverte à GPT-3. L'idée est que ces gros modèles, qu'on appelle modèles fondation, sont des modèles entraînés sur une grande quantité de données et, paradoxalement, ces modèles ne servent pas à grand-chose en l'état. On les met ensuite en action en disant, voilà, maintenant ce modèle, je veux le décliner pour de la traduction, pour des questions-réponses, ou du résumé, etc. Et peut-être même je vais le décliner en plus petite version. Bloom a 176 milliards de paramètres, c'est un énorme modèle. Pour beaucoup d'entreprises, c'est trop gros, ça sert à rien d'avoir un aussi gros modèle, c'est vraiment une grosse cylindrée pour pas grand-chose. Donc à partir de Bloom, on peut créer des plus petits modèles de 10, 5 milliards de paramètres qui, eux, seront plus agiles, moins coûteux à déployer, plus faciles à entraîner, etc. Donc ces gros modèles sont des démonstrateurs technologiques à partir desquels on peut ensuite industrialiser des solutions concrètes pour les entreprises. Un mot sur OpenAI et ChatGPT, qui a complètement changé la donne en matière d'IA, en tout cas apporté une perception totalement différente auprès du grand public. Est-ce que ça vous sert ou ça vous dessert, finalement, toute cette atmosphère un peu bouillante autour de ce sujet ? Je pense que tout ce qui contribue à permettre au grand public et aux entreprises de comprendre ce qu'est l'IA et ce qu'on peut faire avec, c'est positif. La vertu que je reconnais à ChatGPT, c'est d'avoir éduqué du jour au lendemain des millions et des millions de personnes sur l'état de l'art de l'IA aujourd'hui. Et donc instantanément, les décideurs, les développeurs se posent des questions sur ce qu'ils vont faire maintenant, comment ils peuvent rendre leurs entreprises plus agiles, plus efficaces. On peut faire l'analogie avec le cloud il y a quelques années. Il y a un big bang où on se rend compte que la technologie devient plus simple, plus rapide. Elle pose aussi un certain nombre de questions qu'il ne faut absolument pas éluder, qu'il faut regarder vraiment en face et qu'on va résoudre collectivement. Les questions évidemment, c'est l'éthique. Qu'est-ce que vous pensez de ce moratoire qui a été publié par plus de 1100 chercheurs, avec à leur tête Elon Musk ou bien Steve Wozniak, le cofondateur d'Apple, qui disent attention, on va très vite en matière d'IA, il faudrait peut-être faire une pause de six mois ? Notre position, enfin chacun est libre de penser ce qu'il veut, mais notre position globalement est de dire qu'il faut regarder les problèmes en face. Que ce moratoire ne résout rien, que les problèmes à résoudre ne seront certainement pas résolus en 6 mois. On peut avoir des questions légitimes sur l'IA, mais le dentifrice est sorti du tube, on ne le refera pas rentrer. Donc les problèmes doivent être mis sur la table de manière transparente, l'éthique est essentielle, l'analyse des risques est essentielle, la sécurité au sens large que ces modèles posent est essentielle, mais ils doivent être traités comme n'importe quel autre problème posé par une nouvelle technologie par la communauté scientifique, par les ingénieurs, analysés, réglés, et certainement pas mis sous le tapis et dissimulés. On trouve que cette lettre a tendance à entretenir les peurs autour de l'IA. Nous, on n'en a pas peur, on pense qu'il y a des problèmes à résoudre, donc mettons-les sur la table et résolvons-les, mais de manière transparente et collective. Grâce à vous et à d'autres, est-ce qu'on peut parler de souveraineté dans le domaine de l'IA face à des ChatGPT, face à Google, face à Microsoft ou à Meta ? On a une vraie spécificité, nous, françaises et européennes ? Il est vrai que les sociétés que vous citez sont toutes des sociétés américaines, et les sociétés chinoises sont aussi assez actives dans le domaine de l'IA. Une fois de plus, c'est facile de critiquer Google, Microsoft, Meta, mais il se trouve que ces sociétés-là font aussi avancer la recherche, ils publient aussi des modèles. Ils font du très bon travail. Ils ont des équipes brillantes, ils publient des modèles, ils font avancer la communauté. Donc, il n'y a pas les gentils et les méchants. Il y a des activités de recherche publiques, des activités de recherche privées, et puis des activités de recherche privées qui restent confinées à l'entreprise parce qu'après tout, elles les ont financées. Donc on pourrait regretter que l'Europe ne soit pas plus présente sur ces sujets. Il n'est jamais trop tard. Moi, ce que je dis toujours, c'est quand vous regardez les articles publiés par ces grandes boîtes, vous aurez toujours au moins un Français dans la liste des auteurs. Donc commençons peut-être par garder nos cerveaux, à garder nos chercheurs, à faire en sorte qu'ils aient envie de rester en France et en Europe et d'innover localement plutôt que de s'expatrier. Et je pense qu'on sera déjà sur la bonne voie. Le paradoxe est méta, qui a une cellule d'intelligence artificielle très puissante à Paris, notamment avec Yann LeCun, on va dire l'un des piliers de l'intelligence artificielle. Merci beaucoup, Julien. Je vous en prie, c'est un plaisir. Rappelons que vous êtes évangéliste technique chez Hugging Face, l'une des pépites de l'IA en France. Merci. Merci beaucoup. Et on revient tout de suite. On va maintenant partir du côté des étoiles et on va parler satellite avec mon prochain invité. Il s'agit de CLS.

Tags

Hugging FaceIntelligence ArtificielleOpen SourceModèles IASouveraineté Européenne