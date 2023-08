intelligence artificielle

Longtemps pionnière, aux côtés des Etats-Unis, de l'intelligence artificielle (IA), la Chine semble s'être fait distancer dans cette seconde instance qui est celle de l'IA Générative.

Nous souhaitons consacrer ce Fund Insight aux forces et faiblesses du modèle chinois d'IA Générative ; en distinguant l'exercice de communication des fondamentaux.

L'exercice de communication…

Les autorités chinoises affirmaient en juin dernier que leur contenu en IA générative serait supérieur à celui des Etats-Unis ; après avoir communiqué un mois plus tôt que le pays aurait actuellement au moins 79 LLM (Large Language Model de type Chat GPT) et que ce nombre allait croître.

Ces initiatives chinoises sont le fruit de trois types d'acteurs : 1) les Géants du Numérique (Baidu, le leader en la matière, Alibaba et Tencent qui ont chacun leur LLM) ; 2) les acteurs du Computer Vision, comme SenseTime et Yoncong qui ont lancé leur LLM ; 3) les start ups dont les fondateurs émergent soit des géants du numérique (Meituan, Sogou) ou des milieux universitaires.

Les assertions relatives à la domination chinoise en la matière nous semblent en contraction avec l'analyse qui va suivre (paragraphe suivant), visant à montrer que la Chine ne dispose, selon les cas, que peu ou prou des quatre blocs fondateurs nécessaires à l'entraînement (training ) des LLM.

Enfin, la Chine, comme le reste du monde, devra à terme réguler son IA Générative. La forme que cette régulation pourrait prendre en Chine pourrait, une fois encore, fragiliser son modèle de développement.

...et les fondamentaux

En matière d'IA Générative, il nous semble, en réalité que tous les blocs fondateurs de l'écosystème chinois sont fragilisés :

a) Les séries de données constituent la matière première des large language model (LLM) de type chat GPT et donc de l'IA Générative. Après des années de relative fermeture de la Chine sur le monde, c'est bien la qualité et l'exhaustivité de ces séries de données qui est aujourd'hui sujette à caution. Il en résulte que les LLM chinois pourraient avoir une tendance à l'hallucination (phénomène où le chatbot invente une réponse lorsqu'il ne la connait pas) supérieure à ceux de l'Occident.

b) Les logiciels d'accès à la donnée en cloud public, de type SnowFlake et Databricks, constituent les pierres angulaires d'une exploitation « industrielle » et optimisée de longues séries de données, nécessaires à l'entraînement des LLM. Ces éditeurs de logiciels, fournisseurs de solutions de dernière génération car nées dans le cloud public, sont américains et ne sont pas distribués en Chine. Cette dernière s'est dotée de solutions équivalentes (Oushu DB par exemple) mais il est clair que l'industrielle logicielle chinoise affiche plusieurs décennies de retard sur les Etats-Unis ; ce qui va freiner considérablement l'essor de l'IA Générative en Chine à notre sens.

c) Le secteur du cloud public chinois : En Chine, le cloud public est porté comme aux Etats-Unis, par des les géants du Numérique . Alibaba a sa filiale Alicloud, tandis que Tencent a sa filiale Tencent cloud. Ces géants du Numérique sortent à peine de plusieurs années de régulation dont les formes les plus sévères ont abouti à des débuts de démantèlement comme dans le cas d'Alibaba. A cette fragilité financière qui en résulte, s'ajoute la faible optimisation de leurs filiales cloud public qui souffrent d'un marché encore trop largement « on premise », c'est-à-dire une informatique dont les entreprises clientes détiennent encore leurs propres serveurs.

d) Les semiconducteurs leading edge ou puces de l'intelligence artificielle : Le succès boursier et fondamental de Nvidia a mis en exergue le fait que l'IA Générative sacralise l'ère de la computation accélérée, ici les cartes graphiques de Nvidia (aussi appelées GPU) qui forment, s'il en est un, le bloc fondateur de l'IA Générative. Nvidia et ses GPU, mais aussi toutes les entreprises de la même famille fournisseurs potentiels de puces de l'IA (Broadcom, Marvell, AMD et Intel) sont toutes des entreprises sous pavillon américain. La Chine ne dispose pas d'une industrie de semiconducteurs leading edge susceptible de satisfaire ses besoins en puces de l'IA. L'administration américaine ne lui permet d'ailleurs pas de s'en doter une puisqu'elle a édicté une interdiction aux fournisseurs d'équipements Américains et Européens (ASML ou Applied Materials par exemple) de fournir la Chine. Cette même administration interdit également à Nvidia de vendre à la Chine ses puces de computation accélérée, devenues dans le monde le standard nécessaire à l'entraînement des LLM (Large Language Model ).



