Une révolution grâce à la computer vision
Ayush Kumar, scientifique principal associé en données chez IBM Corp., s’est entretenu avec theCUBE lors de Media Week NYC : theCUBE + NYSE Wired 2024. Il a discuté des raisons pour lesquelles des secteurs de l’intelligence artificielle, tels que la computer vision , sont des facteurs de changement majeurs dans l’industrie.
La promesse d'un avenir multimodal
Déverrouiller un avenir multimodal : Comment la vision par ordinateur révolutionne l’analyse des données et la prise de décision
par Brian Njuguna
Avec l’augmentation des données visuelles dans la télémétrie entrante, la computer vision a le potentiel de transformer l’analyse des données. Cette technologie innovante automatise l’extraction d’informations à partir de vidéos et d’images, ce qui permet aux entreprises de tirer des insights en temps réel.
Une technologie au service de la prise de décision
Selon Ayush Kumar, la computer vision est une technologie transformative qui améliorera la prise de décision, automatisera l’extraction de données et optimisera les processus au sein des entreprises. Il souligne l’importance d’offrir une analyse des données visuelles en temps réel pour augmenter l’efficacité opérationnelle.
« Je pense que nous progressons vers un avenir beaucoup plus multimodal que celui dans lequel nous nous trouvons aujourd’hui, » a déclaré Kumar. « Nous verrons plus d’informations émerger sous forme de computer vision et d’OCR que nous faisons sur nos propres données d’entreprise. Du côté de l’intelligence commerciale, je pense qu’il y a un changement important sur la façon dont les informations sont consommées. Traditionnellement, nous avons davantage de rapports visuels, mais en même temps, nous aurons plus d’agents, des informations plus ciblées et des analyses approfondies. »
Les défis de l'entraînement des modèles
Lors de cet entretien, Kumar a également abordé les défis liés à l’entraînement des modèles de traitement des données. Il a mentionné que les coûts d’entraînement des modèles LLM (Large Language Models) deviennent de plus en plus élevés. Cependant, il reste optimiste quant à l’avenir :
« À l’avenir, je pense que le coût de l’entraînement va diminuer. Nous avons vu des techniques efficaces comme l’élagage et la quantification qui réduisent la taille de ces modèles, ce qui nous permet de les entraîner plus facilement. »
L'importance de la curation des données
Kumar a mis en avant l’importance de la curation des données pour alimenter les modèles d’IA. Il a expliqué qu’IBM travaille sur des solutions multi-cloud et multi-modèles pour faciliter cette curation, mais qu’il reste encore des défis à relever, notamment en ce qui concerne les données non structurées.
« Il y a beaucoup de changements en matière d’IA générative, » a-t-il déclaré. « Nous avons compris comment fonctionnent les lacs de données et les entrepôts de données, mais nous essayons toujours de déterminer comment traiter les données non structurées. »
Conclusion : Une technologie en pleine évolution
Cette discussion met en lumière la façon dont la computer vision et l’IA générative transforment le paysage des données et de l’analyse. En facilitant l’automatisation et l’extraction d’informations, ces technologies ouvrent la voie à une prise de décision plus rapide et plus éclairée au sein des entreprises.
Voici la vidéo complète de l’entretien, faisant partie de la couverture de SiliconANGLE et de theCUBE Research de l’événement Media Week NYC : theCUBE + NYSE Wired 2024.