Walton Electronics Co., Ltd.
Contactez nous

ContPerson : Walton-cara

Numéro de téléphone : 15986872308

Free call

L'apprentissage automatique nécessite plusieurs étapes

July 18, 2022

Introduction

Le déploiement du machine learning (ML) est un processus en plusieurs étapes.Cela implique de sélectionner un modèle, de le former pour une tâche spécifique, de le valider avec des données de test, puis de déployer et de surveiller le modèle en production.Ici, nous allons discuter de ces étapes et les décomposer pour vous présenter le ML.ML fait référence à des systèmes qui, sans instruction explicite, sont capables d'apprendre et de s'améliorer.Ces systèmes apprennent à partir des données pour effectuer une tâche ou une fonction particulière.Dans certains cas, l'apprentissage.ou une formation plus spécifique, se produit de manière supervisée lorsque des sorties incorrectes entraînent un ajustement du modèle pour le pousser vers la sortie correcte.Dans d'autres cas, l'apprentissage non supervisé se produit lorsque le système organise les données pour révéler des modèles jusque-là inconnus.La plupart des modèles ML suivent ces deux paradigmes (apprentissage supervisé ou non supervisé).Examinons maintenant ce que l'on entend par modèle, puis explorons comment les données deviennent le carburant de l'apprentissage automatique.Modèle d'apprentissage automatique Un modèle est une abstraction d'une solution d'apprentissage automatique.Le modèle définit l'architecture。 qui, une fois entraînée, devient une implémentation.Par conséquent, nous ne déployons pas de modèles.Nous déployons des implémentations de modèles entraînés à partir de données (plus d'informations à ce sujet dans la section suivante).Ainsi, les modèles, les données et la formation équivaut à des instances de solutions ML (Figure 1).une traduction s'impose.Par exemple, l'alimentation de données textuelles dans un réseau d'apprentissage en profondeur nécessite d'encoder des mots sous une forme numérique qui est généralement un vecteur de grande dimension compte tenu des différents mots qui pourraient être utilisés.De même, les sorties peuvent nécessiter une traduction d'une forme numérique vers une forme textuelle.Les modèles ML sont de plusieurs types, y compris les modèles de réseau neuronal, les modèles bayésiens, les modèles de régression, les modèles de clustering, etc.Le modèle que vous choisissez est basé sur le problème à résoudre.Dans le contexte des réseaux de neurones, les modèles vont des réseaux multicouches peu profonds aux réseaux de neurones profonds qui incluent de nombreuses couches

de neurones spécialisés (unités de traitement).Les réseaux de neurones profonds disposent également d'une gamme de modèles disponibles en fonction de votre application cible.

Par exemple:

● Si votre application se concentre sur l'identification d'objets dans des images, le réseau neuronal convolutif (CNN) est un modèle idéal.Les CNN ont été appliqués à la détection du cancer de la peau et surpassent le dermatologue moyen.

● Si votre application implique la prédiction ou la génération de séquences complexes (telles que des phrases en langage humain), les réseaux de neurones récurrents (RNN) ou les réseaux à mémoire longue et courte durée (LSTM) sont des modèles idéaux.Les LSTM ont également été appliqués à la traduction automatique de langues humaines.

● Si votre application implique la description du contenu d'une image en langage humain, une combinaison d'un CNN et d'un LSTM peut être utilisée (où l'image est introduite dans le CNN et la sortie du CNN représente l'entrée du LSTM, qui émet les séquences de mots).

● Si votre application implique la génération d'images réalistes (telles que des paysages ou des visages), un réseau antagoniste génératif (GAN) représente le modèle de pointe actuel.Ces modèles représentent certaines des architectures de réseaux de neurones profonds les plus populaires actuellement utilisées.Les réseaux de neurones profonds sont populaires car ils peuvent accepter des données non structurées telles que des images, des vidéos ou des informations audio.Les couches du réseau construisent une hiérarchie d'entités qui leur permettent de classer des informations très complexes.Les réseaux de neurones profonds ont démontré des performances de pointe sur un grand nombre de domaines problématiques.Mais comme d'autres modèles de ML, leur précision dépend des données.Explorons cet aspect ensuite.

Données et formation

Les données sont le carburant qui alimente l'apprentissage automatique, non seulement en fonctionnement, mais également dans la construction d'une solution ML grâce à la formation de modèles.Dans le contexte des données de formation pour les réseaux de neurones profonds, il est important d'explorer les données nécessaires dans le contexte de la quantité et de la qualité.Les réseaux de neurones profonds nécessitent de grandes quantités de données pour la formation.Une règle empirique pour la classification basée sur les images est de 1 000 images

par classe.Mais la réponse dépend de la complexité du modèle et de la tolérance à l'erreur.Certains exemples de solutions de ML de production fournissent un éventail de tailles d'ensembles de données.Un système de détection et de reconnaissance faciale a nécessité 450 000 images, et un chatbot de questions-réponses a été entraîné avec 200 000 questions associées à 2 millions de réponses.Des ensembles de données plus petits peuvent également suffire en fonction du problème à résoudre.Une solution d'analyse des sentiments qui détermine la polarité de l'opinion à partir d'un texte écrit ne nécessitait que des dizaines de milliers d'échantillons.La qualité des données est tout aussi importante que la quantité.Compte tenu des grands ensembles de données requis pour la formation, même de petites quantités de données de formation erronées peuvent conduire à une mauvaise solution.Selon le type de données nécessaires, vos données peuvent passer par un processus de nettoyage.Cela garantit que l'ensemble de données est cohérent, manque de données en double, est exact et complet (manque de données invalides ou incomplètes).Des outils existent pour soutenir ce processus.La validation des données pour le biais est également importante pour s'assurer que les données ne conduisent pas à une solution de ML biaisée.La formation ML fonctionne sur des données numériques, de sorte qu'une étape de prétraitement peut être nécessaire en fonction de votre solution.Par exemple, si vos données sont en langage humain, elles doivent d'abord être traduites sous une forme numérique à traiter.Les images peuvent être prétraitées pour plus de cohérence.Par exemple, les images introduites dans un réseau neuronal profond seraient redimensionnées et lissées pour supprimer le bruit (entre autres opérations).L'un des plus gros problèmes du ML est l'acquisition d'un ensemble de données pour former votre solution de ML.Cela pourrait être l'effort le plus important en fonction de votre problème car il pourrait ne pas exister et nécessiter un effort séparé

capturer.Enfin, l'ensemble de données doit être segmenté entre les données d'apprentissage et les données de test.La partie formation est utilisée pour former le modèle, et une fois formée, les données de test sont utilisées pour valider la précision de la solution

 

Prenez contact avec nous

Entrez votre message