Cloud Public Openstack – Flexible Engine

Machine Learning Service (MLS)

Description

Le Machine Learning Service (MLS) est un service de plateforme d’analyse qui aide les utilisateurs à :

  • Identifier les modèles dans les données pour construire des modèles d’apprentissage automatique
  • Utilisez ces modèles pour traiter de nouvelles données et faire des prédictions sur les applications de service

MLS fournit une interface d’opération visualisée permettant à l’utilisateur d’orchestrer les processus de formation, d’évaluation et de prédiction des modèles d’apprentissage automatique. En outre, il intègre de manière transparente l’analyse des données à l’application de prédiction, simplifiant la gestion du cycle de vie des modèles d’apprentissage automatique. En outre, il intègre de manière transparente l’analyse des données à l’application de prédiction, simplifiant la gestion du cycle de vie des modèles d’apprentissage automatique. Il offre une plateforme conviviale et efficace de hautes performances pour vos services d’exploration et d’analyse de données.

Fonctionnalités

Figure 1.1: Processus pour utiliser MLS

Vous pouvez vous connecter à la console MLS pour créer et gérer des instances MLS. Sur l’interface de gestion d’instance MLS visualisée, créez et gérez des projets. Dans les projets, créez et modifiez des flux de travail pour l’analyse des données.

Instance MLS

Une instance MLS doit être créée pour utiliser l’interface d’apprentissage automatique. Vous pouvez créer plusieurs instances MLS en même temps, les gérer et y accéder.

Interface d’opération d’instance MLS 

Chaque instance MLS fournit une interface visualisée vous permettant d’effectuer des opérations MLS. MLS fournit également une API Restful pour que vous puissiez exécuter automatiquement le travail d’analyse prédictive.

Adresse de service

Une fois qu’une instance MLS est créée. L’utilisateur peut accéder à l’interface d’opération Machine Learning via l’adresse d’instance correspondante. L’adresse d’accès interne est accessible uniquement aux clients du même sous-réseau que l’instance MLS. L’adresse d’accès externe n’existe qu’après avoir lié l’instance MLS à une adresse IP élastique lors de la création de l’instance et est accessible à n’importe quel client sur Internet.

Nœud de traitement MLS 

Un nœud est une unité logique en cours d’exécution, représentant une sous-étape de traitement des données. MLS encapsule diverses étapes de traitement des données (chargement de données, pré-traitement des données et algorithmes d’apprentissage automatique) dans différents nœuds, masquant les détails de la programmation. Vous pouvez faire glisser les icônes des nœuds, connecter les nœuds et modifier les propriétés des nœuds pour importer, exporter, convertir et analyser les données de manière flexible.

Workflow

Un flux de travail est un ensemble de processus qui connecte plusieurs nœuds pour construire un modèle d’analyse prédictive. Vous pouvez combiner plusieurs nœuds en les faisant glisser et en les connectant sur l’interface d’opération d’instance MLS pour former une définition d’exécution logique (flux de travail) plus complexe qu’un seul nœud.

Bloc-notes interactif MLS

Bloc-notes interactif MLS intègre Jupyter Notebook pour fournir aux utilisateurs un ordinateur portable en tant qu’environnement de développement intégré d’applications d’apprentissage automatique. Les blocs-notes vous permettent de modifier des scripts Python et d’utiliser MLlib (algorithme natif Spark) pour l’analyse des données, la modélisation et l’application de modèles. Les ordinateurs portables fournissent également aux utilisateurs un grand nombre de packages Python tiers développés pour le calcul de données scientifiques.

Exécuter le modèle de configuration

Un modèle de configuration d’exécution est utilisé pour configurer les ressources informatiques. Vous pouvez créer des modèles de configuration d’exécution sur l’interface d’opération d’instance MLS et les affecter à des projets.

Projet

Un projet organise des ressources d’informations définies par l’utilisateur. Vous pouvez créer des projets sur l’interface d’opération d’instance MLS pour gérer vos flux de travail et exécuter des modèles de configuration.

Spécifications

MLS prend en charge les modèles de configuration d’exécution des tâches Spark. Vous pouvez créer des modèles de configuration d’exécution sur l’interface d’opération d’instance MLS à la demande afin qu’ils puissent être utilisés dans des projets de modélisation sur la plate-forme.

Table 1.1 : Spécifications par défaut des modèles de configuration d’exécution

Paramêtre

Valeur

Maximum nombre d’instances par tenant

5

Nombre de VM par instance

2

Nombre de CPU par instance VM

8U

Taille de mémoire par instance VM

16 GB

Taille d’espace de stockage EVS alloué par instance VM

100 GB

Taille maximum d’espace de stockage OBS requis par instance

100 GB

Nombre d’EIP pour lier par instance

1

Bande passante d’EIP liée à l’instance

5 Mbit/s

Taille de mémoire du pilote Spark

512 MB to 100 GB

Nombre d’exécuteurs Spark

1 to 10000

Nombre de coeurs CPU cores par exécuteur

1 to 100

Taille de mémoire par exécuteur

512 MB to 100 GB

Table 1.2 : Spécifications par défaut des modèles de configuration d’exécution des instances MLS

Paramêtre

Valeur

Description

Taille de mémoire du pilote (MB)

512

La mémoire du pilote est utilisée pour lancer les programmes Spark et créer des contexte Spark

Executeurs

1

Nombre d’exécuteurs

Coeurs CPU des exécuteurs

1

Nombre de coeurs CPU d’un exécuteur

Taille de mémoire des exécuteurs (MB)

512

Mémoire d’un exécuteur

Nom de la file d’attente

défaut

Nom de la file d’attente du cluster MRS actuel

Bénéfices

  • MLS offre aux utilisateurs un moyen simple d’utiliser l’apprentissage automatique et de créer des solutions flexibles d’analyse prédictive dans le cloud. De plus, MLS réduit considérablement la complexité et les coûts d’exploitation et de maintenance, ce qui permet de se concentrer sur les niveaux d’application et d’entreprise.
  • Service en ligne permanent, libération des ressources, réduction des investissements informatiques, accélération des affaires.
  • Fonctionnement et maintenance automatisés et interface simple et intuitive.
  • Analyse prédictive interactive : outils de programmation Notebook Interactive.
  • Compatibilité avec un grand nombre d’algorithmes de la communauté open source.
  • Facilité d’utilisation : interface glisser-déposer pour créer un modèle sans nécessiter de compétences en programmation.
  • Application de modèle: les clients peuvent utiliser le modèle entraîné pour faire des prédictions en masse de nouvelles données.
  • Visualisation : type de graphique riche intégré, WYSIWYG, pour améliorer l’efficacité de l’exploration des données.
  • Bibliothèque riche d’algorithmes: le service MLS optimise l’algorithme d’apprentissage automatique couramment utilisé, a de meilleures performances et un meilleur taux d’accélération linéaire, prend en charge le traitement de l’analyse distribuée de données massives, l’interface intégrée ouverte, l’utilisateur peut étendre l’algorithme personnalisé, l’algorithme seul visible.

Scénarios

Analyse de marché

Les centres commerciaux à partir des enregistrements de consommation des clients pour trouver un groupe de clients avec des caractéristiques communes (intérêts, niveaux de revenus et habitudes de consommation, etc.), analyser quel type de client achète quels produits, afin d’ajuster la stratégie de marché.

Recommandation ciblée

Banques analysant les informations financières personnelles des clients pour recommander des produits appropriés (prêts, produits financiers), à petit prix pour obtenir des gains importants.

Détection de fraude

La compagnie d’assurance analyse les données de comportement historiques d’une personne assurée, établit le modèle de comportement frauduleux et reconnaît la personne assurée qui assure à tort l’indemnisation de l’assurance.

Restrictions d’usage

  • Prise en charge d’un seul AZ.
  • MLS s’appuie sur MRS pour fournir des ressources de calcul et de stockage. Par conséquent, avant de créer une instance MLS, vous devez disposer d’un cluster MRS, sinon, veuillez demander un cluster MRS. MLS prend uniquement en charge le cluster MRS1.3.
  • Les instances MLS créées par l’utilisateur doivent se trouver dans le même sous-réseau VPC et le même groupe de sécurité que le cluster MRS.
  • Si l’instance MLS est créée, la modification de la spécification n’est pas prise en charge. Actuellement, les spécifications d’une instance MLS sont 8 cœurs de processeur, 16 Go de mémoire, 100 Go de stockage. Si vous devez utiliser un nœud de spécification plus élevée, veuillez recréer une instance MLS.
  • Restrictions de la fonction Notebook:
    • – Seul Python est pris en charge.
    • – La ligne de commande Magic n’est pas prise en charge.
    • – La fonction de téléchargement du fichier ipython n’est pas disponible.
    • – Seuls cinq fichiers notebook peuvent être ouverts au maximum.
    • – La visualisation graphique n’est pas prise en charge, c’est-à-dire que les packages Python de données et la visualisation de modèle ne peuvent pas être appelés.