Formation ultime des Services d'intégration de serveurs SQL (SSIS)

Saad Qureshi, Online Instructor

Bénéficiez d'un accès illimité à tous les cours

Suivez des cours enseignés par des leaders de l'industrie et des professionnels

Explorez divers sujets comme l'illustration, le graphisme, la photographie et bien d'autres

Bénéficiez d'un accès illimité à tous les cours

Suivez des cours enseignés par des leaders de l'industrie et des professionnels

Explorez divers sujets comme l'illustration, le graphisme, la photographie et bien d'autres

Leçons de ce cours

- 1.
  
  Introduction au SSIS
  
  3:42
- 2.
  
  Composants du SIS, avantages et inconvénients
  
  3:43
- 3.
  
  Comparaison d'outils SSIS
  
  4:55
- 4.
  
  Installation du SSIS
  
  8:24
- 5.
  
  Première transformation du SSIS
  
  10:23
- 6.
  
  Explication de transformation multicast
  
  16:45
- 7.
  
  Union All & Merge Rejoignez la transformation dans le SSIS
  
  11:25
- 8.
  
  Transformation ConditionalSplit
  
  8:27
- 9.
  
  Transformation de recherche
  
  14:13
- 10.
  
  Transformation de cache
  
  13:36
- 11.
  
  Groupage flous
  
  13:58
- 12.
  
  Transformation d'extraits
  
  8:03
- 13.
  
  Transformation de TermLookup
  
  5:39
- 14.
  
  Transformation globale
  
  14:28
- 15.
  
  Transformation du nombre de lignées
  
  22:28
- 16.
  
  Transformation de pivot dans le SSIS
  
  17:27
- 17.
  
  Tranformation UnPivot dans le SSIS
  
  7:56
- 18.
  
  Implémentation de dimension changeante lentement (SCD-Type01, SCD-Type02)
  
  18:00
- 19.
  
  Exemple de transformation de colonnes d'importation et d'exportation
  
  10:24
- 20.
  
  Transformation de la colonne de copie, de la colonne et de la cartographie de caractères
  
  12:14
- 21.
  
  Tranformation d'échantillonnage et d'échantillonnage en ligne
  
  14:44
- 22.
  
  BulkInsertFinal
  
  10:02
- 23.
  
  Conteneur ForLoop
  
  7:51
- 24.
  
  Conteneur en boucle pour l'apprentissage
  
  12:22

Niveau débutant

Niveau intermédiaire

Niveau avancé

Tous niveaux

113

apprenants

projets

À propos de ce cours

Le Service d'intégration de serveur SQL (SSIS) est un outil d'intégration de données qui extrait des données à partir de plusieurs sources hétérogènes et qui peut les charger vers de multiples destinations différentes.

Voici des composants du SSIS :

Flux de contrôle
Flux de données
Gestionnaire d'événements
Explorateur de paquets
Paramètres

Tâches du SSIS :

Tâche de système de fichiers
Tâches FTP
Tâche de script
Envoyer une tâche de courrier
Tâche d'insertion en vrac
Tâche de script
Tâche de service Web
Tâche XML

Étapes de transformation :

Agrégation
Split conditionnel
Conversion de données
Colonne dérivée
Transformation de recherche
Fusionner son adhésion
Union et Union Tout
Trier
Lookup flous
Groupage flous
Échantillonnage en pourcentage
et bien plus

Rencontrez votre enseignant·e

Saad Qureshi

Online Instructor

Enseignant·e

Background:

Computer Scientist with overall 5 years of industry and several years of freelancing experience. Other than this,I am passionate about teaching and guiding students learning programming languages.

Life Philosophy

Do not dwell in the past,do not dream of the future,concentrate the mind on the present moment.

Service to others is the rent you pay for your room here on earth..

Voir le profil complet

Compétences associées

Développement Plus en développement Science des données

Level: Beginner

Projet de cours pratique

Dans le projet de classe, vous devez extraire des données de trois sources différentes comme un fichier si un fichier Excel et d'autres doivent être CSV et table de bases de données.Une fois les données sont extraites, l'étape suivante pour effectuer la transformation Project,You're les données sur la base de dept_name.

Rappelez-vous une chose, celle avec NULL devrait être remplacée par N/A.All les données doivent être en format correct.La colonne du genre doit être en format approprié comme toutes les valeurs doivent être soit "mâle" ou "Femelle"

Notes attribuées au cours

Pourquoi s'inscrire à Skillshare ?

Suivez des cours Skillshare Original primés

Chaque cours comprend de courtes leçons et des travaux pratiques

Votre abonnement soutient les enseignants Skillshare

Apprenez, où que vous soyez

Suivez des cours où que vous soyez avec l'application Skillshare. Suivez-les en streaming ou téléchargez-les pour les regarder dans l'avion, dans le métro ou tout autre endroit où vous aimez apprendre.

Transcription

1. Introduction au SSIS: Bienvenue dans mon cours sur SQL Server Integration Services. Je m'appelle Zach bon Ishi, je serai votre instructeur tout au long de ce cours. Qu' est-ce que SSIS ? SSIS est un outil ETL qui est utilisé pour extraire des données de plusieurs sources hétérogènes. Il a la capacité de transformer les données. En outre, il peut charger des données vers plusieurs destinations différentes. Alors qu'est-ce qu'on apprend dans le cours ? Nous allons donc aborder différents sujets. C' est donc l'interface graphique de l'outil SSIS. Nous commencerons par cette section Dataflow. Si vous regardez cette section de flux de données, sur votre gauche, vous verrez plusieurs transformations différentes. Nous allons couvrir toutes les transformations importantes comme agrégat, Fusionner, Joindre, Multicast, les conditionnalités de conversion de données de colonne dérivées fractionnement couvriront toutes ces différentes transformations. Ensuite, si je vais descendre, je verrai les étapes de destination de l'approvisionnement. Ainsi, l'étape est utilisée pour extraire des données à partir des étapes source et de destination sont utilisées pour charger des données vers différentes destinations. Donc nous allons couvrir cette section de flux de données, puis nous allons couvrir la section de flux de contrôle. La section de flux de contrôle. Si vous regardez ici, vous allez voir différentes tâches. Ce sont là des tâches importantes que nous allons accomplir. Nous avons une variété de tâches différentes comme FTP, tâche, script, tâche, tâches XML envoyer du courrier à nous, qui est utilisé pour envoyer du courrier. Ensuite, nous avons la tâche d'exécution SQL, que nous allons utiliser pour écrire des requêtes SQL. Il s'agira donc d'un cours complet sur les SSIS qui couvrira tous les sujets importants. Quels sont donc les prérequis ou expertise unique requise pour suivre ce cours ? Donc, vous devriez avoir une connaissance très basique de SQL. Vous n'avez pas besoin d'être un expert en écureuil. Connaissance très basique de n'importe quel outil parce que si vous connaissez un ETL à apprendre n'importe quel autre outil ETL n'est pas très difficile. Aucune connaissance du langage de programmation n'est requise. Les outils que nous allons utiliser Visual Studio 2019 dans SQL Server Data Tools. Ce sont les deux outils que nous allons utiliser dans notre cours. Maintenant. Qui sont mes élèves cibles ? Les développeurs Etl, ceux qui travaillent comme une journée de développeurs ETL peuvent suivre ce cours. Ceux qui recherchent une carrière dans le domaine de l'entreposage de données ou BID peuvent également suivre ce cours. Professionnels qui veulent apprendre un nouvel outil ETL pour améliorer leur carrière, Regardons les défis éducatifs auxquels on peut faire face. Donc, si vous apprenez l'outil SSIS, vous devriez avoir un bon système en place. Windows 7 64 bits ou nouveau vierge doit être installé. Au moins, vous devriez avoir 12 Go d'espace disque libre. Quatre Go de RAM devraient être disponibles. Maintenant, regardons les opportunités de carrière. Donc ce cours va construire vos fondations. Une fois que vous avez terminé le cours, vous pouvez postuler à différents domaines tels que l'entreposage de données, consultant au détail, l'intelligence décisionnelle. Donc ce cours va vous ouvrir plusieurs avenues. Donc, merci beaucoup et avoir un excellent apprentissage. 2. Composants SSIS: Bonjour tout le monde. Dans cette conférence particulière, nous allons couvrir l'introduction de SSIS, composants SSIS, puis nous allons couvrir les avantages et les inconvénients de SSIS. Donc, d'abord, nous allons commencer par l'introduction de SSIS. Qu' est-ce que SSIS ? SSIS signifie SQL Server Integration Services. C' est une plate-forme d'intégration sale. Il a les capacités d'ETL. Etl signifie extraire, transformer et charger. Donc, en utilisant cet outil SSIS, nous pouvons extraire des données de plusieurs sources différentes. Et puis outil SSIS a intégré des transformations telles que l'agrégation, l'exportation et l'importation colonne, SCD, recherche de conversion de données, jointure, etc Donc, en utilisant ces différentes conformations, nous pouvons transformer ensemble de données complexe. Une fois que l'ensemble de données est transformé, nous pouvons charger des données vers plusieurs destinations différentes. Donc outil SSIS a également effectué certaines opérations supplémentaires telles que l'envoi d'e-mails, les opérations FTP. Il a une tâche de service Web, tâche d'insertion en bloc. Donc, nous pouvons faire une variété d'opérations différentes en utilisant l'outil SSIS. Donc composants SSIS, donc il y a cinq composants différents de SSIS. Le premier est le flux de contrôle. Il contient des conteneurs dans les tâches. Le second est le flux de données. Il contient les étapes de destination de l'approvisionnement. En outre, il contient des étapes de transformation. Donc, en utilisant cette section de flux de données, nous pouvons extraire des données de différentes sources. Ensuite, nous pouvons charger des données vers différentes destinations. En outre, nous pouvons utiliser différentes conformations. Composant de gestionnaire d'événements. En utilisant ce composant de gestionnaire d'événements, nous pouvons même messages et e-mails. Composant Explorateur de paquets Il offrait une vue unique pour tous les forfaits. Le dernier est le paramètre. Nous pouvons utiliser des paramètres à l'intérieur d'un paquet, en dehors du paquet. Donc c'est ce que nous avons. Les composants Srs sont concernés. Maintenant, regardons d'abord les avantages et les inconvénients de l'outil SSIS. Avantages. En utilisant l'outil SSIS, nous pouvons extraire des données de sources hétérogènes. Par hétérogène signifie différentes sources. En utilisant l'outil SSIS, nous pouvons faire une variété de différentes transformations. C' est simple, très facile à utiliser. En outre, nous pouvons charger parallèlement des données vers plusieurs destinations différentes. Et regardons les inconvénients. Lorsque plusieurs paquets sont exécutés. Il consomme de la mémoire et des ressources système. Vous devez donc prendre ces choses en considération lors de l'exécution de plusieurs paquets. Le deuxième inconvénient, l'intégration avec d'autres produits. Il est donc très difficile d'intégrer SSIS avec des produits comme Salesforce, workday, etc. Alors maintenant regardons les concurrents des outils SSIS ou Talend, Informatica, IBM Data étape imprimer ce sont les concurrents. Donc, si vous apprenez un outil ETL, par exemple, si votre outil SSIS, apprendre un outil ETL n'est pas très difficile. Donc ce cours va construire vos fondations. Donc, merci beaucoup et avoir un excellent apprentissage. 3. Comparaison d'outils SSIS: Bonjour tout le monde. Dans cette conférence particulière, nous allons établir une comparaison entre l'outil SSIS et le centre de puissance Informatica. Informatica power center est un outil ETL populaire disponible sur le marché. Nous allons donc examiner comment l'outil SSIS est meilleur ou quels domaines il est préférable par rapport au centre d'alimentation Informatica. Maintenant, tout d'abord, permettez-moi de vous montrer quelques outils d'intégration de données populaires qui sont disponibles sur le marché. On a du talent. Talent est dans l'outil d'intégration de données open source, outil très populaire. Ensuite, nous avons Informatica. Informatica coûte cher. Il est utilisé par les grandes organisations. Ensuite, nous avons IBM Data stage, qui est hébergé sur un serveur cloud. Ensuite, nous avons Pentaho outil d'intégration de données. Tout comme dire quand tau est un outil d'intégration de données open source. Maintenant, regardons la comparaison entre SSIS et le centre d'alimentation Informatica. Pourquoi je dessine une comparaison entre SSIS et Informatica, parce qu'Informatica est très populaire outil détaillé, il est forte demande. C' est donc la raison pour laquelle je fais une comparaison avec cet outil particulier. Donc outil SSIS, c'est un outil ETL gratuit. Alors qu'en ce qui concerne le centre d'alimentation Informatica, il est coûteux. Il a des frais de licence que vous devez être avec impatience. Donc, vous devez prendre distinct dans la concentration. Qu' est-ce que je veux dire par outil ETL gratuit ? Donc par libre je veux dire dette. Vous pouvez facilement télécharger cet outil SSIS à partir du site Web de Microsoft et vous pouvez l'installer sur votre système. Ensuite, la seconde est limitée connecteurs sont disponibles pour se connecter avec des applications tierces. Nous avons donc besoin de connecteurs pour se connecter à différentes applications. Donc, quand nous, quand il s'agit de l'outil SSIS, il a des connecteurs limités par rapport au centre d'alimentation Informatica, informatique jusqu'à notre centre en direct nombre de connecteurs que nous avons dans Informatica pour se connecter avec une application tierce. Que sont les applications tierces ? Applications tierces, je veux dire, queues pour flocon de neige Cloud entrepôt de données supposé Google Cloud désert applications tierces, que SQL Server Integration Services ne convient pas pour les organisations mondiales à grande échelle ? Oui. Alors qu'en ce qui concerne le centre d'alimentation Informatica, c'est pour les grandes entreprises du point de vue de la performance. C'est bon. Revenez avec des intégrations plus grandes. Les performances sont affectées. Quand il s'agit de centre d'alimentation Informatica. Il est robuste et rapide et les performances ne sont pas affectées par des intégrations plus importantes. En ce qui concerne la reproductibilité, vous pouvez utiliser un fournisseur tiers qui coûte cher. Donc, quand il s'agit fonctionnalité réutilisable du centre d'alimentation Informatica est grande dans les pouvoirs Informatica et deux, qu'est-ce que je veux dire par réutilisation ? Par conséquent, la réutilisabilité signifie qu'une fois le processus créé, nous pouvons utiliser le traitement particulier de la dette et d'autres processus. C' est la réutilisabilité. Alors que lorsqu'il s'agit de puissances Informatica centrées, cette fonctionnalité est excellente dans Informatica week-end. Réutilisez un composant dans un autre composant. Alors que quand il s'agit de SSIS, vous pouvez utiliser t outil tiers pour la réutilisation. D' accord ? Évolutivité. En ce qui concerne l'évolutivité, la fonctionnalité d'évolutivité est chère, mais excellente. Évolutivité moyenne. Qu' est-ce que je veux dire par évolutivité ? Par exemple, si vous avez un volume énorme de données, alors dans Informatica Power Center, ce qu'il fait, il distribue vos données dans plusieurs serveurs. C' est donc l'évolutivité. Plus il y a de données, plus c'est l'évolutivité. Alors que quand il s'agit de SSI est que les tests ont été empilés patron pour l'évolutivité. Nous avons donc la fonctionnalité d'évolutivité à la fois dans SSIS et dans Informatica. Ssis a un énorme écosystème, alors qu'en ce qui concerne le centre de puissance Informatica, il n'est pas aussi énorme que les sociétés. C' était donc la comparaison entre SSIS et Informatica Power Center. J' espère que vous avez compris le concept. Merci beaucoup et avoir un excellent apprentissage. 4. Installation SSIS: Bonjour tout le monde. Dans cette conférence particulière, nous allons installer SSIS sur votre système informatique. Pour installer SSIS, vous devez d'abord télécharger et installer Visual Studio 2019. Communauté Williams. Donc, dans la barre de recherche Google droite, télécharger, nous avons l'habitude de faire 2019. Ensuite, vous devez cliquer sur ce lien. Nous utilisons pour faire votre point Microsoft.com slash téléchargements. Cliquez donc sur ce lien. Maintenant, alors je vais cliquer sur ce téléchargement gratuit. Communauté William téléchargement gratuit. Cliquez sur ce bouton, vérifiez ce programme d'installation. Ok, maintenant je vais ouvrir cet installateur. Cliquez sur cette installation. Les rendements vous ont dit installer cliquez sur Oui. Alors continuez. Donc, cela va prendre un certain temps à terminer. Donc, au cours de l'avoir un D jeunesse, nous avions l'habitude de faire du propulseur 17, William. C' est le dernier, étaient plus jeunes. Je vous montre comment installer. D'accord. Non. C' est la section en tissu de laine. Maintenant, à partir de là, je vais sélectionner cette option particulière. Après cela, je vais sélectionner ceci, ces deux outils ont installé notre emplacement. Donc, je veux installer dans mon répertoire puisque je n'ai pas assez d'espace dans mon répertoire C, laissez-moi juste changer le répertoire en E. Les rendements pour traiter soit la communauté 19 où vous pouvez manger la directive bien. Donc espace total requis, 12,45. Distill installation dans mon répertoire E. Ok, très bien. Installé, écrire une commande. J' ai donc deux options. Del Norte ont tous été installés. Je veux installer en téléchargeant, je vais choisir cette option particulière, cliquez sur Installer. Le processus a donc été lancé. Cela va télécharger les véhicules dans leur communauté 2019 où vous êtes dans l'air en même temps. Cela va l'installer dans mon système. Est-ce que vous prenez un peu de temps à 0,39 GBs décide. Donc ça va prendre un certain temps. Le processus d'installation a donc été terminé. Ensuite, je vais cliquer sur le bouton Lancer. Donc, les rendements Studio 2019 commence. Ensuite, je vais cliquer sur Continuer sans cordon. Après cela, j'irai dans la section extension et je vais cliquer sur Gérer les extensions. Ensuite, ici sur la section en ligne, je vais cliquer sur la section en ligne. Nous utilisons Studio Marketplace. Ne faites pas défiler vers le bas et sélectionnez et téléchargez ce projet SQL Server Integration Services. Vous devez télécharger et installer ceci dans votre système aux États-Unis pour traiter. Cela prend vraiment six minutes pour terminer. Alors laissez-moi vérifier si j'ai ceci dans mon système ou non. Je vais aller dans les téléchargements. Dans mon annuaire. Téléchargements, j'ai ceci dans mon système. Laisse-moi juste l'annuler. Donc, si vous ne l'avez pas, vous devez le télécharger. Maintenant, annulez-le. Ensuite, je vais cliquer sur ce Microsoft Data Tools Integration Services. Cliquez sur OK. Pendant ce temps, OK, cliquez sur OK. Cliquez ensuite sur Suivant. Installer. OK, veuillez fermer les processus suivants avant de poursuivre l'installation. Choisis-moi d'abord. Fermez toutes les fenêtres. Microsoft, il doit faire la moitié pour fermer toutes ces fenêtres. Non, fermez-le. Fermez toutes les fenêtres. Maintenant. Maintenant, je vais installer Microsoft Data Tools Integration Services. Cliquez sur Suivant. Installer. Fermez les processus suivants, d'accord ? Oui. Le processus d'installation est terminé. Cliquez sur clause après deck dans cette barre de recherche ou recherchez Visual Studio 2019. Donc, j'ouvre le Visual Studio 2019. Non. Créez un nouveau projet. Dans cette recherche de modèles. Dans cette section, je vais rechercher les services d'intégration. Intégration, intégration de la recherche. Dans cette sélective, il a été sélectionné maintenant, cliquez sur Suivant. Le nom du projet sera le premier projet, produit DW Edge. Laissez-moi juste changer un produit où je vais créer un projet ici dans mon répertoire d delta T e source. Sélectionnez un dossier. Ok, crée. Donc, cela va créer votre premier projet dans SSIS, la création de produit Microsoft, nous utilisons pour traiter. Ecoutez, le premier projet a été créé et puis vous protégez, vous avez ce paquet. À partir de là, vous pouvez créer plusieurs paquets. C' est ainsi que vous créez un nouveau package SSIS. Le package 1 a été créé. Kaye, j'espère que tu as compris le processus d'installation. Merci beaucoup et avoir un excellent apprentissage. 5. Première transformation du SSIS: Bonjour tout le monde. Dans cette conférence particulière, nous allons créer notre premier projet en SSI. Oui. Donc, ce que nous allons faire, nous allons charger ce produit de soulignement source de jeu de données. Laisse-moi ouvrir ce fichier. Donc, je vais lire ce jeu de données dans, puis nous allons appliquer quelques transformations sur cet ensemble de données. J' ai donc l'ID du produit, le nom du produit. Donc, l'ID du produit, le nom du produit doit être converti en majuscules. Donc, dans mon champ pays, j'ai des valeurs différentes comme la valeur du pays. Donc, États-Unis, USA, j'ai averti pays d'être représenté sous la forme d'abréviation pour États-Unis. Il devrait être USC, pour le Royaume-Uni, qui devrait être le Royaume-Uni, et pour l'Australie devrait être l'EUS. Donc, nous avons ces 60 pieds dans le champ de la ville. Nous avons des valeurs vides. Je veux remplacer les valeurs vides par n slushy. Ok, alors créons notre premier projet dans SSAS. Donc, je vais aller dans File et puis je vais créer un nouveau projet. Je vais cliquer dessus, puis je vais nommer ce projet. Donc le nom du projet sera classé deux, dB chargement. L' emplacement est décédé, l'emplacement où ce projet va être enregistré. OK, cliquez sur OK. Un nouveau projet a été créé. Donc, afin de lire les données de ce fichier, à partir de ce fichier CSV je vais utiliser. Je vais donc sélectionner l'option de flux de données. Ensuite, je vais sélectionner l'option de source de fichier plat D. Donc, où je vais obtenir l'option source de fichier plat. Laissez-moi donc chercher l'option source du fichier plat. Donc regardez l'option de source de fichier plat. Alors laissez-moi juste faire ce gestionnaire de connexion, je dois créer un nouveau gestionnaire de connexion savait. Ok, très bien, membre fin. Je dois fournir une partie où ce fichier est situé. Donc ce fichier est situé ici. Donc je vais fournir la partie ici. Parcourir, sélectionnez tout. Je vais sélectionner ce fichier. Ok, ce fichier est un fichier délimité par des virgules. colonnes D sont les colonnes de ce fichier particulier, ID produit, nom du produit, ville, profit des ventes, ok, un Guan. Et puis précédemment si, si vous devez prévisualiser le diamètre, vous allez sélectionner cette option Aperçu. OK, cliquez sur OK. Il s'agit désormais des colonnes, ID du produit, du nom, du pays, la ville, des champs et du profit. Cliquez sur. Ok, donc cette étape est faite industrie, mais la prochaine fois, nous allons utiliser l'étape d et adresse. Donc, dans cette étape, je vais utiliser cette option. Option de colonne dérivée. Donc, en utilisant cette option, je vais transformer mon jeu de données. Donc, je dois d'abord, je dois d'abord connecter cette option avec cette option. Laisse-moi rejoindre cette option. Ok, maintenant ça a été connecté. Double-cliquez sur désorption, ok, colonnes, ce sont les colonnes. Alors maintenant ce que je veux, je veux utiliser la déclaration de TK. Donc, la raison pour laquelle je vais utiliser la déclaration de cas parce que ici, dans ce domaine particulier, je veux remplacer les États-Unis étaient les États-Unis, Royaume-Uni avec le Royaume-Uni et l'Australie avec l'EUS. Donc, je veux représenter le champ Pays sous la forme d'abréviation. Donc je vais utiliser cette déclaration de cas, le pays est égal aux États-Unis. interrogation est den, alors la valeur devrait être usa. Si le pays est égal au Royaume-Uni, alors la valeur doit être juke. Si la valeur du pays est Australie , la valeur doit être EUS. Sinon, la vallée devrait être l'Australie. Ok, donc je vais juste copier, coller ça. Je vais coller copie, et je vais coller ceci dans l'expression. Ok, colonnes dérivées ou je vais remplacer le champ Pays. Ok, maintenant, je vais m'en servir. Donc ce que je veux, j'ai ce Citi Field, Citi Field. Donc, où il y a une valeur vide, je veux remplacer une valeur vide par n charnue. Donc, pour la dette, je dois utiliser cette expression. Si la valeur de la ville est égale, égale à deux, vide, alors la valeur doit être remplacée par n forme barre oblique. Sinon, ça devrait vraiment être City. Donc je vais copier ceci ici dans l'expression. Laisse-moi juste copier ça ici. colonne dérivée devrait être ville, d'accord, donc je vais utiliser une autre expression cette fois. Je vais utiliser la fonction de chaîne. Donc, quelle fonction de chaîne je vais utiliser, je vais utiliser la fonction de chaîne en majuscules. Donc, je veux présenter le nom du produit sous la forme de majuscules. Donc, cela doit être une majuscule. Ok, colonne dérivée doit être le nom du produit, remplacer le nom du produit par la valeur du nom du produit en majuscules. Donc, c'est mon expression de colonne dérivée. Ensuite, je vais utiliser d step pour la base de données. Donc, quelle étape de base de données je vais utiliser, je vais utiliser d étape de connexion à la base de données. Laisse-moi juste chercher l'étape ici. Je vais donc utiliser l'étape de destination OLED. Alors laissez-moi juste connecter l'étape de colonne dérivée avec cela. Laisse-moi ouvrir cette étape. Donc, laissez-moi juste fermer ce fichier CSC point de soulignement source produit. Je dois d'abord fermer ce dossier. Ok, ne sauve pas. Connexions DB, je dois créer une nouvelle connexion DB. Nouveau. Cliquez sur nouveau, OK, nom du serveur, recherchez le nom du serveur ici. Donc, le nom du serveur est, il prend un certain temps pour afficher le nom du serveur. Services. Je dois rechercher ici le nom du serveur de services comme ceci. Sql Server 2020 est le nom du serveur, ok, ceci si le nom du serveur. Donc, si je dois rechercher ici, SQL Server 20-20, le serveur SQL Server 2020 est opérationnel. Ok, maintenant l'étape suivante est de sélectionner ou d'entrer un nom de base de données. Le nom de la base de données est dice. J' ai donc déjà créé cette base de données dans MySQL Server. Cliquez sur OK. Ok, table ou voir la table ou la vue bien. Nom de la table devrait être que je dois créer une nouvelle table. Donc, ce sera le nom de la destination DB de table. Laissez-moi simplement copier coller le nom de la table ici. Donc ça va créer automatiquement cette table, d'accord ? En ce moment, cette table n'est pas créée, donc la dysfonctionnalité va créer automatiquement une table dans ma base de données. C' est le nom de la table et le nom de la base de données est dé afin de créer une base de données, ok ? Les données sont déjà un objet appelé ceci. Ok, très bien. Donc, je dois écrire 01, cliquez sur OK. OK. Je dois écrire le bureau 0-1. Maintenant, cette base de données, ce nom de table n'est pas présent, donc cela va créer cette table. Ok, très bien. Cliquez sur OK. Ce mappage de nom de table. Donc, cela dit simplement que l'identifiant du produit de mappage est mappé avec l'ID du produit, le nom du produit, le pays Ce sont donc les champs de cette table de destination. Celle-ci est D. Celle-ci. Ce sont les champs hors de ce produit de soulignement de source de fichier particulier. Cliquez donc sur OK. Cette étape est faite industrie. Maintenant, vous devez enregistrer ce paquet. Pour enregistrer, Vous devez appuyer sur Contrôle S. Donc, ce paquet a été enregistré. Maintenant, si vous devez exécuter ce paquet, vous devez soit cliquer, vous devez cliquer avec le bouton droit de la souris ou n, puis cette tâche d'exécution, ou vous pouvez directement exécuter ce paquet à partir d'ici, commencer. Donc, le paquet a été exécuté. Maintenant, regardez, le paquet a été exécuté avec succès. Pour le confirmer, je dois exécuter cette requête. Regardez, le nom du produit est en majuscules, pays. Champs. Regardez, un pays a été représenté sous la forme d'abréviation, ville où il y a une valeur vide, il a été remplacé par N slushy. D' accord ? C' est ainsi que vous insérez des données dans une base de données. Et c'est ainsi que vous lisez les données d'un système informatique local. Donc, avec l'aide de, avec l'aide de cette colonne dérivée, poisson, j'ai appliqué une transformation différente sur mon jeu de données. Alors j'espère que vous avez compris le concept. Merci beaucoup et avoir un excellent apprentissage. Donc à partir de là, je vais passer en mode édition. 6. Explication de la transformation Multicast: Bonjour tout le monde. Dans cette conférence particulière, nous allons apprendre la transformation de multidiffusion en SSI. Oui. Donc, tout d'abord, je vais créer un nouveau paquet. Pour créer un nouveau package, vous devez cliquer sur ce package SSAS, puis cliquer avec le bouton droit de la souris puis sur le nouveau paquet. Donc, ce sont deux paquets qui sont déjà là dans mon projet. C' est le nom du projet. Maintenant, je vais créer un nouveau paquet, un nouveau paquet SSAS. Donc, je vais appeler ceci, laissez-moi juste renommer ce paquet. Donc, je vais nommer ce paquet comme trait de soulignement fixe. Chargement des soulignements. Nommé ce paquet. Ok, donc c'est le nom du paquet. Les offres sont deux forfaits. Tetr est déjà sorti avec mon projet maintenant. Donc celui-ci est de contrôler la section de flux, section malhonnêteté Dataflow. Donc, quand je vais cliquer sur la section Contrôle de flux, je vais obtenir différentes tâches. Ce sont donc les tâches que je peux effectuer. Celui-ci est la section Dataflow. Donc, à ma gauche, donc quand je vais cliquer sur la section Dataflow sur ma gauche, je vais obtenir des sources dans la destination. Ce sont donc les sources d'où je peux lire les données. Supposons donc que si je dois lire des données à partir d'un fichier Excel, je vais utiliser cette source Excel. Donc, si je dois lire des données d'une source externe, j'utiliserai cette étape. Ok. Ensuite, si je dois charger des données dans mon fichier plat, je vais utiliser cette destination de fichier drapeau. Donc, si je dois charger des données dans ma base de données, je vais utiliser cette destination OLED DB, ok ? Celui-ci est l'étape de flux de données. Maintenant ce que je vais faire, je vais lire ce plat employés de combat fixe point TXT. C' est donc le fichier que je vais lire. Donc, pour lire ce fichier, je vais utiliser cette étape. Je vais sélectionner la source, la source, puis je vais sélectionner cette étape source de fichier plat. Laisse-moi juste glisser et déposer ici. Cliquez sur, Double-cliquez. Ensuite, je dois créer une nouvelle connexion, nouvelle. C' est ainsi que vous créez une nouvelle connexion. Ok, Général, je vais vous fournir le départ. C' est donc le chemin où ce fichier est présent. Je vais sélectionner ce format de fichier. Je vais sélectionner la lecture, l'écriture, puis la colonne. Maintenant, je dois me moquer de mes colonnes. Donc, la première colonne est ID, la deuxième colonne est le FirstName, LastName. Ensuite, le désespoir est le sexe, le sexe, l'âge. Genre. Defined est la dernière colonne du pays, m-th, avancée. ID, prénom, nom, sexe, pays en âge, aperçu. Donc, ce sont mes données. Ok. Cliquez sur OK. Vous pouvez donc également prévisualiser votre jeu de données. Cliquez sur OK. Colonnes. Ce sont les colonnes. Cliquez sur OK, donc la première étape est faite sous stricte. Maintenant, ce que je vais faire ensuite, je vais d'abord charger des données dans ma base de données. Donc, je dois utiliser, laissez-moi utiliser cette transformation de multidiffusion. Donc, le but de l'utilisation de la transformation multidiffusion est la dette. Avec l'aide de cette transformation, je peux envoyer des données à plusieurs destinations. Vous aurez une seule entrée. Valeur d'entrée unique peut être, il peut être envoyé à plusieurs destinations sans aucune condition. Ok, alors maintenant laissez-moi juste connecter la première étape à cette étape. Donc, ce fichier va être envoyé à plusieurs destinations. Donc d'abord ma première destination sera ma base de données. Dans ma deuxième destination sera D, destination Excel. Donc, pour la destination Excel, je vais utiliser cette étape, destination Excel. Maintenant. Ensuite, je vais utiliser la destination DB OLED. Puisque je veux envoyer ces données à ma base de données à une table, je veux charger des données dans ma table. Donc, je vais utiliser d destination OLED DB. Maintenant, je dois créer une nouvelle connexion OLA DB, nouvelle, nouvelle, nouvelle. Je dois le nom du serveur, je dois le rafraîchir. Donc, cela va afficher le nom du serveur multimédia. Alors attendez juste une seconde. Il affichera que vous méritez un nom. Vous devez donc sélectionner votre nom de serveur. Ensuite, vous devez sélectionner le nom de la base de données. Donc, c'est mon nom de serveur, SQL Server 20-20, sélectionnez ou entrez un nom de base de données. Donc, je vais sélectionner les dés comme nom de ma base de données. Ok, donc ces bases de données de dés déjà créées. Donc, afin de créer une base de données, vous devez écrire cette commande créer une base de données. Disons que le projet est le nom de la base de données, point-virgule à la fin. C' est ainsi que vous créez une base de données. La base de données a été créée avec succès. Dans ce cas, j'ai déjà créé la base de données de dés. Donc je vais cliquer, OK, cliquez sur OK. Ensuite, table ou vue. Maintenant nouveau. C' est donc le nom de la table. Maintenant, je dois changer le nom de la table. Donc, mon nom de table sera DRG, cible, employé DRG, EMP souligné table de destination. Donc ça va être le nom de ma table. Id, prénom, ID, ok ? Le nom devrait être 2020, genre, ok ? 23. Il doit être int. Jenga. Chacun devrait être int. Cliquez sur OK. OK. Mappages, défense de mon fichier source, et voici ma destination. Très bien. Ok. Cliquez sur OK. Enregistrez ce fichier. Je dois d'abord enregistrer ce fichier. Maintenant, vous devez d'abord exécuter ça. Donc ceci, c'est ma première destination. Je vais créer une autre destination qui sera fichier Excel, fichier Excel, destination Excel. Mais tout d'abord, je vais exécuter ça. Pour exécuter, je vais cliquer sur Démarrer. Ok, toutes les étapes ont été exécutées avec succès. Maintenant, laissez-moi vérifier. Regardez les progrès. De là, vous pouvez voir la progression Dataflow. Très bien. Je dois d'abord les dés de base de données. Je dois actualiser cette liste, actualiser la table. Celui-ci est le nom de la table sélectionnez Top 1000. Les données ont donc été chargées avec succès. 50 lignes ont été chargées avec succès. Identifiez le prénom, le nom, le sexe, le pays en huit. Maintenant, ensuite, ce que je vais faire, je vais créer une autre destination. Donc, avec l'aide de la multidiffusion, je peux envoyer mes données à plusieurs destinations sans condition. Donc, cette fois, je vais utiliser la destination Excel. Donc, je vais connecter ceci à cette destination Excel. Maintenant, l'étape suivante consiste à configurer la destination Excel. Donc, je vais créer une nouvelle connexion, une nouvelle navigation. C' est donc le répertoire où je vais créer un nouveau fichier. Laissez-moi simplement créer un fichier, un nouveau fichier Excel. Donc c'est le fichier où je vais charger mes données. Le fichier XLS point employé de soulignement. Ça doit être T, G. Open. Cliquez sur OK. Maintenant nom de la feuille Excel. Nouveau, cliquez, nouveau clic. D'accord. Donc maintenant je dois créer une feuille ici. Donc, je vais utiliser cette commande create table. Laissez-moi simplement utiliser cette table de création, fichier de soulignement Excel, ID entier, prénom, N graphique à barres, qui est 10, premier M 20, LastName, type de données de la dette est n graphique à barres. C' est le genre neuf, de bout en bout. T3. L'âge est entier, alors cliquez sur OK. Cliquez sur OK. Sélectionnez maintenant la feuille Excel. Donc fichier de soulignement Excel. Voici donc la feuille T que nous avons créée. Je vais sélectionner ces mappages de feuille. Alors maintenant OK, cliquez sur OK. Donc prénom, nom. Donc, ce sont les données que je suis, je reçois de la source. Celui-ci est le pays de H. Alors maintenant, que va-t-il se passer ? Cela me donnera une erreur. Laisse-moi juste le sauver. Cela me donnera une erreur. Regardez, l'id de la colonne ne peut pas convertir entre Junie, ct, n type de données de chaîne non Unicode. La raison pour laquelle il me donne une erreur parce que le type deta d'Excel dans le type de données, qui provient de données, qui provient de la source, ont des types de données différents. Donc, cette destination Excel dans la destination source a tous les deux des types de données différents. Donc, d'abord, je dois convertir le type de données. Donc, dans Excel, les types de données pour la chaîne sont N var char, alors que les données que nous obtenons de la source sont de différents types de données. Donc, afin de convertir le type de données, je dois utiliser cette étape de transformation de conversion de données. Donc, avant cette étape, avant la destination Excel, je vais utiliser la conversion de données cette étape, étape de transformation. Maintenant, avec l'aide de l'étape Data Convergence, je vais convertir le type de données de mes données. Maintenant, combinez ça. Alors maintenant OK, double-cliquez sur OK, Sélectionner tout. Donc FirstName, le prénom sera chaîne, ce sera une chaîne de code unique. Maintenant, ce type de données est compatible avec le type de données Excel. Maintenant, LastName sera une chaîne Unicode, une chaîne Unicode. Ce type de données est compatible avec le type de données N var char, que nous utilisons pour la force. Pays, chaîne Unicode. Chaque âge, je vais utiliser t, deux octets signés entier ID pour que je vais utiliser D pour vélo entier signé. Donc, laissez-moi juste chercher deux octets signés plage entière. Donc, c'est la plage de deux octets enseignant de signature. Maintenant, ok, très bien. Copie de IID. Écoutez, c'est le type de données que nous recevons de la source. Et il s'agit de copier le type de données, copie de ce type de données. Donc, nous le convertissons en deux octets brillant enseignant, nous convertissons ce prénom. Nous créons une copie et le type de données est la chaîne Unicode. Maintenant, ici, destination Excel. Dans les mappings. Au lieu de cela, je vais utiliser la copie de IED, qui est deux octets signant TJ, copie de first_name, qui est une chaîne Unicode. Copie du nom, copie du sexe, copie du pays. Le dernier est la copie de H. Maintenant, ces deux types de données, source et destination, tous deux un OK compatible. Cliquez sur OK. Maintenant, regardez, il n'y a pas de données. Enregistrez ce paquet maintenant exécuté. D' abord, je dois tronquer cette table. Tronquer la table. Je dois tronquer cette table. Pas de tronquer cette table et d'exécuter. La table a été tronquée. Maintenant, exécutez ceci. Alors maintenant, exécutez ceci. Ecoute, je reçois une erreur. Laisse-moi regarder. Laissez-moi juste vérifier quelle erreur je reçois. Donc je reçois cette erreur. Les gestionnaires de connexions Excel ont échoué avec une exception d'erreur. Il peut y avoir, il peut y avoir un message d'erreur posté avant cela avec plus d'informations. Ok, je sais quelle est l'erreur. D'accord ? Donc, ce que je vais faire pour corriger ce type d'erreur. Je vais aller au projet, puis, je dois aller aux propriétés. Ensuite, et je dois aller à la section de débogage. Ici. Je vais changer la valeur d'exécution, exécuter 64 bits, valeur d'exécution à false. D' accord ? Indiquez si le projet doit démarrer. 64 bits. Évaluer IS runtime, est 64 bits, évaluer IS runtime n'est pas installé. Cette seconde est ignorée. OK, maintenant appliquer cliquez sur OK. Sûr. Maintenant, je n'aurai pas cette erreur, ok ? Parce que le runtime 64 bits n'a pas été installé, je dois donc ignorer cette erreur. Commencez. Maintenant, je n'obtiendrai pas cette erreur. Donc, mon projet est exécuté avec succès. Toutes les étapes ont été exécutées avec succès. Maintenant, j'ai besoin d'ouvrir ce fichier. Cible soulignement employé, J'ai besoin d'ouvrir ce fichier et le nom de cette triche si ce fichier de soulignement Excel que nous avons créé look ID, prénom, nom, sexe, pays H. Les données ont été insérées. Au total, 50 lignes ont été insérées. Maintenant, je dois vérifier ma dette. Je dois vérifier ma table. Regarde. Les données ont été insérées, 50 lignes ont été insérées. Ok, pour passer à ce mode d'édition, vous allez cliquer dessus. Maintenant résultat de l'exécution. Celui-ci est le résultat de l'exécution. Explorateur de packages de projet Regardez, vf Grey a créé trois connexions. Flat File Manager, connexion fichier Excel, ces deux connexions dans la connexion de base de données, ces trois connexions. Et puis nous avons cette tâche de flux de données. Dans la tâche de flux de données, laissez-moi simplement ouvrir ce fichier Flatfile. D sont les composants source de fichier plat, destination OLED DB, ND, composant multidiffusion. Ce sont trois composants que nous avons utilisés. Paramètres, variables que nous n'avons pas utilisées. Bon, maintenant dataflow, en ce moment, nous avons utilisé ce flux de données de section, nous n'avons pas utilisé ce flux de contrôle de section. Donc celui-ci est le nom de mon paquet. J' espère que vous avez compris le concept. Merci beaucoup et avoir un excellent apprentissage. 7. Union Tout et Merge dans la transformation dans SSIS: Bonjour tout le monde. Dans cette conférence particulière, nous allons discuter de l'union tous les finissent Merge, Joindre la transformation dans l'outil SSAS. Donc, tout d'abord, je vais créer un nouveau paquet, cliquer avec le bouton droit de la souris et créer un nouveau paquet. Donc mon nom de paquet sera, laissez-moi juste changer le nom. Fusionner, joindre, souligner la transformation. Laissez-moi d'abord vous montrer mon jeu de données, que je vais lire. Soit deux jeux de données, employé 0-1 point csv. Ce site particulier, dans ce fichier CSV particulier, j'ai un total de 50 enregistrements. Donc j'ai ID, prénom, nom , sexe, pays H dans l'ID du département. Je vais avoir un indéfini, qui est employé 0-2 point CSC. Dans ce dossier particulier, j'ai obtenu neuf dossiers. D' accord ? Donc ce sont les colonnes. Donc, tout d'abord, je vais expliquer le concept de hochement de tête junior. Donc, quand vous devez combiner les enregistrements, vous allez utiliser l'union T toute transformation. Regardez dans ces deux dossiers, dans ces deux dossiers, nous avons combien de colonnes nous avons ? Et le nombre de colonnes sept. Donc, quand nous effectuons l'union de toute transformation, nombre de colonnes dans le type de données devrait être le même ID de look, id qui est présent dans, dans mon autre fichier, devrait avoir le même type de données, FirstName, et le le prénom du fichier implique 01 devrait avoir le même type de données, ok ? Donc, le nombre de colonnes dans le type de données doit être le même. Ok, laisse-moi juste fermer ça. Donc, avec l'aide de l'union toute transformation, je vais combiner ces deux fichiers. Donc, tout d'abord, laissez-moi simplement utiliser la section Dataflow. Alors cliquez sur. Ok, maintenant je vais sélectionner la source. Je vais choisir la source de fichier plat puisque je lis un fichier CSV. OK, à la source de fichier plat, cliquez sur nouveau, je dois sélectionner, Créer une nouvelle connexion, gestionnaire de connexion. D' accord ? Sélectionnez un fichier. Je vais sélectionner un fichier ici. Il est présent dans mon répertoire. Ok, laisse-moi juste fournir la partie de mon dossier. Celui-ci, tous les dossiers. Donc mon fichier membre premier fichier est en jeu 0-1 forme un fichier délimité par des virgules. Je dois vous montrer les propriétés avec le bouton droit de la souris. Regardez le fichier séparé par des virgules Microsoft Excel. Donc, je vais sélectionner cette option particulière, cette ancienne colonnes délimitées. Ce sont les colonnes. Ok, très bien. Cliquez sur OK. Ce sont les colonnes. De même, je vais configurer cette étape. Source du fichier plat. Il devrait avoir une autre connexion. Cette fois-ci, je vais sélectionner le deuxième fichier, employé, 0-2 fichier CSV sombre. Celui-ci, il a un fichier délimité par des virgules. Ok, très bien. Cliquez sur OK. Laissez-moi juste prévisualiser mon jeu de données. Ok, c'est mon phi est au total neuf enregistrements et mes colonnes de fichiers. Ce sont les colonnes. Laisse-moi juste changer le nom. Employee 50 dossiers. La seconde, permettez-moi de changer le nom de cette étape. Employé. Neuf dossiers. Trouve pas ensuite, je vais effectuer le syndicat toute transformation. Alors j'irai ici. Je vais sélectionner l'union toutes les transformations si diverses union toute discipline de transformation est D union toute transformation. Donc, lorsque nous effectuons l'union toute transformation, nous n'avons pas besoin de trier nos données. Ok, donc c'est comme ça que vous allez combiner deux enregistrements, deux fichiers en utilisant l'union toute transformation. Maintenant, prénom, ok, ça va être le prénom, le nom, le sexe, le pays, chacun et l'ID du département. Ignore. Cliquez sur OK. Laissez-moi simplement cliquer à nouveau. Nom de la colonne de sortie. Celui-ci est la sortie dans. Celui-ci est l'union D sur, dans le port un, union toutes les entrées pour entrer un et entrée deux. Et celui-ci va être d, sortie finale. ID, prénom, nom, sexe, pays, chaque département final. Donc, puisque nous allons utiliser la transformation de jointure de fusion comme l, Donc, je vais sélectionner une étape source de plus, qui est l'étape de source de fichier plat. Alors laissez-moi vous montrer l'étape source du fichier plat, celle-ci, je vais le sélectionner. Alors ensuite ce que je vais faire, je vais, je veux lire ce fichier, point csv du département. Dans ce fichier, j'ai également l'ID du département et le nom du département dans ces deux fichiers. que je Donc ceque jeveux d'abord, je veux faire le syndicat tout ce que je veux pour combiner ces deux fichiers. Alors je veux avoir un joint, je voulais avoir un joint sur la base de l'identification du département . Ensuite, je vais lire ce fichier d'identification du département. Cliquez donc sur cette nouvelle transformation. Ok, très bien. Ensuite, je vais sélectionner le fichier de département, point de département délimité fichier csv. D' accord, de belles colonnes. Ce sont les colonnes, aperçu avancé, l'ID du département et le nom du département. Ok, très bien. Laisse-moi juste éditer. Permettez-moi de changer le nom de cette étape. Ce département est nommé D. Ensuite, je vais utiliser une transformation profonde, qui est connue sous transformation de jointure de fusion. Donc, avant d'utiliser cette transformation, je dois d'abord trier mes données. Donc, avec l'aide de la confirmation de jointure de fusion, je peux faire une jointure interne, je peux faire une jointure externe gauche ou je peux faire une jointure externe complète. Mais d'abord, j'ai besoin de trier mes données, soit dans l'ordre croissant, soit dans l'ordre décroissant. Ce sont donc deux entrées. Département d'ingénierie, ce sont deux entrées. Donc d'abord, je dois trier mes données. Donc, afin de trier les données, j'utiliserai cette transformation de tri. Laisse-moi juste le faire glisser. Alors Ivy commence par trier mes données. Alors cliquez sur ceci. Donc, je vais trier sur la base de l'ID de département, trouver l'ordre croissant ici aussi, je vais trier mes données sur la base de l'ID de département. ID de département, ordre croissant, cela devrait signifier ordre croissant. Maintenant, je vais avoir un joint. Donc, sélectionnez OK, input, Fusionner, Joindre les entrées gauche. Ça veut dire dette. Décidez. Cette entrée, emploient 50 enregistrements. Décider va venir de mon côté gauche et ce côté va venir de mon côté droit. Laisse-moi choisir, ok, très bien. Maintenant, sélectionnez ceci, n a rejoint ceci. Maintenant, cliquez sur ceci. Maintenant, j'ai un joint sur la base de l'ID du département. Maintenant, je dois sélectionner mes colonnes, que je veux inclure dans ma sortie finale. Donc je ne vais pas identifier le prénom, le nom, le sexe, le pays sinus h. Non, je ne veux pas d'ID de département, plutôt je veux des noms de département. Je vais sélectionner le nom du département. Donc, je me joins sur la base de l'identifiant du département. Donc, si vous voulez avoir une jointure interne, vous pouvez sélectionner jointure interne, jointure externe gauche. Vous pouvez avoir une jointure externe gauche ou vous pouvez avoir une jointure externe complète. Donc je vais avoir une jointure externe gauche. Alors regardez, colonnes d'entrée, alias de sortie, ok. Maintenant, cliquez sur OK. Tu dois sauver ça à la fin. Ce que je vais faire, je vais charger mes données dans ma table cible, dans ma table de base de données. Donc, pour la base de données, je vais sélectionner ce tableau, cette étape, cette étape de destination où destination Li DB. Laisse-moi combiner ça. D' accord ? Nouveau nu, je dois créer un nouveau. Laisse-moi juste créer un nouveau. D' accord. Dice est le nom. Ok, très bien. Cliquez sur OK. C' est le nom de la connexion. D' accord. Nom de la table que je vais sélectionner. Non, je dois d'abord créer une nouvelle table. Je dois créer une nouvelle table dans le nom de la table sera, laissez-moi simplement créer une nouvelle table. Drg soulignent employé, dst, table, ID, var, char, prénom, nom, sexe, pays, chaque nom de département, OK. Cliquez sur OK. Mappages. Très bien. Cliquez sur OK. Non, sauvegardez ça. Ok, maintenant je dois exécuter ça. Exécuter. Donc c'est comme ça que vous exécutez ceci. Alors regardez, au total 69 enregistrements avaient été chargés dans ma table. Laisse-moi juste rafraîchir ma table. dés. Actualisez cette base de données. Voilà ma table. Laisse-moi vérifier ma table. Une nouvelle table a été créée. Donc le nom de la table est ceci. Sélectionnez les 1000 premières lignes. Regardez un total de 59 enregistrements ont été chargés dans ma table. Regarde. Donc, puisque nous avons effectué en null, jointure externe gauche, donc nous obtenons la valeur nulle 0. D' accord ? Alors j'espère que vous avez compris le concept de Fusionner, Joindre et Union toute transformation. Merci beaucoup et avoir un excellent apprentissage. 8. Transformation ConditionalSplit: Bonjour tout le monde. Dans cette conférence particulière, nous allons examiner un exemple de scission conditionnelle dans SSI. Oui. Donc, la division conditionnelle est juste comme si condition. Donc, basé sur les données de condition est routé. Ok, donc pour mieux comprendre le concept, laissez-moi simplement créer mon paquet d'abord. Je vais donc créer un nouveau paquet. Donc, je vais appeler ce paquet exemple de split conditionnel, exemple CFS. Ok, je vais sélectionner la section du flux de données. Cliquez sur ce bouton, puis je vais sélectionner la source. Donc, d'abord, j'ai besoin de sélectionner ma source. Donc, je vais sélectionner la base de données comme source, OLED, source DB OLED. Donc, ce que je veux, je veux lire les données d'une table de base de données. Donc, pour cela, vous devez utiliser cette source. Laissez-moi vous montrer ma table d'où je vais lire les données. Donc c'est ma table. Fusionner le tableau de soulignement. Dans ce tableau, IF ID, prénom, nom, sexe, pays, agent, ID de département. Donc ce que je vais faire ensuite, je vais configurer ceci. Cliquez sur ce bouton. Donc ce que je fais en ce moment, je crée une nouvelle connexion. Je crée une nouvelle connexion OLED DB. Je crée une nouvelle connexion DB. Donc, ce que je veux, je ne veux pas créer cette nouvelle connexion encore et encore. Ok, donc ce que je peux faire, je peux créer une nouvelle connexion ici dans le gestionnaire de connexion profonde. Donc, je vais créer un nouveau gestionnaire de connexion, une nouvelle connexion. Maintenant, à partir d'ici, je vais sélectionner la connexion à la base de données. Où est ma connexion à la base de données ? Je dois choisir d'ici. Donc, je vais sélectionner ce OK, cliquez sur OK. J' ai donc sélectionné cette connexion à la base de données. Maintenant, si je vais sélectionner cette option, je n'ai pas besoin de créer une nouvelle connexion. Donc, à partir du menu déroulant, je vais sélectionner, ok, maintenant le nom de la table de vue d'ensemble, table. Je vais choisir celui-là. Fusionner le tableau de soulignement. Donc, cette table, je vais sélectionner des colonnes, des colonnes de sortie d'erreur. Maintenant, ce sont les colonnes de cette table. Donc, cette étape est faite dans domestique. Ensuite, je vais utiliser la transformation de division conditionnelle. Donc diviser conditionnel glisser-déposer ici en fonction de la condition que je vais acheminer mes données. Donc, combinez la première étape avec d, deuxième étape avec l'étape de fractionnement conditionnelle. Maintenant, je vais spécifier la condition. Je vais donc spécifier la condition sur cette colonne particulière, pays. Si le pays est égal à deux égal à deux États-Unis, États-Unis, permettez-moi d'écrire une condition égale à États-Unis. La sortie sera USE. Donc, ce sera usaid employés. D' accord ? Maintenant, si Pays égal égal à, désolé, pays, France. Ensuite, la sortie sera la France. Il s'agit du nom de sortie par défaut. Donc, cela va être par défaut, sortie par défaut. D' accord ? Donc, si le pays est égal, égal à deux États-Unis, ce sera la production. Si Pays égal à France, il s'agit du nom de sortie. Différent sera la sortie par défaut. Donc, ok, maintenant, maintenant, je vais sélectionner D Wally DB destination, destination LE DB. D' accord ? Mab, c'est le premier, celui-ci va être sorti. Le premier va être usa. USA ira à cette destination. La seconde va aller à D. La seconde destination n'est pas la France. Le troisième. Je vais avoir une autre base de données de connexion. Cela ira à la valeur par défaut. Ce sera la valeur par défaut. Donc je vais avoir trois destinations. Le premier basé sur la condition. Donc, c'est la condition, états-unis, cela ira à cette destination, France ira à cette destination, et la sortie par défaut ira à d, cette destination. Dans la sortie par défaut, je vais obtenir des données autres que les États-Unis en France. Maintenant, laissez-moi juste configurer ceci. Je n'ai pas besoin de créer une nouvelle connexion. Ok, il est déjà là. Donc le nom de la table sera. Donc, je vais créer une nouvelle table pour ça. La table sera USE. Donc, ce sera le nom des mappages de table. Très bien. Deuxièmement, je vais créer de nouveaux. Celui-ci va être la France. Cliquez sur OK. Le troisième sera la table par défaut. Là-bas. Je vais obtenir des données autres que la France USE FIN, par défaut. Employés, d'accord ? Valeur par défaut. Donc, dans mon premier tableau, je vais obtenir des données sur les employés des États-Unis. Deuxièmement, il y aura des employés de France. Troisièmement, on va récupérer les données. Salariés autres que Usain France. Je dois sauver ça. Maintenant. Après avoir enregistré cela, je vais exécuter ce paquet. Il semble qu'il y ait une erreur. Ok, quelle est l'erreur ? France, trouver, malhonnête le nom de la table par défaut. Tout ce que je reçois. Une erreur s'est produite lors de l'exécution Vernor champ plus composant. Quel composant de disque est le troisième, table ou la vue Colonnes de mappage sur le mappage. Ok, très bien. Mappages. Ok, très bien. J' ai sauvé ça. Non, exécutez ça. D' accord. Les processus exécutés avec succès. Maintenant, je dois vérifier mes tables. Ainsi, trois autres tables seront créées. Rafraîchir. Et les noms de table sont, les noms de table sont USE décent. Cela aura des employés des États-Unis. Regardez pays USA. USA implique que le second sera la France. Décimal ont des employés de France. La France plus ancienne. L' autre, par défaut. Cela aura des données autres que la France et l'USC. D' accord ? C' est donc le concept de brin conditionnel basé sur la condition qu'il va diviser vos données. Alors j'espère que vous avez compris le concept. Merci beaucoup et avoir un excellent apprentissage. 9. Transformation de l'outil de recherche: Bonjour tout le monde. Dans cette conférence particulière, je vais expliquer le concept de transformation de recherche dans les SSI. Donc, afin de comprendre le concept de transformation de recherche, permettez-moi tout d' abord de vous montrer ma table de recherche. Donc, ce que je veux accomplir, laissez-moi vous montrer ce que je veux accomplir. Donc, dans ma table de recherche, j'ai cette colonne Pays ou dans le code pays. Donc, tout d'abord, je vais lire les données de ma source. Dans ma source, j'ai cette bobine de champ, au contraire, laissez-moi juste open source. Ecoutez, j'ai ces pays faibles, donc je vais chercher la valeur des frais de pays dans ma table de recherche. Et contre le champ pays, je vais chercher le code du pays. Laissez-moi d'abord lire le fichier source ici. Donc, tout d'abord, je vais utiliser les sources de fichiers plats. Laissez-moi juste configurer ceci. Je vais créer un nouveau gestionnaire de connexion naviguer et fichiers CSV, point d' employé CSV ou colonnes k. Et un aperçu avancé. Donc ça va être mon ensemble de données. D'accord ? Ce pays regarde colonnes. Ça va être ma source. Ok, ensuite je vais utiliser la transformation de recherche. Recherche. Configuration de la transformation de recherche. Double-cliquez sur la transformation de recherche, ok. Donc, dans la transformation de recherche, j'ai trois, mode cache, le cache complet, argent partiel, pas d'argent liquide. Donc, quand je vais sélectionner l'argent plus, alors cela va aller, cela va sélectionner toutes les données de ma table de référence ou de recherche. C' est ma table de recherche. Il va sélectionner toutes les données de, à partir table de recherche et il stockera les données dans le cache. Ok, au total combien de disques ? Laissez-moi juste compter le nombre de dossiers. Donc, au total, il y a 13 lignes dans ma table, donc il va stocker toutes les règles de cocaïne en D, cache, cache complet. Laisse-moi juste te donner un scénario. Permettez-moi d'expliquer comment le processus va fonctionner. Laisse-moi ouvrir ce fichier. Laisse-moi juste appliquer un filtre ici. Actuellement, Lead sélectionnez les États-Unis. Alors regardez, cette valeur sera recherchée. Je dois donc d'abord configurer le type de connexion du cache complet, le type de connexion. Je peux sélectionner le gestionnaire de connexions de cache dicker, ou je peux sélectionner le seul gestionnaire de connexions DB puisque je lis les données de ma table de base de données. Donc, je vais sélectionner le gestionnaire de connexion DB huileux. Donc, si je lis des données à partir d'un fichier de cache, donc je vais sélectionner cette option particulière puisque dans ce cas, nous lisons des données d'une table de base de données, je vais sélectionner ceci, spécifier comment endl Ruth. Sans entités correspondantes. S' il n'y a pas de correspondance. Par exemple, il s'agit de ma table de référence ou de ma table de choix. S' il n'y a pas de correspondance, que se passera-t-il ? Échec du composant, ignorer l'échec ou rediriger les règles vers aucune sortie de correspondance. Ok, donc je vais avoir deux sorties. L' un sera la sortie en purée, l'autre sera la sortie inégalée, ok, connexion. Donc je vais sélectionner mon câble ici, table de recherche. Ici. La table de choix correspond aux colonnes de cette table de choix. Alors quelles options j'ai ? Je veux donc faire une recherche sur la base des pays. Sélectionnez cette option par rapport au pays. Je vais chercher la colonne de recherche du tribunal de campagne, code pays. Ok, très bien. En ce moment, cet onglet avancé, je ne vois rien dans mon étape avancée. Cliquez sur OK. Il a configuré, il est sélectionné comme plein cash. Plus, cliquez sur OK, enregistrez ceci. Maintenant, je vais ensuite sélectionner, je n'insère pas leur heure dans ma base de données. Je vais sélectionner depuis que je suis en train de tester. Donc, je vais sélectionner l'option de multidiffusion. Je vais choisir de multidiffusion. L' un est pour la sortie en purée, l'autre est pour inégalée. Cela va être la sortie un est match. Cliquez sur OK. L' autre sera la recherche inégalée, pas de sortie de correspondance, ok, sauvegardez ceci. Maintenant, exécutez le processus. Ainsi, lorsque le paquet est exécuté, les premières données seront stockées en premier, ces données seront stockées dans le cache, puis la recherche sera effectuée. Il semble qu'il y ait une erreur. Je dois voir, OK, ce dossier est ouvert. Maintenant, exécutez à nouveau le paquet. Enregistrez ceci et exécutez à nouveau le package. Donc ça va marcher. Maintenant, regardez, 53 règles sont appariées, seulement six lignes sont inégalées. Alors laisse-moi juste voir. Le visualiseur de données du résident est incapable. Les données que nous sommes toutes les colonnes sont maillées. D' accord. Code du pays. Je suis allée la voir. Code pays. D'accord. Je ne veux pas voir ma croissance inégalée. Regarde. pays contre le pays de Dieu, le code du pays, d'accord. Japon pour le Japon, 81 est le code pays. Ok, maintenant, ce que j'essaie d'expliquer en ce moment, mode entièrement cache est configuré. Donc, lorsque le mode de cache complet est configuré pour, alors que va-t-il se passer ? Laissez-moi d'abord ouvrir ce fichier. Appliquez un filtre ici. Disons que je sélectionne l'Australie et les États-Unis, ou peut-être le Japon. Ok, laisse-moi juste, ok, alors supposons que c'est ma première rangée. Alors, que se passe-t-il en cas de mode de cache complet ? Donc, cette valeur sera recherchée dans le plein, dans la mémoire cache. Et je vais obtenir les résultats de mon cache, mémoire cache complète, ok, donc nous utilisons l'option de mode cache complet lorsque ma table de recherche est, est petite au cas où ma table de recherche est énorme. Donc, cela va frapper les performances du système. La raison pour laquelle il va atteindre les performances du système parce que si nous devons copier les données de cette table de recherche deux pour attaquer, il va consommer tellement de ressources système. Imaginez des millions d'enregistrements ont été copiés dans le cache. Donc, évidemment, il va falloir tellement de ressources système, d'accord ? C' est la raison pour laquelle cette option de cache complet est utilisée lorsque cette table de recherche est petite, n'est pas énorme. D' accord ? Qu'en est-il du cache partiel ? Comment ce cache partiel, le concept de cache partiel, va fonctionner. Laissez-moi sélectionner cette option connexion. Ici, vous devez spécifier la taille du cache. Supposons 25 Mo, OK, cliquez sur OK. Maintenant, comment le processus va fonctionner. Dans ce cas, maintenant, toutes les données ne seront pas copiées dans le cache. Alors que va-t-il se passer ? Laisse-moi choisir, ok, donc c'est ma première rangée. Les États-Unis vont être recherchés en ce moment, le cache est vide. Je n'ai pas exécuté le paquet en ce moment. D, d l'argent partiel est vide. n'y a pas de données en d espèces partielles. Alors que va-t-il se passer ? Les États-Unis seront recherchés dans le, dans la mémoire cache partielle. Et puisque le cache est vide, donc il n'obtiendra pas les données. Maintenant, que faire si le prochain processus, il le fera. Ensuite, il va chercher les données dans ma table de recherche, ok, à partir de cette table de recherche, devinez égal getter deta États-Unis contre les États-Unis. Il le fera, il obtiendra ce code de pays. Donc, dans le cache, par défaut, dans la mémoire cache partielle, après avoir obtenu les données, il stockera États-Unis dans le code de pays un. D' accord ? Et la prochaine fois ? Quand cette prochaine fois que cette ligne est exécutée ? Que va-t-il se passer ? Les États-Unis seront fouillés dans le cache D, en espèces partielles. Maintenant, cette fois, dans le temps partiel de Charybdis, nous aurons ça à l'heure D, de l'argent partiel, ok, donc contre les codes de pays, Etats-Unis, je vais obtenir une valeur de D cash partiel. Ok, maintenant supposons que quand la troisième fois, quand la troisième ligne est exécutée, supposons que la troisième ligne soit la suivante. Permettez-moi de chercher un autre Brésil. Supposons que la troisième rangée soit ce Brésil. Maintenant que va-t-il se passer ? Ce Brésil n'est pas stocké dans le cache partiel. Donc, d'abord, cette valeur sera recherchée dans d, mémoire cache partielle. À partir de la mémoire cache partielle, il n'obtiendra pas les données. Quelle est la prochaine étape ? L' étape suivante consiste à rechercher les données dans la table de référence, dans la table de choix, dans la table de choix, il obtiendra les données. C' est contre le Brésil. Je vais avoir 55. Ok. Maintenant, ces deux valeurs seront stockées dans d ici dans la mémoire cache partielle. C' est ainsi que l'argent partiel plus va fonctionner. Maintenant, quand utiliser l'option de cache partiel. Nous utilisons donc l'option de cache partiel. Wendy, la table de recherche est grande lorsqu'elle est maintenant configurée, OK, cliquez sur OK, enregistrez ceci. Maintenant, j'exécute ce paquet avec de l'argent partiel. Exécuter. Ok, je dois fermer ce dossier. D' accord ? J' ai le résultat, ok, cette fois, c'est exécuté avec de l'argent partiel. La prochaine fois, je vais sélectionner l'argent sans argent. En cas d'absence d'argent liquide, que se passe-t-il lors de la première exécution de ce paquet ? Aucune mémoire cache n'est vide. Alors que va-t-il se passer ? Laisse-moi ouvrir le dossier ici. Supposons que ce soit la première ligne. Supposons que celui-ci soit la première rangée. Le Japon est la première rangée. Est-ce que la valeur du Japon sera telle dans la mémoire sans cache, donc il n'obtiendra pas les données ok, alors il va chercher des données dans la table de recherche. A partir de la table de recherche, il obtiendra les données, ok, alors la valeur sera stockée dans la valeur sera stockée en D, pas de mémoire cache. Ok, cette valeur, ok. La prochaine fois, disons le Japon. La valeur suivante est le Japon. La prochaine ligne est le Japon, sera recherché ET AUCUNE mémoire cache. A partir de la mémoire cache pas, il va obtenir les données correctes, car ils prennent déjà sauvegardé. Et si tôt ? Supposons que la valeur suivante soit la suivante, Au lieu du Japon, la valeur suivante est le Brésil. Donc, la valeur Brazi va être recherchée en D, pas de mémoire cache. D' accord ? Dans la mémoire sans cache, il n'obtiendra pas les données maintenant cette fois autour de la recherche égale dans la table de recherche D, dans la table de recherche, il obtiendra les données, ok, Brésil contre le Brésil, je vais obtenir ceci. Alors maintenant que va-t-il se passer ? Il écrasera la valeur précédente, Brésil. Maintenant, dans la mémoire sans cache, Brésil en 55, ces deux valeurs seront stockées. La valeur précédente, qui était le Japon, elle sera écrasée, ok, seule une valeur unique sera stockée. Alors que quand il s'agit de plein cache, quand il s'agit de trésorerie partielle, toutes les valeurs seront stockées. Ok. Donc, en cas d'absence d'argent, la dernière valeur, la dernière valeur sera stockée ok, quand la prochaine fois, quand la nouvelle valeur arrive, la valeur précédente sera écrasée dans le cache. Donc, ce n'est pas de l'argent. Donc les colonnes de connexion. Donc, lorsque nous utilisons signifie cash, donc nous avons utilisé la mémoire cache sans mémoire lorsque nous avons limité la mémoire, lorsque nous ne voulons pas enregistrer toutes nos données dans le cache. En cas de contrainte de mémoire, nous avons utilisé l'option no cache. Maintenant, cliquez sur OK. Sauvegardez ça. Cette fois-ci, j'exécute le paquet avec l'option de mémoire cache. Écoutez, les données ont été exécutées, accord, un paquet DD a été exécuté. J' espère que vous avez compris le concept. Merci beaucoup et avoir un excellent apprentissage. 10. Transformation de cache: Bonjour tout le monde. Dans cette conférence particulière, je vais expliquer le concept de transformation de la trésorerie dans SSAS. Nous allons également examiner le but de l'utilisation de la transformation du cache. Donc, tout d'abord, laissez-moi vous montrer ma table de recherche, qui est dans la base de données SQL Server. Donc c'est ma table de recherche. Donc, dans la conférence précédente, ce que nous faisions, nous lisions ces données à partir de la table de base de données. Ok, donc c'est la table de base de données. Maintenant, ce que je veux, au lieu de lire les données d'une table de base de données, je veux lire les données d'un cash. Alors, comment je peux lire les données d'un cash, je vais utiliser la transformation de cash pour stocker d'abord les données dans une mémoire cache, puis les lire à partir de, à partir d'un cash. Alors comment je peux le faire ? Je peux le faire en utilisant la transformation du cache. Il y a donc deux possibilités de le faire. La première possibilité est soit vous enregistrer les données dans le fichier cache, n'a pas dette fichier cache sera stocké dans la mémoire cache. La deuxième possibilité est marquée. Vous stockez toutes les données dans la mémoire cache. Ok, donc avec le fichier cache, l'avantage est balise, vous pouvez utiliser le fichier cache de dette dans plusieurs paquets, dans, dans, dans n'importe quel paquet, OK, mais avec la première possibilité dette, vous copiez toutes les données dans le cache la mémoire. Avec ce cas, l'inconvénient est la pile. Vous ne pouvez lire les données de ce cash que dans un seul paquet. Aucun autre paquet ne peut lire les données du cache. Permettez-moi donc de vous donner une démonstration pratique de ce concept. Donc tout d'abord, mon premier, tout d'abord, ce que je vais faire, je vais lire ces données, ces données de recherche, et je vais les stocker dans, dans un fichier cache. Donc, pour la dette, je dois utiliser la source Wally DB. Laissez-moi simplement utiliser cet OLED être source configuré cette étape. Donc, je vais sélectionner la table. Je vais sélectionner ma table de recherche. Ok, belles colonnes, très bien. Cliquez sur OK. Ensuite, je vais sélectionner la transformation du cache ici, la transformation gash, celle-ci. Ok, double-cliquez. Ok, gestionnaire de connexion au cache. Je vais créer un nouveau gestionnaire de connexion de cache ici. Donc ça va être mon gestionnaire de connexion de trésorerie. Donc, ce que je vais faire, je vais créer un fichier cache. Ici. Je vais créer, créer un fichier cache qui sera stocké dans une mémoire cache. Donc le format de ce fichier cache sera ce champ sombre W. Ok, donc ça va être mon joint de coffrage. Phi est le nom ouvert. Donc, ce sera le nom hors fichier cache. Cliquez sur OK. Doit être au moins un index indique spécifier un index sur cet onglet de colonne, ok ? Très bien. Colonnes. Vous devez spécifier l'index. Dans ce cas contre pays, je reçois le code du pays. Donc le pays va être mon indice. Donc, je vais spécifier une valeur un. Donc ça va être mon index. Trouver des mappings, pays, pays, accord de pays. Ok, très bien. Sauvegardez ça. Alors que va-t-il se passer ? Il va créer une lutte contre l'argent avec extension. Avec l'extension CHW sombre, je dois exécuter ce paquet. Maintenant, que va-t-il se passer ? Regardez le paquet a été exécuté avec succès. Donc, l'avantage de créer le fichier cache est tat. Maintenant, je peux créer plusieurs paquets et je peux utiliser ce fichier de cache là. Maintenant, ce que je vais faire ensuite, je vais créer un nouveau paquet ici, nouveau paquet. Désormais, flux de données. Ensuite, je vais sélectionner, ou je peux, je peux sélectionner le paquet existant à partir d'ici. Donc, disons que la recherche est mon paquet existant, le flux de données. Je dois sélectionner la section Dataflow. Ce paquet, je vais annuler ce paquet. D' accord ? Donc celui-ci est le paquet de transformation de trésorerie, et celui-ci est le paquet de recherche. Double-cliquez dessus. Laissez-moi juste supprimer ceci. Je ne veux pas que ça soit ok. Suppression de cette multidiffusion. Donc, au lieu de multidiffusion null, je vais utiliser une autre destination, ok ? Pas de cash plus entièrement cash mode plus partiel, pas d'argent comptant plus. Je vais sélectionner le mode de cache complet. Avec le mode de cache complet, je vais obtenir deux types de connexion, option, gestionnaire de connexion gash et gestionnaire de base de données huileux, gestionnaire de connexion. Que cette option, je vais lire les données de ma table de base de données. Ok, maintenant ce que je veux, je veux lire les données de mon fichier cache. Donc, je vais sélectionner cette connexion d'option ici. Je vais sélectionner le gestionnaire de connexion. Donc, dans ce cas, c'est le nom du gestionnaire de connexion. Laissez-moi juste dire le nom du gestionnaire de connexion que j'ai utilisé ici. Donc, le nom du gestionnaire de connexion est le suivant. Gestionnaire de connexion Gash est le nom. Laissez-moi simplement sélectionner le nom du gestionnaire de connexion. Gestionnaire de connexions de cache est le nom. J' ai donc sélectionné n'a pas écrit le gestionnaire de connexion ok. Colonnes. Ce sont les colonnes contre pays. Je vais chercher le code du pays maintenant. Maintenant, je ne vais pas obtenir les données de ma table de base de données. Donc, je vais obtenir les données de mon fichier cache, qui est stocké ici, qui est créé ici. D' accord ? D Ss. Ce fichier de cache sera donc stocké dans la mémoire cache. Ok, un flux de trésorerie décent. Laisse-moi juste l'ouvrir. Je ne peux pas ouvrir ça. Je peux l'ouvrir, mais le format, le Seigneur, étant lisible, Ce n'est pas un format lisible. Encore cinq. Maintenant, ici ce que je peux faire la transformation du cache, c'est fait et dépoussiéré. Donc, la prochaine fois que nous allons sélectionner la destination du fichier plat, faites glisser la destination du fichier. Choisissons ceci. Donc, je vais le stocker dans, dans la sortie de correspondance de recherche. Donc, je vais sélectionner seulement la matière, mais laissez-moi juste configurer ceci. Ok, nouveau, je vais créer un nouveau OK. Cliquez sur. Ok. Nous allons créer un fichier ici, fichier CSV ici. Donc le nom du fichier sera simple. D' accord ? Colonnes ouvertes, ce seront les noms de colonnes. Aperçu, ok, mappings fins, très bien. Le pays a appelé, très bien. Donc ça va être le nom. Alors laissez-moi juste vérifier l'erreur ici. D' accord ? Décoder la valeur Pij est 65001. Ok, laisse-moi juste changer de mise à jour. Ok, laisse-moi juste le changer. La page de score 65001. Donc, je vais choisir 65001 discipline d'option. D' accord. Maintenant, très bien. Les mappages trouvent. Maintenant, exécutez. Le paquet. Le package a été exécuté avec succès. Look simple point CSV est le nom du fichier qui est généré ici. Ok, donc c'est le fichier qui est généré. Si je dois inclure les en-têtes, je peux aussi le faire. Maintenant. Il s'agit donc d'un exemple de lecture de données via un fichier de cache. Maintenant, je vais vous donner un exemple de lecture de données à partir d'une mémoire cache. C' était donc la transformation du cache. Alors maintenant laissez-moi juste éditer le, au lieu de choisir cette option particulière, ce que je peux faire, je peux utiliser cette option, ok ? Je peux décocher cette option. Avec cette option, il va lire les données d'une mémoire cache nulle à partir d'un fichier cache. Mais le problème avec cette option est que je ne peux lire les données de la mémoire cache que dans un seul paquet. Cela ne peut pas être fait dans plusieurs paquets. Mais avec cette option, je peux lire ce fichier de cache dans plusieurs paquets. D' accord ? Comme celui-là est un autre paquet. Celui-ci est un autre paquet. Je lis des données, je lis ce fichier cache à partir d'un autre paquet. Je peux créer d'autres paquets et lire ce psi particulier. Mais avec cette option, cette option ne me limitera que quatre pour ce paquet particulier. Ok, maintenant, ce que je peux faire, laisse-moi juste éditer ça. Au lieu de cela, je vais choisir cette option, d'accord ? Maintenant ce que je peux faire pour dissimuler ma seule maladie, mon paquet unique, ok ? Le paquet unique où la première lecture des données source, je lis les données de recherche, puis je place ce que je dans ma mémoire cache. Après cela, je peux créer une autre tâche de flux de données. Je peux créer une autre tâche de flux de données à partir de l'air. Et je peux le faire. Donc, laissez-moi juste configurer cette tâche de flux de données. Ok, maintenant, dans cette tâche de flux de données, je vais construire la même logique de recherche. Cette logique de recherche, d'accord, fichier plat, lecture à partir d'un fichier plat, puis regardez ici dans cette recherche, je vais lire à partir d'un cash. Donc, je vais sélectionner ceci puis ce type de connexion. Je vais sélectionner le gestionnaire de cache de connexion. D' accord ? Alors faisons-le. Encore une fois. Source du fichier plat. Ensuite, laissez-moi juste configurer le fichier plat. Laissez-moi simplement sélectionner un nouveau navigateur. Csv, point d'employé csv, ok, colonnes. Ok, trouver des aperçus de ça va être mes données. Ok, très bien. La prochaine fois, on va utiliser la recherche. Ok. Cette fois, je vais lire les données de entièrement encaissé, sélectionnez cette connexion ici. Je vais sélectionner le gestionnaire de connexion du cache. Ok, donc dans le gestionnaire de connexion du cache, j'ai configuré. Permettez-moi d'abord de combiner ce cookie de colle fine dans le gestionnaire de connexion du cache. Je dois te montrer ça dans ma première tâche de flux de données, l'argent. Donc, directeur de la connexion de trésorerie, je sélectionne, j'ai décoché cette option, d'accord ? Maintenant, cette fois, je vais lire les données de ce cash. Maintenant, la tâche Flux de données pour rechercher, trouver le mal configuré. La prochaine fois, nous sélectionnerons la multidiffusion juste à des fins de test. D' accord ? Combinez ceci avec l'option Multicast. Je vais seulement sélectionner la sortie de match en ce moment, pas besoin de donner une sortie d'adder. Sauvegardez ça. OK, exécutez la tâche, exécutez le paquet. Cela me donne une erreur, pire erreur y, je reçois cette erreur. Csv a pris fin. Ok, a permis le résultat, ok, très bien. Quelle est l'erreur exactement ? Laissez-moi juste vérifier l'erreur. Y, je reçois cette erreur. Ok. Rediriger les règles pour correspondre, ignorer l'échec. Rediriger les règles pour correspondre à la sortie. Maintenant, c'est bon, très bien. Ok. Donc c'est comme ça que vous lisez les données d'un soda en espèces. J' espère que vous avez compris le concept de transformation de la trésorerie dans SSAS. Merci beaucoup et avoir un excellent apprentissage. 11. Groupement flet: Bonjour tout le monde. Dans cette conférence particulière, nous allons discuter de la recherche floue et la transformation de regroupement floue dans SSI est 2D. Donc, tout d'abord, laissez-moi juste expliquer le scénario. Donc c'est ma feuille Excel. Dans ma feuille, j'ai ces données, le type d'article de pays, prix unitaire ou unitaire, les coûts unitaires, le chiffre d'affaires total, le bénéfice total, etc. Donc, si vous regardez ce pays pieds dans ce champ pays, j'ai une valeur incorrecte. Par exemple, j'ai ce pays qui s'appelle l'Inde. J' ai donc regardé la valeur de l'Inde est incorrecte, l'orthographe est incorrecte. Fin IEEE, c'est incorrect. Regarde IND I0, I0. Donc ce que je veux faire, je veux regrouper par pays Field. Et je vais prendre une partie du prix unitaire, du coût unitaire, du chiffre d'affaires total, du coût total et du bénéfice total. Mais si je vais le faire, j'obtiendrai la valeur incorrecte car cette valeur de champ de pays est incorrecte, certaines valeurs sont incorrectes. Donc, je ne vais pas obtenir le bon groupe par résultat. D' accord ? Donc, tout d'abord, ce que je vais faire, je vais transformer cet ensemble de données, transformer ce champ de pays. Il y a donc d'autres champs qui sont incorrects. Par exemple, les États-Unis. L' orthographe est incorrecte. D' accord. Qu' en est-il du Royaume-Uni ? Alors regarde, Royaume-Uni. Ok, écoute, k i n, g, d am orthographe est incorrecte, donc en utilisant la confirmation de regroupement floue, je vais corriger ce champ, je vais dans ce champ de pays. D' accord ? Donc, ce qu'il va faire, il va prendre la majorité des valeurs. Ecoute, regarde ça assez l'Inde, alors ça va aller correct, la valeur incorrecte. Par exemple, l'Inde va comparer avec toutes les valeurs, les valeurs majoritaires, les valeurs correctes. Et puis il va corriger cette valeur k, puis cet indium. Donc, il y a d'autres champs, laissez-moi juste les valeurs majoritaires du Canada sont que les valeurs de modalité sont correctes. Certaines valeurs sont incorrectes. Diesel est incorrect. Regarde l'orthographe. D' accord. De même, Australie, il n'y a que 22223 valeurs, ok. Cette valeur d disvalue, LLC. L' orthographe correcte est que c'est un bon, maintenant, je vais lire ce fichier, fichier Excel. Donc, je vais utiliser la transformation de fichier plat, source de fichier plat, désolé pas la transformation ne pas l'étape de la source, double-cliquez sur nouveau navigateur. Donc, je dois d'abord sélectionner le fichier. Ventes. Aussi, je vais fermer ce fichier. Il a déjà fermé. D' accord, les colonnes. Trouver un aperçu avancé. Alors prévisualisez. Alors quoi, puisque j'effectue les opérations GroupBy ou je dois convertir le type de données pour le prix unitaire. Ça devrait l'être, disons flotter. Les coûts unitaires doivent être plancher. Je dois convertir ça. Coût total, flotteur, bénéfice total, flotteur, ok, aperçu. Rechercher des colonnes. Les actes sont les colonnes qui font partie de mon fichier source. Maintenant, ensuite, je vais utiliser cette transformation floue à tâtons. Je vais connecter cela avec ce double-clic de regroupement floue. D' accord. Gestionnaire de connexions, spécifiez le gestionnaire de connexions à utiliser pour stocker des tables temporaires. Utilisation de la transformation des données. Donc, le regroupement floue va créer cette transformation de regroupement floue va créer les tables temporaires. Donc, la dette est la raison pour laquelle vous devez créer la connexion de base de données ici. J' ai donc déjà créé, j'ai déjà sélectionné celui-ci. Colonnes. Ce sont les colonnes. Alors maintenant, quelle colonne vous voulez ? Quelle colonne vous souhaitez corriger ? Je veux corriger cette colonne d'entrée de champ de pays. Cette colonne d'entrée correspond aux données de colonne provenant de l'alias de colonne source vers s2 et de l'alias de sortie grope. Donc Country clean va être d, nom corrigé, ok ? Maintenant tapez, il y a deux types. Correspondance exacte quand il y a une correspondance à 100%. Tout d'abord, la similarité minimale de la molarité doit être 0. D' accord ? Maintenant, les chiffres, donc il y a différentes options, donc je dois expliquer ces options multiples. Donc, d'abord, les nouveaux chiffres nécessaires, de début et de fin ne sont pas significatifs. Je dois expliquer le sens de cette phrase. Vous devez donc regarder cet exemple, spécifier la signification des chiffres de début et de fin dans la comparaison des données de colonne. Par exemple, si les chiffres principaux sont significatifs, d'accord ? Si seuls les premiers chiffres sont significatifs, regardez ces deux valeurs, alors ces deux valeurs ne seront pas regroupées, ok ? La valeur de chauffage est 123 et la valeur de fin est Street. D' accord ? Donc ici, dans ce cas, je vais sélectionner nécessaire en cas de besoin, chiffres de début et de fin ne sont pas significatifs, alors dans ce cas, ces deux valeurs seront regroupées parce que j'ai sélectionné dans aucune des options. Maintenant. D'accord ? Ensuite, j'utiliserai l'option multicast. Activé une option de visionneuse de données. Une vue de données grignoter. Sélectionnez les champs. Actuellement varie les aliments du pays, les aliments propres pays, champ propre va venir ici. Où est le pays pour le design avide ? Est-ce que le champ Pays ? Laisse-moi juste placer le champ de campagne dans les airs. OK, cliquez sur OK. Maintenant, enregistrez cette transformation dans l'exécution. Maintenant, vous allez voir une chose est très importante avant de l'exécuter. Je dois te montrer un pas de plus, ce qui est très important. Double-cliquez sur avance. Celui-ci est fait industrie, je dois cliquer sur cette clé d'entrée avancée, sortie t et la similitude, similitude. Donc, s'il y en a, il y a une correspondance exacte, alors la similitude serait un 100%, presque un 100%. Ok. Et maintenant, je veux régler le nombre de similitudes à 62%, ok ? Délimiteurs de jetons, cela signifie que ces compteurs quotidiens seront pris en compte lors de la correspondance. Ok, onglet espace, chariot, retour, alimentation de ligne. Dans le cas où vous voulez en inclure un peu plus. Tu peux le faire. Vous pouvez ajouter ces délimiteurs ici, d'accord ? Maintenant, 62%, ok, très bien. Cliquez sur OK. Sauvegardez ça. Maintenant, exécutez. Maintenant, vous allez voir le résultat, l'Inde. L' Inde. Ok, très bien. L'Inde. Ce S1 est la vallée incorrecte. Celui-ci est la valeur corrigée. Inde IIA valeur incorrecte, indifférent est la valeur corrigée. D' accord. Et qu'en est-il de la similitude ? La similarité entre ces deux valeurs est de 8379%, similarité en pourcentage est de 79%. Donc, disons que si j'augmente le seuil de similitude, alors que va-t-il se passer ? Permettez-moi d'augmenter la similitude à quatre-vingt-cinq pour cent. Laissez-moi vous montrer le résultat ici. Alors. Ceci et cette intégrale, cette valeur de l'Inde va être traitée comme une valeur distincte. D' accord ? Cela ne sera pas corrigé. Ok, maintenant laissez-moi juste parce que dans ce cas, le nombre de similitudes est supérieur à 82%. Maintenant, laissez-moi juste double-cliquer sur avance et laissez-moi juste diminuer le nombre de similitudes à 62%. Cliquez sur OK. C' est ainsi que vous corrigez votre ensemble de données, qui provient de la source. Maintenant, si vous regardez la valeur des États-Unis, regardez, cela a été corrigé plus tôt. La majorité des valeurs seront prises en compte. Cette valeur est minoritaire, ok, le Royaume-Uni de l'État, le Canada. Qu' en est-il du Canada ? Les valeurs majoritaires sont le Canada qui est corrigé des valeurs, certaines valeurs sont incorrectes, qui seront corrigées par cet algorithme de regroupement floue. Et regardez le chiffre de similitude de 85 pour cent. Ecoute, ça a été corrigé. Cela sera comparé avec les valeurs corrigées et cela sera corrigé par le floue. Regroupement de la consommation Australie, Australie La valeur a été corrigée. Ecoute, l'Australie, c'est la bonne. Les valeurs de la majorité australienne sont correctes, ok. Il y a certaines valeurs qui sont incorrectes. Le seuil de similitude. Maintenant. Et maintenant, si je vais effectuer l'opération GroupBy sur le champ Pays, j'obtiendrai le bon résultat. Au lieu de multidiffusion, j'utiliserai la transformation. Une biotransformation de groupe varie ici la transformation agrégée GroupBy. Ok, maintenant double-cliquez. Je vais regrouper par champ de pays. Et regrouperons par chiffre d'affaires total et coût total profit. D' accord ? Non, propre au pays, je prendrai la valeur corrigée. Ok, laisse-moi juste prendre la valeur corrigée. Pays propre, ce pays est la valeur incorrecte. Country clean est la valeur corrigée. Revenu total, coût total, bénéfice total. Donc un pays que je ne vais pas considérer ce pays. Celui-ci est les valeurs incorrectes dans ce champ. Il y a des valeurs incorrectes. Toutes les valeurs de ce champ sont correctes. D' accord ? Groupby, chiffre d'affaires total, coût total et bénéfice total. Maintenant, cliquez sur OK. Ensuite, je vais utiliser l'opération de multidiffusion, transformation des multicastes de sodium ici. Après cet agrégat activé la vue des données. Ok, le revenu total du pays propre trouve. Enregistré ceci en exécution. Regarde. Pays, Canada, Inde, Australie, États-Unis, Royaume-Uni. Ok, maintenant laissez-moi juste, au lieu d'utiliser les frais propres du pays, maintenant, laissez-moi juste utiliser T. Laissez-moi juste inclure les frais d'autres pays de terrain. Maintenant. Permettez-moi d'exclure ce pays liquide propre est concrètement, permettez-moi d'utiliser la discipline plus librepays plus libre . D' accord ? Maintenant regroupés par pays. Maintenant, vous allez voir les valeurs seront incorrectes. Regardez, qui contient D valeurs incorrectes. Écoute, le Canada trompe en répétant deux fois, plusieurs fois, j'obtiens des résultats incorrects. Ok, c'est ainsi que vous transformez votre ensemble de données de source de données en utilisant la transformation de regroupement floue. Permettez-moi de le changer en pays propre, ce qui est le bon. D' accord. Et maintenant, il a été corrigé. Et maintenant, vous allez voir les bonnes données. D' accord ? Alors maintenant, nous allons discuter du thé pour la recherche. 12. Transformation de TermExtract: Bonjour tout le monde. Dans cette conférence particulière, nous allons discuter de la transformation de l'extraction à deux termes dans SSRI. Oui. Donc, tout d'abord, je vais lire le fichier CSV point e-mail. Donc maintenant tout d'abord, je vais utiliser la source du fichier frac afin de lire le fichier CSV nouveau parcourir, puis je vais choisir ce fichier particulier, les fichiers et je dois sélectionner le fichier CSC. Il s'agit d'un point d'e-mail des colonnes csv. Ce sont les colonnes. ID e-mail, objet de l'e-mail, e-mail, description, e-mail. Ok, donc maintenant ce que je vais expliquer l'ID e-mail, objet de l' e-mail, l'e-mail devrait être 1000. D' accord. Cliquez sur OK, colonnes désert ou colonnes. Très bien. Ensuite, je vais utiliser le terme transformation d'extraction. Ainsi, la transformation d'extraction de terme est utilisée pour extraire les mots anglais fréquemment utilisés. Ok, donc quels mots il va extraire ? Il va extraire l'audit de substantif va extraire des phrases de substantif. Donc, je vais sélectionner celui-ci, ok, Maintenant, je dois connecter ceci sur fondamentalement le but d' utiliser le terme transformation d'extraction est d'utiliser, c'est qu'il va extraire, il va me donner le compte données de noms, données présentes dans ma description e-mail. Donc, puisque dans cet exemple, j'utilise, je vais utiliser la description de l'e-mail comme un champ. Donc, il va compter les mots de nom dans la description de l'e-mail. Donc, c'est l'extraction du temps. La transformation est très utile quand il s'agit de SEO, optimisation des moteurs de recherche. Donc l'extraction de Tom ici, ce que je vais faire, je vais sélectionner le terme e-mail, score ND. Par conséquent, l'email est le terme et la valeur du score sera le nombre de noms. D' accord ? Il y a un problème est que la colonne d'entrée ne peut avoir que ces types de données. Donc, tout d'abord, j'ai besoin de convertir le type de données. Donc, pour la dette, j'ai besoin d'utiliser la transformation de conversion des données de conversion. Laisse-moi enlever cette flèche d'ici. Première conversion ivoire, ce type de données. Ok, alors je vais combiner cette belle conversion de données. Objet de l'e-mail, e-mail. Ok, le type de données devrait être Unicode, copie de flux de texte ou femelle va être d nouvelle colonne. OK, cliquez sur OK. Maintenant, l'extraction du terme, l'ID de l' e-mail, l'objet de l'e-mail, l'e-mail, le terme dans le score. Je dois sélectionner la copie de la colonne e-mail. D' accord ? maintenant configurée, erreur de sortie, règles de redirection. En cas d'échec, rediriger en cas d'erreur, ignorer l'échec. Cliquez sur OK, maintenant je vais sélectionner l'avancée. ce moment, je ne discute pas de cette avancée. Type de terme nom, substantif phrase, nom, une phrase de substantif, je vais sélectionner le nom. Je dois vous montrer le fichier CSV Excel, que je vais lire email dot csv. Donc c'est le fichier que je vais lire. Alors écoute, ça va être l'e-mail, d'accord ? Donc, dans cette colonne de courriel, il va extraire les phrases de substantif, OK, alors ça me donnera le compte. Donc, la valeur du terme sera les phrases de nom et la valeur du score sera le nombre de phrases de nom. Bien, ne sauve pas. Alors. Maintenant, le type de score est la fréquence. C' est le type entérique, type de score, ok, maintenant je vais sélectionner la fréquence. Le seuil de fréquence est de deux, longueur maximale. Ceci est désactivé. D' accord ? Maintenant l'exclusion en ce moment je ne parle pas de ça, OK ? Cliquez sur OK. À la fin, je vais utiliser la multidiffusion. Donc ce seuil signifie Tet. La phrase de substantif doit se produire au moins deux fois. Maintenant, activez la vue des données. Les données activées, nous sommes enregistrés et exécutons cette transformation. Donc, vous allez obtenir d, deux colonnes, terme et SCO. Bien sûr. Ceci est un nom, le marketing est une taxe de nom. Les D se produisent quatre fois, trois fois, deux fois. Maintenant, ensuite, je vais changer quelque chose, d'accord ? Disons trois fois, quatre fois. Alors cette fois autour, il va me donner fait qu'une seule rangée, qui se produit seulement quatre fois. Regardez seulement parce que le seuil est défini comme pour le moment, supposons. Maintenant, il y a une autre option. Laissez-moi juste diminuer le seuil. Regardez, vous pouvez aussi extraire en phrase de substantif. phrase de nom est la combinaison des noms. D' accord ? Ensuite, vous pouvez sélectionner le nom, une phrase de nom, d'accord ? Le seuil de fréquence est de deux. Donc, avec ces deux options, vous obtiendrez la longueur maximale d'un terme, seuil de fréquence et la longueur maximale. Alors gardons les choses simples. Exclusion. Donc disons, si vous, disons, je veux exclure n'importe quel nom, n'importe quel nom. Donc, ce que je vais faire, je vais sélectionner l'OLED ODBC être connexion. Ensuite, je vais sélectionner ma table où l'information est stockée. Les informations sont stockées dans ce tableau. Exclure le mot. J' ai déjà créé table de bureau et j'ai déjà inséré le mot marketing. Maintenant, laissez-moi juste exécuter cette requête. Ok, c'est dans la base de données de dés, donc maintenant je dois exécuter ce marketing. Je veux donc exclure le travail de marketing. Donc, je vais sélectionner le membre de la table, exclure le mot et les mots. Cliquez, OK, sauvegardez ça. Il a le goût va exclure le cours de marketing n phi. Cela se produit quatre fois et c'est un K2 fois. 13. Transformation dans TermLookup: Bonjour tout le monde. Dans cette conférence particulière, nous allons discuter du terme transformation de la recherche dans SSIS. Donc, pour la transformation de recherche de terme, vous devez avoir la table de choix. J' ai donc cette table de recherche, soulignement de terme. Laisse-moi juste exécuter ça. Donc, dans ce tableau, j'ai ID dans le mot recherche recherche transformation dans SSIS va déterminer à quelle fréquence ces mots se produisent dans, dans ma description. Donc c'est l'e-mail de description, que je vais prendre cette colonne, je vais prendre dans ce terme transformation de recherche va déterminer à quelle fréquence ces mots se produisent ici dans cette description, ok ? Par exemple, le liquide vous donne juste un exemple. Marketing. Le marketing se produit combien de fois ici ? Non, 0 fois. Qu' en est-il de ce marketing se produit deux fois ? Ce marketing, dans ce marketing, triomphe, 1, 2, 3, trois fois. Qu'en est-il de ça ? 0 fois, ok, donc il ne va pas considérer si cela se produit 0 fois. Donc la valeur de seuil minimale est un. Maintenant, je vais ensuite lire ce fichier particulier, surtout je veux prendre cette description e-mail. Donc, pour la dette, j'ai besoin d'utiliser la source de fichier plat D. Où est la source du fichier plat ? J' ai besoin d'utiliser cette source de fichier de thread. OK, puis double-cliquez sur nouvelle navigation, les fichiers CSV et les colonnes CSV point de fichier e-mail. Ce sont les colonnes d'aperçu avancé. Je dois augmenter la longueur. Cela va être, disons 1000 colonnes. Ce sont les colonnes. Donc, une autre chose importante est de lire cet e-mail est pris comme un type de données de cet e-mail est chaîne. Afin de transformer la recherche à quatre termes, vous devez avoir le type de données de chaîne Unicode pour la dette, j'ai besoin d'utiliser la conversion de données. Alors, où est la conversion des données ? Donc, je dois utiliser cela parce que la recherche de terme n'accepte que l'e-mail Unicode. Ici, au lieu de ce type de données, je vais sélectionner cet Unicode. Laissez-moi juste sélectionner ce code unique, cette chaîne Unicode, ok ? Copie d'alias de sortie du carême féminin. Je vais spécifier 1000. OK, cliquez, OK. C' est fait de l'industrie. Ensuite, je vais utiliser le terme transformation de recherche. Alors, où est cette transformation de recherche de système ? Donc, laissez-moi juste configurer la transformation de recherche de terme ici. Double-cliquez. Maintenant, la première fois va spécifier la table de référence. Donc ça va être ma table de référence. À partir de ce tableau de référence, je vais extraire les mots et il va chercher dans l'e-mail. Donc, ici, je vais spécifier le terme table de recherche, qui est ma table de référence. Recherche de terme. Ok, alors Tom cherche, ok, très bien. Donc email, laissez-moi juste sélectionner cet e-mail et ces mots. Donc, ces mots seront, ces petits mots seront recherchés dans l'e-mail. D' accord ? À la fin, je vais avoir deux colonnes supplémentaires. L' un est terme dans l'autre est le nombre de ces mots, ok, Par exemple, ce marketing se produit trois fois, donc je vais obtenir la valeur du Km ET compter plus tôt. Très bien. Je veux ce sujet e-mail ID e-mail. Non, je ne veux pas de cet e-mail. Je veux cette copie de la femme. Ensuite, je veux configurer cette section, ignorer l'échec. L' utilisation de F1 leur a donné une recherche sensible. D' accord. Maintenant, cela est fait en gastrique. Ensuite, j'utiliserai l'exécution multicast activée. D' accord. Double-cliquez. Ok, très bien. Laissez-moi juste éditer un GWAS. Je dois augmenter la taille de cette colonne. Maintenant, sauvegardez ça. Je dois rafraîchir les colonnes ici. D' accord, les colonnes. Rechercher maintenant exécuter. Ok, écoutez, j'ai deux colonnes supplémentaires. Terme, qui est le mot dans la fréquence Teradata se produit deux fois. Ici, dans cet e-mail. 14. Transformation agrégée: Bonjour tout le monde. Dans cette conférence particulière, nous allons discuter de la transformation globale en SSI. Oui. Mais d'abord, nous allons discuter des fonctions d'agrégation dans SQL. Donc c'est ma table, la table des employés. Dans mon tableau, j'ai ID, prénom, nom, sexe, pays, chacun, nom de département et salaire. Donc, ce que je vais faire ensuite, je vais savoir a fait nombre d'employés dans chaque département. J' ai ce champ de nom de département. Donc, afin de connaître le nombre d'employés dans chaque département, j'utiliserai le nombre de fonctions agrégées. Donc, à partir de cette pièce d'identité , je vais, je vais prendre en compte ce nombre d'identités. Ensuite, le compte ID est une fonction d'agrégation. Donc ça va me donner le décompte. Alors je vais utiliser le nom du département. Alors je vais utiliser le nom du département. Cela me donnera le décompte sage du ministère. Ok. Nom du département compte, ID, groupby. Je vais grandir sur la base du nom du département, tâtons par nom de département. Je vais utiliser un autre MVE moyen, salaire moyen. Alors je vais utiliser le salaire d min. Salaire moyen de chaque département, salaire minimum dans chaque département. Je vais utiliser le salaire ici. Ensuite, je vais utiliser le salaire maximum minimum. Donc maximum est une fonction d'agrégat. Salaire regroupé par nombre de noms de département. Cela me donnera donc le nombre d'employés dans chaque département, le salaire moyen dans chaque département. D' accord. Ensuite, le salaire minimum dans chaque département et le salaire maximum regroupés par nom de département. Laissez-moi juste exécuter cette requête. Donc ça va le faire, OK, celui-là est le salaire moyen. Comme EVD soulignent salaire. Je dois exécuter ce premier salaire moyen. Ce sera le salaire minimum, F min soulignent le salaire. Celui-ci sera mon salaire maximum. À la fin, je vais trouver le salaire total dans chaque département. Salaire comme porte dire soulignement salaire. Donc, c'est ma requête SQL complète. Chaque salaire, salaire minimum, salaire maximum, salaire total. Chaque salaire est calculé en décimal. Je dois convertir chaque charité en deux décimales. Alors je vais en avoir dix. Exécutez la requête. Regarde deux décimales. Maintenant, je vais utiliser la transformation agrégée dans mon, dans mon AS2 SSI. Celui-ci sera le nombre d'employés. En tant que nombre d'employés. Nombre d'employés. Le département Ba a six employés. Dans notre département a 20 employés. Le département technique en a dix, implique. Ce sont des salaires moyens. Salaire minimum, département de la NBA est de 16 mille. Salaire maximum, département de la NBA 211000. Le salaire total est ceci. Maintenant, je vais utiliser la transformation d'agrégat dans SSI. Oui. Donc, tout d'abord, je vais créer un nouveau paquet. Je vais sélectionner la section Dataflow. Donc, tout d'abord, je vais lire mes données à partir de ce fichier csv dot employé. Ok, c'est mon dossier d'où je vais lire mes données. Prénom, nom, sexe, pays, I-T, nom du département et salaire. J' utiliserai la source du fichier plat. Donc, à partir d'ici, je vais sélectionner la source de fichier plat, destination malhonnête de fichier, source de fichier plat. Je dois d'abord cliquer sur cette 1, puis sélectionner la source du fichier plat. Ok, nouvelle navigation. Ensuite, les fichiers CSV. Je vais sélectionner employé point csv page de code de fichier. Je vais sélectionner ce 112 phi 1. Celui-ci, ok, les formateurs ont délimité le nom de colonne dans les premières données ou trouver des colonnes. Ce sont les colonnes. Aperçu, déshonneurs, mon jeu de données. Ok, ID avancé, chaîne, trouver prénom , nom, sexe, sexe, pays. Chacun. Il devrait être, devrait être une valeur numérique. Laissez-moi simplement sélectionner une valeur numérique. District BY une valeur numérique, nom du département, salaire. Le salaire doit être une valeur numérique. Il doit être une valeur numérique, ne peut pas être une chaîne. Je vais sélectionner le salaire comme type de données numériques. Est-ce que ça va ? Avec le genre, très bien. Id. Laissez-moi simplement sélectionner le numérique ou je peux avoir, je peux, Je peux sélectionner la chaîne IDS, OK. Cliquez sur OK. Vous prévisualisez mon jeu de données. Celui-ci est mon. Jeu de données. Cliquez sur OK. Maintenant, étape suivante consiste à utiliser la fonction d'agrégat varie l'agrégat, la transformation d'agrégat. Où la transformation agrégée est-elle décente ? Je vais sélectionner la transformation d'agrégat, connecter ceci. Maintenant. Je vais d'abord sélectionner, je vais sélectionner le nom du département. Sur la base du nom du département. Je vais regrouper mes données. Donc je vais groupeby je vais effectuer l'opération GroupBy sur le nom du département. Ensuite, je vais sélectionner ID , donc ça va me donner le nombre d'employés. Donc chaque employé a une pièce d'identité unique, accord, maintenant, je vais ensuite sélectionner le salaire. D' accord ? Donc je veux calculer d'abord, je vais calculer la somme salariale totale du salaire dans chaque groupe de département par Dan, je vais avoir je vais prendre un compte. Comte. D'accord. Celui-ci est le nombre d'employés. D'accord ? Le second est le salaire total. Salaire, celui-ci va être celui-ci va être le salaire moyen, le salaire moyen. Ensuite, je vais sélectionner le salaire et le salaire minimum moyen, salaire min. Salaire, salaire maximum. Donc premier compte, somme moyenne, salaire minimum et maximum. Je suis en train de regrouper sur la base du nom du département. Cliquez sur OK. Cette étape se fait dans le district. Ensuite, je vais utiliser l'effort de multidiffusion t, but de test. Alors ce que je veux. Ainsi, la transformation de multidiffusion d'étape de multidiffusion peut également être utilisée à des fins de test. Laisse-moi juste le connecter avec celui-là. Ensuite, modifiez, examinez les métadonnées, puis visualiseur de données et afficheur de données activé. Donc, il va détruire les multicasts. La transformation va m'afficher le jeu de données de disque. D' accord ? Donc, ceci est, cela va être utilisé à des fins de test, nom du département, nombre d'employés, salaire total, salaire moyen min, max. Ce sont les colonnes. Jet sera affiché par cette étape de transformation de multidiffusion. Maintenant, sauvegardez ça. Vous devez enregistrer ce package étape cinq. Laisse-moi exécuter ça. Donc ça va afficher différents écrans midi, dis, ok ? Sortie. Maintenant nom du département, nombre d'employés, six employés, 20 employés dans le département RH, salaire total. C' est chaque salaire, salaire minimum et le salaire maximum look juste besoin d'être affiché dans un bon format. Il doit être affiché en points décimaux en ce moment, regardez. Maintenant, pour afficher cela en deux points décimaux, j'ai besoin d'utiliser l'étape de conversion de données. Fermer. Avant. Avant l'étape de multidiffusion, j'ai besoin d'utiliser l'étape de conversion des données. Alors, où est l'étape de convergence des données ? Laisse-moi juste discipliner. Supprimez ceci. Maintenant, je dois afficher un 102 points décimaux. Aucune conversion de données. Chaque chaise Larry copie de chaque salaire. Cela doit être en points décimaux. Je vais le convertir en décimal, à l'échelle et à la précision. Donc l'échelle est deux. Les procédures ne vont pas sélectionner la précision. Alors, quelle est la précision dans l'échelle ? Quelle est la différence entre ces deux-là ? Précédant est quelque chose comme laissez-moi juste vous donner un nombre a, disons deux à trois points pour, pour la précision sera 1-2-3, 3-5. La valeur de précision sera de cinq, et la valeur d'échelle sera de deux. Il s'agit de deux décimales. Si c'est trois, si c'est comme ça, alors la valeur de précision sera six dans la valeur d'échelle sera trois. C' est donc la différence entre la précision et l'échelle. Maintenant, il sera converti en deux décimales. Cliquez sur OK. Multicast. Maintenant, modifiez les métadonnées. Celui-ci est les métadonnées décimales à l'échelle est à la précision n'est pas cert ok, Vue de données. Donc, ce sont les, ce sont les colonnes ou les champs vont obtenir seront affichés par cela. Non. Nom du département, nombre d'employés, salaire total, salaire moyen. D' accord. Tous les salaires que je vais mettre ici, d'accord ? Salaire minimum, salaire maximum, accord, après ce salaire moyen, puis salaire minimum. Puis salaire maximum. D' accord ? Je vais changer ce nom. Cela doit être changé. Donc à partir d'ici je vais changer ce nom, le salaire moyen. Je ne veux pas utiliser la copie de l'énergie moyenne. Ça devrait être EVG. Salaire. Modifier. Alors, prenez un spectateur. D'accord. Salaire moyen. Laisse-moi choisir celui-là. Salaire total, chaque salaire min salaire et le salaire maximum. Cliquez sur OK, enregistrez ceci. Maintenant, exécutez le paquet. Maintenant, il affichera le salaire moyen en points décimaux. Maximiser ce regard, déshonore le salaire moyen qui est affiché en deux décimales. Regardez les maximes de salaire minimum LED. salaire minimum dans le département ITER est juste 10 mille. Le salaire maximum est de 29 mille. Salaire moyen dans le département marketing a ce salaire total est celui-ci, celui-ci est le salaire moyen. Puis département d'admission, le salaire moyen est ce salaire minimum et maximum, les salaires minimums décès et le salaire maximum est ce. C' est donc le concept de fonction agrégée. Ok, j'espère que vous avez compris le concept. Merci beaucoup et avoir un excellent apprentissage. 15. Transformation du nombre de rangées: Bonjour tout le monde. Dans cette conférence particulière, nous allons examiner un exemple de transformation du nombre de lignes dans SSI. Oui. Donc, avec l'aide de la transformation du nombre de rangées, nous allons enregistrer deux chars. Donc, nous allons enregistrer, enregistrer le nombre de lignes en double. Donc, le nombre de Ricard sera le nombre de lignes dans mon nombre de lignes uniques dans mon, dans mon fichier source. Les lignes dupliquées seront le nombre de lignes dupliquées des lignes dupliquées. Autre puis ces deux attributs, je vais enregistrer l'ID de tâche. Je vais enregistrer l'ID de la tâche, nom de la tâche, l'ID du package, le nom du package. Ensuite, je vais enregistrer le nombre de glucides, les lignes dupliquées, le nom d'utilisateur, le temps de chargement. Donc je vais enregistrer ces attributs de désinformation, d'accord ? Tous ces attributs dans ma table, table de base de données. Donc, maintenant, je vais vous donner un exemple de la façon de trouver des lignes en double dans la table SQL. C' est donc ma même table que je vais utiliser à cette fin. Sélectionnez, exécutez cette requête. Maintenant, afin de trouver les lignes en double, je vais utiliser la fonction d'agrégat appelée count, count coma. Ensuite, je vais utiliser en double. Ok, alors je vais regrouper par attributs DZ groupby. J' utiliserai la clause group by, group par tous ces attributs. Ok, alors exécutez maintenant cette requête SQL. Donc cela va me donner la destruction se produit seulement Valentine détruit un verre deux fois. Cette rangée est un anneau trois fois. Ensuite, je vais filtrer ce résultat. Afin de filtrer le résultat du groupe, je dois utiliser cette clause ayant un nombre supérieur à un. Donc, cela va me donner faire des lignes en double. J' ai donc trois lignes qui sont des lignes en double. Donc détruit se produisant deux fois, détruit se produisant deux fois. La dernière rangée se produit trois fois. D' accord ? Il existe trois règles qui sont des doublons, qui sont des lignes dupliquées. Alors maintenant ce que je vais faire, je vais créer un paquet. Je dois créer un paquet, un nouveau paquet. Donc, je vais nommer ce paquet. Je nommerai ce paquet un enregistrement, un nombre de lignes. Je vais le nommer nombre de lignes. Ok, donc ça va être le nom de mon paquet. Ensuite, je vais sélectionner le flux de données. Cliquez sur cette boîte à outils. Donc, je vais lire les données de ma source Flat File. Laissez-moi vous montrer le dossier que je vais lire. Donc ça va être mon dossier. D' accord. Donc ce fichier a un total de combien d'enregistrements ? Ce fichier a 13 enregistrements. Les enregistrements authentiques sont 556789. Il y a neuf disques authentiques. D'accord. Maintenant, laissez-moi juste Cliquez sur ce, configuré ceci. Ok. Maintenant, sélectionnez, cela implique 02 points de colonnes csv. Ok, très bien. Aperçu. J'ai besoin de changer le type de données aussi. Pour l'identification, je vais la sauver. Non, je vais l'enregistrer en tant qu'entier. Prénom, Nom, chaîne, genre, chaîne, pays h. Pour h, je vais l'enregistrer en tant que numéro de département. Je vais l'enregistrer en tant que valeur entière. Maintenant prévisualiser, prévisualiser. Donc, si je dois sélectionner cette option, signifie que s'il y a une valeur nulle dans mon, dans ma source, a conservé des valeurs nulles de la source en tant que valeurs nulles dans le, donc il va conserver les valeurs nulles. Ok, je ne vais pas vérifier cette option. OK, cliquez sur OK. Comme je ne l'ai pas fait, Il n'y a pas de valeur nulle dans ma table source, fichier source. Maintenant, après cela, ce que je vais faire, je vais utiliser la fonction d'agrégation. La raison pour laquelle j'utilise la fonction d'agrégation parce que je veux séparer, dupliquer les lignes dans mes règles authentiques dans MI Okay, lignes. Je vais donc séparer ces trois lignes en double pour la dette. J' ai besoin d'utiliser la fonction d'agrégat, alors je dois utiliser la fonction de split conditionnelle. Donc agrégé. Donc ce que je fais, je vais me regrouper par ID, prénom, nom, sexe. Donc, avec l'aide de la fonction agrégée, je vais le faire. D' accord ? Ensuite, avec l'aide de la division conditionnelle, je vais appliquer la condition. Cette condition. Maintenant, je vais utiliser la fonction d'agrégat. Double-cliquez. Je vais sélectionner toutes les lignes. Ça va compter tout, ok, regroupés par ID. Très bien. Ensuite, permettez-moi d'élargir ce groupe par ID, groupe par nom a grandi par nom, groupe par sexe, pays H. Je dois grouper par ceci, groupe par groupe par ceci, je vais prendre en compte. D' accord ? Maintenant, cliquez sur OK. Après cela, je vais utiliser la scission conditionnelle, diverses scission conditionnelle, celle-ci. Maintenant, scission conditionnelle. Donc maintenant, je vais utiliser la colonne, ce compte tout, je vais utiliser ce nombre de colonnes tout dans je vais appliquer la condition supérieure à un. Ça va être mon, ok. Ce seront mes héros. La sortie par défaut sera les lignes dupliquées. Lignes dupliquées. Maintenant, cliquez sur OK. Donc, cela va me donner une erreur que le type de données DTU O18, ADT, E14 sont incompatibles. Je dois rendre cela compatible, donc je vais l'utiliser. Laisse-moi juste utiliser ça. Donc, cela va convertir ce type de données, ok, maintenant, plus grand que, moins de deux, moins de deux, ce sera moins de deux. Cliquez sur OK. Après ça. Alors regarde, sortie, ok, moins de deux. Si le nombre est inférieur à deux, alors il va être le nombre de lignes non dupliquées, Laissez-moi juste moins de compter. Donc, d moins de deux. Donc 123456, diva, OK, root, ok. Maintenant, cliquez sur OK. La prochaine fois, nous allons utiliser le pas après la mort. Je vais utiliser l'étape de comptage de lignes, un nombre de lignes. Avec cette étape de comptage de lignes, je dois sélectionner l'étape de comptage de lignes est pas de comptage de lignes. Donc, avant d'utiliser l'étape de comptage de lignes, j'ai besoin de définir deux variables. C' est-à-dire que je dois chercher ça. C' est l'étape du comptage des lignes, d'accord ? Contrôle c et contrôle contre Ok ? Lignes dupliquées. Celui-ci va aller bien. Laissez-moi d'abord alerter ça. Renommez cette liste. Maintenant, sauvegardez ça. Maintenant, afin de configurer ces deux nombres de lignes, Ds à compter de lignes, je dois définir une variable. Pour définir une variable, je dois cliquer sur cette option. Je vais donc définir deux variables. Et donc la première variable sera pour le plaisir, et la deuxième variable sera pour celle-ci. Donc le nombre de Ricard sera ma première variable, le nombre de soulignements Ricard. type de données sera entier. La deuxième variable sera dupliquée. Le nombre de lignes sera ma deuxième variable. Entrez le type de données aura droit à la valeur par défaut sera 0. Maintenant, je dois configurer cela. Le premier sera le nombre d'enregistrements. Le second sera les lignes dupliquées. Donc, dans ce cas, les lignes en double, ils seront trois. Ces trois règles seront dupliquées. Maintenant. Ensuite, après cette étape, je dois y aller, je dois sélectionner la section de flux de contrôle. Donc celui-ci est la tâche de flux de données. Donc, si je vais cliquer sur la tâche de flux de données, cela va m'emmener à cette section Dataflow. Laissez-moi simplement cliquer dessus, pas cliquer dessus. Cela va m'emmener à cette section Dataflow. Donc, une fois que cette tâche de flux de données est exécutée, après cela, je vais utiliser une autre tâche. Cette fois-ci, je vais utiliser la tâche d'exécution SQL. D' accord ? Donc, connectez cette tâche avec méfiance Exécuter la tâche SQL. Alors, qu'est-ce que je vais faire ? Je vais créer une table. Donc, je vais d'abord créer cette table. Laissez-moi créer cette table. Nouvelle, nouvelle requête. Je vais créer cette table, créer une table. Journalisation des tables. Je vais nommer cet ID de tâche de journalisation de table. Dans ce tableau, je vais enregistrer le type de données de l'ID de tâche est varchar 50, nom de tâche, ID de package, nom de package, nombre d'enregistrements, nombre lignes en double, nombre de lignes en double, nom d'utilisateur dans le temps de chargement. Vallée par défaut avec gedit. Donc, si aucune valeur insérée, cela va donner D. Laissez-nous datetime, ok, maintenant, pour exécuter ceci, je dois sélectionner ceci. Ensuite, je dois cliquer sur exécuter. Ceci a été créé, table a été créée, actualisez la base de données. Tables. Cela a été créé avec la journalisation des traits de soulignement de table de noms. Ok, très bien. Maintenant, l'étape suivante consiste à utiliser cet insert dans la journalisation des tables. Je dois donner ce nom, la journalisation de la table. Ok, je dois donner ce nom. Sélectionnez cette journalisation de table, insérez dans la table journalisation ID tâche, nom de tâche variable désert, variables système, ID de tâche, nom de tâche ID de package nom de package, variables système désert, nombre d'enregistrements, tout nombre d'enregistrements en double. Ces deux sont, ces deux sont des variables utilisateur que nous avons créées. Maintenant, laisse-moi juste coller ici. ID de tâche de journalisation de table, nom de tâche, ID de package, nom de package, nombre d'enregistrements. Ici, je vais utiliser ça. Alors que ce record compte, très bien. Ce nombre d'enregistrements unique et pourrait dupliquer le nombre d'enregistrements, d'enregistrements en double, le nombre de lignes en double. Ok, je vais utiliser ça. Donc maintenant d'abord, je dois sélectionner cette connexion d'instruction SQL. Je vais sélectionner cette connexion que j'ai déjà créée. L' étape suivante consiste à sélectionner, pour fournir l'instruction SQL ici. Ici, je vais fournir l'instruction SQL d'abord, laissez-moi simplement utiliser ce nombre de lignes en double. Ici, je vais utiliser pour dupliquer le nombre de lignes. Ok, très bien. Dans le nom d'utilisateur. Très bien. Maintenant, contrôlez C. Et puis je dois payer en tant que président dans ma section de déclaration, section instructions SQL je dois coller cette instruction d'insertion, insérer dans la journalisation de la table. ID de tâche est la variable système Nom de tâche, ID de package, nom de package. Celui-ci est d nombre d'enregistrements, qui est cet enregistrement. Laissez-moi juste ignorer le nombre est la variable utilisateur profonde que nous avons créée. Ensuite, le nombre de lignes en double est également la variable utilisateur que nous avons créée. Dernière variable système ptsd, qui est nom d'utilisateur. OK, cliquez sur OK. Celui-ci est configuré. Ensuite, je dois utiliser ce mappage de paramètres. Ajouter. Le premier est regardé variable système, nom de variable. Donc, le premier est l'ID de tâche. Je vais sélectionner l'identifiant de la tâche à partir d'ici. Je vais sélectionner l'identifiant de la tâche , puis je vais sélectionner Nom de la tâche, nom de la tâche. Troisièmement, je vais sélectionner l'ID du paquet, le nom du paquet. ID du package, qui est représenté nom du package ID. Ok, après cela, je vais sélectionner le paquet nommé dans le enregistrements terminé le nombre d'enregistrements dupliqués, le nombre d'enregistrements. Où l'enregistrement compte-t-il ? Le nombre d'enregistrements ? Il s'agit de la variable utilisateur. Le dernier est dy, dupliqué, nombre de lignes, nombre de lignes en double. Celui-ci est le nom d'utilisateur. Donc, je ne donne pas de valeur de ce temps de chargement car lorsque les données sont, lorsque les données seront insérées dans cette table, automatiquement, la valeur DateTime par défaut sera chargée. Ok, donc, je ne donne pas la valeur de temps de chargement, pas le nombre de lignes en double. Après cela, je vais utiliser le nom d'utilisateur. Le dernier est d username, alors que le nom d'utilisateur, celui-ci est le nom d'utilisateur. Donc, le type de données d'entrée ID de tâche sera varchar. Je dois sélectionner le type de données de nom de tâche varchar sera varchar, ID de paquet Beckett, VARCHAR versus VARCHAR. Le nom du paquet sera plus blanc. Ok, le nombre d'enregistrements est le long, qui est le type de données, ok, nombre de lignes dupliquées long, nom d'utilisateur sera varchar. Ok. Suivant est ce paramètre. D' accord. ID de tâche premier index 0123, ok. Donc 00, puis Nom de la tâche 123456. La septième valeur qui est le temps dilué. Cette valeur qu'il va être, cette valeur sera renseignée automatiquement. D' accord ? Cliquez sur OK. Ceci a été configuré. Donc la prochaine fois, nous allons exécuter ce paquet. Cliquez donc sur ce bouton pour exécuter le package. Pour le package a été exécuté avec succès. Maintenant, je vais vérifier ma table de journal. Donc c'est la table que je vais interroger. Rafraîchissez ceci. Ok, laisse-moi juste sélectionner cette table. Sélectionnez Top 1000 règles. Donc, la table a été remplie. Nom de la tâche, il s'agit du nom de la tâche, ID du package, nom du package, nombre de lignes six lignes uniques, trois lignes en double. Nom d'utilisateur, c'est le nom d'utilisateur et c'est le moment où cette ligne est insérée dans ma table. Maintenant, cliquez sur la section Dataflow. Maintenant, cliquez ici. Maintenant, ce que je vais faire, je vais insérer ces six lignes dans ma table de base de données. Donc, après cette étape, je vais utiliser l'étape de destination OLED DB. Je dois utiliser cette étape ne sera que l'étape de destination DB. Maintenant, configurez ceci. Je vais sélectionner cette base de données, ce gestionnaire de connexion, table ou vue Je vais sélectionner ce nom de table sera que je dois créer une nouvelle table. Donc le nom de la table sera DRG, soulignement, employé. Strait de soulignement. Enfin table. C' est donc le nom de la table. Laissez-moi juste supprimer ce compte tout ce que j'ai pour supprimer ce compte tout numérique. Je dois enlever ça. Ok, très bien. Int, prénom, nom, sexe, pays, chaque ID de département et OK. Cliquez sur OK. Identifiant de mappage, prénom , prénom, prénom, nom, sexe, pays, eeh, OK. Vous trouvez Cliquez sur OK. enregistré ce package. Maintenant, je vais exécuter ça. Encore une fois. Cliquez sur cette option pour l'exécuter. D' accord ? Six lignes ont été insérées. Maintenant, afin de vérifier ma table, je vais d'abord la rafraîchir. Laissez-moi juste vérifier si les données sont insérées ou non. Le nom de la table est DRG souligné cette table finale de soulignement EMP, je dois interroger ce regard. Les six enregistrements ont été insérés, 12346. Ok, ces enregistrements ont été insérés. Ce sont des règles uniques. Ok. Et maintenant laissez-moi juste interroger cette table. Une autre ligne est insérée, un nombre d'enregistrements secoue les lignes dupliquées trois, c'est le nom d'utilisateur. Il s'agit du temps de chargement auquel cette ligne est insérée. Il s'agit de l'ID du package. Nom du package est ce nom de tâche comme ceci. Et le pire du nom du paquet. Celui-ci est le nom du paquet. Je dois vous montrer le nom du paquet d'abord, nombre de lignes, celui-ci est d, nom du paquet. D' accord ? Donc, avec l'aide de l'étape de comptage de lignes, nous avons enregistré deux attributs importants. Nombre d'enregistrements dans le nombre de lignes dupliquées. Les D sont des variables système, d'accord ? Ce sont des variables système. Ces deux variables que nous avons créées. Nous appellerons ces deux variables en tant que variables utilisateur. J' espère que vous avez compris le concept. Merci beaucoup et avoir un excellent apprentissage. 16. Transformation pivot dans SSIS: Bonjour tout le monde. Dans cette conférence particulière, nous allons discuter de la transformation pivot dans l'outil SSAS. Laissez-moi d'abord vous montrer l'ensemble de données. Donc c'est mon jeu de données, identifiant d' étudiant, nom d'étudiant cours intmax. Donc, avec l'aide de la transformation de pivot, je vais présenter mon ensemble de données comme ça, ok ? Donc, la transformation de pivot va convertir les données brutes en données de colonne. Il s'agit donc de la ligne de mise en réseau de données Java C Plus Plus de données désertiques, qui se présente sous la forme de règles. Et il est converti en colonnes, C plus et les marques java dans les marques de mise en réseau. Donc lx a obtenu 100 marks en C plus un. Laissez dire Dieu à 30 mois en Java, NC, 200 marks en réseau. Je vais donc présenter ce tableau comme celui-ci à l'aide de la transformation de pivot. Donc, tout d'abord, je vais créer un nouveau paquet. Je nommerai ce paquet de transformation pivot, paquet pivot 0-6. Je vais limiter la transformation du pivot pivot. Maintenant, tout d'abord, je vais sélectionner la tâche de flux de données. Donc, je vais sélectionner le flux de données. Je vais cliquer ici. Donc, le premier est la tâche de flux de données. Cliquez sur Flux de données. Ensuite, je vais, d'abord, ce que je vais faire, je vais insérer des données dans une table. Donc, tout d'abord, je vais créer une table dans les bases de données SQL Server. Les dés à cette table seront créés dans la base de données de dés. Créez cette table, puis exécutez l'instruction insert. Insérez dans, ok. Maintenant, sélectionnez l'étoile à partir des traits de soulignement source étudiant. Alors maintenant je vais convertir ça. Je vais convertir cette table comme ça, ok ? Comme ça. Maintenant, tout d'abord, laissez-moi juste utiliser la source. Source, base de données, source, base de données, source de données. Ok, maintenant double-cliquez. C' est donc la connexion que j'ai déjà sélectionnée. Maintenant, les données accèdent à plus de table. Donc, je vais sélectionner cette table que je viens créer dans la table Student de soulignement source SQL Server. Ici, je vais sélectionner la table d'étudiant de soulignement source. Il s'agit du nom des colonnes de table et prévisualisez les ID d'étudiant pour les cœurs de nom, intmax, cliquez sur OK. La première étape est faite en saupoudreuse. L' étape suivante consiste à utiliser la transformation profonde du pivot. Je vais donc utiliser la transformation du pivot. D'accord ? Alors je vais connecter ça. Laissez-moi simplement double-cliquer sur cette transformation. Donc, la transformation de sous-pivot de clé pivot a la clé de pivot dans la valeur de pivot. Donc tout d'abord, je vais trier ça. Données sur la base de t. Donc, dans ce cas, je vais sélectionner l'identifiant de l'étudiant comme clé. Donc, sur la base de la carte d'étudiant, je vais commencer mes données, carte d'étudiant. Je vais trier ces données qui viennent de cette table. Maintenant, l'étudiant ID pas de thé pivot dans la valeur pivot. Alors, quelle est la clé pivot dans ce cas ? Pivot, c'est les cours de cours, la clé pivot, d'accord ? Ce cours est le pivot et la valeur du pivot est des mocks. Ce sont les marques. Ok, maintenant laisse-moi juste choisir des cours. La clé privée et la valeur de pivot seront des mocks. Ignorer les valeurs de pivot inégalées et les signaler après l'exécution du flux de données. OK, cliquez maintenant ici je vais sélectionner la sortie des colonnes. Non, maintenant je vais sélectionner Networking. Ok, suintement, je vais sélectionner C plus, plus Java networking. Ces trois colonnes que je vais sélectionner ici. Alors sélectionnez-le. Donc d'abord, je vais sélectionner la mise en réseau. Vous devez fournir les valeurs ici. Puis C plus plus java générer la colonne. Maintenant, cliquez sur OK, non, C plus Java networking. Cliquez sur OK. Donc, cette étape est faite et saupoudrée. Donc, ensuite, je vais cliquer avec le bouton droit sur cette étape de pivot, puis cliquez sur Afficher l'éditeur avancé. Donc ce que je veux, je veux inclure toutes les colonnes, y compris le nom de l'étudiant, ok, carte d' étudiant, nom d'étudiant simulé de cours. Je veux inclure toutes les colonnes, paramètres d'entrée et de sortie. Colonnes d'entrée. Ce sont des colonnes d'entrée. Que sont les colonnes de sortie ? ID étudiant, colonnes de sortie du désert. Je veux aussi le nom de l'étudiant. Donc, ce que je vais faire après l'identification de l'étudiant, je dois déplacer le nom de l'étudiant afin de cliquer sur Ajouter une colonne. Je vais donc mentionner le nom du soulignement de l'étudiant. D' accord ? Je vais cliquer sur le nom de soulignement de l'étudiant. La colonne source est minuscule 1. Voici le nom du tutorat. Je dois cliquer sur le nom de l'étudiant. Et D, l'identification de la signalisation est 20. Cette carte d'identité est 20. Spécifiez la ligne h, idée de la colonne de sortie lorsque cet élément a été placé pour la première fois dans le flux de données. Donc, ce que je veux afin de faire correspondre cette colonne avec cette colonne ici dans d Student un nom, je vais mentionner la colonne Source. Et la quatrième colonne est 20. L' ID de signalisation est égal à 20. Ici, je vais mentionner le nom Puis 20 dans la valeur de la clé de pivot sera 0. Ok, maintenant, StudID désert colonnes de sortie nom d'étudiant C plus max. Je dois changer comme c plus presse mocks, Java mocks. Ok, beaucoup de réseautage. Je dois changer ça. OK, cliquez sur OK. Cette étape est donc configurée. Ensuite, je vais configurer l'étape finale, qui est l'étape de destination de fichier plat. Je dois combiner ce double-clic, nouvelle configuration Flatfile. Cliquez sur OK. Maintenant ce que je vais fournir le répertoire ici, les fichiers de documents SSAS, ok, alors laissez-moi juste créer un fichier couches. Je vais créer un fichier, un nouveau fichier CSV. Je vais créer un fichier CSV a, Je vais double-cliquer sur soins. Je vais donc enregistrer ce fichier en tant que fichier CSV. Double-cliquez sur OK, je dois double-cliquer sur ouvrir ce fichier, enregistrer ce fichier en tant que fichier séparé par des virgules CSC. Csv avec un CSV, TSV, ok, enregistrez ce fichier et le nom du fichier sera pivot. Exemple. Sauvegarde ce silence avec ce nom. D' accord ? Maintenant, supprimez la décision. Ok, très bien. Maintenant, parcourez. Je dois mentionner ce fichier CSV pervert exemple dot csv colonnes de fichier. Ok, les découvertes avancées pour renommer C plus les marques Java, marques de réseau, l'aperçu, les D sont les colonnes de mon, dans mon jeu de données. D' accord ? Je dois mettre à jour les noms de ces colonnes dans le premier flux de données, je dois vérifier cette option afin d'obtenir les noms de colonnes aussi. Maintenant. Ok, très bien. Lac. D' accord. Maintenant, les mappages. Ok, je dois ignorer cette mise à jour du gestionnaire de connexion. Pourquoi je reçois cette colonne supplémentaire. Prévisualiser la carte d'étudiant, ok, très bien. Mappages, nom de l'étudiant, C plus mois, marques Java, marques réseau. Ça va être une carte d'étudiant. Cliquez sur OK, enregistrez ce fichier. Maintenant, je vais exécuter le paquet un clic sur le bouton Démarrer, et le processus est exécuté avec succès. Maintenant, j'ai besoin d'ouvrir le fichier. Donc ce fichier est, écoutez, c'est le fichier que j'ai besoin d'ouvrir de ce côté. Donc maintenant, vous allez regarder les données look id étudiant, nom de l' étudiant, C plus java maths terminées marques de mise en réseau. Les données ont donc été affichées. Maintenant, ensuite ce que je vais faire, donc je vais utiliser la tâche FTP. Donc j'ai besoin de cliquer dessus. J' ai besoin d'aller à Edit Mode contrôle flux après la tâche de flux de données, ce que je Avant, J'ai évolué pour utiliser d tâches FTP. Donc essentiellement travailler, je Avant, quel que soit le fichier est créé ici, Je veux copier ce fichier dans le répertoire FTP étaient de reculer gall il répertoire distant. Ok, donc ça va être mon répertoire local et je vais copier ce fichier sera mon répertoire distant. Je veux donc configurer cette tâche FTP. Alors, comment configurer cette tâche FTP ? abord, je vais connecter la première tâche serait cette tâche pour télécharger des fichiers serveur ELA dans mon système. Donc, je vais télécharger ceci, télécharger et installer ce fichier Zola serveur pour Windows. Donc je l'ai déjà dans mon système. Fichiers interface serveur villa. Je vais ouvrir cette connexion. Je l'ai utilisé. Je vais créer un nouvel utilisateur, ajouter un utilisateur, je l' appellerai évaluer IES soulignement utilisateur est le nom. D' accord. Ensuite, je vais activer le mot de passe. Donc mot de passe va être Edmund 1-2-3 est mon mot de passe partagé, plié. Donc c'est le répertoire. Donc ça va être mon rêve. Plus de directives là-bas. Je vais placer mes fichiers et mon répertoire SQP est ceci. Donc je vais appeler ça comme mon répertoire distant, Ed. Et j'ai un répertoire. Et FDP, SSI est SSAS, fichiers FTP. Ok, donc ça va être mon, ça va être mon répertoire distant. Alors, lisez, je vais donner tous les droits. Supprimer, OK, cliquez sur OK. Et maintenant, ce que je vais faire, je vais ouvrir le SSI. Oui, je vais ouvrir cette poussière. FTP le fait, le premier est la connexion, la connexion FTP. Sélectionnez Créer une nouvelle connexion. Nom du serveur est ce nom de serveur EST un à sept sombres, sombres, sombres. D' accord. Un à sept sombres, sombres, sombres. Le nom d'utilisateur est évaluer IES soulignement mot de passe utilisateur est admin 123. Test de connexion, Test de connexion, Réussite. Cliquez sur OK, puis transférez le fichier local. Donc c'est la partie que je dois fournir mon chemin local. Donc, mon parc local dans ce cas sera celui où ce fichier sera généré. Ok, ça va être mon chemin local. Je dois fournir cette partie ici. Donc, je vais fournir la partie locale ici, nouvelle connexion et naviguer. Et ça va être le dossier, ok ? Pervert exemple de fichier csv dot, puis opération, quelle opération vous voulez effectuer. Donc, vous voulez effectuer des fichiers de réception. Je veux synchroniser les fichiers. Donc, je veux envoyer des fichiers à partir de ce répertoire, à partir de ce répertoire. Donc, quel fichier je veux envoyer ce fichier csv point d'exemple de pivot. La prochaine fois, je vais à l'endroit où je vais envoyer ce dossier. Je vais envoyer ce fichier dans mon répertoire distant, et ceci fait partie de mon répertoire distant. Au cas où j'aurais des dossiers. Je vais, je vais fournir le nom du dossier après cette barre oblique. En ce moment, je n'ai pas d'autres répertoires. Mon répertoire distant, c'est mon répertoire distant savoir dossier est là. Donc écraser un fichier JS de destination. Dans le cas où 5A destination JS, je veux écraser mon fichier. Si le fichier est déjà là, cette option écrasera. Je peux écraser mon fichier avec cette option. D' accord ? Expression. Je n'utilise pas l'expression. Cliquez sur OK. Cette tâche de fichier a donc été configurée. Alors qu'est-ce que c'est, ce qui se passera après cela, après l'exécution de ce fichier de paquet sera créé ici. Celui-ci va être mon fichier de répertoire local sera créé après cela. Une fois que cette tâche de flux de données est exécutée avec succès, cette tâche sera exécutée. Cette tâche FTP enverra ce fichier, enverra ce fichier au répertoire du disque. Je dois vous montrer le répertoire où il va placer le fichier. Il va placer le fichier ici dans ce répertoire de fichiers FTP. Ce sera mon répertoire distant maintenant dans l'ordre. Maintenant, je dois exécuter le paquet ici. C' est ainsi que vous exécutez le paquet. Donc regardez, Flux de contrôle, la tâche FTP a été exécutée avec succès. Regarde, c'est mon répertoire distant. fichier csv point de l'exemple de pivot est créé. Regardez l'identifiant de l'étudiant, le nom de l'étudiant, C Plus maths, Java marque le réseautage mux 200 à 80 à la Turquie. Ok, donc maintenant pour regarder les journaux, je peux aller à la progression. Les D sont les journaux de mon colis. Regarde, commence, finis. Ok, toutes les étapes ont été exécutées avec succès. n'y a pas d'éditeur dans mon exécution. Neuf rangées. Et puis trois routes ont été, trois rôles ont été générés après cette étape. Ok, alors j'espère que tu as compris le concept. Merci beaucoup et avoir un excellent apprentissage. 17. Tranformation UnPivot dans SSIS: Bonjour tout le monde. Dans cette conférence particulière, nous allons discuter de la transformation défavorisée de SSI. Oui. C' était donc le résultat de la transformation du pivot. Laisse-moi ouvrir ce fichier. Donc, avec l'aide d'une transformation inédite, nous allons convertir des colonnes en lignes. Regardez, les D sont les colonnes et nous allons les convertir en lignes. D' accord ? Alors maintenant, je vais utiliser la transformation défavorisée. Tout d'abord, je vais créer un nouveau paquet. C' est donc un exemple de transformation pivot. Maintenant, je vais créer un nouveau paquet et je vais le nommer. Et le nom du paquet est le paquet six. Je vais le nommer exemple de pivot et exemple de pivot. D' accord. Maintenant, je vais cliquer sur Flux de données. Cliquez sur OK. Ensuite, je vais cliquer, je vais sélectionner la source du fichier plat. Ok. Double-cliquez sur le gestionnaire de fichiers plats. Je dois créer un nouveau gestionnaire de fichiers fred. Ensuite, je vais sélectionner un fichier. Alors quel fichier je vais sélectionner, trompé ou fichier que je vais sélectionner. Donc, dans ce fichier, j'ai distribué la forme originale de ces données est la discipline. C' est ça. Laisse-moi juste lire ça. Laisse-moi juste obtenir les derniers résultats. C' est donc la forme originale. Donc, je vais convertir ceci en forme originale, convertir cet ensemble de données en forme originale. Donc ce sera mon cours d'une colonne, et ce seront mes moqs. Ok, maintenant, fermez ce jeu de données. Parcourir et je dois sélectionner ce fichier particulier. Exemple parfait, Dark CSV. Ok, ancien délimité une moitié pour vérifier disque souvent les noms de colonnes dans la première ligne de données, colonnes. Ce sont les colonnes, ok, d que le résultat, aperçu avancé. Non, l'identifiant d'étudiant avancé est un type de données entier. Ok, nom de l'étudiant, maquettes de chaîne , entier, marques Java, entier. Les marques de mise en réseau seront des nombres entiers. Aperçu, cliquez sur OK. Colonnes. Ce sont les colonnes. Je dois prévisualiser mes jeux de données et ce sera mes données. Cliquez sur OK. Ensuite, je vais utiliser la transformation d et pivot. Donc, avec l'aide de la transformation défavorisée, ce que je veux accomplir, je veux convertir mon ensemble de données comme celui-ci, ID d' étudiant pour renommer les blagues de base. Ok, double-cliquez dessus. Ensuite, je vais sélectionner C plus les marques de mise en réseau Java. D sont les champs. Ils sont dans ma colonne de cours, mise en réseau Java end x0 plus, plus, ok. Tous les autres champs comme les ID d'étudiant ne nomment pas intmax. Ces champs, ils viendront chercher. L' option est sélectionnée bureau passé à travers. Ces champs seront passés à travers, d'accord ? Maintenant, ok, colonne de destination. Quelle est cette colonne de destination dans le nom de la colonne de valeur de clé pivot. Dans ce cas, la colonne de valeur de clé pivot sera différente. La clé privée avec la colonne de valeur de clé sera grossière. Donc, je vais donner cours comme valeur clé pivot. La colonne de destination sera des marques. Des marques. Cette colonne sera ma colonne de destination. Ce cours de colonne sera ma valeur de clé pivot. Ces deux champs, ces deux colonnes, identifiant étudiant, nom d' étudiant viendra tel quel parce que j'ai sélectionné pass-through. Cliquez sur OK. Celui-ci est fait et saupoudré. Permettez-moi de renommer ceci et de pivoter la transformation. Et pivoter les données des étudiants. Renommez ceci. Lire les données des étudiants. Je dois sauver ça. Maintenant, la deuxième étape est faite dans aucun domestique. Ensuite, je veux voir le résultat de ma transformation de pivot AN. Donc, ce que je peux faire, je peux utiliser n'importe quelle étape de destination. Comme je peux enregistrer mon résultat dans un, dans un fichier CSV, ou je peux enregistrer mon résultat dans une table de base de données. Ou je peux utiliser l'étape de multidiffusion pour simplement afficher le résultat. Dans ce cas, je ne veux pas stocker ces données n'importe où. D' accord ? Donc, ce que je vais faire, je vais utiliser la multidiffusion juste pour afficher les données. Pour activer l'option d'affichage, vous devez cliquer sur ce signe fléché addict. Et puis vous devez aller à l'option Visualiseur de données, visualiseur de données activé. D' accord ? Ensuite, vous devez sélectionner les colonnes que vous voulez afficher. Donc je veux voir l'identifiant de l'étudiant, le nom de l' étudiant seul avec l'identifiant de l'étudiant, le nom de l'étudiant, je veux voir Goethe et se moquer. Ce sont donc les champs que je veux voir. Ok, ensuite, je dois sauvegarder mon colis sauvegardé, mon colis, les paquets sauvegardés. Maintenant, cliquez sur Exécuter. Maintenant, c'est le résultat que je vais obtenir d'une transformation pivot ID étudiant, Alex, ok, C Plus One AT ce résultat est similaire à ce résultat. Alexnet travail 200 mux. Alex mise en réseau marque 200 et nous allons Java équivaut à 30, Alex C plus, plus max 180. Écoute, Alex C Plus, marque quoi AT ? Ce résultat est très similaire à ce résultat. Maintenant, cliquez sur Annuler, allez à D, une exécution de package a rivalisé avec succès. Cliquez ici pour passer au mode de conception ou sélectionner un débogage profond ou arrêté à partir du mode de débogage. Donc c'est le mode de débogage, ok, cliquez dessus. C' est donc le concept d'une transformation pivot en SSI. Oui, j'espère que vous avez compris le concept. Merci beaucoup et avoir un excellent apprentissage. 18. Changing de dimensions: Bonjour tout le monde. Dans cette conférence particulière, nous allons discuter de la dimension qui change lentement. En outre, nous allons implémenter le SCD Type 1 et Type 2 dans SSI. Oui, je vais d'abord expliquer le concept de changement de dimension. Donc, afin de mieux comprendre le concept, considérons ce tableau. Cette table, ID employé. Dans ce tableau, j'ai le nom d'employé dans l'état. Ce sont donc les employés. ID d'employé 1-0. 0-1, le nom d'un employé est Alan et il vit à New York. De même, Georges en employé et vit à Los Angeles. Disons que George a décidé de déménager de Los Angeles à Chicago. Donc ce que je dois faire, je dois conserver les données de George dans mes données historiques historiques de George dans mon entrepôt de données, ok ? Dans ce cas, la dimension changeante est l'état. L' état peut être changé pour Bob à chaque fois que Bob peut passer de Chicago à n'importe quel autre état. Donc, le changement, la colonne changeant est l'état. D' accord ? Disons que George a décidé de déménager de Los Angeles à Chicago. Donc, cette valeur avec la valeur changeante, cette colonne est la colonne changeante, ok ? Donc, la valeur actuelle sera Chicago, dans la valeur historique sera Los Angeles. Donc ce que je veux, je veux maintenir les données historiques de cet employé George. D' accord. Nous avons donc trois types STD, SCD type 0-1, 0-2, NSZD type 03. Dans SCD type 01, nous ne conservons aucune donnée historique. Nous mettons juste à jour la valeur actuelle. La valeur actuelle est Chicago et la vallée précédente est Los Angeles. Donc, la valeur actuelle est, sera mis à jour. Regardez, donc regardez, ma table deviendra comme ça car c'est SCD type 01 où nous ne conservons aucune donnée historique dans SVG type 0 à NSS, je suppose que nous avons un concept de date de début et de date de fin. En outre, nous conservons les données historiques en utilisant l'état actuel. Alors regarde, George. L' ancien état était Los Angeles à partir de cette date pour dicter qui vivait à Los Angeles en ce moment, il vit à Chicago. Il s'agit de la valeur actuelle. D' accord ? Donc, nous pouvons, nous pouvons implémenter le type SCD 0 à avec l'aide de la date de début et la date de fin. En outre, nous pouvons implémenter SCD type 0 dans SSI est avec l'aide de l'état actuel. C' était l'ancien statut et celui-ci est le statut actuel. Dans SCD type 03. Nous avons maintenu l'état précédent. C' est l'état précédent. Dans celui-ci est l'état actuel, et celui-ci est la date d'entrée en vigueur. Donc, un à 2005. C' est la date où George a déménagé à Chicago. Donc, ce sera d. Date d' entrée en vigueur. Maintenant, dans cette conférence particulière, je vais implémenter SCD type 01 dans SCD type 0 dans SSI, Oui. Donc, tout d'abord, j'ai besoin de créer des tables. J' ai besoin de créer ma table source. Alors regardez, tout d'abord, je vais créer cette table, créer une table de soulignement source de table table table employé. Je vais créer cette table dans SSAS. Le nom de la base de données est dy, donc cette table sera créée dans l'état du nom de l'employé de la base de données de dés. Laissez-moi juste exécuter cette commande de table, create table commande. La prochaine fois, je vais exécuter ces trois commandes. Insérer dans les commandes. Copier coller ces commandes. D' accord ? Toutes les données seront insérées. Les données ont été insérées. Nous désélectionnez instruction pour interroger les données de la table des employés de soulignement source. Laissez-moi juste interroger la table. Donc ça va être ma table source. D' accord ? Maintenant, après ce que je vais faire, je vais créer une table de dimensions, table type SCD 0-1. Donc, ok, maintenant je dois créer une table, ma table cible, SCD type 01, ID employé pour l'état du nom d'employé. Donc maintenant tout d'abord, je vais implémenter le type SCD 01 dans STD. Permettez-moi de répéter le concept de SCD type 01 dans SCD type 01 V ne maintenez aucun historique. On met juste à jour les données, d'accord ? Nous venons de mettre à jour la dette actuelle. Et maintenant cette table est vide, en ce moment. n'y a pas de données dans ma table SCD type 01. Maintenant, tout d'abord, ce que je vais faire, je vais utiliser la source de l'équipe. Je vais utiliser la source de base de données, qui source LE DB. Laisse-moi juste glisser et déposer ici. Ok, le nom du projet est Std. Double-cliquez. Donc, ce sera la table de connexion. Le nom de la table sera la table source. Je dois sélectionner ma table source. Donc mes tables source, soulignement source impliquent la table. Donc ça va être ma table source. Ce sont les colonnes, ID employé, nom, État, cliquez sur OK. Celui-ci est configuré. Ensuite, je vais copier la transformation de dimension qui change lentement. C' est donc la transformation construite dix transformation en SSI. Oui. Donc, avec l'aide de cette transformation, je vais seulement implémenter SCD type 01, SCD type 02. OK, double-cliquez, cliquez sur Suivant. Donc celui-ci est le gestionnaire de connexion, gestionnaire de connexion de base de données, table ou vue. Je dois sélectionner la table ou la vue. Pour la table, je vais sélectionner ma table cible, ma table de dimensions. Cette table. Cette table, table SCD type 01, dans cette table, ok ? Employez ID , ça va être ma clé de métier. Ok, ça va être mes affaires. Cliquez sur Suivant. Maintenant, attribut fixe, changement d'attribut en attribut historique, disons si je sélectionne l'attribut changeant. Donc changer d'attribut signifie Ted, j'implémente SCD Type un, attribut historique moyenne stat. J'implémente SCD type 0 sur cet attribut. Nom de l'employé. Le nom de l'employé sera mon attribut fixe. Je ne peux pas employer le nom ne peut pas être changé. D' accord ? Le nom de l'employé ne peut pas être modifié, mais l'employé peut passer d'un état à un autre. Donc état NBA, changement de dimension, changement de colonne et maintenant état, donc je dois avoir deux attributs changeants de l'état peut changer d'attribut ou une colonne changeant ici, ok, d est deux attributs. Donc, le premier sera la clé d'entreprise, le second sera d attribut fixe qui ne peut pas être modifié. Le troisième sera l'attribut modifié. Ok, maintenant j'implémente le type D STG 0-1 abord échoué la transformation si les changements sont détectés dans l'attribut de cinquième style, disons que si je fais quelques changements dans le nom de l'employé, donc cela ne fonctionnera pas, cela me donnera une erreur . Échec de la transformation. Suivant. Ok, ensuite, finis. Alors regardez, la logique a été implémentée automatiquement, changeant lentement la logique SCD Type un a été implémentée. Maintenant, je vais vous montrer ma source dans ma table de dimensions, SET une table. Donc c'est ma table source, et celle-ci est ma table de dimensions. ce moment, c'est vide. Donc, quand la première fois que je vais exécuter ceci, exécutons ceci. Donc, il va remplir la table de type SCD 01. Il a été exécuté avec succès maintenant, toutes les lignes seront insérées. D' accord ? Les données seront identiques. Non, les données seront identiques. Ok, 1001. D'accord. Maintenant, ce que je veux, je veux faire quelques changements dans ma table source. Donc, je vais utiliser cette commande de mise à jour. Je veux mettre à jour ma table source. Et la raison pour laquelle je mets à jour ceci, je suis en train de mettre à jour l'état. Donc, de Los Angeles, George a déménagé à Chicago. Donc je vais changer ce Chicago, mise à jour. Ces données ont été mises à jour maintenant exécutées. Regarde dans ma source. Les données sont Chicago dans, dans mon, dans ma cible ou dans un, C, D type CD 01 table. Statistiques de Los Angeles. Donc, ce que je veux, cet état devrait être mis à jour dans mon, dans ma table cible aussi. Laissez-moi juste exécuter ce paquet à nouveau. Maintenant, puisque j'implémente un CD de type 01, il mettra automatiquement à jour la table cible, la colonne d'état. Donc maintenant, le paquet a été exécuté avec succès. Maintenant, exécutez. Regardez Chicago, ceci a été mis à jour, la valeur a été mise à jour. C' est donc un exemple de type SCD 0-1. Ensuite, je vais implémenter le SCD Type deux avec la date dans SCD Type deux largeur, état de largeur. Donc, d'abord, je vais créer cette table cible. Je dois d'abord créer cette table cible. Donc, ici, je vais créer cette table cible. Donc, ce sera mon SVG type 0 à ce jour, je suis en train d'implémenter cette date. La table a été créée. Ensuite, contrôler C et coller chaise. Ok, en ce moment ma table cible est vide. État, date de début et date de fin. Maintenant, je vais implémenter les champs de date de type SCD 0 à largeur. Maintenant. Ensuite, devez sélectionner la table. D' abord. Je dois sélectionner le type SCD, cette table, la table STD à ce jour, ok ? La clé d'entreprise sera l'ID implicite. Donc c'est ma table de dimensions. Cette table que je sélectionne cette table de dimensions, d'accord ? Maintenant, trouvez le suivant. Ici. emploi du nom sera l'attribut fixe, celui-ci sera l'attribut historique, ok ? Celui-ci sera D attribut historique. Laisse-moi te montrer ma cible. L' utilisation du nom sera l'attribut fixe. Celui-ci sera la clé de l'entreprise. État sera l'attribut historique. D2 le sera. Entrez. Dans. Ensuite, je vais vous montrer où ça viendra. Ok, attribut historique, attribut fixe implique le nom suivant, suivant. Ok, heure de début, je dois commencer et date de fin. Donc, dans ce particulier, dans ces deux champs, dans le second champ, je vais obtenir des valeurs nulles. Le premier champ, je vais obtenir la date et l'heure actuelle. Ensuite, la prochaine finition. Je dois d'abord sauver ça. Regarde. Je dois d'abord sauver ça. Maintenant, je vais exécuter ce paquet. Donc, en ce moment, cette table est vide. Il va se peupler. Cette table, ok, maintenant, regarde, tout ce qui a été inséré. La date de fin sera nulle, différente sera D current_date. Ok, ensuite, ce que je veux, je veux mettre à jour ma table source de Chicago. Disons que je vais définir ça comme Ellie. Disons que George a déménagé dans un lac. Maintenant. Ecoute, celui-ci est un lien, malhonnête Chicago. Maintenant, exécutez ceci à nouveau. Exécutez à nouveau. Maintenant, exécutez ces deux tables. Regarde, date de début, date de fin. Regarde. Dist est la valeur actuelle, la date de début et une date de fin est la valeur NULL. Donc en ce moment, George emménage. George vit à Los Angeles. D' accord. Celui-ci était l'ancienne valeur. Ok, commencé et terminé. Donc, ceci est un exemple de SCD type 0 à largeur début, date et fin. Maintenant, je vais vous montrer un exemple de SCD type 0 à l'état de largeur. Donc, puisque je veux maintenir le statut, donc je vais utiliser cette table. Ok, maintenant laisse-moi juste copier ça. Je vais créer une nouvelle table. table Statut actuel a été créée. Avec succès. Copiez simplement cette table. Ok, maintenant, double-cliquez sur Suivant. Cette fois-ci, ma table cible sera désarmée. Tableau d'état, Statut actuel. Celle-ci sera la clé d'entreprise, ID employé. Cliquez sur Suivant. Ok, impliquer le nom, l'attribut fixe, l'état. Celui-ci va être l'attribut historique. Très bien. Ensuite, ensuite, ok, cette fois, je vais sélectionner cette valeur un courant d'évent. Courant. Donc la valeur actuelle, nous serons représentés comme courant. Sa valeur d'exploration, sa valeur d'inspiration peut être représentée comme actuelle ou fausse. Je vais donner expiré. Maintenant, vous devez sélectionner une valeur dans la colonne pour indiquer le, OK. Je dois sélectionner cet état actuel. Cliquez sur Suivant, Suivant, Terminer. Donc, cela a été configuré SCD type 0 à l'état de largeur. Ecoute, je dois d'abord exécuter. Donc, quand la première fois que ce paquet est exécuté, quand la première fois que les yeux sont insérés, je vais obtenir l'état actuel. Toutes les valeurs auront le statut actuel. Ok, maintenant je vais mettre à jour ce Los Angeles à Chicago. Changeons ça à Chicago. Ceci a été mis à jour. Ok, maintenant regarde. Exécutez Luke George. C' est ma table source. Regardez le test actuel Chicago. Encore une fois, exécutez le paquet. Stark. Maintenant. Encore une fois, regardez expiré et l'état actuel est Chicago en ce moment. Georges vivant un Georges vivant à Chicago. Donc, c'est ainsi que vous implémentez le type SCD 0 à l'état de largeur. Donc, avec l'aide de SCD type 0 à V maintenir les informations historiques. Nous conservons les données historiques. D' accord. C' est ainsi que vous avez stocké les données historiques dans votre base de données. Merci beaucoup et avoir un excellent apprentissage. 19. Exemple de transformation de colonnes à importer et d'exporter: Bonjour tout le monde. Dans cette conférence particulière, nous allons discuter de la transformation des colonnes d'importation et d'exportation dans SSI. Devine. Donc, tout d'abord, je vais vous donner un exemple de transformation de colonne d'importation. Alors laissez-moi simplement créer un nouveau paquet d'abord. Donc, laissez-moi simplement sélectionner les transformations de colonne d'importation. Je vais sélectionner la section Dataflow. Cliquez sur ce bouton et Toolbox. Je vais sélectionner la transformation de colonne d'importation. Laissez-moi simplement cliquer sur la transformation de colonne Importer. Donc, avec l'aide de la transformation de colonne d'importation, que pouvons-nous faire pour importer la transformation de colonne lit les données à partir de fichiers dans Ed deux colonnes dans un flux de données. Laissez-moi vous donner un exemple ici. Donc, quels fichiers cette transformation de colonne d'importation peut lire ? Il peut lire n'importe quel fichier, il peut lire un fichier texte. Il peut lire un fichier MP4, un fichier JPEG JPEG ou un fichier CSV. Il peut lire n'importe quel fichier, d'accord ? Ces trois fichiers doivent donc être lus par transformation de colonne d'importation. Il stockera les données dans une colonne de sortie de flux de données du flux de données. Donc, tout d'abord, laissez-moi juste utiliser la lecture, lire la source Flat File. Ok, source de fichier plat. Je dois configurer ceci. Donc ce que je veux, je veux, je veux donner les noms. Mais tout d'abord, laissez-moi simplement créer un fichier texte, un nom de fichier. Dans ce fichier texte, je vais enregistrer les bouteilles D fichiers. Le chemin de ce fichier particulier est que vous devez cliquer sur le bouton Maj, puis vous devez cliquer avec le bouton droit de la souris sur le pot de copie basé sur. Donc ça va être mon premier employé point CSC, très bien. Ensuite, je vais enregistrer le décalage du fichier disque, appuyez sur Maj, puis cliquez avec le bouton droit de la souris Copier la partie S. Donc ça va être ma deuxième partie. Maintenant, je vais sauver ma troisième partie. Donc, cette fois, je vais obtenir la partie de ce fichier MP4 appelé ps pot. D' accord ? Maintenant, donc je dois enregistrer ce fichier. Donc, tous les chemins ont été définis dans cette partie, dans ce fichier particulier. Maintenant, ce que je vais faire, je vais configurer cette première étape, connu gestionnaire de fichiers plat. Alors je vais vous fournir le chemin. Je vais sélectionner ce phi d SSID particulier est. Laissez-moi juste sélectionner la partie ici. Importer des fichiers, ce fichier plat, ok, colonnes, nom de colonne. Dans la première rangée. Non, il n'y a pas de colonne dans mon dossier. Aperçu. Donc, s'il n'y a pas de colonne, ce SSI est réglé, donnera automatiquement cette colonne, colonne 0. Donc ce sont les chemins dans mon fichier. Cliquez sur OK. Colonnes. Ok. Celui-ci sera la colonne de sortie. Vous pouvez le nommer des données. Cliquez sur OK, cette option est configurée. Ensuite, je vais utiliser la transformation de colonne d'importation. Je dois donc sélectionner la transformation de colonne d'importation ici. Celle-là. Alors je dois combiner ça. Ok, double-cliquez sur cette entrée et cette sortie. Donc celui-ci est l'entrée. Sélectionnez cette entrée, entrée et sortie. Laissez-moi simplement sélectionner l'entrée. Donc celui-ci va être l'entrée. Et je dois définir la colonne d'oeuf de sortie. Ce sera les données de sortie. Maintenant, je dois mapper cette entrée à la sortie. Afin de mapper l'entrée à la sortie, je dois fournir l'ID d'âge de la ligne. Dans ce cas, l'ID d'âge de ligne est pour cette colonne d'entrée ID d'âge de ligne est ceci. Je dois donner l'idée de l'âge limite de ça. Donc, l'ID d'âge de la ligne est 24. Qu' en est-il de ça ? Je dois fournir manuellement l'ID d'âge de la ligne. Maintenant, cette colonne et cette colonne, ces deux colonnes sont mappées. Ok, alors quelle colonne d'importation fera ? La colonne d'importation va stocker les informations dans la colonne de sortie. Dans cette colonne. Ok, il va stocker les informations. Quelles informations ? Ces données de disque de fichier impliquent des données CSV point sur la vallée point JPEG dis données d'image dans ces données MP4, il va stocker ici. D' accord ? Le type de données est l'image, d'accord ? Cliquez sur OK. Suivant ce que je veux après avoir stocké les informations dans la colonne d import, Je veux charger les données dans mon, dans ma base de données. Donc, pour charger les données, je dois utiliser la destination Wally DB. Étape. Recherchez un nom de table. Je dois créer notre table. Tout d'abord, je vais créer une table. Afin de créer notre table, j'utiliserai cette commande. Créer une table. base de données dit dés. Je dois sélectionner le fichier de base de données membre var char 500 fichier de données est VAR binaire max. Cliquez donc sur OK. Il a été créé. Sélectionnez l'étoile dans ce tableau. Sélectionnez l'étoile dans ce tableau. ce moment, cette table est vide. Ok, très bien. Laissez-moi juste configuré ce nom de table est. Tableau de données. Ok, mappages, fichier, ok, données sources. Et celui-ci est d Phi Limb. Le second sera Delta. Celle-ci sera les données que je vais stocker ici. Ok, je vais le stocker maintenant. Impressionnant. Donc, cela a été configuré null. Je vais exécuter mon paquet. Donc regardez, c'est le sous-paquet a été exécuté avec succès. Maintenant, exécutez ce regard. Celui-ci est un fichier de données t, qui est stocké sous la forme de var binaire. Celui-ci est le chemin exact du fichier et définit LIM. Ok. Maintenant, je veux récupérer ces trois fichiers. Donc, ce que je vais faire tout d'abord, laissez-moi simplement supprimer les fichiers DC de mon dossier parce que je veux récupérer ces trois fichiers de ma base de données. Maintenant, afin de récupérer ces données, je vais utiliser t import et non pas exporter la transformation de colonne. Maintenant, je vais utiliser la transformation de colonne d'exportation d'importation. Donc, créez un paquet. Cette fois-ci, je vais utiliser la colonne d'exportation. Donc, tout d'abord, niveau, utilisez le flux de données. Cliquez sur cet outil SSIS. Je vais utiliser la source de base de données OLED. Ensuite, je dois d'abord sélectionner une table. Celui-ci va être mon membre de fichier de table dans le fichier de données, ces deux autres attributs. La prochaine fois, nous allons utiliser la colonne d'exportation. Colonne d'exportation, transformation de plusieurs colonnes d'exportation. Je dois sélectionner la colonne d'exportation. Double-cliquez sur, extraire la colonne, la colonne que vous voulez extraire I1 pour extraire le fichier de données, colonne chemin de fichier. Celui-ci défini est le chemin défini. Donc, cela va être souillé chemin dans ce va être d delta. Celui-ci est la partie des données et malhonnête souillé. D' accord ? Donc, maximisez cela, autorisez la force rose, tronquer, écrire l'ordre des octets. D' accord ? Ces deux-là, je vais sélectionner ces deux-là. La raison pour laquelle je ne sélectionne pas cela parce que les données sont déjà tronquées. Je ne vérifie pas cette option car les données sont déjà tronquées. Maintenant, je dois enregistrer ce paquet 08 est mon, est le nom de mon paquet. Exécutez simplement le paquet. Vous verrez des données dans le dossier. Les données ont été exportées à l'aide de la transformation de colonne d'exportation. Donc, à partir de cette table, fondamentalement, à partir de cette table, j'ai exporté des données. Ecoutez, ces trois fichiers ont été exportés. Laisse-moi ouvrir ce fichier. Tout va bien. Donc, ce sera le fichier image JPEG fichier, qui est un, qui a été exporté, et ceci est d MP4 fichier. J' espère donc que vous avez compris le concept de transformation de colonne d'importation et de transformation de colonne d'exportation dans, en SSI, Oui. Merci beaucoup et avoir un excellent apprentissage. 20. Transformation de copiage, de colonnes et de Column,Derived: Bonjour tout le monde. Dans cette conférence particulière, nous allons apprendre à créer une copie de colonnes. Il existe donc différentes transformations qui peuvent être utilisées afin de créer une copie de colonnes. Donc, tout d'abord, ce que je vais faire, je vais lire pour mes jeux de données. Donc ça va être mon ensemble de données. Donc, ce que je vais faire, je vais créer une copie des ventes, profit et du nom du produit. Laisse-moi fermer ça. Maintenant. Je dois sélectionner ma source. Donc, tout d'abord, je dois utiliser la source de fichier plat pour obtenir l'ensemble de données. Je dois créer un nouveau gestionnaire de connexion, parcourir CSV. Je vais sélectionner les colonnes de produits soulignées source. Aperçu avancé. Je dois sélectionner Product ID doit être un type de données entier. Permettez-moi juste de changer le type de données de cette série devrait être un virgule flottante. Le virgule flottante proposé doit être un virgule flottante. Ok, révision. Donc ça va être mon ensemble de données. Colonnes. Ce sont les colonnes identifiant nom, pays, ville, ventes et profit. Donc, ce que je vais faire, je vais utiliser pour dériver la transformation de colonne. Donc, avec l'aide de la transformation de colonne dérivée, non seulement je peux créer une copie de colonnes, mais je peux également effectuer des transformations. Donc, avec l'aide de cette expression dans cette section, je vais, je peux effectuer une transformation ou sur mon jeu de données, sur mes colonnes. Donc, tout d'abord, ce que je vais faire, je vais sélectionner, ajouter une nouvelle colonne. Je veux créer une copie, ajouter une nouvelle expression de colonne. Donc x va créer un nouveau, il va créer une nouvelle colonne. Donc je ne le suis pas, je n'en prends pas une copie. Je crée une nouvelle colonne. Dans la colonne Nouveau, ce que j'ajoute, j'ajoute, cela échoue. Donc ça va être mon expression. Donc nom de colonne dérivé, quel sera le nom sera, quel sera le nom de colonne dérivé ? Copier. Les ventes seront Mon nom. D' accord. Le deuxième que je vais créer, ajouter une nouvelle colonne, profit, puis copier le profit. Donc fondamentalement ce que je fais, je crée une nouvelle colonne et en effet une nouvelle section de colonne que je suis en train d'éditer. Je mets ces valeurs de profit, valeurs colonne de profit. D'accord ? Le type de données est flottant, d'accord, tel qu'il est. Cliquez sur OK. Maintenant, je vais utiliser la transformation de multidiffusion t. Maintenant, je ne suis pas, je n'insère pas mes données n'importe où, donc j'utiliserai la transformation multicasts juste à des fins de test. Affichage des données activé, double-clic, visualiseur Geta, nom de l'ID du produit, pays, ventes de la ville. Laisse-moi juste mettre les ventes ici. Profit. Alors je dois mettre des ventes. Ok, attendez, les ventes alors je dois mettre une copie du profit des ventes, une copie du profit, ok, maintenant, cliquez sur OK. Je dois sauver ça. Commencez. Non, regarde. Ventes, copie des ventes, profit, copie du profit. C' est ainsi que vous pouvez créer une nouvelle colonne. Valeurs d'entrée, souvent colonne existante. Double-cliquez maintenant. Alors ce que je vais faire ensuite, je vais transformer cette colonne des ventes. Ok, alors secouons. Je veux multiplier cette valeur de vente par 12. Je veux obtenir les ventes mensuelles, attendues, annuelles, d'accord ? Donc, les ventes annuelles et le bénéfice ELE. Je vais multiplier cela. Donc maintenant je dois utiliser la ronde, je veux arrondir mon, mes champs D à Coulomb. Donc ici, je vais utiliser cette expression ronde. D'accord ? Je dois utiliser l'expression ronde ici. Colonnes Ventes. Je vais mettre des ventes. Ensuite, je multiplierai la vente par 12. Ensuite, je vais utiliser la terre deux décimales. Ok, très bien. Alors je vais utiliser la ronde avec cette ronde. Ici, je vais utiliser le prophète. Multipliez par le profit par 12, puis la terre devrait être deux décimales. OK, cliquez sur OK. Maintenant, exécutez le paquet. Maintenant, regardez à 1.386. Le profit s'abstient d'un profit et d'un profit annuel que ces deux points décimaux. Ok, le maximum est de deux décimales. Donc, voici comment vous pouvez créer une copie de vous pouvez, vous pouvez créer une nouvelle colonne et vous pouvez effectuer, voici comment vous pouvez effectuer la transformation sur un, sur une nouvelle colonne. Maintenant, pas ce que je peux faire ensuite. Au lieu de la transformation de colonne dérivée, j'utiliserai la transformation de colonne de copie. Donc, copie de la transformation de colonne va créer une copie de colonnes. Ok, alors qu'est-ce que ça fait ? Il s'agit essentiellement de créer une nouvelle colonne. Cela crée une nouvelle colonne, qui est celle-ci dans. J' ajoute des valeurs, souvent une colonne existante, puis je multiplie les valeurs par 12. Donc, avec l'aide de la transformation de colonne de copie, je ne peux que créer une copie de colonnes. Je peux créer une copie d'une seule colonne ou je peux créer une copie de plusieurs colonnes. Maintenant, au lieu de la transformation de colonne dérivée, j'utiliserai la colonne de copie. Non, supprimez cette transformation. Nulle part est la colonne de copie ici. Je vais utiliser la transformation de la colonne de copie. Non. Double-cliquez. Maintenant, je vais utiliser la colonne de copie, disons le nom du produit. Je veux utiliser ce nom de produit. Je souhaite créer une copie de ce nom de produit. Ok, aussi les ventes et les bénéfices DC-3, copie de la visionneuse de données multicast, ok. Elle lui a permis de voir le nom du produit, le nom du produit, la copie des ventes, la copie du profit. Ok, sauvegardez ça et commencez. Donc, dans la transformation de colonne de copie, je ne peux pas faire de transformation. Je peux simplement créer une copie de look copie du nom du produit, copie des ventes, copie du profit. Ok, maintenant ce que je vais faire, je vais utiliser la transformation de la carte des caractères. Laissez-moi simplement utiliser le caractère, ma transformation de la carte des caractères d'approximation. Alors laissez-moi juste le supprimer, double-cliquez. Ainsi, la transformation de la carte de caractères, transformation de carte corrigée est utilisée sur le type de données de chaîne. Et laissez-moi simplement fermer ceci et je dois rechercher ici la carte des caractères, la transformation, regarder la carte des caractères, appliquer des fonctions de chaîne sur les données des caractères. Par exemple, convertissez à partir de données en majuscules ou en minuscules. Donc, si je dois convertir mes données de chaîne en majuscules ou minuscules, je peux utiliser la transformation de la carte de caractères. Par exemple, nom du produit. Donc, dans mettre les destinations de noms de produits chroniqueurs, je crée une nouvelle colonne. Si je sélectionne ceci, cela va mettre à jour la colonne existante, mais je veux créer une nouvelle opération de colonne. Quelle opération je veux effectuer ? Je peux, je peux convertir ce nom de produit en majuscules, minuscules. Ce sont des opérations différentes. D' accord ? Disons que je veux convertir cela en majuscules Cliquez sur OK. Et la copie d'alias du nom du produit. D' accord ? Donc, c'est ainsi que vous utilisez la transformation de la carte de caractères avec l'aide du caractère mon approximation, je ne peux effectuer que des transformations sur un type de données de chaîne. Quelles transformations ? Voici la liste des transformations que je peux, je peux effectuer sur le type de données String. Donc, je peux créer une copie, mais en même temps je peux mettre à jour la colonne existante, accord, si je sélectionne ceci, donc cela va mettre à jour la colonne existante. Cela ne créera pas de copie, donc je voulais créer une copie, donc je vais sélectionner Nouveau. Cliquez sur OK. Maintenant, sélectionnez cette double-cliquez. Modifier, Vue des données, nom du produit, pays, ville, ventes, profit et copier le nom du produit. Cliquez sur OK. Je dois sauver ça. Maintenant, exécutez le paquet. Maintenant, vous verrez regarder copie du nom du produit. Donc non, ce que je vais faire ensuite, je vais utiliser ce changement en place. Donc, cela va mettre à jour la colonne existante. Maintenant, exécutez ceci, nous allons convertir les valeurs de colonne existantes en majuscules nom du produit, ordinateur, téléphone mobile. Donc, si vous devez appliquer spécifiquement, si vous devez effectuer les transformations en minuscules ou en majuscules et que vous devez créer une copie de colonnes, alors vous pouvez utiliser la transformation de la carte de caractères, d'accord ? Copier la transformation de colonne va simplement créer une copie. Alors que la transformation de colonne dérivée avec LPA, transformation de colonne dérivée, je peux faire plusieurs transformations. Je peux le faire, je peux utiliser plusieurs fonctions. Je peux, je peux utiliser des fonctions mathématiques, je peux utiliser plusieurs fonctions différentes, des fonctions chaîne, des fonctions de datetime, ou cette transformation me donne plusieurs options, ok ? Les opérateurs de type saisir les fonctions, les dysfonctionnements. Ok, ici je peux effectuer la transformation sur mes colonnes. J' espère que vous avez compris le concept. Merci beaucoup et avoir un excellent apprentissage. 21. Échantillonnage et de tranformation d'échantillonnage des pourcentages: Bonjour tout le monde. Dans cette conférence particulière, nous allons apprendre à prendre des échantillons de données à partir de l'ensemble de données original. Laissez-moi d'abord vous montrer mon ensemble de données d'origine. Donc c'est mon ensemble de données d'origine, les enregistrements de ventes point csv. Donc, dans ce dossier particulier, j'ai total. Combien de disques ? Total ? J'ai 100 000 disques. Ok, donc ce que je veux, je veux prendre, je veux prendre quelques exemples de données de cet ensemble de données original. Quelques règles simples. Ok, donc ce que je peux faire en SSI c'est que je peux soit utiliser la transformation d'échantillonnage des règles, celle-ci a augmenté la confirmation d'échantillonnage, soit je peux utiliser la transformation d'échantillonnage en pourcentage. Ok, donc de cette façon, je peux obtenir des exemples de données D à partir de l'ensemble de données original. Ok, maintenant, pour commencer, je vais lire ce simple fichier csv dot Records. Donc, ce fichier est situé dans les cheveux dans mon, dans ce répertoire. Ok, maintenant, tout d'abord, je vais utiliser la source de fichier D plat. Ok, où est la source Flat File ? Je dois d'abord utiliser cette source de fichier plat. Ok, double-cliquez sur configuré cette étape, nouveau, naviguez et sélectionnez les fichiers CSV. Donc celui-ci est mon dossier. Ok, colonnes, noms de colonnes dans la première ligne de données, très bien. Ce sont les colonnes de mes fichiers. Celui-ci est ma région de données d'origine, type d'article de pays, la commande, la date de commande. Je dois changer le type de données à ce jour. Laissez-moi juste changer le type de données. Ce sera la date, numéro de commande, la date d'expédition. Ce sera la date d'échéance. C' est la date. Ok, chaque unité vendue, ça va être la valeur entière pour différents prix unitaires. Ce sera le coût unitaire en virgule flottante. D' accord ? Coût unitaire, flottant, chiffre d'affaires total est en virgule flottante. C' est donc la raison pour laquelle je change le type de données. En virgule flottante Le bénéfice total est également en virgule flottante ou gardé prévisualiser les jeux de données et c'est l'apparence du jeu de données, ces valeurs sont en virgule flottante. C' est la raison pour laquelle j'ai changé les colonnes de type de données k. Ok, tous les mappés sont configurés, OK. Cliquez sur OK. La première étape est configurée. Ensuite, je vais utiliser la transformation de l'échantillonnage Rho afin d'obtenir des règles de dissemblance. D' accord ? Ok, double-cliquez sur le nombre de règles du nombre de règles que vous voulez obtenir à partir de la source. Dix lignes, disons si je spécifie 200, donc je vais avoir 200 règles aléatoires, ok ? Précisons dix. Donc à partir de cet ensemble de données, je veux, je veux seulement dix règles sur, sur 100 000, je vais, je vais avoir seulement dix règles au hasard Ruth. Donc, l'exemple, celui-ci sera les lignes d'échantillon. Celui-ci sera l'autre sortie. Ok, colonnes. Donc ce sont les colonnes. Très bien. Ensuite, je vais utiliser l'étape de multidiffusion. Cette étape, je vais utiliser pour obtenir des données D pour afficher les données. Ok, je vais vous fournir cet échantillon de Rho. Ça va être sorti, d'accord ? Cette sortie sera disponible en multidiffusion D. Je veux donc également prévisualiser mes jeux de données. Je vais activer l'option de visionneuse de données. Ok, donc ça va s'afficher, ça va me donner dix lignes aléatoires. Donc, en ce moment, cette option n'est pas cochée. Donc maintenant à chaque fois que j'exécute ce paquet, je vais obtenir un ensemble de données différent. Donc, la première fois, disons si j'exécute le paquet, donc je vais obtenir les dix lignes, copier les données, laissez-moi simplement coller mes données ici. Donc, je vais avoir la ligne de dix au hasard, d'accord ? Total des revenus, coût total. Quand la prochaine fois que j'exécuterai ce paquet, j'aurai des règles différentes, d'accord ? Donc, je vais obtenir un jeu de données différent. D' accord ? C' est le comportement aléatoire, donc je vais obtenir des données au hasard. Cette fiable, obtenir dix autres règles. Cette fois-ci. L' ensemble de données sera différent. D' accord ? jeu de données Asie est différent. Maintenant, et si je permettrai juste d'activer cette option ? Alors, que faire si j'ai activé ces options de graine aléatoires ? Donc, si je donne la valeur un, donc cette valeur de graine aléatoire est définie comme un. Donc, cette valeur sera utilisée dans un, dans un algorithme. Alors maintenant, quand je vais, disons dix lignes, laissez-moi juste cliquer. D' accord. Alors, quel est le but de cela ? En utilisant la même graine aléatoire sur la même entrée, générez toujours le même échantillon. Je vais expliquer la phrase. Spécifier des semences aléatoires n'est recommandé que pendant le développement et le test de l'emballage. D' accord ? Donc, si vous effectuez, si vous êtes, si vous faites des tests, vous pouvez utiliser cette option. Maintenant, puisque j'ai défini la valeur un, exécutons le paquet et voyons le résultat. Ok, je vais obtenir ce résultat. Laissez-moi juste copier le résultat ici. Donc, lorsque la prochaine fois que je vais exécuter le même paquet, j'obtiendrai le même résultat. La raison pour laquelle je vais obtenir le même résultat parce que la valeur de base est définie comme un, je vais obtenir le même résultat. C' est donc le sens de cette phrase. Ok, maintenant, sauvegardez ce paquet. J' obtiendrai les mêmes résultats. Peut regarder, copier des données. Ecoute, j'aurai le même résultat. Ok, regarde. Maintenant, après ce que je vais faire, je vais changer la valeur de la graine. Alors passons à deux. Maintenant, je vais obtenir un résultat différent, d'accord ? Donc, je vais obtenir dix Ruth au hasard, mais ce sera différent des lignes précédentes, précédentes. Regardez cet ensemble de données est différent. Copier. Laisse-moi juste coller ici. Ok, cet ensemble de données est totalement différent. Maintenant, après ce que je vais faire, je vais à la place de la multidiffusion, je vais utiliser l'audition, je vais utiliser la fonction d'agrégat. Laisse-moi juste enlever ça ici. Je vais utiliser la fonction d'agrégation. Agréger des règles simples, d'accord ? Ensuite, je vais utiliser la multidiffusion, d'accord ? Donc, je vais agréger sur la base du pays. D' accord ? Je veux un coût unitaire, revenu total, un coût total, un bénéfice total, mais je veux regrouper par pays. Je veux effectuer l'opération de somme. Ok, regarde bien. Échantillons de rangées, je vais augmenter le nombre de fruits, disons 500 lignes. Je veux 500 rangées d'échantillons. Je veux effectuer l'agrégation sur ces 500 exemples de règles. Donc, si je vais effectuer l'agrégation sur 100 mille lignes, cela va prendre tellement de temps. Donc, je vais effectuer l'opération de test sur 500 lignes, exécuter le paquet. Donc, le paquet a été exécuté, mais je dois configurer l'option de visionneuse de données Activer. Ici, je vais choisir, ok, très bien. Ici, je vais sélectionner, ok, disons un. Très bien. Maintenant, exécutez le paquet. Regarde. Pays. Coût total, chiffre d'affaires total, coûts unitaires, chiffre total, coût total et bénéfice total. La prochaine fois, nous allons utiliser le pourcentage d'échantillonnage. Une autre transformation pour obtenir l'exemple de jeu de données. Cette transformation est connue sous le nom d'échantillonnage en pourcentage. Laissez-moi simplement créer un nouveau paquet ici. Donc, je vais utiliser, j'utiliserai le même jeu de données. Et cette fois, je vais utiliser la transformation de l'échantillonnage en pourcentage profond. Fichier plat tombe très peur pour la source. D' accord ? Maintenant, je vais utiliser l'échantillonnage. D' accord. Laisse-moi juste fermer ça. Oui, je dois fermer ceci maintenant je vais utiliser l'échantillonnage en pourcentage. Ok, pourcentage de Ruth, 1%. Laisse-moi juste ouvrir mon jeu de données. Donc, dans cet ensemble de données que j'ai, j'ai 100 mille lignes. Donc, je veux obtenir 1% de mon jeu de données. 1% devient 1000 règles. Donc je vais avoir environ 1000 règles. Donc, je ne vais pas sélectionner cette option, ok, prochaine fois que nous allons utiliser l' multidiffusion échantillon d' étape de multidiffusion. D' accord ? Donc impossible les données, nous sommes option. Donc, je vais obtenir environ 1000 règles. Il pourrait être plus de 1000 ou moins de 1000. D' accord ? Ok, combien de rangées ont ? Ont obtenu, il est toujours en cours d'exécution. Il est, il est 970 lignes. J' ai 970 rangées, ok ? Lorsque la prochaine fois que je vais exécuter ce paquet, il va me donner des lignes différentes. Ok, regardons le nombre de lignes ici. 991 cette fois, il m'a donné 991 règles. Ok. Changons-le à 2, 2% pour cent. C' est environ 2 000. Cliquez donc sur OK. Donc, cela va me donner autour, cela ne va pas me donner exactement 1002 mille lignes. D' accord. Cette fois-ci, il m'a donné combien de lignes ? 2033 règles. Il pourrait être plus de 2 000 ou moins de 2 000. D' accord ? Donc c'est l'échantillonnage en pourcentage, 2% de l'ensemble de données, qui est, soit environ 2 000, ok ? Maintenant celui-ci est ma deuxième entrée qui n'a pas été configurée. Donc, si je sélectionne ceci, donc utiliser la graine aléatoire à elle va utiliser la valeur de graine pour générer les lignes aléatoires. Donc, en ce moment, la valeur est définie comme un. Cliquez sur OK. Ok, maintenant cela va me donner le même résultat à chaque fois que le paquet est exécuté, cela va me donner le même résultat. Regarde 0-6 trois, encore une fois, je vais exécuter le paquet. Cela va me donner le même résultat. Si je veux un résultat différent, je dois changer la valeur de semence. Regardez 2063, j'ai besoin de changer la valeur de la graine afin d'obtenir un résultat différent. Ok, maintenant aussi, donc cela va me donner maintenant, cela va me donner le résultat différent parce que la valeur de la graine est modifiée. Regarde 19, 5-4, ok, ça pourrait être plus de 2 000, R0 pourrait être moins de 2 000. Il s'agit d'un échantillonnage en pourcentage. Fondamentalement, nous avons besoin d'échantillons de données pour effectuer des tests. Cliquez donc sur OK. C' était donc le concept de l'échantillonnage en pourcentage et de l'échantillonnage en rangée. Dans l'échantillonnage en ligne, nous fournissons la valeur exacte de la ligne, ok, dans l'échantillonnage en pourcentage, nous obtenons le pourcentage. Par exemple, si elle est de 2%. Donc, je vais aller à 2% de l'ensemble de données total pas exercer. Il pourrait être plus de 2 %, un peu plus que, ou il pourrait être inférieur à. Ok, j'espère que vous avez compris le concept. Merci beaucoup et avoir un excellent apprentissage. 22. BulkInsertFinal: Bonjour tout le monde. Dans cette conférence particulière, nous allons discuter de la tâche d'insertion en vrac dans SSIS. Donc, lorsque vous allez créer un package, vous devez cliquer sur la section Contrôle du flux. Vous n'avez pas besoin de cliquer sur la section Flux de données. D' accord ? Après cela, vous allez aller dans la boîte à outils D SSIS, puis vous devez cliquer sur la tâche d'insertion en bloc. Donc, en utilisant la tâche d'insertion en vrac, nous allons charger des données dans un SQL Server, ok ? Par conséquent, l'insertion en bloc charge les données d'un fichier directement dans un SQL Server. Alors quel fichier nous allons charger ? Je vais charger ce fichier csv point employé. Donc, nous utilisons généralement la tâche d'insertion en vrac quand, quand nous devons charger un énorme volume de données, ok ? Donc, l'avantage de l'utilisation de cette tâche est TAT. Nous n'effectuons aucune transformation. Donc, lorsque nous devons charger des données sans effectuer de transformation, nous utilisons cette tâche d'insertion en vrac. En outre, cette tâche d'insertion en vrac est très rapide, ok ? Maintenant, nous pouvons également insérer, nous pouvons également charger des données en utilisant la tâche de flux de données. Mais avec la tâche de flux de données, il y a une option d'effectuer la conformation. Donc, nous pouvons également effectuer la transformation dans une tâche Dataflow, mais avec la tâche d'insertion en bloc, nous ne pouvons pas effectuer. Ok, maintenant ce que nous allons faire, nous allons d'abord créer une table. Donc pour cela, je vais utiliser ce script. Si la table n'existe pas, elle va d'abord créer une table. D' accord ? Si la table existe, elle ne créera pas de table. Il va ensuite insérer des données dans une table. Donc, tout d'abord, avant d'utiliser la tâche d'insertion en vrac , d' abord, je vais utiliser D Execute SQL tâche, ok ? Double-cliquez dessus. Donc, vous devez configurer cela. Exécuter la tâche SQL, ok, nom Exécuter SQL. D' accord ? Maintenant connexion type O, L E D B connexion. Vous devez sélectionner une connexion. C' est donc le nom de ma connexion à la base de données. Bases de données, dés. Ok, alors je dois, je dois fournir l'instruction SQL ici. Ici, je vais fournir cette instruction SQL. Il s'agit de l'instruction SQL. Copiez ceci et collez la chaise. Ensuite, vous devez cliquer sur OK, ceci est fait et saupoudrée. Cliquez sur OK, cette tâche a été configurée. Laissez-moi vous montrer mes écoles, mon scénario. Regardez, c'est l'étoile de sélection de script à partir de ce nom de schéma de données et ceci est le schéma de table t. Laisse-moi juste garder ça. Exécutez ceci. Si, si cette table existe, si cette table existe, le nom de la table est, permettez-moi juste de fournir le nom de la table. Laissez-moi juste ouvrir le SQL d'exécution et laissez-moi juste changer le nom de la table membre de la table. Laissez-moi le changer pour me laisser juste changer pour aller, vélo, EMP, soulignement, contrôle de la table C et nom de la table est ceci. D' accord ? Donc ça va être le nom de ma table. Ok, très bien Click, OK. Fin Clic. D' accord. Ensuite, je vais utiliser la tâche d'insertion en vrac. Si cette table existe, je dois utiliser cette table. Trouve. Exécuter. Si cette table existe, alors elle ne va pas créer, elle n'exécutera pas cette instruction, ok ? Si cette table n'existe pas, elle exécutera cette instruction create table. Maintenant, je vais combiner la première tâche. Pour la deuxième tâche, je vais configurer la tâche d'insertion en bloc ici nommée déconnexion. Maintenant, je dois fournir la connexion ici. Celui-ci, je vais avoir déjà créé la déconnexion, pas besoin de créer une autre connexion. Ok, table de destination. Donc c'est la table où je vais charger mes données. Donc ce sont des tables, sont les tables qui sont déjà présentes ici dans ma base de données de dés. Je ne peux rien écrire ici, ok ? Donc, je n'écrirai rien. Format est spécifié OK, délimité par ligne, contrôle OK., LF. La colonne délimitée est un fichier séparé par une virgule point-virgule. C' est le fichier séparé par des virgules que je lis. Laissez-moi juste éditer ce fichier. Ok, c'est le fichier que je vais charger. Très bien. Dossier, quel dossier ? Et je veux charger nouveau, sélectionnez un fichier que je veux charger dans ma table de base de données. Ok, très bien. Options. Donc ma première option est ROC, la pourriture de la page de code. Donc, comme nous le sommes, nous lisons un fichier brut, point d'employé CSV. Il s'agit d'un fichier délimité par des virgules. Donc je vais avoir ce type de fichier de données d'option pour TXT, pour les fichiers texte, nous allons avoir cette option char, ok ? Donc, si nous le sommes, si nous importons des données à partir d'une base de données, à partir d'une base de données, ce sont des options différentes que nous pouvons utiliser. Donc, nous pouvons sélectionner l'option native ou nous pouvons sélectionner les autres options, ok, taille de lot 0. Alors, quelle est la signification de cette taille de lot ? La taille du lot signifie que supposons que si vous avez un 100 enregistrements que vous voulez charger. Donc, si vous allez donner la valeur 0, cela signifie qu'après le chargement d'un 100 enregistrements, il effectuera l'opération de validation. Disons. Si vous allez donner la valeur 10, donc cela signifie la dette. Après, après avoir chargé dix enregistrements, il va effectuer le, IT va effectuer l'opération de validation. Ok, Donc c'est la signification de la taille du lot, puisque je veux effectuer l'opération de validation une fois que toutes les données sont chargées dans ma base de données, je vais donner les options 0, dernière ligne de la première ligne. La première ligne sera la ligne d'en-tête. Donc, je vais commencer le chargement à partir de la deuxième rangée. Donc, je vais donner de la valeur deuxième, dernière ligne. Donc, si vous voulez charger toutes les données, vous allez donner la valeur 0. Disons que si vous voulez charger dix lignes, donc je vais donner la valeur 10. Donc, dans ce cas, je vais donner la valeur 0. Ce sont donc des options différentes. Ici, nous avons des options comme les contraintes de vérification. Ce sont différentes options que vous pouvez donner. Gardez les valeurs nulles comme il est, ok. Maintenant, si vous voulez trier vos données, mais c'est une option ici, vous allez spécifier la valeur de la colonne. D' accord ? Ce sont des expressions supplémentaires d'option différentes. Maintenant, cliquez sur OK. Il y a donc une erreur. Vous devez spécifier des noms de table. Donc, afin de spécifier un nom de table, vous devez cliquer avec le bouton droit de la souris. Ensuite, vous devez sélectionner les propriétés. Donc, à partir d'ici, vous allez sélectionner cette option nom de la table de destination. Donc je vais fournir ce membre de table. C' est le nom de la table où je veux charger mes données. Donc je vais fournir cette table. Maintenant. Vous devez enregistrer ce paquet. Vous devez double-cliquer sur cette connexion de package. Ecoute, tu peux voir la table de destination, ok ? Maintenant, cliquez sur OK, enregistrez ceci et exécutez le paquet. Il semble qu'il y ait une erreur. D' accord ? Laissez-moi vérifier quel est le paramètre d'erreur pas correct. Donc, l'erreur est d'entendre cette requête, accord, j'ai besoin de vérifier à nouveau quel est le problème ici. Nom de la table, ok ? Je dois spécifier ce nom de table ici. Exécuter, sélectionnez l'étoile dans ce tableau. Donc, les données ont été insérées dans mes tables de destination de table une différence comment vous insérez des données dans une table à partir de, à partir d'un fichier texte. Ainsi, vous pouvez utiliser la tâche d'insertion en bloc lorsque vous en avez deux. Ensuite, vous devez charger un énorme volume de données et vous voulez de la vitesse, et vous voulez charger en un minimum de temps. C' est donc le concept. J' espère que vous avez compris le concept. Merci beaucoup et avoir un excellent apprentissage. 23. Conteneur ForLoop: Bonjour tout le monde. Dans cette conférence particulière, nous allons discuter t pour le conteneur de boucle dans SSIS. Donc, tout d'abord, je vais sélectionner la section de flux de contrôle. Ensuite, je vais sélectionner la boîte à outils SSIS. Dans la boîte à outils SSIS, j'irai dans la section Conteneurs. Je vais sélectionner le conteneur for-loop à partir d'ici. Il suffit de glisser et de déposer ceci pour le conteneur de boucle. Donc, pour Loop Container est juste comme la boucle FOR dans le langage de programmation. Il va se comporter de la même manière que la boucle par défaut dans le langage de programmation. Donc, dans cette conférence particulière, je vais vous donner un exemple de conteneur de boucle. Donc c'est ma table d'employés. Et laissez-moi juste interroger cette table. Donc, ce que je vais faire avec le conteneur de suivi est que je vais extraire les ID d'événement. Donc, le temps t est l'ID d'événement 16 est 128 ID pair. Donc, je n'extrairai que l'ID pair, les ID de cette table d'employé. Ensuite, je vais insérer des données dans mon soulignement DRG, soulignement d' employé, tableau final de soulignement. Laisse-moi juste sélectionner ceci. D' accord ? Donc, je vais utiliser le conteneur for loop ici, ok, à l'intérieur du conteneur for loop, j'utiliserai la tâche de flux de données. Sélectionnez cette option. Ensuite, je vais utiliser la tâche de flux de données à l'intérieur du flux de contrôle pour le conteneur de boucle. Donc, vous juste à la tâche de flux de données soins, laissez-moi juste configurer ceci pour la boucle, pour le conteneur de boucle. Pour configurer le conteneur de boucle, je vais définir une variable ici. Donc le nom de la variable sera, disons compteur. Donc compteur va être le nom de la variable. La portée est cette variable quatre est limitée à ce conteneur. Le type de données est entier, la valeur par défaut est 0. Donc, double-cliquez sur ceci pour le conteneur de boucle. Maintenant, le temps d'initialiser cette variable de compteur, expression initiale. Je vais écrire comme ceci à, donc c'est comme ça que vous définissez, c'est ainsi que vous écrivez une variable à l'intérieur de l'éditeur de boucle par défaut, compteur. Donc, ce sera le nom d'une variable. Il s'agit d'une variable égale à 0. Évaluer l'expression. Ça va être la condition. Donc, je veux que cela pour la boucle soit exécuté 50 fois à un compteur inférieur à égal à 50. Ensuite, affectez l'expression au compteur égale compteur plus 2. Donc, puisque je veux seulement les règles d'événement, même les ID, donc je vais utiliser cette valeur de compteur, compteur plus 2. C' est donc la variable. Ici. Je dois écrire comme cette annonce, accord, au comptoir plus 2. Très bien. Cliquez sur. D' accord. Ceci est configuré. Maintenant, je vais configurer cette tâche de flux de données. Donc, à l'intérieur de la tâche de flux de données, j'utiliserai la seule discipline de source DB ou LED source. Ensuite, je vais sélectionner la destination. Celui-ci est la source ici, je vais sélectionner cette génération de test. Ensuite, je vais configurer ceci. Il est déjà configuré. Tableau ou vue ou poids Q. Celui-ci est l'éditeur source. Donc, ce que je vais faire, je vais sélectionner la commande SQL. Au lieu d'utiliser la table ou la vue, j'utiliserai la commande SQL ici. Ce que je vais faire, je vais utiliser la valeur du paramètre ici. Donc, sélectionnez l'étoile dans ce tableau. Leur ID est égal à 2 points d'interrogation. Donc, la tige disco Mach est la valeur variable. Je vais donc coller ce discours. Le Danemark sera la valeur variable. J' utiliserai la valeur du paramètre ici, qui sera le compteur. Laisse-moi juste utiliser le compteur. Variable. Discounter. Cliquez sur OK. Colonnes, ce sont les colonnes. Ensuite, je vais configurer la partie de destination. Laissez-moi juste configurer cette table en vue ici je vais sélectionner le trait de soulignement DRG enfin table. Maintenant, laissez-moi juste sélectionner UTR G souligner la table finale, le tableau final de soulignement de l'employeur est celui-ci. D' accord ? Maintenant, les mappages, trouvez ce sont les mappings. Cliquez sur OK, enregistrez ce flux de contrôle. Tu dois sauver ça. Maintenant. moment, cette table est vide. n'y a pas de données à l'intérieur de cette table. Donc, ce qu'il fera, il ne fera qu'extraire, cette partie va extraire les lignes paires. Et ce OLED être destination va insérer leur temps l'employé soulignement enfin table. Ok, maintenant je vais exécuter cette cartographie, ça va, paquet. Exécutez ce paquet. Le package a été exécuté avec succès. Il est en cours d'exécution. Ok, maintenant juste exécuté avec succès. Maintenant, je dois vérifier ma table cible finale. Les données sont insérées. Regardez, toutes les routes sont égales. Toutes les idées sont égales. Deux. Ok, 48, 50. Laisse-moi juste tronquer cette table. Très bien. Maintenant ce que je vais faire, cliquez ici. Maintenant, je vais changer les valeurs ici. Compteur égal à 0, compteur inférieur à égal à 10. Maintenant, il va seulement insérer des lignes de 0 à 10, seulement augmenté de 0 à 10. Il est en cours d'exécution. Maintenant, cochez sélectionner l'étoile de TIG soulignement employé final. Ecoute, seulement cinq rangées, 246810. Ok, donc c'est comme ça que vous utilisez le conteneur de look par défaut. Alors merci beaucoup et avoir un excellent atterrissage. 24. Conteneur de boucle Foreach: Bonjour tout le monde. Dans cette conférence particulière, nous allons discuter du pour chaque conteneur de boucle dans SSIS. Donc, quand nous devons traiter plusieurs fichiers, nous utilisons par défaut chaque conteneur de boucle. Laissez-moi vous montrer les fichiers que je vais traiter. Je vais donc aller dans mon répertoire ici, je vais chercher mes fichiers. Mes fichiers sont présents dans ce répertoire, ces deux fichiers, donc je vais traiter ces deux fichiers. Donc, je vais utiliser le pour chaque conteneur de boucle. Tout d'abord, j'irai ici. Ici, boîte à outils SSIS. Je vais utiliser le pour chaque conteneur de boucle, il suffit de faire glisser et déposer ceci pour chaque conteneur de boucle. Maintenant, je vais définir une variable ici. De là, je vais définir une variable. Le nom de la variable sera, disons que le chemin sera le membre variable. Ensuite, le type de données sera chaîne. La valeur de cette variable sera le chemin d'accès. Sélectionnez simplement un fichier, Maj, appuyez sur Maj, cliquez avec le bouton droit. Ensuite, vous devez cliquer sur Copier en tant que partie. Après cela, vous devez coller le chemin ici. D' accord ? Donc, cela va être une valeur de variable D. Ok, très bien. Ensuite, ce que vous allez faire, vous allez double-cliquer sur ceci pour chaque conteneur de boucle. Ensuite, vous devez sélectionner l'expression de collection. Vous devez savoir, vous n'avez rien à sélectionner. Il suffit de sélectionner ceci. Vous devez sélectionner pour chaque énumérateur de fichiers. Il y a plusieurs énumérateurs. Donc, puisque nous lisons plusieurs fichiers et que nous voulons traiter plusieurs fichiers, donc je vais sélectionner ceci pour chaque fichier et numérateur. Donc maintenant, dans la configuration du numérateur ici, je vais fournir le chemin. Donc le chemin est celui-ci. Ça va être la partie. Il suffit de le parcourir. Et le répertoire d. Ok, laisse-moi juste coller le chemin ici. Après la dette, vous devez spécifier le fichier que vous souhaitez traiter. Donc, cela va traiter tous les fichiers qui sont présents soins dans mon, dans mon répertoire. Donc, si je vais spécifier un fichier spécifique, comme je peux le faire comme ce CFE, il va spécifier qu'il va traiter uniquement les fichiers CSV. Je veux traiter tous les fichiers qui sont présents dans mon répertoire en ce moment j'ai deux fichiers. Cette option, quand je vais vérifier cette option, ce qu'ils sont assez faire une recherche rapide dans les dossiers, ok, si nous avons un dossier ici, disons si j'ai plusieurs dossiers. Nous avons donc plusieurs fichiers à l'intérieur des dossiers. Ensuite, nous devons vérifier cette option maintenant, je n'ai aucun dossier, aucun répertoire à l'intérieur de ce répertoire, aucun dossier à l'intérieur de ce répertoire. Donc, je ne vais pas vérifier cette option, le nom et l'extension nom complet va seulement spécifier ce mappage de variable entièrement qualifié. J' ai déjà créé une variable. Une variable est celle-ci, elle va cartographier avec l'indice zinc 0. Donc, le premier va être D. Part va être la valeur d'une variable. OK, maintenant, cliquez sur OK, il est configuré. Ensuite, ce que je vais faire, je vais utiliser la tâche de flux de données. Donc ce que je fais, je vais traiter ces deux fichiers et je vais charger ça. Je vais charger les données de ces deux fichiers dans ma table, dans ma table SQL Server. Donc, ensuite, j'utiliserai la tâche de flux de données à l'intérieur de ceci pour chaque conteneur de boucle. Ensuite, j'utiliserai la source du fichier plat. Où est la source de fichier plat ? Je dois sélectionner la source de fichier plat après la mort, soit choisir. Je peux également choisir la destination du fichier plat. Si je veux charger des données dans un fichier CSV, peut utiliser d'autres destinations. Destination du fichier Excel. Il y a aussi d'autres destinations là-bas. Destination Raphaël. Donc, puisque je veux charger des données dans mes tables de base de données, donc je vais sélectionner, je vais choisir cette option, huileuse OLED être destination. Configuré, cette double-cliquez sur cette option, nouveau gestionnaire de fichiers plat, je dois créer un nouveau gestionnaire de fichiers de thread. Parcourir, ok, SS, divers pliés, ok, fichiers de documents, entrée CSV, il suffit de sélectionner n'importe quel fichier. Aperçu des colonnes, ok, très bien. Il s'agit des colonnes de données. Très bien. Cliquez sur. Ok, ensuite je vais configurer cette OLED comme destination. instant, je n'ai pas de gestionnaire de configuration. Créer une nouvelle configuration Manager cliquez sur OK, il est configuré. Donc, si vous voulez créer une table à partir de zéro, vous devez cliquer sur nouveau. Donc, puisque j'ai déjà ma table dans ma base de données, je vais utiliser la table de la dette. Donc ma table est que je dois vérifier si la table est là ou non. Je pense que j'ai besoin de créer une nouvelle table. Donc, à partir d'ici, je vais créer une nouvelle table. Dans le nom de la table sera laisser dire Demo. Démo va être le nom de la table. Je crée une table factice. Mappages, très bien. Il est configuré, fait et dépoussiéré. Sauvegardez ça. Alors, ensuite. Que va-t-il se passer ? Je dois exécuter ceci, ceci pour chaque conteneur de boucle. Donc, pour exécuter cela, vous devez cliquer sur ce début. Donc, le processus est exécuté. J' ai besoin de rafraîchir ça. Rafraîchir. Il varie le rafraîchissement. Donc maintenant table, nom de table est démo, OLED être rétrogradé cette table. Alors maintenant, combien de fichiers ? Il y a une centaine de règles dans ma table. Laisse-moi vérifier l'employé 001. Combien de lignes de cette table de ce fichier ? Environ 50 dossiers. Donc, ce qui se passe en ce moment, c'est que je vais vérifier l'employé 0, 2. Alors que se passe-t-il en ce moment ? Il aurait dû charger 63 rôles dans, dans ma table cible. Ce qui se passe en ce moment, c'est la tack. Ce paquet charge ce phi 2 fois. D' accord ? Donc ce que je veux, je veux charger la dette de ces deux fichiers. Donc, il est à plusieurs reprises. Il charge uniquement les données de ce fichier, et il le fait deux fois. Donc je vais tronquer ce câble. Alors pourquoi ça se passe ? Cela se passe parce tronquer cette table. Laisse-moi juste, ok, très bien. Cela se produit parce que je n'ai pas configuré l'étape du gestionnaire de connexion de fichiers plats. J' ai besoin d'aller aux propriétés. Et à partir d'ici, j'ai besoin de configurer cette section d'expression. Alors que se passe-t-il en ce moment ? La première fois qu'il utilise ce fichier. Ensuite, la deuxième fois qu'il utilise ceci, il prend, il exécute ce paquet et il charge le même fichier. Donc, ce que je veux, je veux que cela charge le deuxième fichier, pas le premier fichier. D' accord ? Maintenant, pour la dette, je dois aller ici dans les propriétés de la section expression. Je vais sélectionner la chaîne de connexion. De là, je vais sélectionner la chaîne de connexion, diverses chaînes de connexion. Sachez que je ne suis pas en mesure de trouver la chaîne de connexion. Donc, ce que je vais faire avec l'expression des propriétés du gestionnaire de connexion de fichiers, une expression de chaîne de connexion. Maintenant, cette fois, je vais spécifier l'expression d'évaluation du chemin. Maintenant, cette fois, il va se charger seulement. Il va charger les données de ces deux fichiers pour le total combien de lignes ? 50 lignes dans mon premier fichier CSV. Et la deuxième rangée ? Écoutez, au total 13 lignes, il devrait charger 63, 63 lignes. Maintenant, exécutez ceci. Laisse-moi vérifier. Au total, 63 lignes ont été chargées. Donc, c'est comme ça que vous utilisez par défaut. Largeur de chaque conteneur de boucle. Pour chaque conteneur de boucle, vous ne spécifiez pas la valeur de condition initiale, la valeur initiale et la valeur de point de terminaison. Donc, ici ce que vous allez faire, vous allez à la place vous allez spécifier le, cette stérique, fine statique. Donc, cela signifie qu'il va charger tous les fichiers qui sont présents aide dans le répertoire. Donc maintenant, disons que si vous voulez, au lieu de la table de base de données, vous voulez charger les données dans, dans un fichier plat, dans un fichier CSV, d'accord ? Donc, je vais utiliser la destination du fichier plat. Il y a une destination de fichier plat, celle-ci. Donc, cela va, laissez-moi juste supprimer ceci. Cela va charger mes données dans mon CSV. Mettez donc à jour cette entrée. Non, je veux créer un nouveau gestionnaire de connexions de fichiers. Cliquez sur OK, s3, sélectionnez ce fichier. Maintenant, je vais changer la sortie. Donc je vais changer le nom de ce fichier. Donc, cela va être le point de sortie CSV fichier CSVpoint de sortie. Non, je ne veux pas écraser les données. Cliquez sur OK. Enregistrez ceci et exécutez le mappage. Exécutez le package.

Formation ultime des Services d'intégration de serveurs SQL (SSIS)

Saad Qureshi, Online Instructor

Regardez ce cours et des milliers d'autres

Regardez ce cours et des milliers d'autres

Leçons de ce cours

1.

Introduction au SSIS

3:42

2.

Composants du SIS, avantages et inconvénients

3:43

3.

Comparaison d'outils SSIS

4:55

4.

Installation du SSIS

8:24

5.

Première transformation du SSIS

10:23

6.

Explication de transformation multicast

16:45

7.

Union All & Merge Rejoignez la transformation dans le SSIS

11:25

8.

Transformation ConditionalSplit

8:27

9.

Transformation de recherche

14:13

10.

Transformation de cache

13:36

11.

Groupage flous

13:58

12.

Transformation d'extraits

8:03

13.

Transformation de TermLookup

5:39

14.

Transformation globale

14:28

15.

Transformation du nombre de lignées

22:28

16.

Transformation de pivot dans le SSIS

17:27

17.

Tranformation UnPivot dans le SSIS

7:56

18.

Implémentation de dimension changeante lentement (SCD-Type01, SCD-Type02)

18:00

19.

Exemple de transformation de colonnes d'importation et d'exportation

10:24

20.

Transformation de la colonne de copie, de la colonne et de la cartographie de caractères

12:14

21.

Tranformation d'échantillonnage et d'échantillonnage en ligne

14:44

22.

BulkInsertFinal

10:02

23.

Conteneur ForLoop

7:51

24.

Conteneur en boucle pour l'apprentissage

12:22

À propos de ce cours

Rencontrez votre enseignant·e

Saad Qureshi