Transcripciones
1. Introducción a SSIS: Bienvenido a mi curso de SQL Server Integration Services. Mi nombre es Zach buena Ishi en Seré tu instructor a lo largo de este curso. ¿ Qué es SSIS? Ssis es una herramienta ETL la cual se utiliza para extraer datos de múltiples fuentes heterogéneas. Tiene la capacidad de transformar los datos. Además, puede cargar datos a múltiples destinos diferentes. Entonces, ¿qué estamos aprendiendo en el curso? Por lo que vamos a cubrir diferentes temas. Por lo que esta es la interfaz GUI de la herramienta SSIS. Empezaremos con esta sección de Dataflow. Si miras esta sección de flujo de datos, a tu izquierda, vas a ver múltiples transformaciones diferentes. Vamos a cubrir todas las transformaciones importantes importantes como el agregado, Fusionar, Unir, multicast, derivado de la conversión de datos condicionales divididos cubrirá todas estas transformaciones diferentes. Entonces si voy a bajar, voy a ver los pasos de destino de abastecimiento. Por lo que paso se utiliza para extraer datos de origen y destino pasos se utilizan para cargar datos a diferentes destinos. Por lo que cubriremos esta sección de Dataflow, luego cubriremos la sección de flujo de control. El control de la sección de flujo. Si miras aquí, vas a ver diferentes tareas. Estas son tareas importantes que vamos a cubrir. Tenemos variedad de tareas diferentes como FTP, tarea, script, tarea, tareas XML nos envían correo, cual se utiliza para enviar correo. Después tenemos la tarea de ejecutar SQL, que vamos a utilizar para escribir consultas SQL. Por lo que este va a ser un curso integral sobre SSIS el cual abarcará todos los temas importantes. Entonces, cuáles son los prerrequisitos o experiencia
única se requieren para poder tomar este curso. Por lo que debes tener conocimientos muy básicos de SQL. No necesitas ser un experto de una ardilla. Conocimientos muy básicos de cualquier herramienta porque si conoces una ETL a aprender cualquier otra herramienta ETL no es muy difícil. No se requiere conocimiento del lenguaje de programación. Las herramientas que vamos a utilizar Visual Studio 2019 en SQL Server Data Tools. Estas son las dos herramientas que vamos a utilizar en nuestro curso. Ahora. ¿Quiénes son mis alumnos objetivo? Los desarrolladores de Etl, los que están trabajando como día de desarrolladores de ETL pueden tomar este curso. Aquellos que estén buscando una carrera en el campo del data warehousing o BID también pueden tomar este curso. Profesionales que quieran aprender nueva herramienta ETL para potenciar su carrera, Echemos un vistazo a los retos educativos que uno puede enfrentar. Entonces si estás aprendiendo herramienta SSIS, deberías tener un buen sistema en su lugar. debe instalar Windows 7 de 64 bits o nueva virgen. Al menos deberías tener 12 GB de espacio libre en disco duro. Deben estar disponibles cuatro GB de RAM. Ahora, veamos las oportunidades de carrera. Por lo que este curso va a construir sus cimientos. Una vez que hayas terminado con el curso, podrás aplicar a diferentes campos como data warehousing, consultor de
retail, business intelligence. Por lo que este curso va a abrir múltiples avenidas para ti. Entonces muchas gracias y ten un gran aprendizaje.
2. Componentes SSIS y desventajas: Hola a todos. En esta conferencia en particular, vamos a cubrir la introducción del SSIS, los componentes del
SSIS, y luego vamos a cubrir las ventajas y desventajas del SSIS. Entonces primero, vamos a empezar con la introducción del SSIS. ¿ Qué es SSIS? Ssis es sinónimo de SQL Server Integration Services. Se trata de una plataforma de integración sucia. Cuenta con las capacidades de ETL. Etl significa extracto, transformación, y carga. Por lo que usando esta herramienta SSIS, podemos extraer datos de múltiples fuentes diferentes. Y luego herramienta SSIS tiene incorporadas transformaciones como agregación, columna de
exportación e importación, SCD, búsqueda de conversión de
datos, join, etc. Así que usando estas diferentes conformaciones, podemos transformar conjunto de datos complejo. Una vez transformado el conjunto de datos, podemos cargar datos a múltiples destinos diferentes. Por lo que la herramienta SSIS también realizó algunas operaciones adicionales como el envío de correo electrónico, operaciones FTP. Cuenta con tarea de servicio web, tarea de inserción masiva. Por lo que podemos hacer una variedad de operaciones diferentes utilizando la herramienta SSIS. Por lo que los componentes de SSIS, por lo que hay cinco componentes diferentes de SSIS. El primero es el flujo de control. Contiene contenedores en tareas. El segundo es el flujo de datos. Contiene pasos de destino de abastecimiento. También, contiene pasos de transformación. Por lo que usando esta sección de flujo de datos, podemos extraer datos de diferentes fuentes. Entonces podemos cargar datos a diferentes destinos. También, podemos usar diferentes conformaciones. Componente de controlador de eventos. Usando este componente de manejador de eventos, podemos mismos mensajes y correos electrónicos. Componente explorador de paquetes. Ofrecía una sola vista para todos los paquetes. El último es el parámetro. Podemos utilizar parámetros dentro de un paquete, fuera del paquete. Entonces esto es lo que tenemos. Preocupan a los componentes de los Srs. Ahora veamos primero las ventajas y desventajas de la herramienta SSIS. Ventajas. Utilizando la herramienta SSIS, podemos extraer datos de fuentes heterogéneas. Por medios heterogéneos diferentes fuentes. Usando la herramienta SSIS, podemos hacer variedad de diferentes transformaciones. Es sencillo, muy fácil de usar. Además, podemos cargar datos de forma paralela a múltiples destinos diferentes. Y veamos las desventajas. Cuando se ejecutan varios paquetes. Consume memoria y recursos del sistema. Por lo que hay que tomar en consideración estas cosas al ejecutar múltiples paquetes. El segundo inconvenientes, la integración con otros productos. Por lo que es muy difícil integrar SSIS con productos como Salesforce, workday, etc. Así que ahora veamos a los competidores de las herramientas SSIS o Talend, Informatica, IBM Data stage print estos son los competidores. Entonces si aprendes una herramienta ETL, por ejemplo, si tu herramienta SSIS, aprender una herramienta ETL no es muy difícil. Por lo que este curso va a construir sus cimientos. Entonces muchas gracias y ten un gran aprendizaje.
3. Comparación de herramientas SSIS: Hola a todos. En esta conferencia en particular, vamos a dibujar una comparación entre la herramienta SSIS y el centro de energía de Informatica. Informatica power center es una popular herramienta ETL disponible en el mercado. Entonces vamos a ver cómo es mejor la herramienta SSIS
o qué áreas es mejor en comparación con el centro de energía de Informatica. Ahora, en primer lugar, permítanme mostrarles algunas herramientas de integración de datos populares que están disponibles en el mercado. Tenemos talento. El talento está en herramienta de integración de datos de código abierto, herramienta muy popular. Después tenemos a Informatica. Informatica es costosa. Es utilizado por las grandes organizaciones. Después tenemos IBM Data stage, que está alojado en un servidor en la nube. Después tenemos herramienta de integración de datos Pentaho. Al igual que decir cuándo tau es una herramienta de integración de datos de código abierto. Ahora, veamos la comparación entre SSIS y el centro de energía de Informatica. Por qué estoy dibujando una comparación entre SSIS y Informatica, porque Informatica es muy popular herramienta detallada, es alta demanda. Entonces esa es la razón por la que estoy dibujando una comparación con esta herramienta en particular. Por lo que la herramienta SSIS, es una herramienta ETL gratuita. tanto que cuando se trata de centro de energía de Informatica, es costoso. Tiene una cuota de licencia la cual hay que estar ansiosamente. Por lo que hay que tomar distinto en concentración. ¿ A qué me refiero con herramienta ETL gratuita? Entonces por libre me refiero a deuda. Puedes descargar fácilmente esta herramienta SSIS desde el sitio web de Microsoft y puedes instalarla en tu sistema. Entonces el segundo es limitado conectores están disponibles para conectarse con aplicaciones de terceros. Por lo que necesitamos conectores para conectarnos con diferentes aplicaciones. Entonces cuando nosotros, cuando se trata de herramienta SSIS, tiene conectores limitados en comparación con el centro de alimentación de Informatica, informáticas hasta nuestro centro número vivo de conectores que tenemos en Informatica para conectarnos con aplicación de terceros. ¿ Cuáles son las aplicaciones de terceros? Aplicaciones de terceros, quiero decir, colas para copo de nieve Cloud data warehouse asumió Google Cloud desierto aplicaciones de terceros, que SQL Server Integration Services no es adecuado para organizaciones globales a gran escala ? Sí. tanto que cuando se trata de centro de energía de Informatica, es para las grandes empresas en cuanto al rendimiento. Es Bueno. Vuelve con integraciones más grandes. El desempeño se ve afectado. Cuando se trata de centro de energía de Informatica. Es robusto y rápido y el rendimiento no se ve afectado por integraciones más grandes. Cuando se trata de reproducibilidad, se
puede utilizar un proveedor tercero que es caro. Entonces, cuando se trata Informatica power center característica reutilizable es genial en potencias de Informatica y dos, ¿a qué me refiero con reusabilidad? Por lo que la reutilización significa que una vez que se crea el proceso, podemos utilizar el procesamiento particular de la deuda y otro proceso. Esto es reusabilidad. tanto que cuando se trata de Informatica potencias centradas, esta característica es genial en el fin de semana de Informatica. Reutilizar un componente en otro componente. tanto que cuando se trata de SSIS, se
puede utilizar la herramienta t de terceros para su reutilización. ¿ De acuerdo? Escalabilidad. Cuando se trata de escalabilidad, la función de
escalabilidad es costosa, pero genial. Media de escalabilidad. ¿ A qué me refiero con escalabilidad? Por ejemplo, si tienes un enorme volumen de datos, entonces en Informatica power center, qué hace, distribuye tus datos en múltiples servidores. Entonces esto es escalabilidad. Cuantos más datos, más lo so-qué, esto es escalabilidad. tanto que cuando se trata de SSI es que las pruebas se amontonaron patrón para la escalabilidad. Por lo que tenemos la función de escalabilidad tanto en SSIS como en Informatica. Ssis tiene enorme ecosistema, mientras que cuando se trata del centro de poder de Informatica, no
es tan enorme como las sociedades. Por lo que esta fue la comparación entre SSIS y el centro de energía de Informatica. Espero que hayas entendido el concepto. Muchas gracias y tengan un gran aprendizaje.
4. Instalación de SSIS: Hola a todos. En esta conferencia en particular, vamos a instalar SSIS en su sistema informático. Para instalar SSIS, primero
necesitas descargar e instalar Visual Studio 2019. Comunidad Williams. Por lo que en la barra de búsqueda de Google derecha, descarga, solíamos hacer 2019. Entonces hay que hacer clic en este enlace. Utilizamos para hacer tus descargas de puntos Microsoft.com slash. Entonces haga clic en este enlace. Ahora, entonces haré clic en este Descarga gratuita. Comunidad William descargar gratis. Haga clic en esto, revise este instalador. De acuerdo, ahora voy a abrir este instalador. Haga clic en esta instalación. Los rendimientos te dijeron instalador click Sí. Entonces continúe. Por lo que esto va a tardar algún tiempo en completarse. Entonces en el transcurso de la tener un joven D, Nosotros solíamos hacer propelente 17, William. Este es el último, eran más jóvenes. Te estoy mostrando cómo instalar. Está bien. No. Esta es la sección de tela de lana. Ahora desde aquí voy a seleccionar esta opción en particular. Después de eso, seleccionaré esto, estas dos herramientas instalaron nuestra ubicación. Por lo que quiero instalar en mi directorio ya que no tengo suficiente espacio en mi directorio C, déjame simplemente cambiar el directorio a E. Los rendimientos para tratar ya sea 19 comunidad donde se puede comer directiva bien. Por lo que el espacio total requerido, 12.45. Destilar instalando en mi directorio E. Está bien, bien. Instalado, anotando un pedido. Entonces tengo dos opciones. Del Norte todo se instaló. Deseo instalar descargando, elegiré esta opción en particular, haga clic en Instalar. Por lo que se había iniciado el proceso. Esto va a descargar los vehículos a su comunidad 2019 donde estás en el aire al mismo tiempo. Esto lo instalará en mi sistema. ¿ Así te tomas algún tiempo para que 0.39 GBs decida. Entonces esto va a llevar algún tiempo. Por lo que se ha completado el proceso de instalación. A continuación, voy a hacer clic en el botón Iniciar. Por lo que los rendimientos Studio 2019 está empezando. Por lo que a continuación haré clic en Continuar sin cordón. Después de eso, iré a la sección de extensiones y haré clic en Administrar extensiones. Entonces aquí en la sección de línea haré clic en la sección en línea. Utilizamos Studio Marketplace. No desplácese hacia abajo y seleccione y descargue este proyecto de Servicios de integración de SQL Server. Tienes que descargar e instalar esto en tu sistema en EU para tratar. Esto realmente tarda seis minutos en completarse. Entonces déjame comprobar si tengo esto en mi sistema o no. Iré en las descargas. En mi directorio. Descargas, tengo esto en mi sistema. Sólo déjame cancelarlo. Entonces si no lo tienes, tienes que descargarlo. Ahora cancela. A continuación haré clic en este Microsoft Data Tools Integration Services. Haga clic en Aceptar. Mientras tanto, Ok, click Ok. A continuación, haga clic en Siguiente. Instalar. De acuerdo, por favor cierre los siguientes procesos antes de continuar con la configuración. Seleccióname primero. Cierra todas las ventanas. Microsoft, tiene que hacer medio para cerrar todas estas ventanas. No, ciérralo. Cierra todas las ventanas. Ahora. Ahora voy a instalar los Servicios de Integración de Herramientas de Datos de Microsoft. Haga clic en Siguiente. Instalar. Cierra los siguientes procesos, ¿de acuerdo? Sí. Se ha concluido el proceso de instalación. Haga clic en cláusula tras deck en esta barra de búsqueda o busque Visual Studio 2019. Por lo que estoy abriendo el Visual Studio 2019. No. Crear un nuevo proyecto. En esta búsqueda de plantillas. En esta sección buscaré servicios de integración. Integración, integración de búsqueda. En este selectivo se ha seleccionado ahora, dar click siguiente. Nombre del proyecto será primer proyecto, producto DW edge. Déjame simplemente cambiar un producto donde voy a crear un proyecto aquí en mi fuente d delta T e directorio. Seleccione una carpeta. Está bien, crea. Por lo que esto creará tu primer proyecto en SSIS, creando producto Microsoft, usamos para tratar. Mira, el primer proyecto ha sido creado y luego solo proteges, tienes este paquete. A partir de aquí, puedes crear múltiples paquetes. Es así como se crea un nuevo paquete SSIS. El paquete uno ha sido creado. Kaye, espero que hayas entendido el proceso de instalación. Muchas gracias y tengan un gran aprendizaje.
5. SSIS primera transformación en la primera transformación: Hola a todos. En esta conferencia en particular, vamos a crear nuestro primer proyecto en SSI. Sí. Entonces lo que vamos a hacer, vamos a cargar este dataset fuente de subrayado producto. Déjenme abrir este archivo. Entonces voy a leer este conjunto de datos en, entonces vamos a aplicar algunas transformaciones en este conjunto de datos. Por lo que tengo ID de producto, nombre del producto. Por lo tanto, ID del producto, nombre del producto debe ser convertido a país mayúscula. Por lo que en mi campo de país, tengo valores diferentes como el valor de país. Por lo que Estados Unidos, EUA, he advertido a país que esté representado en forma de abreviatura para Estados Unidos. Debería ser USC, para Reino Unido, que debería ser Reino Unido, y para Australia debería ser EUS. Por lo que tenemos este 60 pies en el campo de la ciudad. Tenemos algunos valores en blanco. Quiero reemplazar los valores en blanco por n slushy. De acuerdo, entonces vamos a crear nuestro primer proyecto en SSAS. Entonces voy a entrar en Archivo y luego voy a crear un nuevo proyecto. Voy a hacer clic en esto, entonces voy a nombrar este proyecto. Por lo que nombre del proyecto se archivará dos, dB cargando. Localización falleció, la ubicación donde se va a guardar este proyecto. De acuerdo, haga clic en OK. se ha creado un nuevo proyecto. Entonces para poder leer datos de este archivo, de este archivo CSV voy a usar. Entonces voy a seleccionar la opción de flujo de datos. Entonces voy a seleccionar la opción D de fuente de archivo plano. Entonces donde voy a obtener la opción de fuente Flat File. Entonces permítanme buscar la opción fuente de Archivo Plano. Así que mira la opción de fuente de archivo plano. Entonces déjame solo hacer este gestor de conexiones, tengo que crear un nuevo gestor de conexiones sabía. Está bien, bien, extremidad fina. Tengo que proporcionar una parte donde se encuentra este archivo. Por lo que este archivo se encuentra aquí. Por lo que voy a proporcionar la parte aquí. Navegar, seleccionar todo. Seleccionaré este archivo. De acuerdo, este archivo es archivo delimitado por comas. Las columnas D's son las columnas de este archivo en particular, ID de
producto, nombre del producto, ciudad, ganancia de ventas, vale, a Guan's. Y luego previamente si, si tienes que previsualizar el diámetro, seleccionarás esta opción Vista previa. Ok, haga clic en Aceptar. Ahora estas son las columnas, ID
del producto, nombre, país, ciudad, campos, y Profit. Haga clic. De acuerdo, así que este paso se hace industria, pero la próxima vez vamos a usar el paso d y dirección. Entonces esto es, en este paso voy a usar esta opción. Opción de columna derivada. Entonces usando esta opción, voy a transformar mi conjunto de datos. Entonces tengo que primero, primero tengo que conectar esta opción con esta opción. Déjame unirme a esta opción. De acuerdo, ahora esto ha sido conectado. Haga doble clic en desorción, ok, columnas, estas son las columnas. Entonces ahora lo que quiero, quiero usar la Declaración de TK. Entonces la razón por la que voy a usar la declaración de caso porque aquí en este campo de país en particular, quiero reemplazar a Estados Unidos fueron USA, Reino
Unido con Reino Unido y Australia con EUS. Por lo que quiero representar campo País en forma de abreviatura. Entonces voy a usar esta declaración de caso, país es igual a Estados Unidos. interrogación es den, entonces el valor debe ser usa. Si País igual a Reino Unido, entonces el valor debe ser juke. Si el valor del país es Australia, entonces el valor debe ser EUS. De lo contrario, el valle debería ser Australia. De acuerdo, así que voy a copiar, pegar esto. Voy a pegar copia, y voy a pegar esto en la expresión. De acuerdo, columnas derivadas o voy a reemplazar el campo País. De acuerdo, ahora, siguiente voy a usar esto. Entonces lo que quiero, tengo este Citi Field, Citi Field. Entonces donde hay un valor en blanco, quiero reemplazar un valor en blanco por n carnoso. Entonces para la deuda, necesito usar esta expresión. Si el valor de la ciudad es igual, igual a dos, en blanco, entonces el valor debe ser reemplazado por n forma de barra inclinada. De lo contrario realmente debería ser Ciudad. Entonces voy a copiar esto aquí en la expresión. Déjame simplemente copiar esto aquí. Columna derivada debe ser ciudad, vale, así que voy a usar otra expresión esta vez. Voy a usar la función de cadena. Entonces, qué función de cadena voy a usar, voy a usar la función de cadena en mayúsculas. Por lo que quiero presentar el nombre del producto en forma de mayúsculas. Entonces esto tiene que ser mayúscula. De acuerdo, columna Derivada debe ser nombre del producto, reemplazar nombre del producto por valor de nombre del producto en mayúsculas. Entonces esta es mi expresión Columna Derivada. Siguiente Voy a usar d paso para base de datos. Entonces qué paso de base de datos voy a usar, voy a usar d paso de conexión de base de datos. Entonces déjame solo buscar el paso aquí. Por lo que usaré el paso de destino OLED. Entonces déjame simplemente conectar Paso Columna Derivada con esto. Permítanme que abra este paso. Por lo que permítanme cerrar esta fuente subrayado producto punto CSC archivo. Tengo que cerrar este expediente primero. Está bien, no ahorres. Conexiones Db, tengo que crear una nueva conexión DB. Nuevo. Haga clic en nuevo, Ok, nombre del
servidor, busque aquí el nombre del servidor. Por lo que el nombre del servidor
es, se está tomando algún tiempo para mostrar el nombre del servidor. Servicios. Tengo que buscar aquí el nombre del servidor de servicios como este. Sql Server 2020 es el nombre del servidor, está bien, esto si el nombre del servidor. Entonces si tengo que buscar aquí, SQL Server 20-20, SQL Server 2020 server está en funcionamiento. De acuerdo, ahora el siguiente paso es seleccionar o introducir un nombre de base de datos. Nombre de la base de datos es dados. Por lo que ya he creado esta base de datos en MySQL Server. Haga clic en Aceptar. De acuerdo, mesa o vista mesa o vista bien. Nombre de la tabla debería ser Tengo que crear una nueva tabla. Por lo que este va a ser el nombre de destino de la tabla DB. Déjame simplemente copiar pegar el nombre de la tabla aquí. Entonces esto va a crear automáticamente esta tabla, ¿de acuerdo? En este momento no se crea esta tabla, por lo que la disfuncionalidad va a crear automáticamente una tabla en mi base de datos. Este es el nombre de la tabla y el nombre de la base de datos es dados con el fin de crear una base de datos, ¿de acuerdo? El dato ya es un objeto llamado esto. Ok, bien. Por lo que tengo que escribir 01, dar clic en Aceptar. OK. Tengo que escribir escritorio 0-1. Ahora esta base de datos, este nombre de tabla no está presente, por lo que esto va a crear esta tabla. Está bien, bien. Haga clic en ok. Esta asignación de nombre de tabla. Entonces esto solo dice que el mapeo de identificación del producto está mapeado con ID del producto, nombre del producto, país. Por lo que estos son los campos fuera de esta tabla de destino. Este es d. éste. Estos son los campos fuera de este producto de subrayado fuente de archivo en particular. Entonces haga clic en Aceptar. Este paso se hace industria. Ahora tienes que guardar este paquete. Para guardar, Tienes que presionar Control S. Así que este paquete se ha guardado. Ahora, si tienes que ejecutar este paquete, tienes que hacer clic, tienes que hacer clic con el botón derecho o n, entonces esta tarea ejecutar, o puedes ejecutar directamente este paquete desde aquí, iniciar. Por lo que el paquete ha sido ejecutado. Ahora, mira, el paquete se ha ejecutado con éxito. Para confirmarlo, tengo que ejecutar esta consulta. Mira, Nombre del producto está en mayúsculas, país. Campos. Mira, un país ha sido representado en forma de abreviatura, ciudad donde hay un valor en blanco, ha
sido sustituido por N slushy. ¿ De acuerdo? Entonces así es como insertas datos en una base de datos. Y así es como lees datos de un sistema informático local. Entonces con la ayuda de, con la ayuda de esta columna Derivada, pescado, he aplicado una transformaciones diferentes en mi conjunto de datos. Entonces espero que hayas entendido el concepto. Muchas gracias y tengan un gran aprendizaje. Entonces desde aquí voy a entrar en modo edición.
6. Explanation de transformación multicast: Hola a todos. En esta conferencia en particular, vamos a aprender la transformación multidifusión en SSI. Sí. Entonces, en primer lugar, voy a crear un nuevo paquete. Para crear un nuevo paquete, tiene
que hacer clic en este paquete SSAS, luego haga clic con el botón derecho y
luego haga clic con el botón derecho luego en nuevo paquete Entonces estos son dos paquetes que ya están ahí en mi proyecto. Este es el nombre del proyecto. Ahora voy a crear un nuevo paquete, nuevo paquete SSAS. Entonces voy a llamar a esto, déjame simplemente cambiar el nombre de este paquete. Por lo que voy a nombrar este paquete como subrayado fijo. Carga de subrayado. Nombrado a este paquete. De acuerdo, entonces este es el nombre del paquete. Las ofertas son dos paquetes. Tetr ya fechó mi proyecto ahora. Entonces éste es para controlar sección de flujo, deshonestidad sección Dataflow. Entonces cuando voy a hacer clic en la sección Control Flujo, voy a conseguir diferentes tareas. Entonces estas son las tareas que puedo realizar. Esta es la sección Dataflow. Entonces a mi izquierda, así que cuando voy a dar clic en la sección Dataflow de mi izquierda, voy a conseguir fuentes en destino. Por lo que estas son las fuentes de donde puedo leer datos. Entonces supongamos que si tengo que leer datos de un archivo Excel, voy a usar esta fuente de Excel. Entonces si tengo que leer datos de una fuente externa, usaré este paso. Ok. Entonces si tengo que cargar datos en mi archivo plano, voy a usar este destino de archivo de bandera. Entonces si tengo que cargar datos en mi base de datos, voy a usar este destino OLED DB, ¿de acuerdo? Este es el paso del flujo de datos. Ahora lo que voy a hacer, voy a leer este piso fijo pelea empleados dot TXT. Entonces este es el expediente que voy a leer. Entonces para, para poder leer este archivo, voy a utilizar este paso. Seleccionaré fuente, fuente, luego voy a seleccionar este paso fuente Flat File. Déjame arrastrar y soltar aquí. Haga clic, haga doble clic. Entonces tengo que crear una nueva conexión, nueva. Entonces así es como se crea una nueva conexión. De acuerdo, General, aquí voy a proporcionar salida. Por lo que este es el camino donde este archivo está presente. Voy a seleccionar este formato de archivo. Voy a seleccionar la columna de lectura, escritura, luego. Entonces ahora tengo que burlarme de mis columnas. Por lo que la primera columna es ID, segunda columna es el FirstName, LastName. Entonces lo desocupado es el género, el género, la edad. Género. Definido es el país última columna, m-th, avanzado. Id, FirstName, apellido, género, país en edad, vista previa. Entonces estos son mis datos. Ok. Haga clic en Aceptar. Por lo que también puedes previsualizar tu conjunto de datos. Haga clic en Aceptar. Columnas. Estas son las columnas. click bien, por lo que el primer paso se hace bajo estricto. Ahora lo que voy a hacer a continuación, voy a cargar los datos en mi base de datos primero. Entonces tengo que usar, déjame usar esta transformación multidifusión. Por lo que el propósito de usar la transformación multicast es la deuda. Con la ayuda de esta transformación, puedo enviar datos a múltiples destinos. Tendrás una sola entrada. Valor de entrada único puede ser, se puede enviar a múltiples destinos sin ninguna condición. Ok, entonces ahora déjame solo conectar el primer paso a este paso. Por lo que esto, este archivo se va a enviar a múltiples destinos. Entonces primero mi primer destino será mi base de datos. En mi segundo destino será D, destino Excel. Por lo que para destino de Excel, voy a utilizar este paso, destino de Excel. Ahora. Siguiente Voy a utilizar el destino OLED DB. Dado que quiero enviar estos datos a mi base de datos a una tabla, quiero cargar datos en mi tabla. Por lo que usaré d destino OLED DB. Ahora, tengo que crear una nueva conexión OLA DB, nueva, nueva, nueva. Tengo que nombre del servidor, tengo que actualizarlo. Por lo que esto va a mostrar el nombre del servidor de medios. Entonces sólo espera un segundo. Te mostrará mereces un nombre. Por lo que hay que seleccionar el nombre de su servidor. Después hay que seleccionar el nombre de la base de datos. Entonces este es mi nombre de servidor, SQL Server 20-20, seleccione o introduzca un nombre de base de datos. Por lo que seleccionaré dados como nombre de mi base de datos. De acuerdo, así que estas bases de datos de dados ya se crearon. Entonces para crear una base de datos, hay
que escribir este comando crear base de datos. Digamos que proyecto es el nombre de la base de datos, coma al final. Entonces así es como se crea una base de datos. La base de datos se ha creado con éxito. En este caso, ya he creado la base de datos de dados. Entonces voy a dar click, ok, click OK. A continuación, tabla o vista. Ahora nuevo. Entonces este es el nombre de tabla. Ahora tengo que cambiar el nombre de la tabla. Por lo que mi nombre de tabla será DRG, objetivo, empleado de DRG, EMP subrayado tabla de destino. Entonces este va a ser el nombre de mi mesa. Id, FirstName, ID, ¿de acuerdo? El nombre debe ser 2020, género, ¿vale? 23. Tiene que ser int. Jenga. Cada uno debe ser int. Haga clic en Aceptar. OK. Mappings, defensa mi archivo fuente, y este es mi destino. Bien. Ok. Haga clic en Aceptar. Guarda este archivo. Tengo que guardar este archivo primero. Ahora, tienes que ejecutar esto primero. Entonces este, este es mi primer destino. Voy a crear otro destino el cual será archivo Excel, archivo Excel, destino de Excel. Pero antes que nada, voy a ejecutar esto. Para poder ejecutar, voy a dar clic en iniciar. De acuerdo, todos los pasos se han ejecutado con éxito. Ahora déjame solo revisar. Mira progreso. Desde aquí se puede ver el progreso Dataflow. Bien. Tengo que primero dados de base de datos. Tengo que refrescar esta lista, refrescar tabla. Este es el nombre de la tabla select Top 1000. Por lo que los datos se han cargado con éxito. Se han cargado 50 filas con éxito. Id nombre, apellido, género, país en ocho. Ahora, a continuación, lo que voy a hacer, voy a crear otro destino. Por lo que con la ayuda de multidifusión, puedo enviar mis datos a múltiples destinos sin condición. Por lo que en esta ocasión voy a utilizar el destino de Excel. Entonces voy a conectar esto con este destino de Excel. Ahora, el siguiente paso es configurar el destino excel. Por lo que voy a crear una nueva conexión, nueva navegación. Entonces este es el directorio donde crearé un nuevo archivo. Déjame simplemente crear un archivo, nuevo archivo de Excel. Entonces este es el archivo donde voy a cargar mis datos. El subrayado empleado punto XLS archivo. Tiene que ser T, G. Abierto. Haga clic en Aceptar. Ahora nombre de la hoja de Excel. Nuevo, click, nuevo click. Está bien. Entonces ahora tengo que crear una hoja aquí. Por lo que usaré este comando crear tabla. Déjame solo usar esta tabla de crear, archivo de subrayado de
Excel, ID entero, nombre, N gráfico de barras, que es 10, primer M 20, apellido, tipo de datos de
deuda es n gráfico de barras. Esto es de género nueve, de extremo a extremo. T3. La edad es entera, así que haga clic en Aceptar. Haga clic en Aceptar. Ahora selecciona la hoja de Excel. Por lo que Excel archivo de subrayado. Entonces esta es la hoja T que hemos creado. Voy a seleccionar esta hoja mappings. Entonces ahora OK, haga clic en Aceptar. Entonces FirstName, Apellido. Entonces este es el dato que soy,
estoy obteniendo de la fuente. Este es país en H. Así que ahora, entonces, ¿qué pasará? Me va a dar un error. Déjame simplemente salvarlo. Me va a dar un error. Mira, la columna id no puede convertir entre Junie, ct, n tipo de datos de cadena no unicode. El motivo por el que me está dando error porque deta tipo de Excel en tipo de datos, que viene de datos, que viene de origen, tienen diferentes tipos de datos. Por lo que este destino de Excel en el destino de origen ambos tienen diferentes tipos de datos. Entonces primero, tengo que convertir el tipo de datos. Entonces en Excel, los tipos de datos para string es N var char, mientras que los datos que estamos obteniendo de la fuente son de diferentes tipos de datos. Por lo que para convertir el tipo de datos, tengo que usar este paso de transformación de Conversión de Datos. Entonces antes de este paso, antes de destino de Excel, voy a utilizar la conversión de datos ese paso, paso de transformación. Ahora, con la ayuda del paso Convergencia de Datos, voy a convertir el tipo de datos de mis datos. Ahora, combina esto. Entonces ahora OK, haga doble clic en Aceptar, Seleccionar todo. Entonces FirstName, el nombre será cadena, será cadena de código única. Ahora este tipo de datos es compatible con el tipo de datos de Excel. Ahora, LastName será cadena Unicode, cadena Unicode. Este tipo de datos es compatible con N var char tipo de datos, que estamos utilizando para la fuerza. País, cadena Unicode. Cada uno por edad, voy a usar t, dos bytes signados ID entero para voy a usar D para bicicleta número entero firmado. Por lo tanto, permítanme buscar rango entero firmado de
dos bytes. Entonces este es el rango de dos bytes firmando profesor. Ahora, bien, bien. Copia del IID. Mira, este es el tipo de datos que estamos obteniendo de la fuente. Y esto es copia de datatype, copia de este tipo de datos. Por lo que lo estamos convirtiendo a dos bytes brillante profesor, estamos convirtiendo este FirstName. Estamos creando una copia y el tipo de datos es cadena Unicode. Ahora aquí, destino de Excel. En los mappings. En lugar de esto, voy a usar la copia fuera de IED, que es de dos bytes firmando TJ, copia de nombre_nombre, que es una cadena Unicode. Copia de Apellidos, copia de género, copia
final de país. El último es copia de H. Ahora, estos dos tipos de datos, fuente y destino, ambos un OK compatible. Haga clic en Aceptar. Ahora mira, no hay datos. Guardar este paquete ahora ejecutado. En primer lugar, tengo que truncar esta mesa. Tabla truncada. Tengo que truncar esta mesa. No truncar esta tabla y ejecutar. Mesa ha sido truncada. Ahora ejecuta esto. Entonces ahora ejecuta esto. Mira, estoy recibiendo un error. Déjame mirar. Déjame solo comprobar qué error estoy obteniendo. Entonces estoy recibiendo este error. Los administradores de conexión de Excel fallaron con excepción de error. Puede haber, puede haber mensaje de error publicado antes de esto con más información. De acuerdo, sé cuál es el error. ¿De acuerdo? Entonces lo que voy a hacer para solucionar este tipo de errores. Voy a ir al proyecto, entonces, tengo que ir a las propiedades. Entonces, y tengo que ir a la sección de depuración. Aquí. Voy a cambiar el valor de tiempo de ejecución, ejecutar 64 bit, valor de tiempo de ejecución a false. ¿ De acuerdo? Especificar si el proyecto debe comenzar. 64 bits. Evaluar el tiempo de ejecución de IS, es de 64 bits, evaluar el tiempo de ejecución de IS no está instalado. Este segundo se ignora. De acuerdo, ahora aplique click Aceptar. Seguro. Ahora no voy a conseguir este error, ¿de acuerdo? Porque no se instaló el tiempo de ejecución de 64 bits, así que tengo que ignorar este error. Inicio. Ahora no voy a recibir este error. Por lo que mi proyecto se ejecuta con éxito. Todos los pasos se han ejecutado con éxito. Ahora necesito abrir este archivo. Empleado de subrayado objetivo, necesito abrir este archivo y nombre de este tramposo si este archivo de subrayado de Excel el cual hemos creado look ID, nombre, apellido, género, país H. Se han insertado datos. han insertado en total 50 filas. Ahora necesito chequear mi deuda. Necesito revisar mi mesa. Mira. Se han insertado datos, se han insertado
50 filas. De acuerdo, para poder ir a este modo de edición, harás clic en este. Ahora resultado de ejecución. Este es el resultado de la ejecución. Explorador de paquetes del proyecto. Ahora mira, vf Grey creó tres conexiones. Flat File Manager, conexión archivo
Excel, estas dos conexiones
en la conexión de base de datos, estas tres conexiones. Y entonces tenemos esta tarea de flujo de datos. En la tarea de flujo de datos, permítanme abrir este Flatfile. D's son los componentes fuente de archivo plano, destino de base de datos
OLED, ND, componente de multidifusión. Se trata de tres componentes que hemos utilizado. Parámetros, variables que no hemos utilizado. De acuerdo, ahora flujo de datos, ahora mismo, hemos utilizado este flujo de datos de sección, no
hemos utilizado este flujo de control de sección. Entonces éste es el nombre de mi paquete. Entonces espero que hayas entendido el concepto. Muchas gracias y tengan un gran aprendizaje.
7. Unión Todos y fusiona la transformación de unión en SSIS: Hola a todos. En esta conferencia en particular, vamos a discutir la unión todo fin Merge, Únete a la transformación en herramienta SSAS. Entonces, en primer lugar, voy a crear un nuevo paquete, hacer clic derecho y crear un nuevo paquete. Entonces mi nombre de paquete será, déjame simplemente cambiar el nombre. Fusionar, unir, subrayar transformación. Entonces déjenme mostrarles primero mi conjunto de datos, que voy a leer. O dos conjuntos de datos, empleado 0-1 punto csv. Este sitio en particular, en este archivo CSV en particular, tengo un total de 50 registros. Por lo que tengo DNI,
FirstName , apellido, género, país H en id
departamento. tendré un indefinido, que es empleado 0-2 puntos CSC. En este expediente en particular, he conseguido nueve registros. ¿ De acuerdo? Entonces estas son las columnas. Entonces, en primer lugar, voy a explicar el concepto de guiño junior. Entonces cuando tengas que combinar los registros vas a usar T union toda transformación. Mira en estos dos registros, en estos dos archivos, tenemos cuántas columnas tenemos? Y número de columnas siete. Entonces cuando estamos realizando union toda la transformación, número de columnas en el tipo de datos debe ser el mismo look id, id que está presente en, en mi otro archivo, debería tener el mismo tipo de datos, FirstName, y el nombre de implica 01 archivo debe tener el mismo tipo de datos, ok? Por lo que el número de columnas en el tipo de datos debe ser el mismo. De acuerdo, déjame cerrar esto. Entonces con la ayuda de sindicato toda transformación, voy a combinar estos dos expedientes. Entonces, en primer lugar, permítanme usar la sección Dataflow. Entonces haga clic. De acuerdo, ahora voy a seleccionar la fuente. Escogeré la fuente Flat File ya que estoy leyendo un archivo CSV. De acuerdo, a Fuente de archivo plano, haga clic en nuevo, tengo que seleccionar, Crear una nueva conexión, gestor de conexiones. ¿ De acuerdo? Seleccione un archivo. Seleccionaré un archivo aquí. Está presente en mi directorio. De acuerdo, déjame sólo proporcionar la parte de mi expediente. Este, todos los expedientes. Por lo que myfile limb primer archivo está en juego 0-1 forma un archivo delimitado por comas. Necesito mostrarte propiedades de clic derecho. Mira archivo separado por comas de Microsoft Excel. Por lo que voy a seleccionar esta opción en particular, esta antigua columnas delimitadas. Estas son las columnas. Ok, bien. Haga clic en Aceptar. Estas son las columnas. De igual forma, voy a configurar este paso. Fuente de archivo plano. Debería tener otra conexión. En esta ocasión, voy a seleccionar el segundo archivo,
empleado, 0-2 archivo CSV oscuro. Este, tiene archivo delimitado por comas. Está bien, bien. Haga clic en Aceptar. Déjame solo previsualizar mi conjunto de datos. De acuerdo, este es mi phi es total nueve registros y mis columnas de archivo. Estas son las columnas. Ahora sólo déjame cambiar el nombre. Empleado 50 registros. El segundo, permítanme simplemente cambiar el nombre de este paso. Empleado. Nueve registros. Encuentra no siguiente, voy a realizar el sindicato toda transformación. Entonces iré aquí. Seleccionaré la unión todas las transformaciones aunque varias unión toda la disciplina de transformación es D unión toda transformación. Entonces cuando estamos realizando la unión toda transformación, no
necesitamos ordenar nuestros datos. De acuerdo, así es como vas a combinar dos registros, dos archivos usando el sindicato toda transformación. Ahora, nombre, vale, este va a ser el nombre,
apellido, género, país, cada uno y identificación del departamento. Ignorar. Haga clic en Aceptar. Déjame volver a hacer clic. Nombre de la columna de salida. Esta es la salida en. Este es D union on, en puerto uno, union todo entrada a entrada uno y entrada dos. Y éste va a ser d, salida final. ID, nombre, apellido, género, país, cada departamento final. Entonces ya que vamos a utilizar la transformación de unión de fusión como l, Así que voy a seleccionar un paso más fuente,
que es el paso de fuente de archivo plano. Entonces déjame mostrarte el paso de fuente de archivo plano, este, lo seleccionaré. Entonces a continuación lo que voy a hacer, voy a, quiero leer este archivo, departamento dot csv. En este expediente, tengo identificación del departamento y nombre del departamento en estos dos archivos también. Tengo id departamento. entonces lo que quiero primero, quiero realizar el sindicato todo lo que quiero combinar estos dos archivos. Entonces quiero tener un porro yo quería tener un porro sobre la base de identificación departamental
Ok. A continuación voy a leer este archivo id del departamento. Entonces haga clic en esta nueva transformación. Está bien, bien. Entonces voy a seleccionar el archivo departamental, departamento dot csv archivo delimitado. De acuerdo, columnas finas. Estas son las columnas, vista previa
avanzada, id del departamento y nombre del departamento. Está bien, bien. Déjame solo editar. Permítanme simplemente cambiar el nombre de este paso. Este departamento tiene nombre D. Siguiente Voy a usar la transformación profunda, que se conoce como Fusionar transformación de unión. Por lo que antes de usar esta transformación, necesito ordenar primero mis datos. Entonces con la ayuda de Merge Join confirmación, puedo hacer una unión interna, puedo hacer una unión externa izquierda o puedo hacer una unión externa completa. Pero primero, necesito ordenar primero mis datos, ya sea en orden ascendente o en orden descendente. Por lo que estos son dos insumos. Ingeniería departamental, estos son dos insumos. Entonces primero, necesito ordenar mis datos. Por lo que para ordenar los datos, usaré esta transformación de tipo. Entonces déjame simplemente arrastrarlo. Entonces hiedra primero ordenar mis datos. Entonces haga clic en esto. Entonces voy a ordenar en base al id departamental, encontrar orden ascendente aquí también, voy a ordenar mis datos en base al id departamento. id departamental, orden ascendente, debería significar orden ascendente. Ahora voy a tener un porro. Así que seleccione OK, input, Fusionar, Unir entradas Izquierda. Significa deuda. Decidir. Este insumo, emplear 50 registros. Decidir va a venir por mi lado izquierdo y este lado va a venir por mi lado derecho. Déjame solo seleccionar, vale, bien. Ahora, selecciona esto, n se unió a esto. Ahora haz clic en esto. Ahora estoy teniendo un antro a base de id departamental Ahora, necesito seleccionar mis columnas, las cuales quiero incluir en mi salida final. Entonces no identificaré nombre,
apellido, género, país sine h No, no quiero identificación departamental, más bien quiero nombres departamentales. Seleccionaré el nombre del departamento. Entonces me estoy uniendo sobre la base del id departamento. entonces si quieres tener una unión interna, puedes seleccionar unión interna, izquierda unión externa. Puedes tener unión externa izquierda o puedes tener unión externa completa. Entonces voy a tener una unión externa izquierda. Entonces mira, columnas de entrada, Alias de salida, está bien. Ahora haga clic en Aceptar. Tienes que guardar esto al final. De lo que voy a hacer, voy a cargar mis datos en mi tabla de objetivos,
en mi tabla de base de datos. Entonces para base de datos, voy a seleccionar este popa, este paso, este paso de destino donde destino Li DB. Permítanme simplemente combinar esto. ¿ De acuerdo? Nuevo nu, tengo que crear un nuevo. Déjame solo crear una nueva. Está bien. Dice es el nombre. Está bien, bien. Haga clic en ok. Este es el nombre de conexión. Está bien. Nombre de la tabla Voy a seleccionar. No, primero tengo que crear una nueva tabla. Tengo que crear una nueva tabla en el nombre de la tabla será, déjame simplemente crear una nueva tabla. Drg underscore empleado, dst, tabla, ID, var, char, Nombre, apellido, género, país, nombre de
cada departamento, OK. Haga clic en Aceptar. Mappings. Bien. Haga clic en Aceptar. No, guarde esto. De acuerdo, ahora tengo que ejecutar esto. Ejecutar. Entonces así es como ejecutas esto. Entonces mira, se habían cargado 69 registros totales en mi tabla. Déjame refrescar mi mesa. Dados. Refrescar esta base de datos. Ahí está mi mesa. Déjame sólo revisar mi mesa. Se ha creado una nueva tabla. Entonces el nombre de tabla es éste. Selecciona las 1000 primeras filas. Look total 59 registros se han cargado en mi tabla. Mira. Entonces ya que hemos realizado en null, left outer join, entonces estamos obteniendo el valor nulo 0. ¿ De acuerdo? Por lo que espero que hayas entendido el concepto de Fusionar, Unir y unir toda transformación. Muchas gracias y tengan un gran aprendizaje.
8. Transformación condicional ConditionalSplit: Hola a todos. En esta conferencia en particular, vamos a ver un ejemplo de una división condicional en SSI. Sí. Por lo que la división condicional es igual que si condición. Por lo que en base a los datos de condición se enrutan. Ok, entonces con el fin de entender mejor el concepto, déjame simplemente crear mi paquete primero. Entonces voy a crear un nuevo paquete. Entonces voy a llamar a este paquete condicional split ejemplo, CFS ejemplo. Ok, seleccionaré la sección de flujo de datos. Haga clic en esto, luego voy a seleccionar la fuente. Por lo que primero necesito seleccionar mi fuente. Por lo que voy a seleccionar la base de datos como mi fuente, OLED, OLED DB fuente. Entonces lo que quiero, quiero leer datos de una tabla de base de datos. Entonces para eso, necesitas usar esta fuente. Entonces déjame mostrarte mi tabla desde donde voy a leer datos. Entonces esta es mi mesa. Fusionar tabla de subrayado. En esta tabla, IF ID, nombre, apellido, género, país, agente, id
departamento. entonces lo que voy a hacer a continuación, voy a configurar esto. Haga clic en esto. Entonces lo que estoy haciendo ahora mismo, estoy creando una nueva conexión. Estoy creando una nueva conexión OLED DB. Estoy creando una nueva conexión DB. Entonces lo que
quiero, no quiero crear esta nueva conexión una y otra vez. De acuerdo, entonces lo que pueda hacer, puedo crear una nueva conexión aquí en deep connection manager. Por lo que voy a crear un nuevo gestor de conexiones, nueva conexión. Ahora a partir de aquí, voy a seleccionar la conexión de base de datos. Entonces, ¿dónde está mi conexión a base de datos? Necesito seleccionar desde aquí. Por lo que seleccionaré este OK, haga clic en Aceptar. Por lo que he seleccionado esta conexión de base de datos. Ahora si voy a seleccionar esta opción, no
necesito crear una nueva conexión. Entonces desde el menú desplegable voy a seleccionar, ok, ahora nombre de tabla de visión general, tabla. Voy a seleccionar este. Fusionar tabla de subrayado. Por lo que esta tabla, seleccionaré columnas, columnas de salida de error. Ahora estas son las columnas de esta tabla. Por lo que este paso se hace en doméstico. Siguiente Voy a usar la transformación dividida condicional. Por lo que condicional split drag and drop aqui en base a la condición voy a enrutar mis datos. Por lo tanto, combina el primer paso con d, segundo paso con el escalón dividido condicional. Ahora aquí voy a precisar la condición. Por lo que especificaré la condición en esta columna en particular, país. Si país es igual a dos Estados Unidos, Estados
Unidos, permítanme escribir una condición igual igual a Estados Unidos. El resultado será USO. Por lo que estos serán empleados de usaid. ¿ De acuerdo? Ahora bien, si País igual igual a, lo siento, país, Francia. Entonces la salida será Francia. Este es el nombre de salida predeterminado, predeterminado. Entonces esto va a ser por defecto, salida por defecto. Ok? Entonces si país es igual, igual a dos Estados Unidos, esta será la salida. Si Country igual es igual a Francia, este será el nombre de salida. Diferente será la salida predeterminada. Entonces, está bien, ahora, siguiente voy a seleccionar D Wally DB, destino LE DB. ¿ De acuerdo? Mab, este el primero, éste va a ser de salida. El primero va a ser USA. Usa irá a este destino. El segundo va a ir a D. El segundo destino no lo hace Francia. El tercero. Voy a tener otra base de datos de conexión. Esto irá al valor predeterminado. Este será el predeterminado. Entonces voy a tener tres destinos. El primero basado en la condición. Entonces esta es la condición, estados
unidos, esto irá a este destino, Francia irá a este destino, y la salida predeterminada irá a d, este destino. En la salida por defecto, voy a obtener datos distintos de USA en Francia. Ahora permítanme que acaba de configurar esto. No necesito crear una nueva conexión. Está bien, ya está ahí. Por lo que el nombre de la tabla será. Entonces voy a crear una nueva tabla para esto. Mesa será USO. Por lo que este será el nombre de los mapeos de tablas. Bien. Segundo voy a crear nuevo. Este va a ser Francia. Haga clic en Aceptar. El tercero va a ser tabla por defecto. Ahí. Voy a obtener datos que no sean Francia END USE, por defecto. Empleados, ¿de acuerdo? Por defecto. Por lo que en mi primera mesa voy a obtener datos de empleados de USA. El segundo conseguirá empleados de Francia. En tercer lugar, sacaremos datos de baja. Empleados distintos de Usain France. Tengo que salvar esto. Ahora. Después de guardar esto, voy a ejecutar este paquete. Parece que hay un error. Ok, ¿cuál es el error? Francia, encontrar, deshonesto el nombre de la tabla default. Lo que sea que esté recibiendo. Hubo error durante la ejecución Vernor campo más componente. ¿ Cuál es un componente de disco tercero, tabla o vista Columnas de mapeo en el mapeo. Está bien, bien. Mappings. Ok, bien. Guardó esto. No ejecutar esto. Está bien. Los procesos ejecutados con éxito. Ahora necesito revisar mis mesas. Por lo que se crearán tres tablas más. Refrescar. Y los nombres de las tablas son, los nombres de las
tablas son USO decente. Esto tendrá empleados de Estados Unidos. Look country USA. Usa implica que el segundo será Francia. Decimal tienen empleados de francia. Francia más antigua. El otro, default. Esto tendrá datos distintos de Francia y USC. ¿ De acuerdo? Entonces este es el concepto de ramita
condicional basado en la condición en la que va a dividir tus datos. Entonces espero que hayas entendido el concepto. Muchísimas gracias y ten un gran aprendizaje.
9. Transformación de búsqueda: Hola a todos. En esta conferencia en particular, voy a explicar el concepto de transformación de búsqueda en SSI. Entonces para entender el concepto de transformación de búsqueda, primer lugar, déjame mostrarte mi tabla de búsqueda. Entonces lo que quiero lograr, Déjame mostrarte lo que quiero lograr. Por lo que en mi tabla de búsqueda, tengo esta columna País o en el código de país. Entonces, en primer lugar, voy a leer datos de mi fuente. En mi fuente, tengo esta bobina de campo, contrario, déjame sólo código abierto. Mira, tengo estos países débiles, así que voy a buscar este valor de cuota de país en mi tabla de búsqueda. Y contra el campo campestre, voy a conseguir el código de país. Entonces permítanme leer primero el archivo fuente aquí. Entonces, en primer lugar, voy a usar las fuentes de archivos planos. Déjame solo configurar esto. Voy a crear un nuevo gestor de conexiones browse y archivos CSV, empleado dot CSV o k columnas. Y adelanto avanzado. Entonces este va a ser mi conjunto de datos. ¿De acuerdo? Este país mira columnas. Esta va a ser mi fuente. De acuerdo, a continuación voy a usar la transformación de búsqueda. Lookup. Se configuró la transformación de búsqueda. Haga doble clic en la transformación de búsqueda, ok. Entonces en la transformación de búsqueda, tengo tres, modo
caché, caché completa, efectivo
parcial, sin efectivo. Entonces cuando voy a seleccionar más el efectivo, así que esto va a, esto va a seleccionar todos los datos de mi consulta o tabla de consulta. Esta es mi tabla de búsqueda. Se va a seleccionar todos los datos de, de la tabla de búsqueda y almacenará los datos en la caché. De acuerdo, ¿cuántos registros totales? Permítanme sólo contar el número de registros. Tan total hay 13 filas en mi tabla, por lo que almacenará todas las reglas de cocaína en D, caché, caché completo. Entonces déjame solo darte un escenario. Permítanme que explique cómo va a funcionar el proceso. Déjame abrir este archivo. Entonces déjame solo aplicar un filtro aquí. Actualmente, liderar seleccionar los Estados Unidos. Entonces mira, se buscará este valor. Por lo que primero tengo que configurar el tipo de conexión de caché completa, tipo de conexión. Puedo seleccionar dicker cache connection manager, o puedo seleccionar el único gestor de conexiones DB ya que estoy leyendo datos de mi tabla de base de datos. Por lo que voy a seleccionar el gestor de conexión de DB aceitosa. Entonces si estoy leyendo datos de un archivo de caché, así que voy a seleccionar esta opción en particular ya que en este caso estamos leyendo datos de una tabla de base de datos de tabla voy a seleccionar esto, especificar cómo endl Ruth. Sin entidades coincidentes. Si no hay partido. Por ejemplo, esta es mi tabla de referencia o tabla de búsqueda. Si no hay partido, ¿qué pasará? Componente de fallo, ignorar falla o redirigir reglas a ninguna salida de coincidencia. Ok, entonces voy a tener dos salidas. Una será la salida puré, la otra será la salida inigualable, vale, conexión. Entonces voy a seleccionar mi cable aquí, mesa de búsqueda. Aquí. El cuadro de búsqueda es esta tabla de búsqueda columnas. Entonces, ¿qué opciones tengo? Por lo que quiero tener un lookup en base a países. Seleccione esto contra país. Voy a conseguir la columna de búsqueda de cancha country, código de país. Está bien, bien. Ahora mismo este Tab Avanzado, no
veo nada en mi paso avanzado. Haga clic en Aceptar. Se ha configurado, se selecciona como efectivo completo. Más, haga clic en Aceptar, guarde esto. Ahora, siguiente voy a seleccionar, no
voy a insertar su tiempo en mi base de datos. Seleccionaré ya que estoy probando. Por lo que seleccionaré la opción multicast. Seleccionaré para multicast. Uno es para puré de salida, el otro es para inigualable. Esto va a ser salida uno es partido. Haga clic en Aceptar. El otro va a ser la búsqueda inigualable, sin salida de coincidencia, vale, guarda esto. Ahora ejecuta el proceso. Por lo que cuando se ejecute el paquete, los
primeros datos se almacenarán en primero, estos datos se almacenarán en la caché, luego se realizará la búsqueda. Parece que hay un error. Tengo que ver, OK, este archivo está abierto. Ahora ejecuta de nuevo el paquete. Guarda esto y vuelve a ejecutar el paquete. Entonces esto va a funcionar. Ahora, mira, 53 reglas están igualadas, sólo seis filas son inigualables. Entonces déjame sólo ver. El Visor de Datos incapaz del residente. Datos somos todas columnas están enmalladas. Está bien. Código de País. Fui a verla. Código de país. Está bien. No quiero ver mi crecimiento inigualable. Mira. País contra país de Dios, el código de país, está bien. Japón para Japón, 81 es el código de país. De acuerdo, ahora, lo que estoy tratando de explicar en este momento, modo
completamente caché está configurado. Entonces, cuando se configura el modo de caché completa,
entonces, ¿qué sucederá? Entonces déjenme abrir primero este archivo. Aplica un filtro aquí. Entonces digamos que estoy seleccionando Australia y Estados Unidos, o tal vez Japón. De acuerdo, déjame, vale, así que supongamos que esta es mi primera fila. Entonces, ¿qué pasará en caso del modo de caché completa? Por lo que este valor se buscará en su totalidad, en la memoria caché. Y voy a obtener los resultados de mi caché, memoria caché
completa, vale, así que usamos la opción de modo de caché completa cuando mi tabla de búsqueda es,
es pequeña en caso de que mi tabla de búsqueda sea enorme. Entonces esto es, esto va a golpear el rendimiento del sistema. El motivo por el que va a golpear el rendimiento del sistema porque si tenemos que copiar los datos de esta tabla de búsqueda dos para atacar, va a consumir tantos recursos del sistema. Imagina que millones de registros habían sido copiados en la caché. Entonces obviamente definitivamente va a tomar tantos recursos del sistema, ¿de acuerdo? Esa es la razón por la que se utiliza esta opción de caché completa cuando esta tabla de búsqueda es pequeña, no es enorme. ¿ De acuerdo? ¿Y la caché parcial? Cómo va a funcionar esta caché parcial, el concepto de caché parcial. Déjame seleccionar esta opción de conexión. Aquí tienes que especificar el tamaño de caché. Supongamos 25 MB, OK, haga clic en Aceptar. Ahora cómo va a funcionar el proceso. En este caso, ahora, no todos los datos se copiarán en la caché. Entonces, ¿qué pasará? Déjame seleccionar, vale, así que esta es mi primera fila. Este Estados Unidos se va a buscar en este momento el caché está vacío. No he ejecutado el paquete en este momento. D, d efectivo parcial está vacío. No hay datos en d efectivo parcial. Entonces, ¿qué pasará? Estados Unidos se buscará en el, en la memoria caché parcial. Y como la caché está vacía, por lo que no obtendrá los datos. Ahora, y si el próximo proceso, lo hará. A continuación buscará los datos en mi tabla de búsqueda, bien, de esta tabla de búsqueda, guess equal getter deta United States contra Estados Unidos. Lo hará, obtendrá este código de país único. Por lo que en la caché, por defecto, en la memoria caché parcial, después de obtener los datos, almacenará Estados Unidos en el código de país uno. ¿ De acuerdo? ¿Y la próxima vez? ¿ Cuándo esta próxima vez se ejecute esta fila? ¿ Qué pasará? Estados Unidos se buscará en caché D, efectivo parcial. Ahora esta vez alrededor,
en el tiempo parcial de Charybdis alrededor, vamos a conseguir eso en el tiempo d, en efectivo parcial, vale, así que contra este código de país, Estados Unidos obtendré un valor de D efectivo parcial. De acuerdo, ahora supongamos cuando la tercera vez, cuando se ejecute la tercera fila, supongamos que la tercera fila es ésta. Déjame simplemente buscar diferentes Brasil. Supongamos que la tercera fila es este Brasil. Ahora, ¿qué pasará? Este Brasil no se almacena en la caché parcial. Entonces primero, este valor se buscará en d, memoria caché parcial. A partir de la memoria caché parcial, no obtendrá los datos. Ahora, ¿cuál es el siguiente paso? siguiente paso es buscar los datos en la tabla de referencia, en la tabla de búsqueda, en la tabla de búsqueda, obtendrá los datos. Esto es de contra Brasil. Conseguiré 55. Ok. Ahora esto, estos dos valores se almacenarán en d aquí en la memoria caché parcial. Entonces así es como va a funcionar el efectivo parcial más. Ahora cuándo usar la opción de caché parcial. Por lo que utilizamos la opción de caché parcial. Wendy, la tabla de búsqueda es grande cuando ahora está configurada, OK, haga clic en Aceptar, guarde esto. Ahora estoy ejecutando este paquete con efectivo parcial. Ejecutar. De acuerdo, tengo que cerrar este expediente. ¿ De acuerdo? Tengo el resultado, ok, esta vez alrededor, esto se ejecuta con efectivo parcial. Ahora, la próxima vez voy a seleccionar el no efectivo. En caso de que no haya efectivo, ¿qué pasará cuando se ejecute por primera vez este paquete? No hay memoria caché vacía. Entonces, ¿qué pasará? Déjame abrir el archivo aquí. Supongamos que esta es la primera fila. Supongamos que ésta es la primera fila. Japón es la primera fila. ¿ El valor de Japón será tal en la memoria sin caché, por lo que no obtendrá los datos ok, entonces buscará datos en la tabla de búsqueda. De la tabla de búsqueda, obtendrá los datos, de acuerdo, entonces el valor se almacenará en el valor se almacenará en D, sin memoria caché. Ok, este valor, ok. La próxima vez, digamos Japón. El siguiente valor es Japón. Siguiente fila es Japón, se buscará Y SIN memoria caché. De la memoria sin caché, va a conseguir que los datos estén bien, porque toman ya guardado. Ahora, ¿qué pasa con esto temprano? Supongamos que el siguiente valor es este, En lugar de Japón, el siguiente valor es Brasil. Por lo que el valor Brazi se va a buscar en D, sin memoria caché. ¿ De acuerdo? En la memoria sin caché, no obtendrá los datos ahora en esta ocasión alrededor de búsqueda igualitaria en la tabla de búsqueda D, en la tabla de búsqueda, obtendrá los datos, vale, Brasil contra Brasil, voy a conseguir esto. Entonces ahora ¿qué pasará? Se sobrescribirá el valor anterior, Brasil. Ahora en la memoria sin caché, Brasil en 55, se almacenarán estos dos valores. El valor anterior, que era Japón, se sobrescribirá,
vale, solo se almacenará un valor único. tanto que cuando se trata de caché completa, cuando se trata de efectivo parcial, se almacenarán
todos los valores. Ok. Entonces en caso de que no haya efectivo, el último valor, el último valor se almacenará ok, cuando la próxima vez, cuando llegue el nuevo valor, el valor anterior se sobrescribirá en la caché. Entonces esto no es efectivo. Por lo que columnas de conexión. Entonces cuando usamos denotar efectivo, así que usamos la memoria no caché cuando tenemos memoria reducida de memoria, cuando no queremos guardar todos nuestros datos en la caché. En caso de restricción de memoria, se
utilizó la opción sin caché. Ahora haga clic en Aceptar. Guarda esto. Esta vez, estoy ejecutando el paquete con la opción de memoria caché. Mira, los datos se han ejecutado, vale, se ha ejecutado un paquete DD. Entonces espero que hayas entendido el concepto. Muchas gracias y tengan un gran aprendizaje.
10. Transformación de cache: Hola a todos. En esta conferencia en particular, voy a explicar el concepto de transformación de efectivo en SSAS. También veremos el propósito de usar la transformación de caché. Entonces, en primer lugar, permítanme mostrarles mi tabla de búsqueda, que está en la base de datos de SQL Server. Entonces esta es mi tabla de búsqueda. Entonces en la conferencia anterior, lo que estábamos haciendo, estábamos leyendo estos datos de la tabla de la base de datos. De acuerdo, así que esta es la tabla de la base de datos. Ahora, lo que quiero, en lugar de leer datos de una tabla de base de datos, quiero leer datos de un efectivo. Entonces cómo puedo leer datos de un efectivo, usaré la transformación de efectivo para almacenar primero datos en una memoria caché, luego leerlo de, de, de un efectivo. Entonces, ¿cómo puedo hacerlo? Puedo hacerlo usando la transformación de caché. Por lo que hay dos posibilidades de hacer esto. La primera posibilidad es o guardas los datos en archivo de caché, no archivo de caché de deuda se almacenará en la memoria caché. Se etiqueta la segunda posibilidad. Almacena todos los datos en la memoria caché. Ok, entonces con archivo de caché, el beneficio es etiqueta, puedes usar archivo de caché de deuda en múltiples paquetes, en, en, en cualquier paquete, OK, pero con la primera posibilidad de deuda, copias todos los datos en la caché memoria. Con este caso, el inconveniente es la pila. Solo se pueden leer datos de él en efectivo en un solo paquete. Ningún otro paquete puede leer los datos de la caché. Por lo tanto, permítanme darles una demostración práctica de este concepto. Entonces, en primer lugar, mi primero, en primer lugar, lo que voy a hacer, voy a leer estos datos, estos datos de búsqueda, y lo voy a almacenar en,
en un archivo de caché. Entonces para la deuda, tengo que usar fuente t Wally DB. Déjame solo usar este OLED ser fuente configurada este paso. Por lo que seleccionaré la tabla. Voy a seleccionar mi tabla de búsqueda. De acuerdo, columnas finas, bien. Haga clic en Aceptar. Entonces voy a seleccionar la transformación de caché aquí, transformación de corte, ésta. Ok, haga doble clic. De acuerdo, gestor de conexión de caché. Voy a crear un nuevo gestor de conexión de caché aquí. Entonces este va a ser mi gerente de conexión de efectivo. Entonces lo que voy a hacer, voy a crear un archivo de caché. Aquí. Voy a crear, crear un archivo de caché que se almacenará en una memoria caché. Entonces el formato de este archivo de caché será este de campo oscuro w. Ok, entonces este va a ser mi gash de encofrado. Phi es el nombre abierto. Entonces este va a ser el nombre fuera del archivo de caché. Haga clic en Aceptar. ¿Debe ser al
menos un índice indica especificar algún índice en esa pestaña de columna, de acuerdo? Bien. Columnas. Tienes que especificar el índice. En este caso contra país, estoy, estoy recibiendo el código de país. Por lo que el país va a ser mi índice. Entonces voy a especificar un valor uno. Entonces este va a ser mi índice. Encuentra mappings, country, country, country acorde. Está bien, bien. Guarda esto. Entonces, ¿qué pasará? Creará una pelea de efectivo con extensión. Con extensión CHW oscura, tengo que ejecutar este paquete. Ahora, ¿qué pasará? Mira que el paquete se ha ejecutado con éxito. Por lo que el beneficio de crear el archivo de caché es tat. Ahora, puedo crear múltiples paquetes de paquetes y puedo usar este archivo de caché allí. Ahora, lo que voy a hacer a continuación, voy a crear un nuevo paquete aquí, nuevo paquete. Ahora flujo de datos. Entonces voy a seleccionar, o puedo,
puedo seleccionar el paquete existente desde aquí. Entonces digamos que la búsqueda es mi paquete existente, flujo de datos. Tengo que seleccionar sección Dataflow. Este paquete, voy a cancelar este paquete. ¿ De acuerdo? Entonces este es el paquete de transformación de efectivo, y éste es el paquete Lookup. Haga doble clic en esto. Permítanme simplemente borrar esto. No quiero esto ok. Eliminado este multicast. Entonces en lugar de multicast null, voy a usar otro destino, ¿de acuerdo? No hay efectivo más efectivo totalmente en efectivo más modo parcial, no hay efectivo más. Voy a seleccionar el modo de caché completa. Con el modo de caché completa, voy a obtener dos tipos de conexión, opción, gash connection manager y oleoso DB manager, gestor de conexiones. Que esta opción, voy a leer datos de mi tabla de base de datos. De acuerdo, ahora lo que
quiero, quiero leer datos de mi archivo de caché. Por lo que seleccionaré esta opción conexión aquí. Voy a seleccionar el gestor de conexiones. Entonces en este caso, este es el nombre de administrador de conexiones. Permítanme decir sólo el nombre del gestor de conexiones que utilicé aquí. Entonces el nombre del administrador de conexiones es éste. Gash connection manager es el nombre. Por lo tanto, permítanme seleccionar el nombre del administrador de conexiones. Gestor de conexión de caché es el nombre. Así que he seleccionado sí escribir administrador de conexión ok. Columnas. Estas son las columnas contra país. Voy a conseguir el código de país ahora. Ahora bien, no voy a obtener los datos de mi tabla de base de datos. Por lo que obtendré los datos de mi archivo de caché, que se almacena aquí, que se crea aquí. ¿ De acuerdo? D Ss. Por lo que este archivo de caché se almacenará en la memoria caché. De acuerdo, flujo de efectivo decente. Déjame simplemente abrirla. No puedo abrir esto. Puedo abrirlo, pero el formato, el Señor, siendo legible, Esto no es un formato legible. De nuevo, cinco. Ahora, aquí lo que puedo hacer la transformación de caché, se
hace y se espolvorea. Por lo que la próxima vez que vamos a seleccionar el Destino de Archivo Plano, arrastre Destino de Archivo. Seleccionemos esto. Entonces lo voy a almacenar en,
en salida de match de búsqueda. Entonces seleccionaré solo importa, pero déjame solo configurar esto. De acuerdo, nuevo, voy a crear un nuevo OK. Haga clic. Ok. Vamos a crear un archivo aquí, archivo CSV aquí. Por lo que el nombre del archivo será simple. ¿ De acuerdo? Columnas abiertas, estos serán los nombres de las columnas. Vista previa, bien, mapeos finos, bien. País llamado, bien. Entonces este va a ser el nombre. Entonces déjame solo comprobar el error aquí. ¿ De acuerdo? Decodificar el valor de Pij es 65001. Está bien, déjame cambiar de actualización. Está bien, déjame cambiarlo. El marcador página 65001. Por lo que voy a seleccionar la disciplina de opción 65001. Está bien. Ahora bien. Mappings encontrar. Ahora ejecuta. El paquete. El paquete ha sido ejecutado con éxito. Look simple dot CSV es el nombre del archivo que se genera aquí. De acuerdo, entonces este es el archivo que se genera. Si tengo que incluir los encabezados, también
puedo hacer eso. Ahora. Por lo que este es un ejemplo de lectura de datos a través de un archivo de caché. Ahora siguiente les voy a dar un ejemplo de lectura de datos de una memoria caché. Entonces esta fue la transformación de caché. Entonces ahora déjame solo editar el, en lugar de elegir esta opción en particular, qué puedo hacer, puedo usar esta opción, ¿de acuerdo? Puedo desmarcar esta opción. Con esta opción, se va a leer datos de una memoria caché nada de un archivo de caché. Pero el problema con esta opción es que puedo leer datos de la memoria caché solo en un solo paquete. Esto no se puede hacer en múltiples paquetes. Pero con esta opción, puedo leer este archivo de caché en múltiples paquetes. ¿ De acuerdo? Al igual que este es otro paquete. Este es otro paquete. Estoy leyendo datos, estoy leyendo este archivo de caché de otro paquete. Puedo crear algunos paquetes más y leer este psi en particular. Pero con esta opción, esta opción me limitará sólo cuatro para este paquete en particular. De acuerdo, ahora, lo que puedo hacer, déjame solo editar esto. En lugar de esto, voy a elegir esta opción, ¿de acuerdo? Ahora qué puedo hacer para disfrazar mi sola enfermedad, mi solo paquete, ¿de acuerdo? El solo paquete donde por primera vez leyendo los datos de origen, estoy leyendo los Datos de búsqueda y luego estoy colocando que yo en mi memoria caché. Después de esto, puedo crear otra tarea de flujo de datos. Puedo crear otra tarea de flujo de datos desde el aire. Y yo puedo hacer esto. Entonces déjame simplemente configurar esta tarea de flujo de datos. De acuerdo, ahora, en esta tarea de flujo de datos, voy a construir la misma lógica de búsqueda. Esta lógica de búsqueda, bien, archivo plano, leyendo desde archivo plano, luego mira aquí en este lookup, voy a leer de un efectivo. Por lo que seleccionaré esto entonces este tipo de conexión. Voy a seleccionar el gestor de caché de conexión. ¿ De acuerdo? Entonces hagámoslo. Una vez más. Fuente de archivo plano. Entonces déjame solo configurar el archivo plano. Permítanme simplemente seleccionar nueva navegación. Cv, empleado dot csv, ok, columnas. De acuerdo, encontrar previsualizaciones de esto van a ser mis datos. Está bien, bien. La próxima vez vamos a usar la búsqueda. Ok. Esta vez alrededor, voy a leer datos de totalmente cobrados, seleccione esta conexión aquí. Voy a seleccionar el gestor de conexiones de caché. De acuerdo, entonces en el gestor de conexiones de caché, he configurado. Permítanme primero combinar esta cookie de pegamento fino en el gestor de conexiones de caché. Tengo que mostrarles esto en mi primera tarea de flujo de datos, efectivo. Entonces gerente de conexión de efectivo, selecciono, tengo desmarcar esta opción, ¿de acuerdo? Ahora en esta ocasión voy a leer datos de él en efectivo. Ahora Tarea de flujo de datos para buscar, encontrar el mal configurado. La próxima vez seleccionaremos la multicast solo para fines de prueba. ¿ De acuerdo? Combina esto con la opción Multicast. Voy a seleccionar sólo la salida de coincidencia en este momento, no hay necesidad de dar una salida de adder. Guarda esto. De acuerdo, ejecuta la tarea, ejecuta el paquete. Esto me está dando un error, peor error y, estoy recibiendo este error. Cv ha terminado. Está bien, ha permitido resultado, está bien, bien. ¿ Cuál es el error exactamente? Déjame sólo comprobar el error. Y, estoy recibiendo este error. Ok. Redirigir las reglas para que coincidan, ignorar el fracaso. Redirigir reglas para igualar salida. Ahora bien, está bien, bien. Ok. Entonces así es como lees datos de un refresco en efectivo. Espero que hayas entendido el concepto de transformación de efectivo en SSAS. Muchas gracias y tengan un gran aprendizaje.
11. Grouping de fuzzy: Hola a todos. En esta conferencia en particular, vamos a discutir la búsqueda difusa y la transformación de agrupación difusa en SSI es 2D. Entonces, en primer lugar, permítanme explicar el escenario. Entonces esta es mi hoja de Excel. En mi hoja tengo estos datos, tipo de artículo de país, unidades o precio , costos
unitarios, ingresos totales, beneficio total, etc. Así que si nos fijamos en este campo de país, tengo algún valor incorrecto. Entonces, por ejemplo, tengo este país llamado India. Por lo que miro el valor de la India es incorrecto, la ortografía es incorrecta. Terminar IEEE, esto es incorrecto. Mira IND I0, I0. Entonces lo que quiero hacer, quiero agrupar por país Campo. Y voy a tomar algo de precio unitario, costo
unitario, ingresos totales, costo
total, y beneficio total. Pero si voy a hacer esto, obtendré el valor incorrecto porque este valor de campo país es incorrecto, algunos valores son incorrectos. Entonces no voy a conseguir el grupo correcto por resultado. ¿ De acuerdo? Entonces, en primer lugar, lo que voy a hacer, voy a transformar este conjunto de datos, transformado este campo de país. Por lo que hay algunos otros campos que son incorrectos. Por ejemplo, Estados Unidos. La ortografía es incorrecta. Está bien. ¿ Y el Reino Unido? Entonces mira, Reino Unido. De acuerdo, mira, k i n, g, d am ortografía es incorrecta, así que usando la confirmación de agrupación difusa, voy a corregir este campo, voy a ir a este campo country. Ok? Entonces lo que va a hacer, va a tomar la mayoría de los valores. Mira, mira esto bastante India, entonces va a ir correcto, el valor incorrecto. Por ejemplo, India va a comparar con todos los valores, valores mayoritarios, valores correctos. Y entonces se va a corregir este valor k, luego este indio. Entonces hay algunos otros campos, déjame sólo Canadá los valores mayoritarios son esta modalidad los valores son correctos. Hay algunos valores que son incorrectos. El diésel es incorrecto. Mira la ortografía. Está bien. De igual manera, Australia, sólo hay 22223 valores, ok. Este valor d desvalorización, LLC. La ortografía correcta es esta una bien, ahora, voy a leer este archivo, archivo Excel. Por lo que usaré la transformación de archivo plano, Fuente de archivo plano, lo siento no transformación hace paso fuente, haga doble clic en nuevo navegar. Por lo que tengo que seleccionar primero el archivo. Ventas. Además, voy a cerrar este expediente. Ya ha cerrado. De acuerdo, columnas. Encuentra vista previa avanzada. Por lo que previsualizar. Entonces qué, ya que estoy realizando las operaciones GroupBy o tengo que
convertir el tipo de datos por precio unitario. Debería ser, digamos flotar. Los costos unitarios deben ser sueltos. Tengo que convertir esto. Costo total, flotación, beneficio total, flotar, bien, vista previa. Encuentra columnas. Las escrituras son las columnas que forman parte de mi archivo fuente. Ahora, a continuación, voy a usar esta transformación difusa a tientas. Voy a conectar esto con esta agrupación difusa doble clic. Está bien. Administrador de conexiones, especifique el administrador de conexiones que se utilizará para almacenar Tablas Temporales. Usos de transformación de datos. Por lo que el agrupamiento difuso va a crear esta transformación de agrupación difusa va a crear las tablas temporales. Entonces la deuda es la razón por la que tienes que crear la conexión de base de datos aquí. Por lo que ya he creado, ya he seleccionado este. Columnas. Estas son las columnas. Entonces ahora, ¿qué columna quieres? Qué columna desea corregir? Deseo corregir esta columna de entrada de campo de país. Esta columna de entrada es los datos de la columna que viene de la fuente al columna
s2 y alias de salida a tientas. Entonces país limpio va a ser d, nombre corregido, ¿de acuerdo? Ahora tipo, hay dos tipos. Coincidencia exacta cuando hay un partido del 100%. En primer lugar, la similitud mínima de molaridad debe ser 0. ¿ De acuerdo? Ahora números, así que hay diferentes opciones, así que tengo que explicar estas múltiples opciones. Por lo que primero, necesario, liderando y atrayendo nuevos números no son significativos. Tengo que explicar el significado de esta frase. Por lo que hay que mirar este ejemplo, especificar la importancia de los números a la izquierda y al final al comparar los datos de la columna. Por ejemplo, si los números principales son significativos, ¿de acuerdo? Si los números principales solo son significativos, mira estos dos valores,
entonces estos dos valores no se agruparán, ¿de acuerdo? El valor de calefacción es 123 y el valor final es Calle. ¿ De acuerdo? Entonces aquí en este caso, voy a seleccionar necesarios en caso de necesidad, los números de inicio y final no son significativos,
entonces en este caso, entonces en este caso, estos dos valores se agruparán porque he seleccionado en ninguna de las dos opciones. Ahora. ¿De acuerdo? Entonces usaré la opción multicast. Habilitado una opción de visor de datos. A mordisquear Data View. Seleccione los campos. Actualmente varía los alimentos del
país, los piensos limpios del país, campo limpio del país va a venir aquí. ¿ Dónde está el país para el diseño ansioso? ¿ Es el campo País? Permítanme simplemente colocar el campo campestre dentro del aire. Ok, haga clic en Aceptar. Ahora guardar esta transformación en ejecutar. Ahora vas a ver una cosa es muy importante antes de ejecutarla. Necesito mostrarles un paso más, lo cual es muy importante. Haga doble clic en avance. Este se hace industria, tengo que hacer clic en esta clave de entrada avanzada, salida t y la similitud, similitud. Entonces si hay, hay una coincidencia exacta, entonces la similitud sería un 100%, casi un 100%. Ok. Y ahora quiero fijar el conteo de similitud al 62%, ¿de acuerdo? Delimitadores de tokens, significa stead estos medidores diarios serán considerados al coincidir. De acuerdo, tabulador espacial, carro, retorno, alimentación de línea. En caso de que quieras incluir algunos más. se puede hacer. Aquí puedes agregar estos delimitadores, ¿de acuerdo? Ahora, 62%, está bien, bien. Haga clic en Aceptar. Guarda esto. Ahora, ejecute. Ahora vas a ver el resultado, India. India. Está bien, bien. India. Este S1 es el valle incorrecto. Este es el valor corregido. India IIA valor incorrecto, indiferente es el valor corregido. Está bien. ¿ Y qué pasa con la similitud? La similitud entre estos dos valores son 8379%, por ciento de similitud es 79%. Entonces digamos si aumento el umbral de similitud,
entonces, ¿qué va a pasar? Permítanme simplemente aumentar la similitud al ochenta y cinco por ciento. Déjame mostrarte el resultado aquí. Entonces. Esto y esta integral, este valor de la India va a ser tratado como valor separado. Ok? Esto no se corregirá. De acuerdo, ahora déjame sólo porque en este caso, el recuento de
similitudes está por encima del 82%. Ahora déjame solo hacer doble clic avanzar y déjame simplemente disminuir el conteo de similitud al 62%. Haga clic en Aceptar. Entonces así es como corriges tu conjunto de datos, que viene de la fuente. Ahora, si miras el valor de Estados Unidos,
mira, esto antes se ha corregido. Se considerará la mayoría de los valores. Este valor está en minoría, vale, el Reino Unido del estado, Canadá. ¿ Qué pasa con Canadá? Los valores mayoritarios son Canadá el cual es valores corregidos, algunos valores son incorrectos, cuales serán corregidos por este algoritmo de agrupación difusa. Y mira el recuento de similitud ochenta y cinco por ciento. Mira, esto ha sido corregido. Esto se comparará con el con los valores corregidos y esto será corregido por el difuso. Agrupando consumación Australia, Australia valor ha sido corregido. Mira, Australia, este es el correcto. Los valores mayoritarios de Australia son correctos, ok. Hay algunos valores que son incorrectos. El umbral de similitud. Ahora. Y ahora si voy a realizar la operación GrupoPor en el campo País, obtendré el resultado correcto. En lugar de multicast, usaré la transformación. Un grupo biotransformación aquí varía el grupoPor transformación agregada. Ok, ahora haga doble clic. Agruparé por campo de país. Y agruparemos por ingresos totales y ganancias de costo total. ¿ De acuerdo? No, país limpio, tomaré el valor corregido. De acuerdo, déjame sólo tomar el valor corregido. País limpio, este país es el valor incorrecto. País limpio es el valor corregido. Ingresos totales, costo total, beneficio total. Entonces algún país que no voy a considerar a este país. Este son los valores incorrectos en este campo. Hay algunos valores incorrectos. Todos los valores de este campo son correctos. ¿ De acuerdo? Groupby, ingresos totales, costo
total, y beneficio total. Ahora haga clic en Aceptar. Entonces voy a usar la operación multicast, transformación de multicast
sódico aquí. Después de este agregado habilitado la vista de datos. De acuerdo, país limpio ingresos totales encontrar. Guardado esto en ejecutar. Mira. País, Canadá, India, Australia, Estados
Unidos, Reino Unido. De acuerdo, ahora déjame solo, en lugar de usar la cuota de limpieza del país, ahora, déjame usar T. Déjame solo incluir las otras cuotas de país de campo. Ahora. Permítanme simplemente excluir a este país fluido limpio es concretamente, permítanme usar el país más libre disciplina
más libre. ¿ De acuerdo? Ahora agrupados por país. Ahora vas a ver que los valores serán incorrectos. Mira, que contiene D valores incorrectos. Mira, Canadá engaña repitiendo dos veces, múltiples veces, estoy obteniendo los resultados incorrectos. De acuerdo, así es como transformas tu conjunto de datos de fuentes de datos usando la transformación de agrupación difusa. Permítanme simplemente cambiarlo a país limpio, que es el correcto. Está bien. Y ahora se ha corregido. Y ahora vas a ver los datos correctos. ¿ De acuerdo? Por lo que ahora siguiente, vamos a discutir Té para el lookup.
12. Transformación de termExtract: Hola a todos. En esta conferencia en particular, vamos a discutir la transformación de extracción de dos términos en SSRI. Sí. Entonces, en primer lugar, voy a leer el archivo CSV de punto de correo electrónico. Por lo que ahora primero que nada,
usaré la fuente de archivos frac con el fin de leer el archivo CSV nuevo browse, luego elegiré este archivo en particular, archivos y tendré que seleccionar el archivo CSC. Este es un correo electrónico dot csv columnas. Estas son las columnas. ID de correo electrónico, asunto del correo electrónico, correo electrónico, descripción, correo electrónico. De acuerdo, Entonces ahora lo que voy a explicar ID de correo electrónico, asunto de
correo electrónico, correo electrónico debe ser 1000. Está bien. Haga clic en Ok, columnas desierto o columnas. Bien. A continuación, voy a utilizar el término transformación de extracción. Por lo tanto, la transformación de extracción de término se utiliza para extraer palabras en inglés de uso frecuente. De acuerdo, entonces, ¿qué palabras va a extraer? Se va a extraer sustantivo auditoria se va a extraer frases de sustantivo. Entonces voy a seleccionar este, bien, Ahora tengo que conectar esto en básicamente el propósito de usar el término transformación de extracción es usar, es que se va a extraer, me va a dar la cuenta off datos de sustantivos, datos presentes en mi email descripción. Entonces ya que En este ejemplo, estoy usando, voy a usar la descripción del correo como campo. Por lo que va a contar las palabras del sustantivo en la descripción del correo electrónico. Entonces esto es extracción de tiempo. La transformación es muy útil cuando se trata de SEO, optimización de motores de búsqueda. Entonces Tom extracción aquí, lo que voy a hacer, voy a seleccionar el término de correo electrónico, puntuación ND. Entonces el correo electrónico es el término y el valor de puntuación va a ser el número de sustantivos. ¿ De acuerdo? Hay un problema es que la columna de entrada solo puede tener este tipo de datos. Entonces, antes que nada, necesito convertir el tipo de datos. Entonces para la deuda, necesito usar la transformación de conversión de datos de conversión. Permítanme simplemente quitar este letrero de flecha de aquí. Primero marfil convertir, este tipo de datos. De acuerdo, entonces voy a combinar esta fina conversión de datos. Asunto del correo electrónico, correo electrónico. De acuerdo, el tipo de datos debe ser Unicode, copia de flujo de
texto o hembra va a ser d nueva columna. De acuerdo, haz clic en Ok. Ahora término extracción, ID de correo electrónico, asunto de
correo electrónico, correo electrónico, término en la puntuación. Tengo que seleccionar la copia de la columna de correo electrónico. ¿ De acuerdo? Ahora error configurado, error de salida, reglas de redirección. En caso de fallo, redireccionar en caso de error, ignorar falla. Da click bien, ahora siguiente Voy a seleccionar el avanzado. Ahora mismo no estoy discutiendo este avance. Término tipo sustantivo, frase de
sustantivo, sustantivo, una frase de sustantivo, voy a seleccionar sustantivo. Tengo que mostrarte el archivo CSV de Excel, cual voy a leer email dot csv. Entonces este es el expediente que voy a leer. Entonces mira, este va a ser el correo, ¿de acuerdo? Entonces en esta columna de correo electrónico se va a extraer las frases de sustantivo, Ok, entonces me va a dar el conteo. Por lo que el término valor será las frases de sustantivo y el valor de puntuación será el recuento de frases de sustantivo. Bien, No Ahorres. Entonces. Ahora, el tipo de puntuación es la frecuencia. Este es el tipo entérico, tipo de
puntuación, vale, ahora mismo voy a seleccionar la frecuencia. Umbral de frecuencia es de dos, longitud
máxima. Esto está deshabilitado. ¿ De acuerdo? Ahora exclusión ahora mismo no estoy discutiendo esto, ¿de acuerdo? Haga clic en Ok. Al final voy a usar la multidifusión. Por lo que este umbral significa Tet. El sustantivo frase debe ocurrir como mínimo dos veces. Ahora, habilite la Vista de datos. Datos habilitados, estamos guardados esto y ejecutamos esta transformación. Entonces vas a conseguir d, dos columnas, término y SCO. Curso. Este es un sustantivo, comercialización es una cuota de sustantivo. Las ds están ocurriendo cuatro veces, tres veces, dos veces. Ahora, a continuación, voy a cambiar algo, ¿de acuerdo? Digamos tres veces, cuatro veces. Entonces esta vez alrededor se va a dar me hizo sólo una fila, que está ocurriendo sólo cuatro veces. Mira sólo porque el umbral está establecido como por ahora, supongamos. Ahora hay otra opción. Permítanme que disminuya el umbral. Mira, también puedes extraer en frase de sustantivo. Noun frase es la combinación de sustantivos. ¿ De acuerdo? Entonces puedes seleccionar el sustantivo, una frase de sustantivo, ¿de acuerdo? El umbral de frecuencia es de dos. Por lo que con estas dos opciones, obtendrás la longitud máxima de un término, umbral de
frecuencia y longitud máxima. Entonces, vamos a mantenerlo simple. Exclusión. Entonces digamos, si ustedes, digamos, quiero excluir cualquier sustantivo, cualquier sustantivo. Entonces lo que voy a hacer, voy a seleccionar la ODBC OLED sea conexión. Después voy a seleccionar mi tabla donde se almacena la información. En esta tabla se almacena la información. Excluir palabra. Ya he creado mesa de escritorio y ya he insertado la palabra marketing. Ahora, déjame simplemente ejecutar esta consulta. De acuerdo, Esto está en la base de datos de dados, así que ahora tengo que ejecutar este marketing. Por lo que quiero excluir el trabajo de mercadotecnia. Por lo que seleccionaré la extremidad de la tabla, excluiré palabra y palabras. Haga clic, Ok, guarde esto. Sabe va a excluir el curso de mercadotecnia n phi. Esto está ocurriendo cuatro veces y esto es un K2 veces.
13. Transformación de Term Lookup: Hola a todos. En esta conferencia en particular, vamos a discutir el término transformación de búsqueda en SSIS. Por lo que para la transformación de búsqueda de término, es necesario tener la tabla de búsqueda. Por lo que tengo esta tabla de búsqueda, término subrayado buscar arriba. Déjame simplemente ejecutar esto. Entonces en esta tabla tengo ID en la palabra búsqueda término transformación de búsqueda en SSIS se va a determinar con qué frecuencia se están produciendo estas palabras en, en mi descripción. Entonces este es el correo electrónico descripción, que voy a tomar esta columna, voy a tomar en este término búsqueda transformación va a determinar con qué frecuencia estas palabras están ocurriendo aquí en esta descripción, ¿de acuerdo? Por ejemplo, el líquido solo te da un ejemplo. Mercadotecnia. ¿Se está produciendo el marketing cuántas veces aquí? No, 0 veces. ¿ Y qué pasa con este marketing se está produciendo dos veces? Este marketing, en este marketing, triunfo, 1, 2, 3, tres veces. ¿Qué pasa con esto? 0 veces, vale, así que no se va a considerar si está ocurriendo 0 veces. Por lo que el valor umbral mínimo es uno. Ahora, a continuación voy a leer este archivo en particular, sobre todo quiero tomar esta descripción de correo electrónico. Por lo que para la deuda, necesito usar D fuente de archivo plano. ¿ Dónde está la fuente de archivo plano? Necesito usar esta fuente de archivo de hilo. De acuerdo, luego haga doble clic en nuevo navegador, archivos
CSV y archivo de correo electrónico dot csv columnas. Estas son las columnas de vista previa avanzada. Tengo que aumentar la longitud. Esto va a ser, digamos 1000 columnas. Estas son las columnas. Por lo que otra cosa importante es leer este correo electrónico se toma como un tipo de datos de este correo electrónico es cadena. Para lograr la transformación de búsqueda de cuatro términos, necesita tener el tipo de datos de cadena Unicode para la deuda, necesito usar la conversión de datos. Entonces, ¿dónde está la conversión de datos? Por lo que tengo que usar esto porque término lookup solo acepta correo electrónico Unicode. Aquí en lugar de este tipo de datos, seleccionaré este Unicode. Déjame solo seleccionar este código único, esta cadena Unicode, ¿de acuerdo? Salida Alias copia de cuaresma femenina. Voy a precisar 1000. De acuerdo, click, Ok. Esto se hace industria. Siguiente Voy a utilizar el término búsqueda transformación. Entonces, ¿dónde está esta transformación de búsqueda del sistema? Entonces permítanme simplemente configurar el término búsqueda transformación aquí. Haga doble clic. Ahora, primera vez va a especificar la tabla de referencia. Entonces esta va a ser mi mesa de referencia. De esta tabla de referencia, voy a extraer las palabras y se va a buscar en el correo electrónico. Entonces aquí voy a especificar el término tabla de búsqueda, que es mi tabla de referencia. Búsqueda de término. De acuerdo, entonces Tom lookup, ok, bien. Entonces correo electrónico, déjame solo seleccionar este correo electrónico y estas palabras. Por lo que estas palabras serán, estas pequeñas palabras se buscarán en el correo electrónico. ¿ De acuerdo? Al final, voy a tener dos columnas extra. Uno es término en el otro es el recuento de estas palabras, vale, Por ejemplo, este marketing se está produciendo tres veces, así que voy a obtener el valor de Km Y contar antes. Bien. Deseo este email ID email subject. No, no quiero este correo electrónico. Yo quiero esta copia de hembra. Entonces quiero configurar esta sección, ignorar falla. El uso de F1 les dio búsquedas sensibles. Está bien. Ahora esto se hace en gástrico. A continuación utilizaré la ejecución multicast habilitada. Está bien. Haga doble clic. Está bien, bien. Déjame solo editar un GWAS. Tengo que aumentar el tamaño de esta columna. Ahora guarde esto. Tengo que refrescar las columnas aquí. De acuerdo, columnas. Encuentra ahora ejecutar. De acuerdo, mira, tengo dos columnas extra. Término, que es la palabra en la frecuencia Teradata está ocurriendo dos veces. Aquí en este correo electrónico.
14. Transformación de gregación: Hola a todos. En esta conferencia en particular, vamos a discutir la transformación agregada en SSI. Sí. Pero primero, vamos a discutir las funciones agregadas en SQL. Entonces esta es mi mesa, mesa de empleados. En mi mesa tengo DNI, nombre,
apellido,
género, país, cada uno, nombre del departamento y sueldo. Entonces lo que voy a hacer a continuación, voy a averiguar sí número de empleados en cada departamento. Tengo este campo de nombre de departamento. Por lo que para conocer el número de empleados en cada departamento, utilizaré el recuento agregado de funciones. Entonces a partir de este
DNI, voy a, voy a tomar en cuenta este conteo de DNI. Entonces cuenta ID es una función agregada. Entonces esto me va a dar el conteo. Entonces voy a usar el nombre del departamento. Entonces voy a usar el nombre del departamento. Esto me dará el conteo sabio del departamento. Ok. Conteo de nombres del departamento, ID, groupby. Voy a crecer por sobre la base del nombre del departamento, tientas por nombre del departamento. Voy a usar otra EVD promedio, salario promedio. Entonces voy a usar d salario min. Salario promedio de cada departamento, salario
mínimo en cada departamento. Voy a usar el salario aquí. Entonces voy a utilizar el salario máximo mínimo. Por lo que máximo es una función agregada. Sueldo agrupado por conteo de nombres de departamento. Por lo que esto me dará el número de empleados en cada departamento, salario
promedio en cada departamento. Está bien. Después el salario mínimo en cada departamento y el salario máximo agrupado por nombre del departamento. Déjame simplemente ejecutar esta consulta. Entonces esto va a, Vale, éste es salario promedio. A medida que EVD subrayan salario. Necesito ejecutar este primer salario promedio. Este va a ser el salario mínimo, F min subrayado Salario. Este va a ser mi f salario máximo. Al final, voy a enterarme del salario total en cada departamento. Sueldo como Door tell underscore sueldo. Entonces esta es mi consulta SQL completa. Todo salario, salario mínimo, salario
máximo, salario total. Todo salario emitido como decimal. Necesito convertir cada caridad a dos puntos decimales. Entonces voy a tener diez. Ejecutar la consulta. Mira dos puntos decimales. Ahora voy a utilizar la transformación agregada en mi, en mi SSI AS2. Este va a ser número de empleados. Como número de empleados. Número de empleados. El departamento de Ba cuenta con seis empleados. En nuestro departamento cuenta con 20 empleados. Departamento de tecnología tiene diez, implica. Se trata de salarios medios. Salario mínimo, departamento de la NBA es de 16 mil. Salario máximo, departamento de la NBA 211000. El salario total es éste. Ahora voy a utilizar la transformación agregada en SSI. Sí. Entonces, en primer lugar, voy a crear un nuevo paquete. Seleccionaré la sección de flujo de datos. Entonces, en primer lugar, voy a leer mis datos de este archivo csv de punto empleado. De acuerdo, este es mi expediente desde donde voy a leer mis datos. Nombre, apellido, género, país, I-T, nombre del departamento y sueldo. Usaré la fuente de Archivo Plano. Entonces desde aquí voy a seleccionar la fuente Flat File, archivo
plano destino deshonesto, fuente Flat File. Necesito hacer clic en este 1 primero, luego seleccionar Fuente de archivo plano. De acuerdo, nueva navegación. Después archivos CSV. Seleccionaré empleado dot csv página de código de archivo. Voy a seleccionar este 112 phi one. Este, vale, formateadores delimitan nombre de columna en los primeros datos o encuentran columnas. Estas son las columnas. Vista previa, deshonores, mi conjunto de datos. De acuerdo, ID avanzado, string, encuentra
FirstName, apellido, género, género, país. Cada uno. Debe ser, debe ser un valor numérico. Permítanme simplemente seleccionar un valor numérico. Distrito POR un valor numérico, nombre del departamento, salario. El salario debe ser un valor numérico. Tiene que ser un valor numérico, no puede ser una cadena. Voy a seleccionar salario como tipo de datos numéricos. ¿ Está bien esto? Con género, bien. Id. Déjame solo seleccionar el numérico o puedo tener, puedo,
puedo seleccionar cadena IDS, OK. Haga clic en Aceptar. Se previsualiza mi conjunto de datos. Este es mío. Conjunto de datos. Haga clic en Aceptar. Ahora, el siguiente paso es usar la función de agregado varía el agregado, la transformación de agregados. ¿ Dónde es decente la transformación agregada? Voy a seleccionar la transformación agregada, conectar esto. Ahora. Voy a seleccionar primero, voy a seleccionar el nombre del departamento. Sobre la base del nombre del departamento. Voy a agrupar mis datos. Por lo que voy a groupby realizaré el grupoPor operación sobre el nombre del departamento. Entonces voy a seleccionar id Así que esto me va a dar el número de empleados. Entonces cada empleado tiene una identificación única, vale, ahora, siguiente seleccionaré el salario. ¿ De acuerdo? Entonces quiero calcular primero,
voy a calcular la suma salarial total de salario en cada grupo departamental por Dan, voy a tener voy a tomar un conteo. Contar. Está bien. Este es número de empleados. ¿De acuerdo? El segundo es el salario total. Salario, éste va a ser éste
va a ser salario promedio, el salario promedio. Entonces seleccionaré sueldo
y salario mínimo promedio, salario mínimo. Salario, salario máximo. Por lo que primer recuento, suma media, salario
mínimo y máximo. Estoy agrupando en base al nombre del departamento. Haga clic en ok. Este paso se realiza en distrito. A continuación, voy a usar t esfuerzo multicast, propósito de pruebas. Entonces lo que yo quiera. Por lo que la transformación multicast paso multicast también se puede utilizar para fines de prueba. Permítanme conectar esto con éste. Después edita, revisa los metadatos, luego el visor de datos, y habilita el visor de datos. Por lo que va a destruir las multicast. La transformación me va a mostrar conjunto de datos de disco. ¿ De acuerdo? Entonces esto es, esto se va a utilizar para fines de prueba, nombre del
departamento, número de empleados, salario
total, salario promedio min, max. Estas son las columnas. Jet será mostrado por este paso de transformación multicast. Ahora guarde esto. Tienes que guardar este paso paquete cinco. Déjame ejecutar esto. Entonces esto va a mostrar diferente display midi, dis, ¿de acuerdo? Salida. Ahora nombre del departamento, número de empleados, seis empleados, 20 empleados en departamento de RRHH, sueldo total. Este es cada salario, salario
mínimo y el look de salario máximo solo necesita mostrarse en un formato adecuado. Tiene que mostrarse en puntos decimales ahora mismo, mira. Ahora con el fin de mostrar esto en dos puntos decimales, necesito usar el paso de conversión de datos. Cerrar. Antes. Antes del paso multicast, necesito usar el paso de conversión de datos. Entonces, ¿dónde está el paso de convergencia de datos? Sólo déjame disciplinar. Elimine esto. Ahora, tengo que mostrar un 102 puntos decimales. Sin conversión de datos. Toda silla Larry copia de cada Sueldo. Esto tiene que ser en puntos decimales. Voy a convertir esto a decimal, escala y precisión. Entonces la escala es dos. Procedimientos no van a seleccionar la precisión. Entonces, ¿qué es la precisión en escala? ¿ Cuál es la diferencia entre estos dos? Preferente es algo así como déjame solo darte un número a, digamos dos a tres puntos para, para la precisión será 1-2-3, 3-5. El valor de precisión será de cinco, y el valor de escala será de dos. Se trata de dos puntos decimales. Si son tres, si es así, entonces el valor de precisión será de seis en valor de escala será de tres. Entonces esa es la diferencia entre precisión y escala. Ahora se convertirá en dos decimales. Haga clic en Aceptar. Multicast. Ahora, edita metadatos. Este es el decimal de metadatos a escala es a la precisión no está cert bien, Vista de datos. Por lo que estos son los, estas son las columnas o campos que obtendrán se mostrarán por esto. No. Nombre del departamento, número de empleados, salario
total, salario promedio. Está bien. Cada salario que voy a poner aquí, ¿de acuerdo? Salario mínimo, salario máximo, bien, después de este salario promedio, luego salario mínimo. Entonces salario máximo. ¿ De acuerdo? Voy a cambiar este nombre. Esto tiene que cambiarse. Entonces a partir de aquí voy a cambiar este nombre, salario promedio. No quiero usar la copia de la energía promedio. Debería ser EVG. Sueldo. Editar. Después consigue un espectador. Está bien. Salario promedio. Permítanme sólo seleccionar este. Sueldo total, cada salario salario mínimo y el salario máximo. Haga clic en Aceptar, guarde esto. Ahora ejecuta el paquete. Ahora mostrará el salario promedio en puntos decimales. Maximiza este look, deshonra el salario promedio que se está mostrando en dos puntos decimales. Mira salario mínimo máximos LED. El salario mínimo en departamento ITER es de apenas 10 mil. El salario máximo es de 29 mil. Salario promedio en departamento de mercadotecnia tiene este salario total es
éste, éste es el salario promedio. Entonces departamento de ingesta, salario promedio es este salario mínimo y máximo, salarios
mínimos muertes y el salario máximo es éste. Entonces este es el concepto de función agregada. De acuerdo, espero que hayas entendido el concepto. Muchísimas gracias y ten un gran aprendizaje.
15. Transformación de cuentas filas: Hola a todos. En esta conferencia en particular, vamos a ver un ejemplo de transformación del recuento de filas en SSI. Sí. Entonces con la ayuda de la transformación del recuento de filas, vamos a registrar dos tanques. Entonces vamos a grabar,
registrar conteo cualquier fila duplicada. Por lo que Ricard cuenta será el número de filas en mi número de filas únicas en mi, en mi archivo fuente. Las filas duplicadas serán el recuento de filas duplicadas de filas duplicadas. Otros entonces estos dos atributos, voy a guardar el ID de tarea. Voy a grabar ID de tarea, nombre de
tarea, ID de paquete, nombre del paquete. Entonces voy a guardar el recuento de carbohidratos, filas
duplicadas, nombre de usuario, tiempo de carga. Entonces voy a grabar desinformación estos atributos, ¿de acuerdo? Todos estos atributos en mi tabla, tabla de base de datos. Entonces ahora te voy a dar un ejemplo de cómo averiguar filas duplicadas en tabla SQL. Entonces esta es mi misma mesa que voy a utilizar para este propósito. Seleccionar, ejecutar esta consulta. Ahora con el fin de averiguar las filas duplicadas, voy a utilizar la función agregada llamada count, count coma. Entonces voy a usar como duplicado. De acuerdo, entonces voy a agrupar por atributos DZ groupby. Voy a utilizar el grupo por cláusula, grupo por todos estos atributos. De acuerdo, entonces ahora ejecuta esta consulta SQL. Entonces esto me va a dar destruir está ocurriendo solo San Valentín destruye un trago dos veces. Esta fila es un anillo tres veces. Siguiente Voy a filtrar este resultado. Para filtrar el resultado grupal, tengo que usar esta cláusula teniendo conteo mayor que uno. Entonces esto me va a dar do filas duplicadas. Entonces tengo tres filas que son filas duplicadas. Por lo que destruye ocurriendo dos veces, destruye ocurriendo dos veces. La última fila está ocurriendo tres veces. ¿ De acuerdo? Existen tres reglas que son duplicados, que son filas duplicadas. Entonces ahora lo que voy a hacer, voy a crear un paquete. Tengo que crear un paquete, nuevo paquete. Por lo que voy a nombrar este paquete. Voy a nombrar a este paquete un registro, un recuento de filas. Yo lo nombraré conteo de filas. Ok, entonces este va a ser el nombre de mi paquete. Entonces seleccionaré el flujo de datos. Haga clic en esta caja de herramientas. Por lo que voy a leer datos de mi fuente Flat File. Entonces déjame solo mostrarte el expediente que voy a leer. Entonces este va a ser mi expediente. Está bien. Entonces este archivo tiene total cuántos registros? Este archivo tiene 13 registros. Los registros genuinos son 556789. Se tienen nueve registros genuinos. Está bien. Ahora, déjame solo Haga clic en esto, configuró esto. Ok. Ahora seleccione, esto implica 02 columnas csv de puntos. Ok, bien. Vista previa. Necesito cambiar el tipo de datos también. Por DNI, lo voy a guardar. No, lo voy a guardar como entero. Nombre, apellido, cadena, género, cadena, country h. para h, lo
voy a guardar como id departamento. lo
voy a guardar como valor entero. Ahora vista previa, vista previa. Entonces si tengo que seleccionar esta opción, significa
que si hay un valor nulo en mi,
en mi fuente, retenidos valores nulos de la fuente como valores nulos en el, por lo que va a retener los valores nulos. De acuerdo, no voy a revisar esta opción. Ok, haga clic en Aceptar. Ya que no lo he hecho, No hay ningún valor nulo en mi tabla fuente, archivo fuente. Ahora después de esto, lo que voy a hacer, voy a usar la función agregada. El motivo por el que estoy usando la función agregada porque quiero separar, duplicar filas en mis reglas genuinas en MI Ok, filas. Entonces voy a separar estas tres filas duplicadas por deuda. Necesito usar la función agregada, entonces tengo que usar la función dividida condicional. Tan agregada. Entonces lo que estoy haciendo, soy,
voy a agrupar por ID, FirstName, LastName, género. Entonces con la ayuda de la función agregada, voy a hacer esto. ¿ De acuerdo? Entonces con la ayuda de split condicional, voy a aplicar la condición. Este padecimiento. Ahora, usaré la función agregada. Haga doble clic. Seleccionaré todas las filas. Esto va a contar todo, bien, agrupado por ID. Bien. Entonces déjame solo ampliar este grupo por ID, grupo por nombre creció por apellido,
grupo por género, país H. Tengo que agruparme por esto, grupo por grupo por esto, tomaré en cuenta. ¿ De acuerdo? Ahora, haga clic en Aceptar. Después de esto, voy a usar la división condicional, diversa división condicional, ésta. Ahora, split condicional. Entonces ahora aquí voy a usar la columna, este contar todo, voy a usar esta columna contar todo en voy a aplicar la condición mayor a uno. Este va a ser mi, ok. Estos serán mis héroes. La salida predeterminada serán las filas duplicadas. Filas duplicadas. Ahora da click bien. Entonces esto me va a dar un error de que el tipo de datos DTU O18, ADT, E14 son incompatibles. Tengo que hacer esto compatible, así que usaré esto. Déjame solo usar esto. Entonces esto va a convertir este tipo de datos, ok, ahora, mayor que a, menos de dos, menos de dos, esto va a ser menos de dos. Haga clic en Aceptar. Después de esto. Entonces mira, salida, vale, menos de dos. Si el recuento es menor a dos, entonces va a ser no duplicados filas contar, Déjame sólo menos que contar. Entonces d menos de dos. Entonces 123456, diva, OK, root, ok. Ahora, haga clic en Aceptar. Ahora la próxima vez vamos a usar el paso después de la muerte. Voy a usar el paso de conteo de filas, un conteo de filas. Con este paso de recuento de filas, tengo que seleccionar el paso de recuento de filas es pasos de recuento de filas. Entonces, antes de usar el paso de recuento de filas, necesito definir dos variables. Es decir, tengo que buscar esto. Este es el paso de conteo de filas, ¿de acuerdo? Control c y control v. ¿De acuerdo? Filas duplicadas. Este va a estar bien. Permítanme primero alertar esto. Cambie el nombre de esta lista. Ahora, guarde esto. Ahora para configurar estos dos conteos de filas, Ds a conteos de filas, tengo que definir una variable. Para definir una variable, tengo que hacer clic en esta opción. Por lo que definiré dos variables. Y así la primera variable será para la diversión, y la segunda variable será para ésta. Por lo que el conteo de Ricard será mi primera variable, el conteo de subrayado de Ricard. tipo de datos será entero. La segunda variable será duplicada. El recuento de filas será mi segunda variable. Entrar tipo de datos tendrá derecho al valor predeterminado será 0. Ahora tengo que configurar esto. El primero será el conteo récord. El segundo serán las filas duplicadas. Entonces en este caso, filas duplicadas, serán tres. Estas tres reglas serán duplicadas. Ahora. A continuación, después de este paso, me tengo que ir, tengo que seleccionar la sección de flujo de control. Entonces esta es la tarea de flujo de datos. Entonces si voy a hacer clic en la tarea de flujo de datos, esto me va a llevar a esta sección de Dataflow. Déjame hacer clic en esto, no hacer clic en esto. Esto me va a llevar a esta sección de Dataflow. Entonces una vez que se ejecute esta tarea de flujo de datos, después de esto, voy a usar otra tarea. Esta vez, voy a usar la tarea de ejecutar SQL. ¿ De acuerdo? Por lo tanto, conecta esta tarea con la desconfianza Ejecutar tarea SQL. Entonces, ¿qué siguiente voy a hacer? Voy a crear una tabla. Por lo que crearé primero esta tabla. Permítanme simplemente crear esta tabla. Nueva, nueva consulta. Voy a crear esta tabla, crear tabla. Registro de tabla. Voy a nombrar esta tabla identificador de tarea de registro. En esta tabla voy a guardar el tipo de datos ID de tarea es varchar 50, nombre de
tarea, ID del paquete, nombre del
paquete, recuento de registros, recuento de filas
duplicadas, conteo de filas duplicadas, nombre de usuario en el tiempo de carga. Valle por defecto con gedit. Entonces si no se insertan valores, esto le va a dar D. Vamos datetime, vale, ahora, para poder ejecutar esto, tengo que seleccionar esto. Entonces tengo que dar clic en ejecutar. Esto se ha creado, ha creado
tabla, se actualiza la base de datos. Mesas. Esto se ha creado con registro de subrayado de tabla de nombres. Ok, bien. Ahora el siguiente paso es usar esta inserción en el registro de tabla. Tengo que dar este nombre, registro de tabla. Ok, tengo que dar este nombre. Seleccionar esta tabla registro, insertar en tabla registro ID de tarea, nombre de
tarea variable desierto, variables de
sistema, ID de tarea, nombre de
tarea ID de paquete nombre de paquete ID, variables de sistema
desierto, recuento de registros, cualquier conteo de registros duplicados. Estos dos son, estos dos son variables de usuario que hemos creado. Ahora déjame pegar aquí. Tabla registro ID de tarea, nombre de tarea, ID de
paquete, nombre del paquete, recuento de registros. Aquí voy a usar esto. En tanto que este recuento récord, bien. Este recuento de registros y podría duplicar el conteo de registros, conteo registros
duplicado, conteo de filas duplicadas. Ok, voy a usar esto. Entonces ahora primero, tengo que seleccionar esta conexión de declaración SQL. Voy a seleccionar esta conexión que ya he creado. siguiente paso es seleccionar, para proporcionar aquí la sentencia SQL. Aquí voy a proporcionar primero la sentencia SQL, déjame solo usar este conteo de filas duplicado. Aquí voy a usar para duplicar el recuento de filas. Está bien, bien. En el nombre de usuario. Bien. Ahora, control C. Y luego tengo que pagar como silla en mi sección de estados de cuenta, sección sentencias
SQL Tengo que pegar esta declaración de inserción, insertar en registro de tabla. ID de tarea es la variable de sistema Nombre de tarea, ID de
paquete, nombre del paquete. Este es d conteo de registros, que es este registro. Permítanme simplemente hacer caso omiso de la cuenta es la variable de usuario profunda que hemos creado. Entonces el conteo de filas duplicadas es también la variable de usuario que hemos creado. Última variable de sistema ptsd, que es nombre de usuario. Ok, haga clic en Aceptar. Esta está configurada. A continuación tengo que usar este mapeo de parámetros. Agregar. El primero se ve variable de sistema, nombre de variable. Por lo que el primero es ID de tarea. Voy a seleccionar el id de tarea desde aquí. Voy a seleccionar el id de la tarea. luego voy a seleccionar Nombre de la tarea, nombre de la tarea. En tercer lugar, voy a seleccionar el ID del paquete, nombre del paquete. ID del paquete, que se representa el nombre del paquete ID. De acuerdo, después de esto, voy a seleccionar el paquete llamado en el registros terminó
el conteo de registros duplicados, conteo de registros. ¿ Dónde cuenta el registro? ¿Recuento récord? Esta es la variable de usuario. El último es dy,
duplicado, recuento de filas, conteo de filas duplicado. Este es el nombre de usuario. Entonces no estoy dando valor de este tiempo de carga porque cuando los datos son, cuando se insertarán datos en esta tabla, automáticamente, se cargará el valor predeterminado DateTime. Ok, entonces, por lo tanto, no estoy dando el valor de tiempo de carga, no el conteo de filas duplicado. Después de esto, voy a utilizar el nombre de usuario. El último es d nombre de usuario, mientras que el nombre de usuario, éste es el nombre de usuario. Por lo que el tipo de datos de entrada de ID de tarea será varchar. Tengo que seleccionar el nombre de tarea varchar tipo de datos será varchar, Beckett ID del paquete, VARCHAR versus VARCHAR. El nombre del paquete será más blanco. De acuerdo, el recuento de registros es el largo, que es el tipo de datos, ok, recuento de filas
duplicado largo, nombre de usuario será varchar. Ok. A continuación se presenta este parámetro. Está bien. Identificador de tarea primer índice 0123, está bien. Entonces 00, luego Nombre de tarea 123456. El séptimo valor que se diluye el tiempo. Este valor va a ser, este valor se poblará automáticamente. ¿ De acuerdo? Haga clic en OK. Esto ha sido configurado. Por lo que la próxima vez vamos a ejecutar este paquete. Entonces haga clic en este botón para ejecutar el paquete. Para empaquetar se ha ejecutado con éxito. Ahora voy a revisar mi tabla de registro. Entonces esta es la tabla que voy a consultar. Refresca esto. De acuerdo, déjame solo seleccionar esta mesa. Seleccionar Top 1000 reglas. Por lo que la mesa se ha poblado. Nombre de la tarea, este es el nombre de la tarea, ID del
paquete, nombre del paquete, recuento de filas seis filas únicas, tres filas duplicadas. usuario, este es el nombre de usuario y este es el
momento en que esta fila se inserta en mi tabla. Ahora haga clic en la sección de flujo de datos. Ahora, haga clic aquí. Ahora lo que voy a hacer, voy a insertar estas seis filas en la tabla de mi base de datos. Entonces después de este paso voy a utilizar el paso de destino OLED DB. Tengo que usar este paso será solo paso de destino DB. Ahora, configura esto. Voy a seleccionar esta base de datos, este gestor de conexiones, tabla o vista Seleccionaré este nombre de tabla será tendré que crear una nueva tabla. Por lo que nombre de la tabla
será DRG, subrayado, empleado. Subrayar. Por fin mesa. Entonces este es el nombre de tabla. Déjame simplemente eliminar este conteo todo lo que tengo para quitar este conteo todo numérico. Tengo que quitar esto. Está bien, bien. Int, nombre, apellido, género, país, cada departamento ID y OK. Haga clic en Aceptar. Cartografía ID, nombre ,
apellido, nombre, apellido, género, país, eeh, OK. Se encuentra Click OK. guardó este paquete. Ahora voy a ejecutar esto. Otra vez. Haga clic en esto para ejecutar esto. ¿ De acuerdo? Se han insertado seis filas. Ahora con el fin de revisar mi mesa, primero
voy a refrescarla. Permítanme sólo comprobar si se insertan datos o no. Nombre de la tabla es DRG subrayado este subrayado EMP tabla final, tengo que consultar este look. Se han insertado los seis registros, 12346. De acuerdo, se han insertado estos registros. Estas son reglas únicas. Ok. Y ahora permítanme sólo consultar esta tabla. Se inserta otra fila, un recuento de registros sacude filas duplicadas tres, este es el nombre de usuario. Este es el tiempo de carga en el que se inserta esta fila. Este es el ID del paquete. El nombre del paquete es este nombre de tarea como este. Y lo peor de nombre del paquete. Este es el nombre del paquete. Necesito mostrarte el nombre del paquete primero, recuento de
filas, este es d, nombre del paquete. ¿ De acuerdo? Por lo que con la ayuda del paso de recuento de filas, hemos registrado dos atributos importantes. Recuento de registros en el recuento de filas duplicadas. D's son d son variables de sistema, ¿de acuerdo? Se trata de variables de sistema. Estas dos variables que hemos creado. Llamaremos a estas dos variables como variables de usuario. Entonces espero que hayas entendido el concepto. Muchas gracias y tengan un gran aprendizaje.
16. Transformación de pilotes en SSIS: Hola a todos. En esta conferencia en particular, vamos a discutir la transformación pivote en herramienta SSAS. Entonces déjenme mostrarles primero el conjunto de datos. Entonces este es mi conjunto de datos, id de
estudiante, curso de nombre de estudiante intmax. Entonces con la ayuda de la transformación de pivote, voy a presentar mi conjunto de datos así, ¿de acuerdo? Por lo que la transformación de pivote va a convertir los datos brutos en datos de columna. Por lo que esta es la red de datos de fila Java C Plus Plus datos del desierto, que está en forma de reglas. Y se convierte en columnas, C plus plus y marcas java en las marcas de red. Por lo que lx tiene un 100 marcas en C plus a. vamos dice Dios a 30 meses en Java, NC, 200 marcas en networking. Por lo que voy a presentar esta tabla así con la ayuda de la transformación del pivote. Entonces, en primer lugar, voy a crear un nuevo paquete. Voy a nombrar a este paquete pivote transformación, paquete pivot 0-6. Limitaré la transformación del pivote pivot. Ahora primero que nada, voy a seleccionar la tarea de flujo de datos. Por lo que seleccionaré flujo de datos. Voy a dar click aquí. Entonces la primera es la tarea de flujo de datos. Haga clic en flujo de datos. Entonces voy a, primero, lo que voy a hacer, voy a insertar datos en una tabla. Entonces, en primer lugar, crearé una tabla en bases de datos de SQL Server. Dados en esta tabla se crearán en base de datos de dados. Cree esta tabla y, a continuación, ejecute la instrucción insert. Inserta en, está bien. Ahora selecciona estrella de fuente subrayados Estudiante. Entonces ahora voy a convertir esto. Voy a convertir esta mesa así, ¿de acuerdo? Al igual que esto. Ahora, en primer lugar, permítanme sólo usar la fuente. Fuente, DB, fuente, DB, fuente DB. De acuerdo, ahora haga doble clic. Entonces esta es la conexión que ya tengo está seleccionada. Ahora los datos acceden más tabla. Por lo que voy a seleccionar esta tabla que acabo crear en SQL Server código de subrayado tabla de estudiantes. Aquí voy a seleccionar fuente de subrayado tabla de estudiantes. Este es el nombre de las columnas de la tabla y vista previa de los ID de estudiante a ellos nombre núcleos, intmax, haga clic en Aceptar. El primer paso se realiza en polvo. El siguiente paso es usar la transformación de pivote profundo. Entonces voy a usar la transformación del pivote. ¿De acuerdo? Entonces voy a conectar esto. Permítanme hacer doble clic en esta transformación. Por lo que la transformación de sub pivote de clave de pivote tiene clave de pivote en el valor de pivote. Entonces, antes que nada, voy a ordenar esto. Datos sobre la base de t. Entonces en este caso voy a seleccionar ID de estudiante como clave. Por lo que con base en la identificación de estudiante, voy a empezar mis datos, identificación de estudiante. Voy a ordenar este dato que viene de esta tabla. Ahora, estudiante ID no pivote té en el valor de pivote. Entonces, ¿qué es la clave pivot en este caso? Pivot es cursos de curso, la clave de pivote, ¿de acuerdo? Este curso es el pivote y el valor de pivote es burlas. Estas son las marcas. De acuerdo, ahora déjame solo seleccionar cursos. Clave privada y valor de pivote serán burlas. Ignore los valores de pivote no igualados e informe de ellos después de la ejecución del flujo De acuerdo, pulsa ahora aquí Voy a seleccionar la salida de las columnas. No, ahora voy a seleccionar Networking. De acuerdo, filtrar, voy a seleccionar C plus, además de redes Java. Estas tres columnas que voy a seleccionar aquí. Entonces selecciónelo. Por lo que primero seleccionaré networking. Tienes que proporcionar los valores aquí. Entonces C plus plus java generar columna. Ahora, haga clic en Aceptar, no, C más redes Java. Haga clic bien. Por lo que este paso se hace y se espolvorea. Entonces a continuación voy a hacer clic con el botón derecho en este paso de pivote y luego hacer clic en Mostrar Editor avanzado. Entonces lo que quiero, quiero incluir todas las columnas, incluyendo nombre del estudiante, ok, identificación del
estudiante, curso simulado nombre del estudiante. Quiero incluir todas las columnas, parámetros
de entrada y salida. Columnas de entrada. Estas son columnas de entrada. ¿ Cuáles son las columnas de salida? Alumno ID, columnas de salida del desierto. Por lo que quiero nombre de estudiante también. Entonces lo que voy a hacer después de la identificación de estudiante, necesito desplazar el nombre del alumno por lo que voy a dar clic en Agregar columna. Por lo que voy a mencionar el nombre de subrayado de los estudiantes. ¿ De acuerdo? Haré clic en nombre de subrayado del estudiante. Columna fuente es minús1. Aquí tienes tutoría nombre. Necesito hacer clic en nombre del alumno. Y D, identificación de señalización es 20. Este DNI es de 20. Especifique la línea h, idea de la columna de salida cuando este ítem se colocó por primera vez en el flujo de datos. Entonces lo que quiero para que esta columna coincida con esta columna aquí en d Estudiante un nombre Voy a mencionar la columna Fuente. Y la cuarta columna es 20. Identificador de señalización es igual a 20. Aquí voy a mencionar el Entonces nombre 20 en el valor de clave pivote será 0. De acuerdo, ahora, StudentId desierto columnas de salida student id name C plus max. Tengo que cambiar como c plus press mocks, Java se burla. Está bien, networking mucho. Tengo que cambiar esto. Ok, haga clic en Aceptar. Por lo que este paso está configurado. A continuación voy a configurar el paso final, que es archivo plano Paso de destino. Tengo que combinar este doble clic, nueva configuración de Flatfile. Haga clic en Aceptar. Ahora lo que voy a proporcionar el directorio aquí, archivos de documento
SSAS, vale, así que déjame solo crear unas capas de archivos. Voy a crear un archivo, un nuevo archivo CSV. Voy a crear un archivo CSV a, voy a hacer doble clic cuidado. Entonces voy a guardar este archivo como este archivo CSV. Haga doble clic en Aceptar, tengo que hacer doble clic en abrir este archivo, guardar este archivo como el archivo separado por comas CSC. CSV con un CSV, TSV, bien, guarda este archivo y el nombre del archivo será pivot. Ejemplo. Se guardó este silencio con este nombre. ¿ De acuerdo? Ahora, suprimir el decidir. Está bien, bien. Ahora navega. Tengo que mencionar este archivo CSV pervertido ejemplo punto csv columnas de archivo. De acuerdo, hallazgos avanzados para renombrar C más marcas java, marcas de
redes, vista previa, D son las columnas en mi, en mi conjunto de datos. ¿ De acuerdo? Tengo que actualizar estos nombres de columna en el primer flujo de datos, tengo que revisar esta opción para obtener también los nombres de las columnas. Ahora. Está bien, bien. Lago. Está bien. Ahora mappings. Ok, tengo que ignorar esta actualización del gestor de conexiones. Por qué estoy recibiendo esta columna extra. Vista previa de identificación de estudiante, está bien, bien. Mappings, nombre del estudiante, C más mes, marcas
Java, marcas de networking. Esta va a ser la identificación de estudiante. Haga clic en Aceptar, guarde este archivo. Ahora voy a ejecutar el paquete un clic botón Inicio, y el proceso se ejecuta con éxito. Ahora necesito abrir el archivo. Entonces este archivo es, mira, este es el archivo que necesito para abrir este lado. Entonces ahora vas a mirar los datos look student id, nombre del
estudiante, C plus java matemáticas terminaron marcas de networking. Por lo que se han mostrado los datos. Ahora siguiente qué voy a hacer, así que voy a utilizar la tarea FTP. Por lo que necesito hacer clic en esto. Necesito ir a Edit Mode control flow después de la tarea de flujo de datos, lo que Avant, evolucioné para usar d Tareas FTP. Entonces básicamente trabajo, yo Avant, sea cual sea el archivo que se cree aquí, quiero copiar este archivo en el directorio FTP fueron a retirarse agall it directorio remoto. De acuerdo, entonces este va a ser mi directorio local y voy a copiar este archivo será mi directorio remoto. Por lo que quiero configurar esta tarea FTP. Entonces, ¿cómo configurar esta tarea FTP? En primer lugar, voy a conectar la primera tarea sería esta tarea para descargar archivos servidor ELA en mi sistema. Entonces voy a descargar esto, descargar e instalar este archivo Zola server para windows. Por lo que ya lo tengo en mi sistema. Archivos villa interfaz de servidor. Voy a abrir esta conexión. Yo sí lo usé. Voy a crear un nuevo usuario, agregar un usuario, lo llamaré evaluar IES subrayado usuario es el nombre. Está bien. Entonces voy a habilitar la contraseña. Por lo que la contraseña va a ser Edmund 1-2-3 es mi contraseña compartida, doblada. Entonces este es el directorio. Entonces este va a ser mi sueño. Más directiva ahí. Voy a colocar mis archivos y mi directorio SQP es éste. Entonces voy a llamar a esto como mi directorio remoto, Ed. Y tengo a un directorio. Y FDP, SSI es SSAS, archivos
FTP. De acuerdo, así que este va a ser mi, este va a ser mi directorio remoto. Entonces bien, lee, voy a dar todos los derechos. Eliminar, está bien, haz clic en Aceptar. Y ahora lo que voy a hacer a continuación, voy a abrir el SSI. Sí, voy a abrir este polvo. FTP lo hace el primero es la conexión, conexión FTP. Por lo tanto, selecciona Crear una nueva conexión. El nombre del servidor es este nombre del servidor ES de uno a siete oscuro, oscuro, oscuro. Está bien. De uno a siete oscuro, oscuro, oscuro. Nombre de usuario es evaluar IES underscore contraseña de usuario es admin 123. Conexión de prueba, Conexión de prueba, Exitoso. Haga clic en Aceptar y, a continuación, transferir archivo parte local. Por lo que esta es la parte que tengo para proporcionar mi camino local. Por lo que mi parque local en este caso será éste donde se generará este archivo. De acuerdo, este va a ser mi camino local. Tengo que aportar esta parte aquí. Por lo que voy a proporcionar la parte local aquí, nueva conexión y navegar. Y este va a ser el expediente, ¿de acuerdo? Pervert ejemplo archivo csv dot, luego operación, qué operación desea realizar. Por lo que desea realizar recibir archivos. Quiero sincronizar archivos. Por lo que quiero enviar archivos desde este directorio, desde este directorio. Entonces qué archivo quiero enviar este archivo pivot ejemplar dot csv. La próxima vez voy a donde voy a enviar este archivo. Voy a enviar este archivo en mi directorio remoto, y esto es parte de mi directorio remoto. En caso de que tenga algunas carpetas. Voy a, voy a proporcionar el nombre de carpeta después de esta barra. En este momento, no tengo más directorios. Mi directorio remoto, este es mi directorio remoto saber carpeta está ahí. Por lo que sobrescribir archivo un destino JS. En caso de 5A destino JS, quiero sobrescribir mi archivo. Si el archivo ya está ahí, esta opción se sobrescribirá. Puedo sobrescribir mi archivo con esta opción. ¿ De acuerdo? Expresión. No estoy usando la expresión. Haga clic en Aceptar. Por lo que esta tarea de archivo ha sido configurada. Entonces qué, qué sucederá después de esto, después de la ejecución de este archivo de paquete se creará aquí. Este va a ser mi archivo de directorio local se creará después de esto. Una vez que esta tarea de flujo de datos se ejecute con éxito, se ejecutará
esta tarea. Esta tarea FTP enviará este archivo, enviará este archivo al directorio del disco. Necesito mostrarle el directorio donde va a colocar el archivo. Se va a colocar el archivo aquí en este directorio de archivos FTP. Este va a ser mi directorio remoto ahora en orden. Ahora tengo que ejecutar el paquete aquí. Así es como se ejecuta el paquete. Así que mira, Control Flow, tarea
FTP se ha ejecutado con éxito. Mira, este es mi directorio remoto. crea el archivo csv de punto ejemplar de Pivot. Look student id, nombre del estudiante, C Plus matemáticas, Java marca networking mux 200 a 80 a Turquía. De acuerdo, entonces ahora con el fin de mirar los registros, puedo ir al progreso. Mira D son los registros de mi paquete. Mira, empieza, termina. De acuerdo, todos los pasos se han ejecutado con éxito. No hay editor en mi ejecución. Nueve filas. Y luego tres rutas han sido, se han generado
tres roles después de este paso. De acuerdo, entonces espero que hayas entendido el concepto. Muchísimas gracias y ten un gran aprendizaje.
17. Tranformación UnPivot en SSIS: Hola a todos. En esta conferencia en particular, vamos a discutir la transformación desfavorecida en SSI. Sí. Por lo que este fue el resultado de la transformación del pivote. Déjame abrir este archivo. Entonces con la ayuda de una transformación inédita, vamos a convertir columnas en filas. Entonces mira, D's son las columnas y lo vamos a convertir en filas. ¿ De acuerdo? Entonces ahora voy a usar la transformación desfavorecida. En primer lugar, voy a crear un nuevo paquete. Entonces este es un ejemplo de transformación de pivote. Ahora voy a crear un nuevo paquete y lo voy a nombrar. Y el nombre del paquete es el paquete seis. Voy a llamarlo ejemplar pivote y pivote ejemplar. Está bien. Ahora voy a dar clic en Flujo de datos. Haga clic en Aceptar. A continuación Voy a dar clic, voy a seleccionar la fuente de Flat File. Ok. Haga doble clic en administrador de archivos planos. Tengo que crear un nuevo gestor de archivos fred. Entonces voy a seleccionar un archivo. Entonces qué archivo voy a seleccionar, engañado o archivo que voy a seleccionar. Por lo que en este expediente he distribuido la forma original de estos datos es disciplina. Esto. Déjame volver a leer esto. Déjame solo obtener los últimos resultados. Entonces esta es la forma original. Entonces voy a convertir esto a forma original, convertir este conjunto de datos a forma original. Entonces este será mi curso de una columna, y estos serán mis burlas. Ok, ahora, cierra este conjunto de datos. Navegar y tengo que seleccionar este archivo en particular. Ejemplo perfecto, Dark CSV. Ok, ex delimitado un medio para comprobar
disco a menudo nombres de columna en la primera fila de datos, columnas. Estas son las columnas, bien, d que el resultado, vista previa avanzada. No, el id de estudiante avanzado es de tipo de datos entero. Ok, nombre del estudiante, string mocks, entero, marcas Java, entero. Las marcas de red serán enteros. Vista previa, haga clic en Aceptar. Columnas. Estas son las columnas. Tengo que previsualizar mis conjuntos de datos y estos van a ser mis datos. Haga clic en Aceptar. A continuación, voy a usar la transformación d y pivote. Entonces con la ayuda de la transformación desfavorecida, lo que quiero lograr, quiero convertir mi conjunto de datos así, ID de
estudiante para renombrar smocks core. Ok, haga doble clic en esto. Entonces voy a seleccionar C más marcas de redes Java. D's son los campos. Están en mi columna de curso, networking Java end x0 plus, plus, ok. Todos los demás campos como ID de estudiante para no nombrar intmax. Estos campos, vendrán a buscar. Se selecciona la opción escritorio pasado a través. Estos, estos campos serán pasados, ¿de acuerdo? Ahora, bien, columna de destino. Cuál es esta columna de destino en el nombre de la columna de valor de clave de pivote. En este caso, la columna de valor de clave de pivote será diferente. Clave privada con columna de valor clave será gruesa. Entonces voy a dar curso como valor clave pivote. Columna de destino serán marcas. Marcas. Esta columna será mi columna de destino. Este curso de columna será mi valor clave de pivote. Estos dos campos, estas dos columnas, id de
estudiante, nombre del estudiante vendrán tal cual es porque he seleccionado pass-through. Haga clic en Aceptar. Este está hecho y espolvoreado. Permítanme simplemente cambiar el nombre de esto y pivote la transformación. Y pivote los datos de los estudiantes. Renombrar esto. Lectura de datos estudiantiles. Tengo que salvar esto. Ahora, el segundo paso se hace en nacional ninguno. A continuación, quiero ver el resultado de mi transformación de pivote AN. Entonces lo que puedo hacer, puedo usar cualquier paso de destino. Al igual que puedo guardar mi resultado en un, en un archivo CSV, o puedo guardar mi resultante en una tabla de base de datos. O puedo usar el paso de multidifusión para solo ver el resultado. En este caso, no quiero almacenar estos datos en ninguna parte. ¿ De acuerdo? Entonces lo que voy a hacer, voy a usar la multidifusión hasta solo para ver los datos. Para habilitar la opción de vista, tienes que hacer clic en este signo de flecha adicto. Y luego hay que ir a la opción Visor de datos, habilitado visor de datos. ¿ De acuerdo? Después hay que seleccionar las columnas que desea ver. Por lo que quiero ver id del
estudiante, nombre del estudiante solo con id del estudiante, nombre del estudiante, quiero ver Goethe y burlas. Entonces estos son los campos que quiero ver. De acuerdo, a continuación, tengo que guardar mi guardado, mi paquete, los paquetes guardados. Ahora, haga clic en Ejecutar. Ahora este es el resultado que voy a obtener de una transformación pivote Student ID, Alex, ok, C Plus One AT este resultado es similar a este resultado. Alexnet trabajando 200 mux. Alex networking marca 200 y vamos a Java asciende a 30, Alex C plus, más max 180. Mira, Alex C Plus, Plus marca qué AT? Este resultado es muy similar a este resultado. Ahora, haga clic en Cancelar, vaya a D, una ejecución de paquete compitió con éxito. Haga clic aquí para cambiar al modo de diseño o seleccionar una depuración profunda o detenida desde el modo de depuración. Entonces este es el modo de depuración, vale, haz clic en esto. Entonces este es el concepto de una transformación pivote en SSI. Sí, espero que hayas entendido el concepto. Muchas gracias y tengan un gran aprendizaje.
18. Implementación de dimensión ligeramente (SCD-Type01, SCD-TypeType02): Hola a todos. En esta conferencia en particular, vamos a discutir la dimensión que cambia lentamente. También, vamos a implementar el SCD Tipo uno y Tipo dos en SSI. Sí, entonces primero voy a explicar el concepto de cambio lento de dimensión. Entonces para entender mejor el concepto, consideremos esta tabla. Esta tabla, ID de empleado. En esta tabla tengo nombre de ID de empleado in-state. Entonces estos son los empleados. Empleado ID 1-0. 0-1, nombre de un empleado es Alan y está viviendo en Nueva York. De igual forma, Georges en empleado y está viviendo en Los Ángeles. Digamos que George's decidió mudarse de Los Ángeles a Chicago. Entonces lo que necesito hacer, necesito mantener los datos de George en
mis datos históricos de George en mi almacén de datos, ¿de acuerdo? En este caso, la dimensión cambiante es de estado. Estado se puede cambiar por Bob en cualquier momento Bob puede trasladarse de Chicago a cualquier otro estado. Entonces el cambio, la columna cambiante es de estado. ¿ De acuerdo? Entonces ahora digamos que George's decidió mudarse de Los Ángeles a Chicago. Entonces este valor con el valor cambiante, esta columna es la columna cambiante, ¿de acuerdo? Por lo que el valor actual será Chicago, en el valor histórico será Los Ángeles. Entonces lo que quiero, quiero mantener el mantener los datos históricos de este empleado George. Está bien. Por lo que tenemos tres tipos de
ETS, SCD tipo 0-1, 0-2, NSZD tipo 03. En SCD tipo 01, no
mantenemos ningún dato histórico. Acabamos de actualizar el valor actual. El valor actual es Chicago y el Valle anterior es Los Ángeles. Por lo que el valor actual es, se actualizará. Mira, así que mira, mi tabla se volverá así para esto es SCD tipo 01 donde
no mantenemos ningún dato histórico en SVG tipo 0 a NSS, supongo que tenemos un concepto de fecha de inicio y fecha de fin. También, mantenemos los datos históricos utilizando el estado actual. Entonces mira, George. El viejo estado fue Los Ángeles a partir de esta fecha para dictar quién vivía en Los Ángeles en este momento, está viviendo en Chicago. Este es el valor actual. ¿ De acuerdo? Para que podamos, podemos implementar el SCD tipo 0 a con la ayuda de fecha de inicio y fecha de fin. También, podemos implementar SCD tipo 0 a en SSI es con la ayuda del estado actual. Este era el estatus antiguo y éste es el estado actual. En SCD tipo 03. Mantuvimos el estado anterior. Este es el estado anterior. En éste se encuentra el estado actual, y éste es la fecha de entrada en vigor. Entonces uno al 2005. Entonces esta es la fecha en que George se ha mudado a Chicago. Por lo que ésta será d. Fecha de entrada en
vigor. Ahora, en esta conferencia en particular, voy a implementar SCD tipo 01 en SCD tipo 0 a en SSI, Sí. Entonces, antes que nada, necesito crear algunas tablas. Necesito crear mi tabla de fuentes. Entonces mira, en primer lugar, voy a crear esta tabla,
crear tabla fuente de subrayado tabla de empleados. Voy a crear esta tabla en SSAS. El nombre de la base de datos es dy, por lo que esta tabla se creará en la base de datos de dados empleado id nombre estado. Déjame simplemente ejecutar este comando de tabla, crear comando de tabla. La próxima vez voy a ejecutar estos tres comandos. Insertar en comandos. Copiar pegar estos comandos. ¿ De acuerdo? insertarán todos los datos. Se han insertado datos. Nosotros anular la selección de declaración para consultar los datos de fuente de subrayado tabla de empleados. Permítanme sólo consultar la tabla. Entonces esta va a ser mi tabla de fuentes. ¿ De acuerdo? Ahora a continuación lo que voy a hacer, voy a crear una tabla de dimensiones, tabla tipo
SCD 0-1. Entonces, vale, ahora tengo que crear una tabla,
mi tabla de destino, SCD tipo 01, ID de
empleado para estado de nombre del empleado. Por lo que ahora primero que nada, voy a implementar el SCD tipo 01 en STD. Permítanme simplemente repetir el concepto de SCD tipo 01 en SCD tipo 01 V no mantener ningún historial. Nosotros solo actualizamos los datos, ¿de acuerdo? Acabamos de actualizar la deuda actual. Y ahora esta mesa está vacía, ahora mismo. No hay datos en mi tabla SCD tipo 01. Ahora, en primer lugar, lo que voy a hacer, voy a usar Team source. Voy a utilizar la fuente de la base de datos, que LE DB fuente. Déjame arrastrar y soltar aquí. De acuerdo, el nombre del proyecto es std. Haga doble clic. Entonces esta va a ser la tabla de conexiones. El nombre de la tabla será la tabla de origen. Tengo que seleccionar mi tabla de fuentes. Por lo que mis tablas de
fuente, subrayado de fuente implican tabla. Entonces esta va a ser mi tabla de fuentes. Estas son las columnas, ID de empleado, nombre, Estado, haga clic en Aceptar. Esta está configurada. A continuación, voy a copiar la transformación de dimensión que cambia lentamente. Entonces esta es la transformación construida diez transformación en SSI. Sí. Entonces con la ayuda de esta transformación, solo
voy a implementar SCD tipo 01, SCD tipo 02. De acuerdo, haga doble clic, haga clic en siguiente. Por lo que este es el gestor de conexiones, gestor de conexiones de base de datos, tabla o vista. Tengo que seleccionar la tabla o vista. Para tabla, voy a seleccionar mi tabla de destino,
mi tabla de dimensiones. Esta mesa. Esta tabla, tabla SCD tipo 01, en esta tabla, ¿de acuerdo? Emplear id Va a ser mi clave de negocio. Ok, va a ser asunto mío. Haga clic, haga clic en Siguiente. Ahora, atributo fijo, cambiando atributo en atributo histórico, digamos si selecciono el atributo cambiante. Por lo que cambiar atributo significa Ted, estoy implementando SCD Tipo uno, atributo
histórico media stat Estoy implementando SCD tipo 0 a en ese atributo. Nombre del empleado. El nombre del empleado será mi atributo fijo. No puedo emplear nombre no se puede cambiar. ¿ De acuerdo? El nombre del empleado no se puede cambiar, pero el empleado puede pasar de un estado a otro estado. Entonces estado NBA, cambio de dimensión, cambio de columna y ahora estado, así que tengo que tener dos atributos cambiantes de estado puede estar cambiando atributo o una columna cambiante aquí, vale, d es dos atributos. Por lo que la primera será la clave de negocio, la segunda será d atributo fijo que no se puede cambiar. El tercero será el atributo cambiado. Ok, ahora estoy implementando D STG tipo 0-1 primero falló transformación si se detectan cambios en atributo quinto estilo, digamos si hago algunos cambios en nombre del empleado, por lo que no va a funcionar, me va a dar un error . Falla la transformación. Siguiente. De acuerdo, a continuación, termina. Entonces mira, la lógica se ha implementado automáticamente, cambiando
lentamente la lógica SCD Tipo uno se ha implementado. Ahora te voy a mostrar mi fuente en mi tabla de dimensiones, SET one table. Entonces esta es mi tabla de fuentes, y esta es mi tabla de dimensiones. Ahora mismo está vacío. Entonces cuando, cuando la primera vez que voy a ejecutar esto, ejecutemos esto. Por lo que va a poblar la tabla SCD tipo 01. Se ha ejecutado con éxito ahora, insertarán
todas las filas. ¿ De acuerdo? Los datos serán los mismos. No, los datos serán los mismos. De acuerdo, 1001. Está bien. Ahora lo que quiero, quiero hacer algunos cambios en mi tabla de fuentes. Por lo que usaré este comando de actualización. Deseo actualizar mi tabla de fuentes. Y la razón por la que estoy actualizando esto, estoy actualizando el estado. Por lo que desde Los Ángeles, George se ha mudado a Chicago. Entonces voy a cambiar este Chicago, actualización. Este dato se ha actualizado ahora ejecutar. Mira en mi fuente. Datos es Chicago en, en mi, en mi objetivo o en una tabla, C, D tipo CD 01. Estadísticos Los Ángeles. Entonces lo que quiero, este estado debería actualizarse en mi, en mi tabla de objetivos también. Entonces déjame simplemente ejecutar de nuevo este paquete. Ahora, ya que estoy implementando un CD tipo 01, actualizará automáticamente la tabla de destino, la columna de estado. Por lo que ahora el paquete se ha ejecutado con éxito. Ahora ejecuta. Mira Chicago, esto se ha actualizado, ha actualizado el
valor. Por lo que este es un ejemplo de SCD tipo 0-1. A continuación voy a implementar el SCD Tipo dos con fecha en SCD Tipo dos ancho, estado ancho. Entonces primero crearé esta tabla de objetivos. Tengo que crear primero esta tabla de objetivos. Entonces aquí voy a crear esta tabla de objetivos. Entonces este va a ser mi SVG tipo 0 a la fecha, estoy implementando esta fecha. Se ha creado la tabla. A continuación, Control C y pegar silla. De acuerdo, ahora mismo mi mesa objetivo está vacía. Estado, fecha de inicio, y fecha de fin. Ahora voy a implementar los campos de fecha SCD tipo 0 a ancho. Ahora. A continuación, hay que seleccionar la tabla. En primer lugar. Tengo que seleccionar el tipo SCD, esta tabla, STD a la tabla de fecha, ¿de acuerdo? Clave de negocio será implicar identificación. Entonces esta es mi tabla de dimensiones. Esta tabla estoy seleccionando esta tabla de dimensiones, ¿de acuerdo? Ahora encuentra a continuación. Aquí. Emplear nombre será atributo fijo, éste será el atributo histórico, ¿de acuerdo? Este será D atributo histórico. Déjame mostrarte mi objetivo. Emplear nombre será el atributo fijo. Esta será la clave del negocio. Estado será el atributo histórico. D2 será. Entra. En. A continuación, te mostraré a dónde vendrá. De acuerdo, atributo histórico, atributo fijo implican nombre siguiente, siguiente. De acuerdo, hora de inicio, tengo que fecha de inicio y fecha de fin. Entonces en este particular, en estos dos campos, en el segundo campo, voy a obtener valores nulos. El primer campo, voy a conseguir la fecha actual. A continuación, siguiente final. Tengo que salvar esto primero. Mira. Tengo que salvar esto primero. Ahora voy a ejecutar este paquete. Por lo que ahora mismo, esta mesa está vacía. Se va a poblar. Esta mesa, está bien, ahora, mira, todo lo que se ha insertado. La fecha de finalización será nula, diferente será D current_date. De acuerdo, a continuación, lo que
quiero, quiero actualizar mi tabla de fuentes desde Chicago. Digamos que voy a poner esto como Ellie. Digamos que George se ha mudado a un lago. Ahora. Mira, este es un eslabón, deshonesto Chicago. Ahora vuelve a ejecutar esto. Ejecuta esto otra vez. Ahora ejecuta estas dos tablas. Mira, mira, fecha de inicio, fecha de fin. Mira. Dist es el valor actual, fecha de
inicio, y una fecha de finalización es valor nulo. Por lo que actualmente, George se muda. George vive en Los Ángeles. Está bien. Este era el valor antiguo. Ok, comenzó y terminó. lo que este es un ejemplo de SCD tipo 0 para ancho inicio, fecha y fin. Ahora te voy a mostrar un ejemplo de SCD tipo 0 al estado ancho. Entonces ya que quiero mantener el estado, así usaré esta tabla. De acuerdo, ahora déjame solo copiar esto. Voy a crear una nueva tabla. Se ha creado la tabla Estado Actual. Con éxito. Basta con copiar esta tabla. De acuerdo, ahora, haga doble clic siguiente. En esta ocasión, se desarmará mi mesa de objetivos. Tabla de estado, Estado actual. Esta será la clave del negocio, id del empleado. click next. De acuerdo, implicar nombre, atributo fijo, estado. Este va a ser el atributo histórico. Bien. A continuación, a continuación, de acuerdo ,
esta vez alrededor, voy a seleccionar este valor una corriente de ventilación. Actual. Por lo que valor actual seremos representados como actuales. Su valor de exploración, el valor de inspiración se puede representar como actual o falso. Voy a dar caducado. Ahora debes seleccionar un valor de columna para indicar el, OK. Tengo que seleccionar este estado actual. Haga clic en Siguiente, Siguiente, terminar. Por lo que esto se ha configurado SCD tipo 0 al estado ancho. Ahora mira, primero tengo que ejecutar. Entonces cuando la primera vez que se ejecuta este paquete, cuando la primera vez que se inserten ojos, voy a obtener el estado actual. Todos los valores tendrán el estado actual. De acuerdo, ahora voy a actualizar este Los Ángeles a Chicago. Cambiémoslo a Chicago. Esto ha sido actualizado. De acuerdo, ahora mira. Ejecuta a Luke George. Esta es mi tabla de fuentes. Mira prueba actual Chicago. Nuevamente, ejecute el paquete. Stark. Ahora. De nuevo, mira caducado y el estado actual es Chicago en este momento. Georges viviendo un Georges viviendo en Chicago. Entonces así es como se implementa el SCD tipo 0 al estado ancho. Por lo que con la ayuda de SCD tipo 0 a V mantener la información histórica. Mantenemos los datos históricos. Está bien. Es así como almacenaste los datos históricos en tu base de datos. Muchas gracias y tengan un gran aprendizaje.
19. Importar columna y exportar de de transformación de columnas: Hola a todos. En esta conferencia particular, vamos a discutir la transformación de la columna de importación y exportación en SSI. Adivina. Entonces, en primer lugar, les
voy a dar un ejemplo de transformación de columnas de importación. Entonces permítanme simplemente crear un nuevo paquete primero. Entonces permítanme sólo seleccionar las transformaciones de columna de importación. Seleccionaré la sección de flujo de datos. Haga clic en este y Caja de herramientas. Voy a seleccionar la transformación de la columna de importación. Déjame hacer clic en la transformación de la columna Importar. Entonces con la ayuda de la transformación de columnas de importación, qué podemos hacer para importar transformación de columnas lee datos de archivos en Ed a dos columnas en un flujo de datos. Entonces permítanme sólo darles un ejemplo aquí. Entonces, ¿qué archivos puede leer esta transformación de columna de importación? Puede leer cualquier archivo, puede leer un archivo de texto. Puede leer un archivo MP4, un archivo JPEG JPEG, o un archivo CSV. Se puede leer cualquier archivo, ¿de acuerdo? Por lo que estos tres archivos se lean por transformación de columna de importación. Almacenará los datos en una columna de salida de flujo de datos del flujo de datos. Entonces, en primer lugar, déjame usar la fuente de leer, leer Flat File. De acuerdo, Fuente de Archivo Plano. Tengo que configurar esto. Entonces lo que
quiero, quiero, quiero proporcionar los nombres. Pero antes que nada, permítanme simplemente crear un archivo de texto, un nombre de archivo. En este archivo de texto, voy a guardar los archivos D de botellas. El camino de este archivo en particular es que tienes que hacer clic en el botón de turno, luego tienes que hacer clic derecho en copiar pot basado en. Entonces este va a ser mi primer empleado dot CSC, bien. Entonces voy a guardar el archivo de disco shift, presionado Shift, luego haga clic derecho Copiar parte S. Entonces esta va a ser mi segunda parte. Ahora voy a salvar mi tercera parte. Por lo que en esta ocasión voy a conseguir la parte de este archivo MP4 llamado ps pot. ¿ De acuerdo? Ahora, así que tengo que guardar este archivo. Por lo que todos los caminos se han definido en esta parte, en este archivo en particular. Ahora, lo que voy a hacer, voy a configurar este primer paso, sabía administrador de archivos planos. Entonces voy a proporcionar el camino. Voy a seleccionar este particular phi d SSID es. Permítanme sólo seleccionar la parte aquí. Importar archivos, este archivo plano, bien, columnas, nombre de columna. En la primera fila. No, no hay ninguna columna en mi expediente. Vista previa. Entonces si no hay columna, este SSI está sintonizado, dará automáticamente esta columna, columna 0. Entonces estos son los caminos en mi archivo. Haga clic en Aceptar. Columnas. Ok. Esta será la columna de salida. Se puede nombrar datos. Haga clic en ok, esto está configurado. Siguiente Voy a utilizar la transformación de la columna de importación. Por lo que tengo que seleccionar la transformación de la columna de importación aquí. Este. Entonces tengo que combinar esto. Ok, haga doble clic en esta entrada y salida. Entonces éste es el insumo. Seleccione esta entrada, entrada y salida. Permítanme sólo seleccionar la entrada. Entonces éste va a ser el insumo. Y tengo que definir la columna de huevo de salida. Estos van a ser los datos de salida. Ahora, tengo que mapear esta entrada a la salida. Para mapear la entrada a la salida, tengo que proporcionar el ID de edad de línea. En este caso, el ID de edad de línea es para esta columna de entrada ID de edad de línea es este. Tengo que proporcionar la idea de la edad de línea de esto. Por lo que la edad de línea ID es de 24. ¿ Qué pasa con esto? Tengo que proporcionar manualmente el ID de edad de la línea. Ahora esta columna y esta columna, estas dos columnas están mapeadas. Ok, entonces ¿qué columna de importación hará? Columna de importación va a almacenar la información en la columna de salida. En esta columna. De acuerdo, se va a almacenar la información. ¿ Qué información? Este archivo datos de disco implican
datos de punto CSV sobre el punto valle JPEG dis datos de imagen en este dato MP4, se va a almacenar aquí. ¿ De acuerdo? El tipo de datos es imagen, ¿de acuerdo? Haga clic en Aceptar. A continuación lo que quiero después de almacenar la información en d columna de importación, quiero cargar los datos en mi, en mi base de datos. Por lo que para poder cargar los datos, tengo que usar el destino Wally DB. Paso. Encuentra un nombre de tabla. Tengo que crear nuestra mesa. En primer lugar, voy a crear una tabla. Para crear nuestra tabla, usaré este comando. Crear Tabla. Base de datos dice dados. Tengo que seleccionar el archivo de base de datos limb var char 500 data file es VAR binary max. Entonces haga clic en Aceptar. Se ha creado. Selecciona estrella de esta tabla. Selecciona estrella de esta tabla. En este momento esta mesa está vacía. Está bien, bien. Permítanme que acaba de configurar este nombre de tabla es. Tabla de datos. De acuerdo, mappings, archivo, está bien, datos fuente. Y éste es d phi Limb. El segundo va a ser d delta. Este va a ser el dato que voy a almacenar aquí. De acuerdo, ya lo voy a almacenar. Impresionante. Por lo que esto ha sido configurado nulo. Voy a ejecutar mi paquete. Entonces mira, es sub paquete se ha ejecutado con éxito. Ahora ejecuta este look. Este es archivo de datos t, que se almacena en forma de var binario. Esta es la ruta exacta del archivo y define LIM. Ok. Ahora quiero recuperar estos tres archivos. Entonces lo que voy a hacer en primer lugar, déjame simplemente eliminar archivos DC de mi carpeta porque quiero recuperar estos tres archivos de mi base de datos. Ahora con el fin de recuperar estos datos, voy a utilizar t import no export column transformation. Ahora voy a utilizar la transformación de la columna de exportación de importación. Entonces crea un paquete. En esta ocasión, voy a utilizar la columna de exportación. Entonces, antes que nada, nivele, use el flujo de datos. Haga clic en esta herramienta SSIs. Voy a utilizar la fuente OLED DB. Entonces tengo que seleccionar primero una mesa. Este va a ser mi tabla archivo limb en archivo de datos, estos otros dos atributos. La próxima vez vamos a utilizar la columna de exportación. Columna de exportación, transformación de columna de exportación diversa. Tengo que seleccionar columna de exportación. Haga doble clic, extraiga columna, qué columna desea extraer I1 para extraer el archivo de datos, columna de ruta de archivo. Este definido es camino definido. Por lo que esto se va a manchar camino en esto va a ser d delta. Este es el dato y parte deshonesta deshonesta deshonesta. ¿ De acuerdo? Así que maximiza esto, permite fuerza rosa, truncar, escribir orden de bytes. ¿ De acuerdo? Estos dos, voy a seleccionar a estos dos. El motivo por el que no estoy seleccionando esto porque los datos ya están truncados. No estoy marcando esta opción porque los datos ya están truncados. Ahora, tengo que guardar este paquete 08 es mi, es el nombre de mi paquete. Simplemente ejecute el paquete. Verás datos en la carpeta. Se han exportado datos utilizando la transformación de la columna de exportación. Entonces de esta tabla, básicamente, de esta tabla he exportado datos. Mira, estos tres archivos han sido exportados. Déjame abrir este archivo. Todo bien. Por lo que este va a ser el archivo de imagen JPEG, que es un, que se ha exportado, y este es d archivo MP4. Por lo que espero que hayas entendido el concepto de transformación de columnas de importación y transformación de columnas de exportación en, en SSI, Sí. Muchas gracias y tengan un gran aprendizaje.
20. Columna de copia, columna derivada y asignación de personajes: Hola a todos. En esta conferencia en particular, vamos a aprender a crear una copia de columnas. Por lo que hay diferentes transformaciones que se pueden utilizar con el fin de crear una copia de columnas. Entonces antes que nada, lo que voy a hacer, voy a leer para mis conjuntos de datos. Entonces este va a ser mi conjunto de datos. Entonces lo que voy a hacer, voy a crear una copia de ventas, beneficio y nombre del producto. Entonces ahora déjame simplemente cerrar esto. Ahora. Tengo que seleccionar mi fuente. Entonces, en primer lugar, tengo que usar la fuente de archivo plano con el fin de obtener el conjunto de datos. Tengo que crear un nuevo gestor de conexiones, navegar CSV. Seleccionaré la fuente subrayada columnas de producto. Vista previa avanzada. Tengo que seleccionar Product ID debería ser un tipo de datos entero. Permítanme simplemente cambiar el tipo de datos de esta serie debería ser un punto flotante. El punto flotante que se profería debe ser un punto flotante. De acuerdo, revisión. Entonces este va a ser mi conjunto de datos. Columnas. Estas son las columnas id name, countries, city, sales, y profit. Entonces lo que voy a hacer, voy a utilizar para derivar la transformación de columnas. Entonces con la ayuda de la transformación de columnas derivadas, no sólo puedo crear una copia de columnas, sino que también puedo realizar algunas transformaciones. Entonces con la ayuda de esta expresión en esta sección, voy, puedo realizar la transformación o en mi conjunto de datos, en mis columnas. Entonces, en primer lugar, lo que voy a hacer, voy a seleccionar, añadir unas nuevas columnas. Quiero crear una copia, agregar una nueva expresión de columna. Por lo que x creará una nueva
, creará una nueva columna. Entonces no lo estoy, no voy a tomar una copia. Estoy creando una nueva columna. En la columna Nuevo, lo que estoy agregando, estoy agregando, esto falla. Entonces esta va a ser mi expresión. Entonces Derivado nombre de columna, ¿cuál será el nombre
lo hará, cuál será el nombre de columna derivado? Copiar fuera. Las ventas serán Mi nombre. Está bien. El segundo que voy a crear, añadir una nueva columna, beneficio, luego copiar beneficio. Entonces básicamente lo que estoy haciendo, estoy creando una nueva columna y de hecho nueva sección de columnas estoy editando. Estoy poniendo estos valores de ganancia, valores columna de
ganancias. ¿De acuerdo? El tipo de datos es flotante, bien, como es. Haga clic en Aceptar. Ahora a continuación voy a usar t transformación multicast. Ahora no lo estoy, no estoy insertando mis datos en ninguna parte, así que usaré la transformación multicasts solo con fines de prueba. Vista de datos habilitada, doble clic, visor de
Geta, nombre de ID de producto, países, ventas de ciudad. Déjame solo poner ventas aquí. Beneficio. Entonces tengo que poner ventas. Está bien, espera, ventas entonces tengo que poner copia de ganancia de ventas, copia de ganancia, bien, ahora, haga clic en Aceptar. Tengo que salvar esto. Inicio. No, mira. Ventas, copia de ventas, beneficio, copia de beneficio. Entonces así es como puedes crear una nueva columna. Valores de entrada, columna a menudo existente. Ahora haga doble clic. Entonces lo que voy a hacer a continuación, voy a transformar esta columna de ventas. De acuerdo, entonces vamos a sacudir. Quiero multiplicar este valor de ventas por 12. Yo quiero conseguir las ventas mensuales,
esperadas, ventas anual esperadas, ¿de acuerdo? Por lo que las ventas anualmente y el beneficio ELE. Multiplicaré esto. Entonces ahora tengo que usar la ronda, quiero redondear mi, mis Ds a campos Coulomb. Entonces aquí voy a usar esta expresión redonda. ¿De acuerdo? Tengo que usar la expresión redonda aquí. Columnas Ventas. Pondré ventas. Entonces multiplicaré la venta por 12. Entonces voy a usar tierra dos puntos decimales. Está bien, bien. Entonces voy a usar la ronda con esta ronda. Aquí, voy a usar al profeta. Multiplicar por ganancia por 12, entonces la tierra debe ser de dos puntos decimales. Ok, haga clic en Aceptar. Ahora ejecuta el paquete. Ahora mira a 1.386. Beneficio desista una ganancia y ganancia anual como este dos puntos decimales. Ok, el máximo es de dos puntos decimales. Entonces así es como puedes crear una copia de tu puedes, puedes crear una nueva columna y puedes realizar, así es como puedes realizar la transformación en una, en una nueva columna. Ahora, No lo que pueda hacer a continuación. En lugar de la transformación de columna derivada, utilizaré la transformación de columna de copia. Por lo que la transformación de columnas de copia va a crear una copia de columnas. Ok, entonces, ¿qué hace esto? Esto básicamente es crear una nueva columna. Esto está creando una nueva columna, que es ésta en. Estoy agregando valores, a menudo columna existente, luego estoy multiplicando valores por 12. Entonces con la ayuda de la transformación de columnas de copia, solo
puedo crear una copia de columnas. Puedo crear una copia de una sola columna o puedo crear una copia de varias columnas. Ahora en lugar de la transformación de columna derivada, usaré la columna de copia. No, elimine esta transformación. En ninguna parte se copia columna aquí. Voy a usar la transformación de columna de copia. No. Haga doble clic. Ahora voy a usar la columna de copia, digamos nombre del producto. Deseo utilizar este nombre del producto. Deseo crear una copia de este nombre de producto. De acuerdo, también ventas y beneficio DC-3, copia de entonces multicast Data Viewer, ok. Habilitó para ver el nombre
del producto, nombre del producto, copia de ventas, copia de beneficio. De acuerdo, guarde esto y empiece. Por lo que en la transformación de columnas de copia, no
puedo hacer una transformación. Simplemente puedo crear una copia look copia del nombre del producto, copia de ventas, copia de beneficio. De acuerdo, ahora a continuación lo que voy a hacer, voy a usar la transformación del mapa de caracteres. Déjame solo usar el personaje, mi transformación de mapa de caracteres de aproximación. Entonces déjame simplemente eliminarlo, haga doble clic. Por lo que la transformación del mapa de caracteres, la transformación del mapa
corregida se utiliza en el tipo de datos Y déjame simplemente cerrar esto y tengo que buscar aquí mapa de caracteres,
transformación, buscar mapa de caracteres, aplicar funciones de cadena en datos de caracteres. Por ejemplo, convertir a partir de datos que estén en mayúsculas o minúsculas. Entonces si tengo que convertir mis datos de cadena a mayúsculas o minúsculas, puedo usar la transformación del mapa de caracteres. Por ejemplo, nombre del producto. Por lo que en poner columnista nombre de producto destinos, estoy creando unas nuevas columnas. Si selecciono esto, esto va a actualizar la columna existente, pero quiero crear una nueva operación de columna. ¿ Qué operación quiero realizar? Puedo, puedo convertir este nombre de producto a mayúsculas, minúsculas. Se trata de operaciones diferentes. Ok? Digamos que quiero convertir esto a mayúsculas Click OK. Y la copia alias del nombre del producto. ¿ De acuerdo? Entonces así es como usas la transformación del mapa de caracteres con la ayuda de carácter mi aproximación, solo
puedo realizar, solo puedo realizar transformaciones en un tipo de datos de cadena. ¿ Qué transformaciones? Estas son la lista de transformaciones que puedo,
puedo realizar en tipo de datos String. Entonces puedo crear una copia, pero al mismo tiempo puedo actualizar la columna existente,
vale, si selecciono esto, así que esto va a actualizar la columna existente. Esto no va a crear una copia, así que quería crear una copia, así que seleccionaré Nuevo. Haga clic en Aceptar. Ahora seleccione esta opción Haga doble clic. Editar, Vista de datos, nombre del producto, país, ciudad, ventas, beneficio, y copia el nombre del producto. Haga clic en Aceptar. Tengo que salvar esto. Ahora, ejecute el paquete. Ahora verás look copia del nombre del producto. Entonces no, lo que voy a hacer a continuación, voy a usar esto en lugar cambio. Por lo que esto va a actualizar la columna existente. Ahora ejecuta esto, vamos a convertir los valores de columna existentes a aspecto mayúscula Nombre del producto, computadora, teléfono móvil. Entonces si tienes que aplicar específicamente, si tienes que realizar las
transformaciones en minúsculas o mayúsculas y tienes que crear una copia de columnas, entonces puedes usar la transformación del mapa de caracteres, ¿de acuerdo? Copiar la transformación de columna sólo va a crear una copia. En tanto que la transformación de columna
derivada con LPA, Transformación de columna derivada, puedo hacer múltiples transformaciones. Puedo hacer, puedo usar múltiples funciones. Puedo, puedo usar funciones matemáticas,
puedo usar múltiples funciones diferentes, funciones de
cadena, funciones de fecha y hora, o esta transformación me da múltiples opciones, ¿de acuerdo? Operadores tipo captación funciones, mal funcionamiento. Ok, aquí puedo realizar la transformación en mis columnas. Entonces espero que hayas entendido el concepto. Muchas gracias y tengan un gran aprendizaje.
21. Percent de muestro y muestra de la transformación de la transformación: Hola a todos. En esta conferencia en particular, vamos a aprender a tomar datos de muestra de, a partir del conjunto de datos original. Déjame mostrarte primero mi conjunto de datos original. Entonces este es mi conjunto de datos original, registros
de ventas dot csv. Por lo que en este expediente en particular, tengo total. ¿ Cuántos registros? ¿ Total? Tengo 100 mil registros. De acuerdo, entonces lo que
quiero, quiero tomar, quiero tomar pocos datos de muestra de este conjunto de datos original. Algunas reglas simples. De acuerdo, entonces lo que puedo hacer en SSI es que puedo usar las reglas de transformación de muestreo, esta creció confirmación de muestreo, o puedo usar la transformación de muestreo porcentual. Ok, entonces de esta manera puedo obtener conjuntos de datos de muestra D del conjunto de datos original. De acuerdo, ahora, para antes que nada, voy a leer este sencillo archivo Records dot csv. Por lo que este archivo se encuentra en cabello en mi, en este directorio. De acuerdo, ahora, antes que nada, voy a usar la fuente de archivo plano D. De acuerdo, ¿dónde está la fuente de Flat File? Tengo que usar esto primero,
vale, fuente de Flat File. Ok, haga doble clic configurado este paso, nuevo, navegar, y seleccionar los archivos CSV. Entonces este es mi expediente. De acuerdo, columnas, nombres de columna en la primera fila de datos, bien. Estas son las columnas de mis archivos. Esta es mi región de datos original, país tipo de artículo, pedido, fecha de pedido. Tengo que cambiar el tipo de datos a la fecha. Permítanme simplemente cambiar el tipo de datos. Esta va a ser fecha, ID de
pedido, fecha de envío. Esta va a ser fecha de vencimiento. Es fecha. De acuerdo, cada unidad vendida, este va a ser el valor entero por precio unitario diverso. Esto va a ser costo unitario de punto flotante. ¿ De acuerdo? Costo unitario, flotar, ingresos totales está en punto flotante. Entonces esa es la razón por la que estoy cambiando el tipo de datos. En punto flotante. El beneficio total también está en punto flotante o mantenido previsualizar los conjuntos de datos y este es el conjunto de datos se ve, estos valores están en punto flotante. Esa es la razón por la que he cambiado las columnas de tipo de datos k. Está bien, todo mapeado configurado, OK. Haga clic en Aceptar. El primer paso está configurado. A continuación, voy a usar la transformación de muestreo t rho con el fin de obtener reglas disimulables. ¿ De acuerdo? Ok, haga doble clic en número de reglas de cuántas reglas desea obtener de la fuente. Diez filas, digamos si especifico 200, así que voy a conseguir 200 reglas aleatorias, ¿de acuerdo? Vamos a especificar diez. Entonces de este conjunto de datos,
quiero, solo quiero diez reglas
fuera de, de un 100 mil, voy a, voy a conseguir sólo diez al azar Ruth. Por lo que muestra, esta serán las filas de muestra. Esta será la otra salida. Ok, columnas. Entonces estas son las columnas. Bien. Siguiente Voy a usar el paso multicast. Este paso voy a utilizar para obtener datos D para ver los datos. De acuerdo, aquí voy a proporcionar esta muestra rho. Esto va a ser salida, ¿de acuerdo? Esta salida vendrá en D multicast. Por lo que también quiero previsualizar mis conjuntos de datos. Habilitaré la opción de visor de datos. De acuerdo, así que esto se va a mostrar, esto me va a dar diez filas aleatorias. Por lo que en este momento esta opción no está marcada. Entonces ahora cada vez que ejecuto este paquete, voy a conseguir diferentes conjuntos de datos. Entonces la primera vez digamos si ejecuto el paquete, así que voy a conseguir las diez filas, copiar datos, déjame simplemente pegar mis datos aquí. Entonces voy a conseguir la fila de diez al azar, ¿de acuerdo? Ingresos totales, costo total. Ahora, cuando la próxima vez que vaya a ejecutar este paquete, obtendré reglas diferentes, ¿de acuerdo? Por lo que voy a obtener diferentes conjuntos de datos. ¿ De acuerdo? Este es el comportamiento aleatorio, así que voy a obtener datos al azar. Esto confiable, consigue otras diez reglas. Esta vez alrededor. El conjunto de datos será diferente. ¿ De acuerdo? El conjunto de datos de Asia es diferente. Ahora bien, ¿y si dejame solo habilitar esta opción? Entonces, ¿y si habilitara esta opciones de semilla aleatoria? Entonces si doy valor uno, por lo que este valor de semilla aleatorio se define como uno. Por lo que este valor se utilizará en un, en un algoritmo. Entonces ahora cuando voy a, digamos diez filas, déjame simplemente hacer clic. Está bien. Entonces, ¿cuál es el propósito de esto? Usando la misma semilla aleatoria en la misma entrada, generar
siempre la misma muestra. Voy a explicar la sentencia. Especificar semilla aleatoria se recomienda sólo durante el desarrollo y la prueba del paquete. ¿ De acuerdo? Entonces si estás desempeñando, si lo estás, si estás haciendo algunas pruebas, puedes usar esta opción. Ahora, ya que he definido el valor uno, vamos a ejecutar el paquete y ver el resultado. De acuerdo, voy a conseguir este resultado. Permítanme simplemente copiar el resultado aquí. Entonces cuando la próxima vez que vaya a ejecutar el mismo paquete, obtendré el mismo resultado. El motivo por el que voy a obtener el mismo resultado porque el valor de semilla se define como uno, obtendré el mismo resultado. Entonces este es el significado de esta frase. De acuerdo, ahorita, guarda este paquete. Conseguiré los mismos resultados. Puede buscar, copiar datos. Mira, obtendré el mismo resultado. Está bien, mira. Ahora, a continuación lo que voy a hacer, voy a, voy a cambiar el valor de la semilla. Entonces cambiémoslo a dos. Ahora voy a conseguir un resultado diferente, ¿de acuerdo? Por lo que conseguiré diez al azar Ruth, pero será diferente a las filas anteriores, anteriores. Mira este conjunto de datos es diferente. Copia. Déjame pegar aquí. De acuerdo, este conjunto de datos es totalmente diferente. Ahora, a continuación a lo que voy a hacer, voy a ir en lugar de multicast, voy a usar la audiencia, voy a usar la función agregada. Permítanme que me quite esto aquí. Voy a usar la función agregada. Agrega reglas simples, ¿de acuerdo? Siguiente Voy a usar la multicast, ¿de acuerdo? Entonces me voy a sumar sobre la base de país. ¿ De acuerdo? Quiero un costo unitario, ingresos
totales, costo total, beneficio
total, pero quiero agrupar por sobre la base del país. Yo quiero realizar la operación de suma. Está bien, mira bien. Filas de muestra, voy a aumentar el número de frutas, digamos 500 filas. Quiero 500 filas de muestra. Yo quiero realizar agregación sobre estas 500 reglas de muestra. Entonces si voy a realizar la agregación en 100 mil filas, va a llevar tanto tiempo. Entonces voy a realizar la operación de prueba en 500 filas, ejecutar el paquete. Por lo que el paquete ha sido ejecutado, pero tengo que configurar la opción Visor de datos Habilitar. Aquí voy a seleccionar, bien, bien. Aquí voy a seleccionar, vale, digamos uno. Bien. Ahora ejecuta el paquete. Mira. País. Costo total, ingresos totales, costos
unitarios, ingresos
totales, costo total, y beneficio total. La próxima vez vamos a utilizar el muestreo porcentual. Otra transformación para obtener el conjunto de datos de muestra. Esta transformación se conoce como muestreo porcentual. Permítanme simplemente crear un nuevo paquete aquí. Entonces voy a usar,
usaré el mismo conjunto de datos. Y esta vez alrededor voy a usar una transformación de muestreo de porcentaje profundo. Archivo plano cae muy asustado para la fuente. ¿ De acuerdo? Ahora a continuación, voy a utilizar el muestreo. Está bien. Déjame simplemente cerrar esto. Sí, tengo que cerrar esto ahora voy a utilizar el muestreo porcentual. De acuerdo, porcentaje de ruth, 1%. Entonces déjame simplemente abrir mi conjunto de datos. Entonces en este conjunto de datos que
tengo, tengo 100 mil filas. Por lo que quiero obtener el 1% de mi conjunto de datos. 1% se convierte en 1000 reglas. Entonces voy a conseguir alrededor de 1000 reglas. Entonces no voy a seleccionar esta opción, vale, próxima vez vamos a usar la multidifusión muestra de
paso de
multidifusión. ¿ De acuerdo? Por lo que incapaces los datos somos opción. Por lo que voy a conseguir aproximadamente 1000 reglas. Podría ser más de 1000 o podría ser menos de 1000. ¿ De acuerdo? De acuerdo, ¿cuántas filas tienen? Tienen, sigue ejecutándose. Es, es 970 filas. Tengo 970 filas, ¿de acuerdo? Cuando la próxima vez que vaya a ejecutar este paquete, me
va a dar diferentes filas. De acuerdo, echemos un vistazo al recuento de filas aquí. 991 esta vez alrededor, me ha dado 991 reglas. Ok. Cambiémoslo a 2, 2% por ciento. Son alrededor de 2 mil. Entonces haga clic en Aceptar. Entonces esto me va a dar alrededor, esto no me va a dar 1002 mil filas exactas. Está bien. Esta vez alrededor me ha dado cuántas filas? 2033 reglas. Podría ser más de 2 mil o podría ser menos de 2 mil. ¿ De acuerdo? Entonces esto es muestreo porcentual, 2% del conjunto total de datos, que es, que es alrededor de 2 mil, ¿de acuerdo? Ahora ésta es mi segunda entrada que no han configurado. Entonces si selecciono esto, así que usa la semilla aleatoria a ella va a usar el valor de semilla para generar las filas aleatorias. Entonces en este momento el valor se establece como uno. Haga clic en Aceptar. De acuerdo, ahora esto me va a dar el mismo resultado cada vez que se ejecute el paquete, esto me va a dar el mismo resultado. Mira 0-6 tres, otra vez, voy a ejecutar el paquete. Esto me va a dar el mismo resultado. Si quiero un resultado diferente, tengo que cambiar el valor de semilla. Mira 2063, necesito cambiar el valor de semilla para obtener un resultado diferente. Ok, ahora también, así que esto me va a dar ahora, esto me va a dar el resultado diferente porque se cambia el valor de la semilla. Mira 19, 5-4,
vale, podría ser más de 2 mil, R0 podría ser menos de 2 mil. Se trata de muestreo porcentual. Básicamente necesitamos conjunto de datos de muestra para realizar pruebas. Entonces haga clic en Aceptar. Entonces este fue el concepto de muestreo porcentual y el muestreo de filas. En el muestreo de filas, proporcionamos el valor exacto de fila, bien, en el muestreo porcentual obtenemos el porcentaje. Por ejemplo, si es 2%. Entonces voy a llegar al 2% del conjunto de datos total no ejercer. Podría ser más del 2%, un poco más que, o podría ser menor que. De acuerdo, espero que hayas entendido el concepto. Muchísimas gracias y ten un gran aprendizaje.
22. BulkInsertFinal: Hola a todos. En esta conferencia en particular, vamos a discutir la tarea de inserción masiva en el SSIS. Entonces cuando vas a crear un paquete, tienes que hacer clic en la sección Control Flow. No tienes que hacer clic en la sección Flujo de datos. ¿ De acuerdo? Después de esto, vas a ir en caja de herramientas D SSIS, luego tienes que hacer clic en la tarea de inserción masiva. Entonces usando la tarea de inserción masiva, vamos a cargar datos en un SQL Server, ¿de acuerdo? Por lo que insertar masilla tarea carga datos de un archivo directamente en un SQL Server. Entonces, ¿qué archivo vamos a cargar? Voy a cargar este archivo del empleado dot csv. Entonces generalmente usamos tarea de inserción masiva cuando, cuando tenemos que cargar enorme volumen de datos, ¿de acuerdo? Por lo que el beneficio de usar esta tarea es TAT. No realizamos ninguna transformación. Entonces cuando tenemos que cargar datos sin realizar ninguna transformación, utilizamos esta tarea de inserción masiva. Además, esta tarea de inserción masiva es muy rápida, ¿de acuerdo? Ahora, también podemos insertar, también podemos cargar datos usando la tarea de flujo de datos. Pero con la tarea de flujo de datos, hay una opción de realizar la conformación. Entonces también podemos realizar la transformación en un Dataflow tareas, pero con tarea de inserción masiva, no podemos realizar. De acuerdo, ahora lo que vamos a hacer, vamos a crear una mesa primero. Entonces para esto, voy a usar este guión. Si la tabla no existe, primero
va a crear una tabla. ¿ De acuerdo? Si la tabla existe, entonces no creará una tabla. Posteriormente insertará datos en una tabla. Entonces en primer lugar, antes de usar la tarea de inserción masiva, primero, voy a usar la tarea D Ejecutar SQL, ¿de acuerdo? Haga doble clic en esto. Por lo que hay que configurar esto. Ejecutar tarea SQL, bien, nombre Ejecutar SQL. ¿ De acuerdo? Ahora conexión tipo O, L E D B conexión. Tienes que seleccionar una conexión. Entonces este es el nombre de mi conexión a base de datos. Bases de datos, dados. De acuerdo, entonces tengo que hacerlo, tengo que proporcionar aquí la declaración SQL. Aquí voy a proporcionar esta declaración SQL. Esta es la sentencia SQL. Copia esto y pega silla. Entonces tienes que hacer clic en Aceptar, esto está hecho y espolvoreado. Haga clic en Ok, esta tarea se ha configurado. Déjame mostrarte mis escuelas, mi guión. Mira, este es el script select star a partir de este nombre de esquema de datos y este es esquema de tabla t. Déjame quedarme con esto. Ejecutar esto. Si, si existe esta tabla, si existe esta tabla, nombre de la tabla es, permítanme simplemente proporcionar el nombre de la tabla. Déjame solo abrir el SQL de ejecución y déjame simplemente cambiar el nombre de la tabla de extremidad de la tabla. Déjame cambiarlo para dejarme simplemente cambiarlo a bien, bici,
EMP, subrayado, tabla Control C y nombre de la tabla Es éste. ¿ De acuerdo? Entonces este va a ser el nombre de mi mesa. Ok, bien Click, Ok. Fine Click. Está bien. Siguiente Voy a utilizar la tarea de inserción masiva. Si esta tabla existe, tengo que usar esta tabla. Encuentra. Ejecutar. Si esta tabla existe, entonces no va a crear, no va a ejecutar esta declaración, ¿de acuerdo? Si esta tabla no existe, entonces ejecutará esta instrucción create table. Ahora pues voy a combinar la primera tarea. Para la segunda tarea, configuraré la tarea de inserción masiva aquí llamada desconexión. Ahora tengo que proporcionar la conexión aquí. Este, ya voy a haber creado desconexión, no hay necesidad de crear otra conexión. De acuerdo, mesa de destino. Entonces esta es la tabla donde voy a cargar mis datos. Entonces estas son tablas, estas son las tablas que ya están presentes aquí en mi base de datos de dados. No puedo escribir nada aquí, ¿de acuerdo? Entonces no escribiré nada. El formato es especificar OK, delimitado por
filas, OK. control, LF. columna delimitada es el archivo separado por comas de punto y coma. Este es el archivo separado por comas que estoy leyendo. Déjame solo editar este archivo. De acuerdo, este es el archivo que voy a cargar. Bien. Archivo, ¿qué expediente? Y quiero cargar nuevo, seleccionar un archivo que quiero cargar en mi tabla de base de datos. Está bien, bien. Opciones. Entonces mi primera opción es ROC, código page rot. Entonces ya que estamos, estamos leyendo un archivo sin procesar, empleado dot CSV. Se trata de un archivo delimitado por comas. Entonces voy a tener esta opción tipo de archivo de datos para TXT, para archivos de texto, vamos a tener esta opción char, ¿de acuerdo? Entonces si lo estamos, si estamos importando datos de una base de datos, de cualquier base de datos, estas son diferentes opciones que podemos utilizar. Para que podamos seleccionar la opción nativa o podemos seleccionar las otras opciones, bien, tamaño de lote 0. Entonces, ¿cuál es el significado de este tamaño de lote? Tamaño de lote significa que supongamos si tienes un 100 registros que quieres cargar. Entonces si vas a dar valor 0, significa
que después de cargar un 100 registros, realizará la operación de commit. Digamos. Si vas a dar valor 10, entonces significa deuda. Después, después de cargar diez registros, se va a realizar el, TI va a realizar la operación de commit. De acuerdo, Entonces este es el significado del tamaño del lote, ya que quiero realizar la operación de commit una vez que todos los datos se carguen en mi base de datos, voy a dar opciones 0, última fila en la primera fila. La primera fila va a ser la fila de encabezado. Entonces voy a iniciar la carga desde la segunda fila. Por lo que voy a dar valor segundo, última fila. Entonces si quieres cargar todos los datos, vas a dar valor 0. Digamos si quieres cargar diez filas, así que voy a dar valor 10. Entonces en este caso, voy a dar valor 0. Por lo que estas son opciones diferentes. Aquí tenemos opciones como restricciones de comprobación. Estas son diferentes opciones que puedes dar. Mantén los nulos como es, ok. Ahora si quieres ordenar tus datos, pero esta es una opción aquí, vas a especificar el valor de la columna. ¿ De acuerdo? Estas son expresiones extra de opción diferentes. Ahora pulsa Ok. Entonces hay un error. Debe especificar nombres de tabla. Por lo que para especificar un nombre de tabla, hay
que hacer clic con el botón derecho. Entonces hay que seleccionar las propiedades. Entonces a partir de aquí vas a seleccionar esta opción nombre de la tabla de destino. Entonces aquí voy a proporcionar esta extremidad de mesa. Este es el nombre de la tabla donde quiero cargar mis datos. Por lo que voy a proporcionar esta mesa. Ahora. Tienes que guardar este paquete. Tienes que hacer doble clic en esta conexión de paquetes. Mira, puedes ver la mesa de destino, ¿de acuerdo? Ahora haga clic en OK, guarde esto y ejecute el paquete. Parece que hay un error. ¿ De acuerdo? Déjame comprobar cuál es el parámetro de error no está bien. Entonces el error es escuchar esta consulta, vale, necesito volver a verificar cuál es el problema aquí. Nombre de la mesa, ¿de acuerdo? Tengo que especificar este nombre de tabla aquí. Ejecutar, seleccionar estrella de esta tabla. Por lo que los datos se han insertado en mi tabla
tablas de destino una diferencia cómo se insertan datos en una tabla de, desde un archivo de texto. Para que puedas, usarás la tarea de inserción masiva cuando tengas dos. Entonces tienes que cargar enorme volumen de datos y quieres velocidad, y quieres cargar en tiempo mínimo. Entonces este es el concepto. Espero que hayas entendido el concepto. Muchísimas gracias y ten un gran aprendizaje.
23. ForLoop Container: Hola a todos. En esta conferencia en particular, vamos a discutir t For Loop Container en SSIS. Entonces, en primer lugar, voy a seleccionar la sección de flujo de control. Entonces seleccionaré la caja de herramientas SSIS. En la caja de herramientas SSIS, entraré en la sección Contenedores. Seleccionaré el contenedor for-loop a partir de aquí. Simplemente arrastre y suelte esto para contenedor de bucle. Entonces para Loop Container es igual que FOR loop en lenguaje de programación. Se va a comportar de la misma manera que el bucle predeterminado en el lenguaje de programación. Entonces en esta conferencia en particular, les
voy a dar un ejemplo de for loop container. Entonces esta es mi mesa de empleados. Y permítanme sólo consultar esta tabla. Entonces lo que voy a hacer con contenedor de seguimiento es que voy a extraer los identificadores de eventos. Entonces el tiempo t es el evento ID 16 es 128 incluso id. Así que sólo voy a extraer el ID parejo,
ID de esta tabla de empleados. Entonces voy a insertar datos en mi guion de subrayado DRG,
subrayado de empleado, tabla final de subrayado. Permítanme sólo seleccionar esto. ¿ De acuerdo? Entonces usaré el contenedor for loop aquí, vale, dentro del contenedor for loop, usaré la tarea de flujo de datos. Seleccione esta. Entonces voy a usar la tarea de flujo de datos dentro del flujo de control para contenedor de bucle. Entonces solo en el cuidado de tareas de flujo de datos, déjame solo configurar esto para bucle, para contenedor de bucle. Para configurar el contenedor de bucle, voy a definir una variable aquí. Entonces el nombre de la variable será, digamos contador. Entonces contador va a ser el nombre de la variable. Alcance es esta variable cuatro sólo se limita a este contenedor. El tipo de datos es entero, el valor
predeterminado es 0. Así que haga doble clic en esto para contenedor de bucle. Ahora es el momento de inicializar esta variable contador, expresión inicial. Escribiré así en, así es como se define, así es como se escribe una variable dentro del editor de bucle predeterminado, contador. Entonces este va a ser el nombre de una variable. Esta es una variable igual a 0. Evaluar la expresión. Esta va a ser la condición. Entonces quiero que esto for loop se ejecute 50 veces en contador menos que igual a 50. A continuación, asignar expresión en Contador es igual a contador más 2. Entonces ya que solo quiero las reglas del evento, incluso los identificadores, así que voy a usar este valor de contador, contador más 2. Entonces esta es la variable. Aquí. Tengo que escribir como este anuncio, vale, en mostrador más 2. Bien. Haga clic. Está bien. Esto está configurado. Ahora siguiente voy a configurar esta tarea de flujo de datos. Por lo que dentro de la tarea de flujo de datos, usaré la única disciplina de fuente DB o LED ser fuente. Después voy a seleccionar el destino. Esta es fuente aquí voy a seleccionar esta generación de prueba. A continuación, configuraré esto. Ya está configurado. Mesa o vista o Q peso. Este es el editor de fuentes. Entonces lo que voy a hacer, voy a seleccionar el comando SQL. En lugar de usar la tabla o vista, usaré aquí el comando SQL. De lo que voy a hacer, voy a usar el valor del parámetro aquí. Por lo que selecciona estrella de esta mesa. Su ID es igual a 2 signo de interrogación. Por lo que disco stem Mach es el valor variable. Entonces aquí voy a pegar este discurso. Dinamarca va a ser el valor variable. Usaré aquí el valor del parámetro, que será el contador. Entonces déjame solo usar el mostrador. Variable. Discounter. Haga clic en Aceptar. Columnas, estas son las columnas. Siguiente Voy a configurar la parte de destino. Déjame simplemente configurar esta tabla a la vista aquí voy a seleccionar el subrayado DRG finalmente tabla. Ahora, permítanme simplemente seleccionar UTR G subrayado tabla final, patrón subrayado tabla final es ésta. ¿ De acuerdo? Ahora mappings, encuentra estos son los mappings. Haga clic en Aceptar, guarde este flujo de control. Tienes que salvar esto. Ahora. momento, esta mesa está vacía. No hay datos dentro de esta tabla. Entonces lo que va a hacer, sólo va a extraer, esta parte va a extraer las filas pares. Y este destino OLED ser va
a insertar su tiempo el empleado subrayado finalmente tabla. De acuerdo, ahora siguiente voy a ejecutar este mapeo, esta bien, paquete. Ejecutar este paquete. El paquete ha sido ejecutado con éxito. Se está ejecutando. Ok, ahora acaba de ejecutarse con éxito. Ahora necesito revisar mi tabla final de objetivos. Se insertan datos. Mira, todos los caminos están parejos. Todas las ideas están pareadas. Dos. De acuerdo, 48, 50. Ahora permítanme simplemente truncar esta mesa. Bien. Ahora lo que voy a hacer, haga click aquí. Ahora voy a cambiar los valores aquí. Contador igual a 0, contador menor que igual a 10. Ahora solo insertará filas de 0 a 10, solo que incluso subió de 0 a 10. Se está ejecutando. Ahora comprueba seleccionar estrella de TIG subrayado final empleado. Mira, sólo cinco filas, 246810. De acuerdo, así es como usas el contenedor de aspecto predeterminado. Entonces muchas gracias y ten un gran aterrizaje.
24. Foreach Loop en contenedor de círculo: Hola a todos. En esta conferencia en particular, vamos a discutir el para cada contenedor de bucle en SSIS. Entonces cuando tenemos que procesar múltiples archivos, usamos por defecto cada contenedor de bucle. Déjame mostrarte los archivos que voy a procesar. Por lo que iré en mi directorio aquí, buscaré mis archivos. Mira, mis archivos están presentes aquí dentro de este directorio, estos dos archivos, así que voy a procesar estos dos archivos. Por lo que usaré el para cada contenedor de bucle. En primer lugar, iré aquí. Aquí, caja de herramientas SSIS. Voy a usar el para cada contenedor de bucle, solo tienes que arrastrar y soltar esto para cada contenedor de bucle. Ahora voy a definir una variable aquí. A partir de aquí voy a definir una variable. Nombre de la variable será, digamos ruta será la extremidad variable. Entonces el tipo de datos será string. Valor de esta variable será la ruta. Simplemente selecciona cualquier archivo,
turno, presiona Mayús, haz clic con el botón derecho. Después tienes que hacer clic en Copiar como parte. Después de eso hay que pegar el camino aquí. ¿ De acuerdo? Por lo que este va a ser valor variable D. Está bien, bien. A continuación, lo que vas a hacer, vas a hacer doble clic en esto para cada contenedor de bucle. Entonces hay que seleccionar expresión de colección. Tienes que saber, no tienes que seleccionar nada. Sólo tienes que seleccionar esto. Tienes que seleccionar para cada enumerador de archivos. Hay múltiples enumeradores. Entonces ya que estamos leyendo múltiples archivos y queremos procesar múltiples archivos, así que voy a seleccionar esto para cada archivo y numerador. Por lo que ahora en la configuración del numerador aquí voy a proporcionar el camino. Entonces el camino es éste. Esta va a ser la parte. Basta con navegar por él. Y d directorio. De acuerdo, déjame pegar el camino aquí. Después de la deuda, tienes que especificar qué archivo quieres procesar. Entonces esto va a procesar todos los archivos que están presentes atención en mi, en mi directorio. Entonces si voy a especificar algún archivo específico, como puedo hacer como este CFE, se va a especificar que va a procesar solo archivos CSV. Quiero procesar todos los archivos que están presentes en mi directorio en este momento tengo dos archivos. Esta opción, cuando voy a comprobar esta opción, lo que son bastante hacer una búsqueda rápida las carpetas, bien, si tenemos una carpeta aquí, digamos si tengo múltiples carpetas. Por lo que tenemos múltiples archivos dentro de las carpetas. Entonces tenemos que revisar esta opción ahora mismo, no
tengo ninguna carpeta,
ningún directorio dentro de este directorio, ninguna carpeta dentro de este directorio. Por lo que no voy a comprobar esta opción, nombre y extensión nombre totalmente calificado solo voy a especificar este mapeo variable totalmente calificado. Ya he creado una variable. Una variable es esta, se va a mapear con índice de zinc 0. Entonces primero va a ser D. Parte va a ser el valor de una variable. De acuerdo, ahora, click Ok, está configurado. A continuación, lo que voy a hacer, voy a utilizar la tarea de flujo de datos. Entonces lo que estoy haciendo, voy a procesar estos dos archivos y voy a cargar esto. Voy a cargar los datos de estos dos archivos en mi tabla, en mi tabla SQL Server. Entonces a continuación, usaré la tarea de flujo de datos dentro de esto para cada contenedor de bucle. A continuación utilizaré la fuente de archivo plano. ¿ Dónde está la fuente de archivo plano? Tengo que seleccionar la fuente de archivo plano después de la muerte, o bien elegir. También puedo elegir el destino de archivo plano. Si quiero cargar datos en un archivo CSV, puede usar algunos otros destinos. Destino de archivo de Excel. Ahí también hay algunos otros destinos. Destino Raphael. Entonces ya que quiero cargar datos en mis tablas de base de datos, por lo que
seleccionaré, elegiré esta opción, aceitosa OLED sea destino. Configurado, esta doble clic en esta opción, nuevo administrador de archivos planos, tengo que crear un nuevo gestor de archivos de subprocesos. Navega, está bien, SS, varios doblados, bien, archivos de documento, entrada CSV, solo selecciona cualquier archivo. Columnas vista previa, bien, bien. Estas son las columnas de datos. Bien. Haga clic. De acuerdo, siguiente configuraré este OLED ser destino. En este momento, no tengo ningún gestor de configuración. Crear una nueva configuración Administrador click Ok, está configurado. Por lo que si quieres crear una tabla desde cero, tienes que hacer clic en nuevo. Entonces como ya tengo mi tabla en mi base de datos, voy a usar tabla de deudas. Entonces mi mesa es que necesito comprobar si la mesa está ahí o no. Creo que necesito crear una nueva tabla. Entonces a partir de aquí voy a crear una nueva tabla. En el nombre de la tabla se dejará decir Demo. Demo va a ser el nombre de la tabla. Estoy creando una mesa ficticia. Mappings, bien. Está configurado, hecho y espolvoreado. Guarda esto. Entonces siguiente. ¿ Qué pasará? Tengo que ejecutar esto,
esto para cada contenedor de bucle. Por lo que para poder ejecutar esto, hay
que hacer clic en este inicio. Por lo que se ejecuta el proceso. Necesito refrescar esto. Refrescar. Varía la actualización. Por lo que ahora tabla, nombre de la tabla es demo, OLED ser degradado esta tabla. Entonces ahora mismo, ¿cuántos archivos? Hay un 100 reglas en mi en mi mesa. Entonces déjame solo revisar empleado 001. ¿ Cuántas filas de esta tabla de este archivo? Alrededor de 50 archivos. Entonces lo que está pasando ahora mismo es que me deja revisar al empleado 0, 2. Entonces, ¿qué está pasando ahora mismo? Debería haber cargado 63 roles en, en mi tabla de objetivos. Lo que está pasando ahora mismo es tack. Este paquete está cargando este phi 2 veces. ¿ De acuerdo? Entonces lo que quiero, quiero cargar la deuda de estos dos expedientes. Por lo que es repetidamente. Se está cargando los datos de sólo este archivo, y lo está haciendo dos veces. Entonces voy a truncar este cable. Entonces, ¿por qué está sucediendo? Está sucediendo porque truncan esta mesa. Déjame, vale, bien. Está sucediendo porque no he configurado el paso de administrador de conexión de archivos planos. Necesito ir a las propiedades. Y desde aquí, necesito configurar esta sección de expresiones. Entonces, ¿qué está pasando ahora mismo? Primera vez que está usando este archivo. Entonces la segunda vez que está usando esto, está tomando, está ejecutando este paquete y está cargando el mismo archivo. Entonces lo que quiero, quiero que esto cargue el segundo archivo, no el primer archivo. ¿ De acuerdo? Ahora por deuda, necesito ir aquí en la sección de expresión propiedades. Seleccionaré la cadena de conexión. Desde aquí seleccionaré la cadena de conexión, cadena de conexión diversa. Sepa que no puedo encontrar la cadena de conexión. Entonces lo que voy a hacer con file connection manager properties expression, una expresión de cadena de conexión. Ahora en esta ocasión voy a especificar la ruta evaluar expresión. Ahora, en esta ocasión, sólo
se va a cargar. Se va a cargar los datos de estos dos archivos para total cuántas filas? 50 filas en mi primer archivo CSV. ¿ Y la segunda fila? Mira, total 13 filas, debería cargar 63, 63 filas. Ahora ejecuta esto. Déjame sólo revisar. han cargado en total 63 filas. Entonces así es como usas el valor predeterminado. Cada ancho de contenedor de bucle. Para cada contenedor de bucle, no se especifica el valor de condición inicial, inicial y el valor de punto final. Entonces aquí lo que vas a hacer, vas a hacerlo en su lugar vas a especificar la, esta estática estática, fina. Por lo que esto significa que va a cargar todos los archivos que están presentes ayuda en el directorio. Entonces ahora digamos que si quieres, en lugar de la tabla de base de datos, quieres cargar los datos en, en un archivo plano, en un archivo CSV, ¿de acuerdo? Entonces voy a usar el destino de archivo plano. Hay destino de archivo plano, este. Entonces esto va a, déjame simplemente borrar esto. Esto va a cargar mis datos en mi CSV. Por lo tanto, actualiza este insumo. No, quiero crear un nuevo administrador de conexión de archivos. Haga clic en Ok, s3, seleccione este archivo. Ahora, voy a cambiar la salida. Entonces voy a cambiar el nombre de este archivo. Por lo que este va a ser el de punto de salida CSV archivo
CSV
de punto de salida. No, no quiero sobrescribir los datos. Haga clic en Ok. Guarda esto y ejecuta el mapeo. Ejecutar el paquete.