Primer ETL Usando SQL Server Data Tools

Elena López

23 Jun 202015:31

Summary

TLDREn este tutorial práctico, se muestra cómo utilizar las herramientas de Microsoft para configurar y diseñar un proceso de ETL. El objetivo es exportar datos de una tabla llamada 'fifa' en una base de datos 'ss' a otra base de datos llamada 'destino'. Se inicia eliminando contenido previo y seguidamente se crea un paquete, se establece una conexión a la instancia de origen de datos, y se configura un Data Flow. Se selecciona la tabla de origen, se establece la conexión y se configura el destino, asegurándose de que los nombres de las columnas coincidan para el mapeo automático. Finalmente, se ejecuta el flujo de datos para verificar que los datos se exportaron correctamente, y se sugiere que en el próximo video se explorarán técnicas para agregar paquetes existentes a un proyecto en SQL Server Data Tools.

Takeaways

😀 El video es una guía práctica sobre cómo utilizar las herramientas de Microsoft para configurar y diseñar una tarea de ETL.
📝 Se comienza eliminando el contenido de una tabla previamente creada para realizar el ejercicio práctico.
🔗 Se menciona la necesidad de exportar datos desde una tabla llamada 'fifa' en una base de datos 'ss' a otra base de datos llamada 'destino'.
🧼 Se realiza una limpieza en la tabla 'fifa' dentro de la base de datos 'destino' para prepararla para la inserción de datos.
🔧 Se crea un paquete y se le renombra a 'fifa' para comenzar la configuración de la conexión a la instancia de origen de datos.
🔄 Se establece una conexión OLEDB a la instancia de origen de datos especificando el servidor, método de autenticación y la base de datos.
🔍 Se verifica la conexión a la instancia de origen de datos haciendo clic en 'probar conexión'.
📚 Se crea un 'Data Flow' para gestionar las tareas relacionadas con la transferencia de datos.
🔌 Se selecciona y configura el origen de datos, en este caso, una conexión a SQL Server, y se especifica la tabla 'fifa' como fuente.
📈 Se agrega y configura el destino de los datos, que es otra base de datos en SQL Server, y se establece la conexión hacia la base de datos 'destino'.
🔗 Se enlazan los componentes del Data Flow asegurando que el flujo de datos sea secuencial y se manejen posibles errores.
🗂 Se realiza el mapeo de columnas entre el origen y el destino, asegurando que los datos se inserten correctamente en la tabla de destino.
🚀 Se ejecuta el paquete para verificar que los datos se transfieren correctamente de la tabla de origen a la tabla de destino.
📹 En el próximo video se discutirán técnicas para agregar paquetes existentes a un proyecto de SQL Server Data Tools.

Q & A

¿Qué es lo que vamos a realizar en el video?
-En el video vamos a realizar nuestro primer ejercicio práctico utilizando la herramienta de Microsoft para la configuración y diseño de ETL, eliminando contenido de una tabla y exportando datos desde una base de datos llamada 'ss' a otra llamada 'destino'.
¿Cuál es la primera acción que se realiza en el proceso práctico?
-La primera acción es eliminar el contenido que ya había en la tabla del primer ejemplo anteriormente creada.
¿Qué herramienta de Microsoft se utiliza para este ejercicio práctico?
-Se utiliza la herramienta de Microsoft SQL Server Data Tools (SSDT) para la configuración y diseño de ETL.
¿Cómo se asegura que la eliminación de la tabla se haya realizado correctamente?
-Se ejecuta una query para limpiar la tabla y se verifica que se haya ejecutado correctamente.
¿Qué es un paquete en el contexto de SQL Server Data Tools?
-Un paquete en SQL Server Data Tools es una colección de tareas y flujos de datos que se pueden ejecutar juntas para realizar una tarea específica, como el movimiento de datos.
¿Cómo se renombra un paquete en SQL Server Data Tools?
-Se hace clic derecho sobre el paquete y se selecciona la opción de renombrar, luego se introduce el nuevo nombre que refleje la tarea que realiza.
¿Qué es una conexión OLEDB y cómo se crea en SQL Server Data Tools?
-OLEDB es un protocolo de acceso a datos que permite conectarse a diferentes fuentes de datos. Para crear una conexión en SQL Server Data Tools, se hace clic derecho en el espacio de conexiones y se selecciona 'Crear nueva conexión', especificando el servidor, método de autenticación y la base de datos.
¿Qué es un Data Flow y cómo se crea en SQL Server Data Tools?
-Un Data Flow es una parte integral de un paquete de SQL Server Data Tools que se utiliza para mover datos entre orígenes y destinos. Se crea haciendo clic derecho y seleccionando 'Nuevo Data Flow...'.
¿Qué son las tareas Source y Destination y cómo se utilizan en un Data Flow?
-Las tareas Source y Destination son componentes clave en un Data Flow que se utilizan para definir el origen de los datos y el destino donde se moverán los datos respectivamente. Se seleccionan y se configuran para trabajar con una conexión específica.
¿Cómo se configura el origen de datos en un Data Flow?
-Se selecciona el tipo de conexión o origen de datos, se elige la base de datos y se especifica la tabla o vista desde la que se obtendrán los datos. También se puede hacer una previsualización de los datos y seleccionar las columnas que se utilizarán.
¿Qué es el mapeo de columnas y cómo se realiza en SQL Server Data Tools?
-El mapeo de columnas es el proceso de asociar las columnas del origen con las del destino para asegurar que los datos se muevan correctamente. Se realiza seleccionando las columnas en el origen y mapeándolas a las correspondientes en el destino.
¿Cómo se garantiza que los datos se muevan correctamente de un origen a un destino en un Data Flow?
-Se configuran correctamente las conexiones de origen y destino, se eligen las tablas y columnas adecuadas y se prueba la ejecución del Data Flow para verificar que los datos se mueven como se espera.
¿Qué se puede hacer si los nombres de las columnas en el origen y el destino no coinciden?
-Si los nombres de las columnas no coinciden, se puede mapear manualmente cada columna seleccionando el nombre correspondiente en el origen y en el destino.
¿Cómo se maneja un error en el proceso de un Data Flow?
-Se pueden arrastrar flechas rojas desde el componente donde se produjo el error hacia otro componente, como un archivo de Excel, para manejar el error de una manera específica.
¿Qué indica el cheque verde en SQL Server Data Tools al ejecutar un Data Flow?
-El cheque verde en SQL Server Data Tools indica que el Data Flow se ha ejecutado correctamente sin errores.