Actividad de fusión de Snowflake
Introducción
Una actividad de Fusión de Snowflake, utilizando su conexión de Snowflake, inserta o actualiza un archivo CSV de datos de tabla en Snowflake y está destinada a ser utilizada como un objetivo para consumir datos en una operación. La actividad de Fusión de Snowflake no admite la eliminación de un registro existente.
Nota
La actividad de Fusión de Snowflake es similar a una actividad de upsert como se usa en otros conectores.
Crear una actividad de fusión de Snowflake
Una instancia de una actividad de Fusión de Snowflake se crea a partir de una conexión de Snowflake utilizando su tipo de actividad Fusión.
Para crear una instancia de una actividad, arrastre el tipo de actividad al lienzo de diseño o copie el tipo de actividad y péguelo en el lienzo de diseño. Para más detalles, consulte Crear una instancia de actividad o herramienta en Reutilización de componentes.
Una actividad de Fusión de Snowflake existente se puede editar desde estas ubicaciones:
- El lienzo de diseño (consulte Menú de acciones de componentes en Lienzo de diseño).
- La pestaña Componentes del panel del proyecto (consulte Menú de acciones de componentes en Pestaña de componentes del panel del proyecto).
Configurar una actividad de fusión de Snowflake
Siga estos pasos para configurar una actividad de Fusión de Snowflake:
-
Paso 1: Ingrese un nombre y seleccione una tabla
Proporcione un nombre para la actividad y seleccione una tabla. -
Paso 2: Seleccione claves de fusión
Especifique las columnas que se utilizarán como claves de fusión. -
Paso 3: Seleccione un enfoque
Se admiten diferentes enfoques para fusionar datos en Snowflake. Elija entre Mapeo Directo o Archivo de Etapa. Al utilizar el enfoque de Archivo de Etapa, puede seleccionar las opciones de Usar Etapa Existente o Usar Etapa Temporal. -
Paso 4: Revisar los esquemas de datos
Se muestran los esquemas de solicitud y respuesta generados desde el endpoint. Los esquemas mostrados dependen del Enfoque especificado en el paso anterior.
Paso 1: Ingresar un nombre y seleccionar una tabla
En este paso, proporciona un nombre para la actividad y selecciona una tabla. Cada elemento de la interfaz de usuario de este paso se describe a continuación.
-
Nombre: Ingresa un nombre para identificar la actividad. El nombre debe ser único para cada actividad de Fusión de Snowflake y no debe contener barras diagonales
/
ni dos puntos:
. -
Seleccionar una Tabla: Esta sección muestra las tablas disponibles en el endpoint de Snowflake. Al reabrir una configuración de actividad existente, solo se muestra la tabla seleccionada en lugar de recargar toda la lista de tablas.
-
Tabla Seleccionada: Después de seleccionar una tabla, se lista aquí.
-
Buscar: Ingresa el valor de cualquier columna en el cuadro de búsqueda para filtrar la lista de tablas. La búsqueda no distingue entre mayúsculas y minúsculas. Si las tablas ya se muestran dentro de la tabla, los resultados de la tabla se filtran en tiempo real con cada pulsación de tecla. Para recargar tablas desde el endpoint al buscar, ingresa criterios de búsqueda y luego actualiza, como se describe a continuación.
-
Actualizar: Haz clic en el ícono de actualizar o en la palabra Actualizar para recargar tablas desde el endpoint de Snowflake. Esto puede ser útil si se han agregado tablas a Snowflake. Esta acción actualiza todos los metadatos utilizados para construir la tabla de tablas mostrada en la configuración.
-
Seleccionar una Tabla: Dentro de la tabla, haz clic en cualquier parte de una fila para seleccionar una tabla. Solo se puede seleccionar una tabla. La información disponible para cada tabla se obtiene del endpoint de Snowflake:
-
Nombre: El nombre de una tabla.
-
Tipo: El tipo, que es una tabla.
-
Consejo
Si la tabla no se llena con tablas disponibles, la conexión a Snowflake puede no ser exitosa. Asegúrate de estar conectado volviendo a abrir la conexión y volviendo a probar las credenciales.
-
-
Guardar y salir: Si está habilitado, haga clic para guardar la configuración de este paso y cerrar la configuración de la actividad.
-
Siguiente: Haga clic para almacenar temporalmente la configuración de este paso y continuar al siguiente paso. La configuración no se guardará hasta que haga clic en el botón Finalizado en el último paso.
-
Descartar cambios: Después de realizar cambios, haga clic para cerrar la configuración sin guardar los cambios realizados en ningún paso. Un mensaje le pide que confirme que desea descartar los cambios.
Paso 2: Seleccionar claves de combinación
En este paso, especifique las columnas que se utilizarán como claves de combinación. Cada elemento de la interfaz de usuario de este paso se describe a continuación.
-
Claves de combinación: Seleccione las columnas que se utilizarán como claves de actualización para la combinación.
-
Atrás: Haga clic para almacenar temporalmente la configuración de este paso y regresar al paso anterior.
-
Siguiente: Haga clic para almacenar temporalmente la configuración de este paso y continuar al siguiente paso. La configuración no se guardará hasta que haga clic en el botón Finalizado en el último paso.
-
Descartar cambios: Después de realizar cambios, haga clic para cerrar la configuración sin guardar los cambios realizados en ningún paso. Un mensaje le pide que confirme que desea descartar los cambios.
Paso 3: Seleccionar un enfoque
Se admiten diferentes enfoques para combinar datos en Snowflake. Elija entre Mapeo directo o Archivo de etapa. Al utilizar el enfoque de Archivo de etapa, selecciona las opciones de Usar etapa existente o Usar etapa temporal.
- Enfoque de mapeo directo
- Enfoque de archivo de etapa (usar etapa existente)
- Enfoque de archivo de etapa (usar etapa temporal)
Enfoque de mapeo directo
-
Enfoque: Usa el menú desplegable para seleccionar Mapeo Directo.
-
Nombre Temporal de la Etapa: Ingresa un nombre que se utilizará para una etapa temporal en Snowflake.
-
Atrás: Haz clic para almacenar temporalmente la configuración de este paso y regresar al paso anterior.
-
Siguiente: Haz clic para almacenar temporalmente la configuración de este paso y continuar al siguiente paso. La configuración no se guardará hasta que hagas clic en el botón Finalizado en el último paso.
-
Descartar Cambios: Después de realizar cambios, haz clic para cerrar la configuración sin guardar los cambios realizados en ningún paso. Un mensaje te pedirá que confirmes que deseas descartar los cambios.
Enfoque de Archivo de Etapa (Usar Etapa Existente)
-
Enfoque: Usa el menú desplegable para seleccionar Archivo de Etapa.
-
Tipo de Etapa: Usa el menú desplegable para seleccionar Usar Etapa Existente.
-
Seleccionar una Etapa: Esta sección muestra las etapas disponibles en el punto final de Snowflake. Al reabrir una configuración de actividad existente, solo se muestra la etapa seleccionada en lugar de recargar toda la lista de etapas.
-
Etapa Seleccionada: Después de seleccionar una etapa, se lista aquí.
-
Buscar: Ingresa el valor de cualquier columna en el cuadro de búsqueda para filtrar la lista de etapas. La búsqueda no es sensible a mayúsculas. Si las tablas ya se muestran dentro de la tabla, los resultados de la tabla se filtran en tiempo real con cada pulsación de tecla. Para recargar tablas desde el punto final al buscar, ingresa criterios de búsqueda y luego actualiza, como se describe a continuación.
-
Actualizar: Haz clic en el ícono de actualizar o en la palabra Actualizar para recargar tablas desde el punto final de Snowflake. Esto puede ser útil si has agregado recientemente tablas a Snowflake. Esta acción actualiza todos los metadatos utilizados para construir la tabla de tablas mostrada en la configuración.
-
Seleccionando una Etapa: Dentro de la tabla, haz clic en cualquier parte de una fila para seleccionar una etapa. Solo se puede seleccionar una etapa. La información disponible para cada etapa se obtiene del punto final de Snowflake:
-
Nombre: El nombre de etapa de Snowflake.
-
Tipo: El tipo de etapa de Snowflake. Para información sobre las diferencias entre etapas internas y externas, consulta la documentación de Snowflake sobre creación de etapas.
-
Consejo
Si la tabla no se llena con las etapas disponibles, la conexión a Snowflake puede no ser exitosa. Asegúrate de estar conectado volviendo a abrir la conexión y volviendo a probar las credenciales.
-
-
Atrás: Haz clic para almacenar temporalmente la configuración de este paso y regresar al paso anterior.
-
Siguiente: Haz clic para almacenar temporalmente la configuración de este paso y continuar al siguiente paso. La configuración no se guardará hasta que hagas clic en el botón Finalizado en el último paso.
-
Descartar Cambios: Después de realizar cambios, haz clic para cerrar la configuración sin guardar los cambios realizados en ningún paso. Un mensaje te pedirá que confirmes que deseas descartar los cambios.
Enfoque de Archivo de Etapa (Usar Etapa Temporal)
-
Enfoque: Usa el menú desplegable para seleccionar Archivo de Etapa.
-
Tipo de Etapa: Usa el menú desplegable para seleccionar Usar Etapa Temporal.
-
Nombre de Etapa Temporal: Ingresa un nombre que se utilizará para una etapa temporal en Snowflake.
-
Atrás: Haz clic para almacenar temporalmente la configuración de este paso y regresar al paso anterior.
-
Siguiente: Haz clic para almacenar temporalmente la configuración de este paso y continuar al siguiente paso. La configuración no se guardará hasta que hagas clic en el botón Finalizado en el último paso.
-
Descartar Cambios: Después de realizar cambios, haz clic para cerrar la configuración sin guardar los cambios realizados en ningún paso. Un mensaje te pedirá que confirmes que deseas descartar los cambios.
Paso 4: Revisar los esquemas de datos
Los esquemas de solicitud y respuesta generados desde el endpoint se muestran. Los esquemas mostrados dependen del Enfoque especificado en el paso anterior.
Estas subsecciones describen las estructuras de solicitud y respuesta para cada enfoque:
Estas acciones están disponibles con cada enfoque:
-
Esquemas de Datos: Estos esquemas de datos son heredados por transformaciones adyacentes y se muestran nuevamente durante el mapeo de transformación.
Nota
Los datos suministrados en una transformación tienen prioridad sobre la configuración de la actividad.
El conector de Snowflake utiliza la versión 3.19.0 del Controlador JDBC de Snowflake, y los comandos SQL de Snowflake. Consulta la documentación de la API para obtener información sobre los nodos y campos del esquema.
-
Actualizar: Haz clic en el ícono de actualizar o en la palabra Actualizar para regenerar esquemas desde el punto final. Esta acción también regenera el esquema en otras ubicaciones a lo largo del proyecto donde se hace referencia al mismo esquema, como en una transformación adyacente.
-
Atrás: Haz clic para almacenar temporalmente la configuración de este paso y regresar al paso anterior.
-
Terminado: Haz clic para guardar la configuración de todos los pasos y cerrar la configuración de la actividad.
-
Descartar Cambios: Después de realizar cambios, haz clic para cerrar la configuración sin guardar los cambios realizados en ningún paso. Un mensaje te pide que confirmes que deseas descartar los cambios.
Enfoque de Mapeo Directo
Estos son los campos del esquema visibles en la captura de pantalla de ejemplo arriba:
-
Solicitud
Campo/Nodo del Esquema de Solicitud Notas updateRequest
Nodo de la solicitud de fusión. table
Nodo que muestra el nombre de la tabla NAME. item
Nodo del ítem. column_A
Valor para el primer nombre de columna, COLOR. column_B
Valor para el segundo nombre de columna, FLOWER. . . .
Valores para las columnas de tabla sucesivas. -
Respuesta
Campo/Nodo del Esquema de Respuesta Notas mergeResponse
Nodo de la respuesta de fusión. noOfRowsUpdated
Conteo de las filas actualizadas. noOfRowsInserted
Conteo de las filas insertadas. errors
Nodo de los errores. item
Nodo de los elementos de error. errorMessage
Mensaje de error para el elemento de error.
Enfoque de Archivo de Etapa
Estos son los campos del esquema visibles en la captura de pantalla de ejemplo arriba:
-
Solicitud
Campo/Nodo del Esquema de Solicitud Notas mergeRequest
Nodo de la solicitud de fusión. stageName
Ruta o prefijo bajo el cual se cargarán los datos en la etapa de Snowflake. fileContent
Contenidos del archivo de datos, en formato CSV, que se van a preparar para actualizar en la tabla de Snowflake. destPrefix
Prefijo del archivo de destino que se utilizará en la etapa de Snowflake. destFileName
Nombre del archivo de destino que se utilizará en la etapa de Snowflake. Importante
Si se selecciona Usar Etapa Existente y el Tipo de la etapa seleccionada es externa,
stageName
yfileContent
se excluyen del esquema de solicitud.
Para obtener información sobre las diferencias entre etapas internas y externas, consulte la documentación de Snowflake sobre creación de etapas.
-
Respuesta
Campo/Nodo del Esquema de Respuesta Notas mergeResponse
Nodo de la respuesta de fusión. noOfRowsUpdated
Conteo de las filas actualizadas. noOfRowsInserted
Conteo de las filas insertadas. errors
Nodo de los errores. item
Nodo de los elementos de error. errorMessage
Mensaje de error para el elemento de error.
Siguientes pasos
Después de configurar una actividad de Snowflake Merge, complete la configuración de la operación agregando y configurando otras actividades o herramientas como pasos de operación. También se pueden configurar los ajustes de la operación, que incluyen la capacidad de encadenar operaciones que están en los mismos o diferentes flujos de trabajo.
Las acciones del menú para una actividad son accesibles desde el panel del proyecto y el lienzo de diseño. Para más detalles, consulte el menú de acciones de actividad en Conceptos básicos del conector.
Las actividades de Snowflake Merge se pueden utilizar como un objetivo con estos patrones de operación:
- Patrón de transformación
- Patrón de dos transformaciones (como el primer o segundo objetivo)
Para utilizar la actividad con funciones de scripting, escribe los datos en una ubicación temporal y luego utiliza esa ubicación temporal en la función de scripting.
Cuando estés listo, despliega y ejecuta la operación y valida el comportamiento revisando los registros de la operación.