Actividad de actualización masiva de Amazon Redshift
Introducción
Una actividad de Actualización Masiva de Amazon Redshift, utilizando su conexión de Amazon Redshift, actualiza múltiples registros en una tabla en Amazon Redshift y está destinada a ser utilizada como un objetivo para consumir datos en una operación. Esta actividad proporciona la opción de establecer el número de registros por lote y la opción de detener el procesamiento de los registros restantes si se encuentra un error.
Crear una actividad de actualización masiva de Amazon Redshift
Una instancia de una actividad de Actualización Masiva de Amazon Redshift se crea a partir de una conexión de Amazon Redshift utilizando su tipo de actividad Actualización Masiva.
Para crear una instancia de una actividad, arrastre el tipo de actividad al lienzo de diseño o copie el tipo de actividad y péguelo en el lienzo de diseño. Para más detalles, consulte Crear una instancia de actividad o herramienta en Reutilización de componentes.
Una actividad de Actualización Masiva de Amazon Redshift existente se puede editar desde estas ubicaciones:
- El lienzo de diseño (consulte Menú de acciones de componentes en Lienzo de diseño).
- La pestaña Componentes del panel del proyecto (consulte Menú de acciones de componentes en Pestaña de componentes del panel del proyecto).
Configurar una actividad de actualización masiva de Amazon Redshift
Siga estos pasos para configurar una actividad de Actualización Masiva de Amazon Redshift:
-
Paso 1: Ingrese un nombre y seleccione un esquema
Proporcione un nombre para la actividad y seleccione un esquema. -
Paso 2: Seleccione una tabla
Seleccione la tabla que contiene los registros que se van a actualizar. -
Paso 3: Revisar los esquemas de datos
Se muestran los esquemas de solicitud o respuesta generados desde el endpoint.
Paso 1: Ingresar un nombre y seleccionar un esquema
En este paso, proporciona un nombre para la actividad y selecciona un esquema. Cada elemento de la interfaz de usuario de este paso se describe a continuación.
-
Nombre: Ingresa un nombre para identificar la actividad. El nombre debe ser único para cada actividad de Actualización Masiva de Amazon Redshift y no debe contener barras diagonales (
/
) ni dos puntos (:
). -
Seleccionar un Esquema: Esta sección muestra los esquemas disponibles en el endpoint de Amazon Redshift. Al reabrir una configuración de actividad existente, solo se muestra el esquema seleccionado en lugar de recargar toda la lista de esquemas.
-
Nombre del Esquema Seleccionado: Después de seleccionar un esquema, se lista aquí.
-
Buscar: Ingresa el valor de cualquier columna en el cuadro de búsqueda para filtrar la lista de esquemas. La búsqueda no distingue entre mayúsculas y minúsculas. Si los esquemas ya se muestran en la tabla, los resultados de la tabla se filtran en tiempo real con cada pulsación de tecla. Para recargar esquemas desde el endpoint al buscar, ingresa criterios de búsqueda y luego actualiza, como se describe a continuación.
-
Actualizar: Haz clic en el ícono de actualizar o en la palabra Actualizar para recargar esquemas desde el endpoint de Amazon Redshift. Esto puede ser útil si se han agregado esquemas a Amazon Redshift. Esta acción actualiza todos los metadatos utilizados para construir la tabla de esquemas mostrada en la configuración.
-
Seleccionar un Esquema: Dentro de la tabla, haz clic en cualquier parte de una fila para seleccionar un esquema. Solo se puede seleccionar un esquema. La información disponible para cada esquema se obtiene del endpoint de Amazon Redshift:
- Esquema: El nombre del esquema de Amazon Redshift.
Consejo
Si la tabla no se llena con los esquemas disponibles, la conexión a Amazon Redshift puede no ser exitosa. Asegúrese de estar conectado volviendo a abrir la conexión y volviendo a probar las credenciales.
-
-
Configuraciones Opcionales: Haga clic para expandir configuraciones opcionales adicionales:
- Tamaño del Lote: Ingrese un tamaño de lote que sea mayor que 0 o menor que 10000. El valor predeterminado es 100.
- Continuar en Caso de Error: Seleccione continuar la ejecución de la actividad si se encuentra un error para un conjunto de datos en una solicitud de lote. Si se encuentran errores, se escriben en el registro de operaciones.
-
Guardar y Salir: Si está habilitado, haga clic para guardar la configuración de este paso y cerrar la configuración de la actividad.
-
Siguiente: Haga clic para almacenar temporalmente la configuración de este paso y continuar al siguiente paso. La configuración no se guardará hasta que haga clic en el botón Finalizado en el último paso.
-
Descartar Cambios: Después de realizar cambios, haga clic para cerrar la configuración sin guardar los cambios realizados en ningún paso. Un mensaje le pide que confirme que desea descartar los cambios.
Paso 2: Seleccionar una tabla
En este paso, seleccione una Tabla. Cada elemento de la interfaz de usuario de este paso se describe a continuación.
-
Seleccionar una Tabla: Esta sección muestra las tablas disponibles en el punto final de Amazon Redshift. Al reabrir una configuración de actividad existente, solo se muestra la tabla seleccionada en lugar de recargar toda la lista de tablas.
-
Nombre del Esquema Seleccionado: El nombre del esquema seleccionado en el paso anterior se lista aquí.
-
Nombre de la Tabla Seleccionada: Después de seleccionar una tabla, se lista aquí.
-
Buscar: Ingrese el valor de cualquier columna en el cuadro de búsqueda para filtrar la lista de tablas. La búsqueda no distingue entre mayúsculas y minúsculas. Si las tablas ya se muestran dentro de la tabla, los resultados de la tabla se filtran en tiempo real con cada pulsación de tecla. Para recargar tablas desde el punto final al buscar, ingrese criterios de búsqueda y luego actualice, como se describe a continuación.
-
Actualizar: Haga clic en el ícono de actualizar o en la palabra Actualizar para recargar las tablas desde el punto final de Amazon Redshift. Esto puede ser útil si se han agregado tablas a Amazon Redshift. Esta acción actualiza todos los metadatos utilizados para construir la tabla de tablas que se muestra en la configuración.
-
Seleccionar una Tabla: Dentro de la tabla, haga clic en cualquier parte de una fila para seleccionar una tabla. Solo se puede seleccionar una tabla. La información disponible para cada tabla se obtiene del punto final de Amazon Redshift:
-
Nombre de la Tabla: El nombre de la tabla de Amazon Redshift.
-
Esquema: El nombre del esquema de Amazon Redshift.
-
Catálogo: El nombre del catálogo de Amazon Redshift.
-
Consejo
Si la tabla no se llena con las tablas disponibles, la conexión de Amazon Redshift puede no ser exitosa. Asegúrese de estar conectado volviendo a abrir la conexión y volviendo a probar las credenciales.
-
-
Atrás: Haga clic para almacenar temporalmente la configuración de este paso y regresar al paso anterior.
-
Siguiente: Haga clic para almacenar temporalmente la configuración de este paso y continuar al siguiente paso. La configuración no se guardará hasta que haga clic en el botón Finalizado en el último paso.
-
Descartar Cambios: Después de realizar cambios, haga clic para cerrar la configuración sin guardar los cambios realizados en ningún paso. Un mensaje le pide que confirme que desea descartar los cambios.
Paso 3: Revisar los esquemas de datos
Cualquier esquema de solicitud o respuesta generado desde el punto final se muestra. Cada elemento de la interfaz de usuario de este paso se describe a continuación.
-
Esquemas de Datos: Estos esquemas de datos son heredados por transformaciones adyacentes y se muestran nuevamente durante el mapeo de transformaciones.
Nota
Los datos proporcionados en una transformación tienen prioridad sobre la configuración de la actividad.
El conector de Amazon Redshift utiliza el Controlador JDBC de Amazon Redshift versión 2.1.0.28 y los Comandos SQL de Amazon Redshift. Consulte la documentación de Amazon Redshift y la documentación de la Descripción General del Sistema de Amazon Redshift para obtener información adicional.
Los esquemas de datos de solicitud y respuesta constan de estos nodos y campos:
-
Solicitud
Campo/Nodo del Esquema de Solicitud Notas accounts
Nodo de cuentas a ser actualizadas Set
Nodo de información a ser actualizada id
ID a ser establecido name
Nombre a ser establecido balance
Valor a ser establecido Where
Nodo de criterios a ser utilizados para identificar la información a ser actualizada columnName
Nombre de la columna condition
Utiliza una condición SQL de Amazon Redshift value
Valor para la condición -
Respuesta
Campo/Nodo del Esquema de Respuesta Notas bulkErrorResponse
El formato del esquema de solicitud tableName
Nombre de la tabla donde se actualizaron en bloque los registros responseDetails
Nodo de detalles de la respuesta batchSize
Número de registros por lote totalRecords
Número total de registros que estuvieron involucrados en la operación recordsAffected
Número total de registros que fueron actualizados en bloque errorDetails
Nodo que contiene cualquier mensaje de error SqlState
Código que identifica condiciones de error SQL errorMsg
Mensaje de error errorCode
Código de error
-
-
Actualizar: Haga clic en el ícono de actualizar o en la palabra Actualizar para regenerar esquemas desde el punto final de Amazon Redshift. Esta acción también regenera un esquema en otras ubicaciones a lo largo del proyecto donde se hace referencia al mismo esquema, como en una transformación adyacente.
-
Regresar: Haga clic para almacenar temporalmente la configuración para este paso y regresar al paso anterior.
-
Terminado: Haga clic para guardar la configuración para todos los pasos y cerrar la configuración de la actividad.
-
Descartar Cambios: Después de realizar cambios, haga clic para cerrar la configuración sin guardar los cambios realizados en ningún paso. Un mensaje le pide que confirme que desea descartar los cambios.
Próximos pasos
Después de configurar una actividad de Amazon Redshift Update Bulk, completa la configuración de la operación añadiendo y configurando otras actividades o herramientas como pasos de la operación. También puedes configurar los ajustes de la operación, que incluyen la capacidad de encadenar operaciones que están en los mismos o diferentes flujos de trabajo.
Las acciones del menú para una actividad son accesibles desde el panel del proyecto y el lienzo de diseño. Para más detalles, consulta el menú de acciones de actividad en Conceptos básicos de conectores.
Las actividades de Amazon Redshift Update Bulk pueden ser utilizadas como un objetivo con estos patrones de operación:
- Patrón de transformación
- Patrón de dos transformaciones (como el primer o segundo objetivo)
Para utilizar la actividad con funciones de scripting, escribe los datos en una ubicación temporal y luego utiliza esa ubicación temporal en la función de scripting.
Cuando estés listo, despliega y ejecuta la operación y valida el comportamiento revisando los registros de operación.