Saltar al contenido

Actividad de actualización masiva de Amazon Redshift

Introducción

Una actividad de Actualización Masiva de Amazon Redshift, utilizando su conexión de Amazon Redshift, actualiza múltiples registros en una tabla en Amazon Redshift y está destinada a ser utilizada como un objetivo para consumir datos en una operación. Esta actividad proporciona la opción de establecer el número de registros por lote y la opción de detener el procesamiento de los registros restantes si se encuentra un error.

Crear una actividad de actualización masiva de Amazon Redshift

Una instancia de una actividad de Actualización Masiva de Amazon Redshift se crea a partir de una conexión de Amazon Redshift utilizando su tipo de actividad Actualización Masiva.

Para crear una instancia de una actividad, arrastre el tipo de actividad al lienzo de diseño o copie el tipo de actividad y péguelo en el lienzo de diseño. Para más detalles, consulte Crear una instancia de actividad o herramienta en Reutilización de componentes.

Una actividad de Actualización Masiva de Amazon Redshift existente se puede editar desde estas ubicaciones:

Configurar una actividad de actualización masiva de Amazon Redshift

Siga estos pasos para configurar una actividad de Actualización Masiva de Amazon Redshift:

Paso 1: Ingresar un nombre y seleccionar un esquema

En este paso, proporciona un nombre para la actividad y selecciona un esquema. Cada elemento de la interfaz de usuario de este paso se describe a continuación.

Configuración de la actividad de actualización masiva de Amazon Redshift paso 1

  • Nombre: Ingresa un nombre para identificar la actividad. El nombre debe ser único para cada actividad de Actualización Masiva de Amazon Redshift y no debe contener barras diagonales (/) ni dos puntos (:).

  • Seleccionar un Esquema: Esta sección muestra los esquemas disponibles en el endpoint de Amazon Redshift. Al reabrir una configuración de actividad existente, solo se muestra el esquema seleccionado en lugar de recargar toda la lista de esquemas.

    • Nombre del Esquema Seleccionado: Después de seleccionar un esquema, se lista aquí.

    • Buscar: Ingresa el valor de cualquier columna en el cuadro de búsqueda para filtrar la lista de esquemas. La búsqueda no distingue entre mayúsculas y minúsculas. Si los esquemas ya se muestran en la tabla, los resultados de la tabla se filtran en tiempo real con cada pulsación de tecla. Para recargar esquemas desde el endpoint al buscar, ingresa criterios de búsqueda y luego actualiza, como se describe a continuación.

    • Actualizar: Haz clic en el ícono de actualizar o en la palabra Actualizar para recargar esquemas desde el endpoint de Amazon Redshift. Esto puede ser útil si se han agregado esquemas a Amazon Redshift. Esta acción actualiza todos los metadatos utilizados para construir la tabla de esquemas mostrada en la configuración.

    • Seleccionar un Esquema: Dentro de la tabla, haz clic en cualquier parte de una fila para seleccionar un esquema. Solo se puede seleccionar un esquema. La información disponible para cada esquema se obtiene del endpoint de Amazon Redshift:

    Consejo

    Si la tabla no se llena con los esquemas disponibles, la conexión a Amazon Redshift puede no ser exitosa. Asegúrese de estar conectado volviendo a abrir la conexión y volviendo a probar las credenciales.

  • Configuraciones Opcionales: Haga clic para expandir configuraciones opcionales adicionales:

    • Tamaño del Lote: Ingrese un tamaño de lote que sea mayor que 0 o menor que 10000. El valor predeterminado es 100.
    • Continuar en Caso de Error: Seleccione continuar la ejecución de la actividad si se encuentra un error para un conjunto de datos en una solicitud de lote. Si se encuentran errores, se escriben en el registro de operaciones.
  • Guardar y Salir: Si está habilitado, haga clic para guardar la configuración de este paso y cerrar la configuración de la actividad.

  • Siguiente: Haga clic para almacenar temporalmente la configuración de este paso y continuar al siguiente paso. La configuración no se guardará hasta que haga clic en el botón Finalizado en el último paso.

  • Descartar Cambios: Después de realizar cambios, haga clic para cerrar la configuración sin guardar los cambios realizados en ningún paso. Un mensaje le pide que confirme que desea descartar los cambios.

Paso 2: Seleccionar una tabla

En este paso, seleccione una Tabla. Cada elemento de la interfaz de usuario de este paso se describe a continuación.

Configuración de actividad de actualización masiva de Amazon Redshift paso 2

  • Seleccionar una Tabla: Esta sección muestra las tablas disponibles en el punto final de Amazon Redshift. Al reabrir una configuración de actividad existente, solo se muestra la tabla seleccionada en lugar de recargar toda la lista de tablas.

    • Nombre del Esquema Seleccionado: El nombre del esquema seleccionado en el paso anterior se lista aquí.

    • Nombre de la Tabla Seleccionada: Después de seleccionar una tabla, se lista aquí.

    • Buscar: Ingrese el valor de cualquier columna en el cuadro de búsqueda para filtrar la lista de tablas. La búsqueda no distingue entre mayúsculas y minúsculas. Si las tablas ya se muestran dentro de la tabla, los resultados de la tabla se filtran en tiempo real con cada pulsación de tecla. Para recargar tablas desde el punto final al buscar, ingrese criterios de búsqueda y luego actualice, como se describe a continuación.

    • Actualizar: Haga clic en el ícono de actualizar o en la palabra Actualizar para recargar las tablas desde el punto final de Amazon Redshift. Esto puede ser útil si se han agregado tablas a Amazon Redshift. Esta acción actualiza todos los metadatos utilizados para construir la tabla de tablas que se muestra en la configuración.

    • Seleccionar una Tabla: Dentro de la tabla, haga clic en cualquier parte de una fila para seleccionar una tabla. Solo se puede seleccionar una tabla. La información disponible para cada tabla se obtiene del punto final de Amazon Redshift:

    Consejo

    Si la tabla no se llena con las tablas disponibles, la conexión de Amazon Redshift puede no ser exitosa. Asegúrese de estar conectado volviendo a abrir la conexión y volviendo a probar las credenciales.

  • Atrás: Haga clic para almacenar temporalmente la configuración de este paso y regresar al paso anterior.

  • Siguiente: Haga clic para almacenar temporalmente la configuración de este paso y continuar al siguiente paso. La configuración no se guardará hasta que haga clic en el botón Finalizado en el último paso.

  • Descartar Cambios: Después de realizar cambios, haga clic para cerrar la configuración sin guardar los cambios realizados en ningún paso. Un mensaje le pide que confirme que desea descartar los cambios.

Paso 3: Revisar los esquemas de datos

Cualquier esquema de solicitud o respuesta generado desde el punto final se muestra. Cada elemento de la interfaz de usuario de este paso se describe a continuación.

Configuración del paso 3 de actividad de actualización masiva de Amazon Redshift

  • Esquemas de Datos: Estos esquemas de datos son heredados por transformaciones adyacentes y se muestran nuevamente durante el mapeo de transformaciones.

    Nota

    Los datos proporcionados en una transformación tienen prioridad sobre la configuración de la actividad.

    El conector de Amazon Redshift utiliza el Controlador JDBC de Amazon Redshift versión 2.1.0.28 y los Comandos SQL de Amazon Redshift. Consulte la documentación de Amazon Redshift y la documentación de la Descripción General del Sistema de Amazon Redshift para obtener información adicional.

    Los esquemas de datos de solicitud y respuesta constan de estos nodos y campos:

    • Solicitud

      Campo/Nodo del Esquema de Solicitud Notas
      accounts Nodo de cuentas a ser actualizadas
      Set Nodo de información a ser actualizada
      id ID a ser establecido
      name Nombre a ser establecido
      balance Valor a ser establecido
      Where Nodo de criterios a ser utilizados para identificar la información a ser actualizada
      columnName Nombre de la columna
      condition Utiliza una condición SQL de Amazon Redshift
      value Valor para la condición
    • Respuesta

      Campo/Nodo del Esquema de Respuesta Notas
      bulkErrorResponse El formato del esquema de solicitud
      tableName Nombre de la tabla donde se actualizaron en bloque los registros
      responseDetails Nodo de detalles de la respuesta
      batchSize Número de registros por lote
      totalRecords Número total de registros que estuvieron involucrados en la operación
      recordsAffected Número total de registros que fueron actualizados en bloque
      errorDetails Nodo que contiene cualquier mensaje de error
      SqlState Código que identifica condiciones de error SQL
      errorMsg Mensaje de error
      errorCode Código de error
  • Actualizar: Haga clic en el ícono de actualizar o en la palabra Actualizar para regenerar esquemas desde el punto final de Amazon Redshift. Esta acción también regenera un esquema en otras ubicaciones a lo largo del proyecto donde se hace referencia al mismo esquema, como en una transformación adyacente.

  • Regresar: Haga clic para almacenar temporalmente la configuración para este paso y regresar al paso anterior.

  • Terminado: Haga clic para guardar la configuración para todos los pasos y cerrar la configuración de la actividad.

  • Descartar Cambios: Después de realizar cambios, haga clic para cerrar la configuración sin guardar los cambios realizados en ningún paso. Un mensaje le pide que confirme que desea descartar los cambios.

Próximos pasos

Después de configurar una actividad de Amazon Redshift Update Bulk, completa la configuración de la operación añadiendo y configurando otras actividades o herramientas como pasos de la operación. También puedes configurar los ajustes de la operación, que incluyen la capacidad de encadenar operaciones que están en los mismos o diferentes flujos de trabajo.

Las acciones del menú para una actividad son accesibles desde el panel del proyecto y el lienzo de diseño. Para más detalles, consulta el menú de acciones de actividad en Conceptos básicos de conectores.

Las actividades de Amazon Redshift Update Bulk pueden ser utilizadas como un objetivo con estos patrones de operación:

Para utilizar la actividad con funciones de scripting, escribe los datos en una ubicación temporal y luego utiliza esa ubicación temporal en la función de scripting.

Cuando estés listo, despliega y ejecuta la operación y valida el comportamiento revisando los registros de operación.