Saltar al contenido

Actividad de Inserción Masiva de Amazon Redshift

Introducción

Una actividad de Inserción Masiva de Amazon Redshift, utilizando su conexión de Amazon Redshift, inserta múltiples registros en una tabla en Amazon Redshift y está destinada a ser utilizada como un objetivo para consumir datos en una operación. Esta actividad ofrece la opción de establecer el número de registros por lote y la opción de detener el procesamiento de los registros restantes si se encuentra un error.

Crear una actividad de Inserción Masiva de Amazon Redshift

Una instancia de una actividad de Inserción Masiva de Amazon Redshift se crea a partir de una conexión de Amazon Redshift utilizando su tipo de actividad Inserción Masiva.

Para crear una instancia de una actividad, arrastre el tipo de actividad al lienzo de diseño o copie el tipo de actividad y péguelo en el lienzo de diseño. Para más detalles, consulte Crear una instancia de actividad o herramienta en Reutilización de componentes.

Una actividad de Inserción Masiva de Amazon Redshift existente se puede editar desde estas ubicaciones:

Configurar una actividad de Inserción Masiva de Amazon Redshift

Siga estos pasos para configurar una actividad de Inserción Masiva de Amazon Redshift:

Paso 1: Ingresar un nombre y seleccionar un esquema

En este paso, proporciona un nombre para la actividad y selecciona un esquema. Cada elemento de la interfaz de usuario de este paso se describe a continuación.

Configuración de la actividad de inserción masiva de Amazon Redshift paso 1

  • Nombre: Ingresa un nombre para identificar la actividad. El nombre debe ser único para cada actividad de Inserción Masiva de Amazon Redshift y no debe contener barras diagonales (/) ni dos puntos (:).

  • Seleccionar un Esquema: Esta sección muestra los esquemas disponibles en el endpoint de Amazon Redshift. Al reabrir la configuración de una actividad existente, solo se muestra el esquema seleccionado en lugar de recargar toda la lista de esquemas.

    • Nombre del Esquema Seleccionado: Después de seleccionar un esquema, se lista aquí.

    • Buscar: Ingresa el valor de cualquier columna en el cuadro de búsqueda para filtrar la lista de esquemas. La búsqueda no distingue entre mayúsculas y minúsculas. Si los esquemas ya se muestran dentro de la tabla, los resultados de la tabla se filtran en tiempo real con cada pulsación de tecla. Para recargar esquemas desde el endpoint al buscar, ingresa criterios de búsqueda y luego actualiza, como se describe a continuación.

    • Actualizar: Haz clic en el ícono de actualizar o en la palabra Actualizar para recargar esquemas desde el endpoint de Amazon Redshift. Esto puede ser útil si se han agregado esquemas a Amazon Redshift. Esta acción actualiza todos los metadatos utilizados para construir la tabla de esquemas mostrada en la configuración.

    • Seleccionar un Esquema: Dentro de la tabla, haz clic en cualquier parte de una fila para seleccionar un esquema. Solo se puede seleccionar un esquema. La información disponible para cada esquema se obtiene del endpoint de Amazon Redshift:

    Consejo

    Si la tabla no se llena con los esquemas disponibles, la conexión a Amazon Redshift puede no ser exitosa. Asegúrate de estar conectado volviendo a abrir la conexión y volviendo a probar las credenciales.

  • Configuraciones Opcionales: Haz clic para expandir configuraciones opcionales adicionales:

    • Tamaño del Lote: Ingresa un tamaño de lote que sea mayor que 0 o menor que 10000. Valor predeterminado: 100.
    • Continuar en Caso de Error: Selecciona para continuar la ejecución de la actividad si se encuentra un error para un conjunto de datos en una solicitud de lote. Si se encuentran errores, se escriben en el registro de operaciones.
  • Guardar y Salir: Si está habilitado, haz clic para guardar la configuración de este paso y cerrar la configuración de la actividad.

  • Siguiente: Haz clic para almacenar temporalmente la configuración de este paso y continuar al siguiente paso. La configuración no se guardará hasta que hagas clic en el botón Finalizado en el último paso.

  • Descartar Cambios: Después de realizar cambios, haz clic para cerrar la configuración sin guardar los cambios realizados en ningún paso. Un mensaje te pide que confirmes que deseas descartar los cambios.

Paso 2: Seleccionar una tabla

En este paso, selecciona una tabla. Cada elemento de la interfaz de usuario de este paso se describe a continuación.

Configuración de la actividad de inserción masiva de Amazon Redshift paso 2

  • Seleccionar una Tabla: Esta sección muestra las tablas disponibles en el punto final de Amazon Redshift. Al reabrir una configuración de actividad existente, solo se muestra la tabla seleccionada en lugar de recargar toda la lista de tablas.

    • Nombre del Esquema Seleccionado: El nombre del esquema seleccionado en el paso anterior se lista aquí.

    • Seleccionar Nombre de Tabla: Después de seleccionar una tabla, se lista aquí.

    • Buscar: Ingresa el valor de cualquier columna en el cuadro de búsqueda para filtrar la lista de tablas. La búsqueda no distingue entre mayúsculas y minúsculas. Si las tablas ya se muestran dentro de la tabla, los resultados de la tabla se filtran en tiempo real con cada pulsación de tecla. Para recargar tablas desde el punto final al buscar, ingresa criterios de búsqueda y luego actualiza, como se describe a continuación.

    • Actualizar: Haz clic en el ícono de actualizar o en la palabra Actualizar para recargar las tablas desde el punto final de Amazon Redshift. Esto puede ser útil si se han agregado tablas a Amazon Redshift. Esta acción actualiza todos los metadatos utilizados para construir la tabla de tablas que se muestra en la configuración.

    • Seleccionar una Tabla: Dentro de la tabla, haz clic en cualquier parte de una fila para seleccionar una tabla. Solo se puede seleccionar una tabla. La información disponible para cada tabla se obtiene del punto final de Amazon Redshift:

    Consejo

    Si la tabla no se llena con las tablas disponibles, la conexión de Amazon Redshift puede no ser exitosa. Asegúrate de estar conectado volviendo a abrir la conexión y volviendo a probar las credenciales.

  • Atrás: Haz clic para almacenar temporalmente la configuración de este paso y regresar al paso anterior.

  • Siguiente: Haz clic para almacenar temporalmente la configuración de este paso y continuar al siguiente paso. La configuración no se guardará hasta que hagas clic en el botón Finalizado en el último paso.

  • Descartar Cambios: Después de realizar cambios, haz clic para cerrar la configuración sin guardar los cambios realizados en ningún paso. Un mensaje te pedirá que confirmes que deseas descartar los cambios.

Paso 3: Revisar los esquemas de datos

Cualquier esquema de solicitud o respuesta generado desde el punto final se muestra. Cada elemento de la interfaz de usuario de este paso se describe a continuación.

Configuración de la actividad de inserción masiva de Amazon Redshift paso 3

  • Esquemas de Datos: Estos esquemas de datos son heredados por transformaciones adyacentes y se muestran nuevamente durante el mapeo de transformaciones.

    Nota

    Los datos suministrados en una transformación tienen prioridad sobre la configuración de la actividad.

    El conector de Amazon Redshift utiliza el Controlador JDBC de Amazon Redshift versión 2.1.0.28 y Comandos SQL de Amazon Redshift. Consulte la documentación de Amazon Redshift y la documentación de Descripción General del Sistema de Amazon Redshift para obtener información adicional.

    Los esquemas de datos de solicitud y respuesta constan de estos nodos y campos:

    • Solicitud

      Campo/Nodo del Esquema de Solicitud Notas
      accounts Nodo que representa las cuentas donde se van a insertar registros en bloque
      id ID que se va a insertar
      name Nombre que se va a insertar
      balance Valor que se va a insertar
    • Respuesta

      Campo/Nodo del Esquema de Respuesta Notas
      bulkErrorResponse El formato del esquema de solicitud
      tableName Nombre de la tabla donde se insertaron registros en bloque
      responseDetails Nodo de detalles de la respuesta
      batchSize Número de registros que se insertaron en bloque por lote
      totalRecords Número total de registros que fueron procesados
      recordsAffected Número total de registros que fueron insertados en bloque
      errorDetails Nodo que contiene cualquier mensaje de error
      SqlState Código que identifica condiciones de error SQL
      errorMsg Mensaje de error
      errorCode Código de error
  • Actualizar: Haz clic en el ícono de actualizar o en la palabra Actualizar para regenerar esquemas desde el endpoint de Amazon Redshift. Esta acción también regenera un esquema en otras ubicaciones a lo largo del proyecto donde se hace referencia al mismo esquema, como en una transformación adyacente.

  • Regresar: Haz clic para almacenar temporalmente la configuración de este paso y volver al paso anterior.

  • Terminado: Haz clic para guardar la configuración de todos los pasos y cerrar la configuración de la actividad.

  • Descartar Cambios: Después de realizar cambios, haz clic para cerrar la configuración sin guardar los cambios realizados en ningún paso. Un mensaje te pide que confirmes que deseas descartar los cambios.

Próximos pasos

Después de configurar una actividad de Insertar en bloque de Amazon Redshift, completa la configuración de la operación añadiendo y configurando otras actividades o herramientas como pasos de operación. También puedes configurar los ajustes de la operación, que incluyen la capacidad de encadenar operaciones que están en los mismos o diferentes flujos de trabajo.

Las acciones del menú para una actividad son accesibles desde el panel del proyecto y el lienzo de diseño. Para más detalles, consulta el menú de acciones de actividad en Conceptos básicos de conectores.

Las actividades de Insertar en bloque de Amazon Redshift pueden ser utilizadas como un objetivo con estos patrones de operación:

Para usar la actividad con funciones de scripting, escribe los datos en una ubicación temporal y luego utiliza esa ubicación temporal en la función de scripting.

Cuando estés listo, despliega y ejecuta la operación y valida el comportamiento revisando los registros de operación.