Actividad de Inserción Masiva de Amazon Redshift

Introducción

Una actividad de Inserción Masiva de Amazon Redshift, utilizando su conexión de Amazon Redshift, inserta múltiples registros en una tabla en Amazon Redshift y está destinada a ser utilizada como un objetivo para consumir datos en una operación. Esta actividad ofrece la opción de establecer el número de registros por lote y la opción de detener el procesamiento de los registros restantes si se encuentra un error.

Crear una actividad de Inserción Masiva de Amazon Redshift

Una instancia de una actividad de Inserción Masiva de Amazon Redshift se crea a partir de una conexión de Amazon Redshift utilizando su tipo de actividad Inserción Masiva.

Para crear una instancia de una actividad, arrastre el tipo de actividad al lienzo de diseño o copie el tipo de actividad y péguelo en el lienzo de diseño. Para más detalles, consulte Crear una instancia de actividad o herramienta en Reutilización de componentes.

Una actividad de Inserción Masiva de Amazon Redshift existente se puede editar desde estas ubicaciones:

El lienzo de diseño (consulte Menú de acciones de componentes en Lienzo de diseño).
La pestaña Componentes del panel del proyecto (consulte Menú de acciones de componentes en Pestaña de componentes del panel del proyecto).

Configurar una actividad de Inserción Masiva de Amazon Redshift

Siga estos pasos para configurar una actividad de Inserción Masiva de Amazon Redshift:

Paso 1: Ingrese un nombre y seleccione un esquema
Proporcione un nombre para la actividad y seleccione un esquema.
Paso 2: Seleccione una tabla
Seleccione la tabla que contiene los registros que se van a insertar.
Paso 3: Revisar los esquemas de datos
Se muestran los esquemas de solicitud o respuesta generados desde el endpoint.

Paso 1: Ingresar un nombre y seleccionar un esquema

En este paso, proporciona un nombre para la actividad y selecciona un esquema. Cada elemento de la interfaz de usuario de este paso se describe a continuación.

Configuración de la actividad de inserción masiva de Amazon Redshift paso 1

Nombre: Ingresa un nombre para identificar la actividad. El nombre debe ser único para cada actividad de Inserción Masiva de Amazon Redshift y no debe contener barras diagonales (/) ni dos puntos (:).
Seleccionar un Esquema: Esta sección muestra los esquemas disponibles en el endpoint de Amazon Redshift. Al reabrir la configuración de una actividad existente, solo se muestra el esquema seleccionado en lugar de recargar toda la lista de esquemas.
- Nombre del Esquema Seleccionado: Después de seleccionar un esquema, se lista aquí.
- Buscar: Ingresa el valor de cualquier columna en el cuadro de búsqueda para filtrar la lista de esquemas. La búsqueda no distingue entre mayúsculas y minúsculas. Si los esquemas ya se muestran dentro de la tabla, los resultados de la tabla se filtran en tiempo real con cada pulsación de tecla. Para recargar esquemas desde el endpoint al buscar, ingresa criterios de búsqueda y luego actualiza, como se describe a continuación.
- Actualizar: Haz clic en el ícono de actualizar o en la palabra Actualizar para recargar esquemas desde el endpoint de Amazon Redshift. Esto puede ser útil si se han agregado esquemas a Amazon Redshift. Esta acción actualiza todos los metadatos utilizados para construir la tabla de esquemas mostrada en la configuración.
- Seleccionar un Esquema: Dentro de la tabla, haz clic en cualquier parte de una fila para seleccionar un esquema. Solo se puede seleccionar un esquema. La información disponible para cada esquema se obtiene del endpoint de Amazon Redshift:
  - Esquema: El nombre del esquema de Amazon Redshift.
Consejo

Si la tabla no se llena con los esquemas disponibles, la conexión a Amazon Redshift puede no ser exitosa. Asegúrate de estar conectado volviendo a abrir la conexión y volviendo a probar las credenciales.
Configuraciones Opcionales: Haz clic para expandir configuraciones opcionales adicionales:
- Tamaño del Lote: Ingresa un tamaño de lote que sea mayor que 0 o menor que 10000. Valor predeterminado: 100.
- Continuar en Caso de Error: Selecciona para continuar la ejecución de la actividad si se encuentra un error para un conjunto de datos en una solicitud de lote. Si se encuentran errores, se escriben en el registro de operaciones.
Guardar y Salir: Si está habilitado, haz clic para guardar la configuración de este paso y cerrar la configuración de la actividad.
Siguiente: Haz clic para almacenar temporalmente la configuración de este paso y continuar al siguiente paso. La configuración no se guardará hasta que hagas clic en el botón Finalizado en el último paso.
Descartar Cambios: Después de realizar cambios, haz clic para cerrar la configuración sin guardar los cambios realizados en ningún paso. Un mensaje te pide que confirmes que deseas descartar los cambios.

Paso 2: Seleccionar una tabla

En este paso, selecciona una tabla. Cada elemento de la interfaz de usuario de este paso se describe a continuación.

Configuración de la actividad de inserción masiva de Amazon Redshift paso 2

Seleccionar una Tabla: Esta sección muestra las tablas disponibles en el punto final de Amazon Redshift. Al reabrir una configuración de actividad existente, solo se muestra la tabla seleccionada en lugar de recargar toda la lista de tablas.
- Nombre del Esquema Seleccionado: El nombre del esquema seleccionado en el paso anterior se lista aquí.
- Seleccionar Nombre de Tabla: Después de seleccionar una tabla, se lista aquí.
- Buscar: Ingresa el valor de cualquier columna en el cuadro de búsqueda para filtrar la lista de tablas. La búsqueda no distingue entre mayúsculas y minúsculas. Si las tablas ya se muestran dentro de la tabla, los resultados de la tabla se filtran en tiempo real con cada pulsación de tecla. Para recargar tablas desde el punto final al buscar, ingresa criterios de búsqueda y luego actualiza, como se describe a continuación.
- Actualizar: Haz clic en el ícono de actualizar o en la palabra Actualizar para recargar las tablas desde el punto final de Amazon Redshift. Esto puede ser útil si se han agregado tablas a Amazon Redshift. Esta acción actualiza todos los metadatos utilizados para construir la tabla de tablas que se muestra en la configuración.
- Seleccionar una Tabla: Dentro de la tabla, haz clic en cualquier parte de una fila para seleccionar una tabla. Solo se puede seleccionar una tabla. La información disponible para cada tabla se obtiene del punto final de Amazon Redshift:
  - Nombre de la Tabla: El nombre de la tabla de Amazon Redshift.
  - Esquema: El nombre del esquema de Amazon Redshift.
  - Catálogo: El nombre del catálogo de Amazon Redshift.
Consejo

Si la tabla no se llena con las tablas disponibles, la conexión de Amazon Redshift puede no ser exitosa. Asegúrate de estar conectado volviendo a abrir la conexión y volviendo a probar las credenciales.
Atrás: Haz clic para almacenar temporalmente la configuración de este paso y regresar al paso anterior.
Siguiente: Haz clic para almacenar temporalmente la configuración de este paso y continuar al siguiente paso. La configuración no se guardará hasta que hagas clic en el botón Finalizado en el último paso.
Descartar Cambios: Después de realizar cambios, haz clic para cerrar la configuración sin guardar los cambios realizados en ningún paso. Un mensaje te pedirá que confirmes que deseas descartar los cambios.

Paso 3: Revisar los esquemas de datos

Cualquier esquema de solicitud o respuesta generado desde el punto final se muestra. Cada elemento de la interfaz de usuario de este paso se describe a continuación.

Configuración de la actividad de inserción masiva de Amazon Redshift paso 3

Esquemas de Datos: Estos esquemas de datos son heredados por transformaciones adyacentes y se muestran nuevamente durante el mapeo de transformaciones.

Nota

Los datos suministrados en una transformación tienen prioridad sobre la configuración de la actividad.

El conector de Amazon Redshift utiliza el Controlador JDBC de Amazon Redshift versión 2.1.0.28 y Comandos SQL de Amazon Redshift. Consulte la documentación de Amazon Redshift y la documentación de Descripción General del Sistema de Amazon Redshift para obtener información adicional.

Los esquemas de datos de solicitud y respuesta constan de estos nodos y campos:

Solicitud

Campo/Nodo del Esquema de Solicitud	Notas
`accounts`	Nodo que representa las cuentas donde se van a insertar registros en bloque
`id`	ID que se va a insertar
`name`	Nombre que se va a insertar
`balance`	Valor que se va a insertar

Respuesta

Campo/Nodo del Esquema de Respuesta	Notas
`bulkErrorResponse`	El formato del esquema de solicitud
`tableName`	Nombre de la tabla donde se insertaron registros en bloque

`responseDetails`	Nodo de detalles de la respuesta
`batchSize`	Número de registros que se insertaron en bloque por lote
`totalRecords`	Número total de registros que fueron procesados
`recordsAffected`	Número total de registros que fueron insertados en bloque

`errorDetails`	Nodo que contiene cualquier mensaje de error
`SqlState`	Código que identifica condiciones de error SQL
`errorMsg`	Mensaje de error
`errorCode`	Código de error

Actualizar: Haz clic en el ícono de actualizar o en la palabra Actualizar para regenerar esquemas desde el endpoint de Amazon Redshift. Esta acción también regenera un esquema en otras ubicaciones a lo largo del proyecto donde se hace referencia al mismo esquema, como en una transformación adyacente.
Regresar: Haz clic para almacenar temporalmente la configuración de este paso y volver al paso anterior.
Terminado: Haz clic para guardar la configuración de todos los pasos y cerrar la configuración de la actividad.
Descartar Cambios: Después de realizar cambios, haz clic para cerrar la configuración sin guardar los cambios realizados en ningún paso. Un mensaje te pide que confirmes que deseas descartar los cambios.

Próximos pasos

Después de configurar una actividad de Insertar en bloque de Amazon Redshift, completa la configuración de la operación añadiendo y configurando otras actividades o herramientas como pasos de operación. También puedes configurar los ajustes de la operación, que incluyen la capacidad de encadenar operaciones que están en los mismos o diferentes flujos de trabajo.

Las acciones del menú para una actividad son accesibles desde el panel del proyecto y el lienzo de diseño. Para más detalles, consulta el menú de acciones de actividad en Conceptos básicos de conectores.

Las actividades de Insertar en bloque de Amazon Redshift pueden ser utilizadas como un objetivo con estos patrones de operación:

Patrón de transformación
Patrón de dos transformaciones (como el primer o segundo objetivo)

Para usar la actividad con funciones de scripting, escribe los datos en una ubicación temporal y luego utiliza esa ubicación temporal en la función de scripting.

Cuando estés listo, despliega y ejecuta la operación y valida el comportamiento revisando los registros de operación.