Actividad de consulta de Google BigQuery
Introducción
Una actividad de Consulta de Google BigQuery, utilizando su conexión de Google BigQuery, consulta una tabla en un conjunto de datos en Google BigQuery y está destinada a ser utilizada como fuente en una operación.
Crear una actividad de consulta de Google BigQuery
Una instancia de una actividad de Consulta de Google BigQuery se crea a partir de una conexión de Google BigQuery utilizando su tipo de actividad Consulta.
Para crear una instancia de una actividad, arrastre el tipo de actividad al lienzo de diseño o copie el tipo de actividad y péguelo en el lienzo de diseño. Para más detalles, consulte Crear una instancia de actividad o herramienta en Reutilización de componentes.
Una actividad de Consulta de Google BigQuery existente se puede editar desde estas ubicaciones:
- El lienzo de diseño (consulte Menú de acciones de componentes en Lienzo de diseño).
- La pestaña Componentes del panel del proyecto (consulte Menú de acciones de componentes en Pestaña de componentes del panel del proyecto).
Configurar una actividad de consulta de Google BigQuery
Siga estos pasos para configurar una actividad de Consulta de Google BigQuery:
-
Paso 1: Ingrese un nombre y seleccione el conjunto de datos
Proporcione un nombre para la actividad y seleccione el conjunto de datos. -
Paso 2: Seleccione la tabla
Seleccione la tabla. -
Paso 3: Construya su consulta
Establezca condiciones en una consulta utilizando los campos del objeto y aplique paginación a una consulta. -
Paso 4: Revise los esquemas de datos
Se mostrarán los esquemas de solicitud o respuesta.
Paso 1: Ingrese un nombre y seleccione el conjunto de datos
En este paso, proporcione un nombre para la actividad y seleccione el conjunto de datos. Cada elemento de la interfaz de usuario de este paso se describe a continuación.
-
Nombre: Ingrese un nombre para identificar la actividad. El nombre debe ser único para cada actividad de Consulta de Google BigQuery y no debe contener barras diagonales
/
ni dos puntos:
. -
Seleccionar el Conjunto de Datos: Esta sección muestra los conjuntos de datos disponibles en el punto final de Google BigQuery.
-
Conjunto de Datos Seleccionado: Después de seleccionar un conjunto de datos, se lista aquí.
-
Buscar: Ingrese el valor de cualquier columna en el cuadro de búsqueda para filtrar la lista de conjuntos de datos. La búsqueda no distingue entre mayúsculas y minúsculas. Si los conjuntos de datos ya se muestran en la tabla, los resultados de la tabla se filtran en tiempo real con cada pulsación de tecla. Para recargar conjuntos de datos desde el punto final al buscar, ingrese criterios de búsqueda y luego actualice, como se describe a continuación.
-
Actualizar: Haga clic en el ícono de actualizar o en la palabra Actualizar para recargar conjuntos de datos desde el punto final de Google BigQuery. Esto puede ser útil si se han agregado conjuntos de datos a Google BigQuery. Esta acción actualiza todos los metadatos utilizados para construir la tabla de conjuntos de datos mostrada en la configuración.
-
Seleccionar un Conjunto de Datos: Dentro de la tabla, haga clic en cualquier parte de una fila para seleccionar un conjunto de datos. Solo se puede seleccionar un conjunto de datos. La información disponible para cada conjunto de datos se obtiene del punto final de Google BigQuery:
-
Nombre: El nombre del conjunto de datos.
-
Descripción: La descripción del conjunto de datos.
-
Consejo
Si la tabla no se llena con conjuntos de datos disponibles, la conexión de Google BigQuery puede no haber sido exitosa. Asegúrese de estar conectado volviendo a abrir la conexión y volviendo a probar las credenciales.
-
-
Guardar y Salir: Si está habilitado, haga clic para guardar la configuración de este paso y cerrar la configuración de la actividad.
-
Siguiente: Haga clic para almacenar temporalmente la configuración de este paso y continuar al siguiente paso. La configuración no se guardará hasta que haga clic en el botón Finalizado en el último paso.
-
Descartar Cambios: Después de realizar cambios, haga clic para cerrar la configuración sin guardar los cambios realizados en ningún paso. Un mensaje le pide que confirme que desea descartar los cambios.
Paso 2: Seleccionar la tabla
En este paso, seleccione la tabla. Cada elemento de la interfaz de usuario de este paso se describe a continuación.
-
Seleccionar la Tabla: Esta sección muestra las tablas disponibles en el punto final de Google BigQuery.
-
Conjunto de Datos Seleccionado: El conjunto de datos seleccionado en el paso anterior se enumera aquí.
-
Tabla Seleccionada: Después de seleccionar una tabla, se enumera aquí.
-
Buscar: Ingrese el valor de cualquier columna en el cuadro de búsqueda para filtrar la lista de tablas. La búsqueda no distingue entre mayúsculas y minúsculas. Si las tablas ya se muestran dentro de la tabla, los resultados de la tabla se filtran en tiempo real con cada pulsación de tecla. Para recargar tablas desde el punto final al buscar, ingrese criterios de búsqueda y luego actualice, como se describe a continuación.
-
Actualizar: Haga clic en el ícono de actualizar o en la palabra Actualizar para recargar tablas desde el punto final de Google BigQuery. Esto puede ser útil si se han agregado tablas a Google BigQuery. Esta acción actualiza todos los metadatos utilizados para construir la tabla de tablas mostradas en la configuración.
-
Seleccionando una Tabla: Dentro de la tabla, haga clic en cualquier parte de una fila para seleccionar una tabla. Solo se puede seleccionar una tabla. La información disponible para cada tabla se obtiene del punto final de Google BigQuery:
-
Nombre: El nombre de la tabla.
-
Descripción: La descripción de la tabla.
-
Consejo
Si la tabla no se llena con tablas disponibles, la conexión de Google BigQuery puede no ser exitosa. Asegúrese de estar conectado volviendo a abrir la conexión y volviendo a probar las credenciales.
-
-
Atrás: Haz clic para almacenar temporalmente la configuración de este paso y regresar al paso anterior.
-
Siguiente: Haz clic para almacenar temporalmente la configuración de este paso y continuar al siguiente paso. La configuración no se guardará hasta que hagas clic en el botón Finalizado en el último paso.
-
Descartar cambios: Después de realizar cambios, haz clic para cerrar la configuración sin guardar los cambios realizados en ningún paso. Un mensaje te pedirá que confirmes que deseas descartar los cambios.
Paso 3: Construye tu consulta
En este paso, construye una declaración de consulta estableciendo condiciones para los campos de objeto y aplicando paginación ya sea a través del generador de consultas o ingresando manualmente una declaración de consulta. Cada elemento de la interfaz de usuario de este paso se describe a continuación.
Nota
Puedes omitir el generador de consultas e ingresar una declaración de consulta en el campo Cadena de consulta.
Consejo
Los campos con un ícono de variable admiten el uso de variables globales, variables de proyecto y variables de Jitterbit. Comienza escribiendo un corchete cuadrado abierto [
en el campo o haciendo clic en el ícono de variable para mostrar una lista de las variables existentes de las que elegir.
-
Campos a recuperar: Usa esta sección para construir una consulta seleccionando campos a recuperar.
-
Buscar: Ingresa cualquier parte de un nombre de campo en el cuadro de búsqueda para filtrar la lista de campos para el objeto seleccionado. La búsqueda no distingue entre mayúsculas y minúsculas. Los resultados listados se filtran en tiempo real con cada pulsación de tecla.
-
Actualizar: Haz clic en el ícono de actualizar o en la palabra Actualizar para recargar los campos del objeto desde el punto final de Google BigQuery.
-
Seleccionar todo: Al usar el cuadro de búsqueda para filtrar, puedes usar esta casilla de verificación para seleccionar todos los campos visibles a la vez.
-
-
Seleccionar campos: Selecciona las casillas de verificación de los campos que deseas incluir en la consulta para que se agreguen automáticamente a la declaración de consulta en la Cadena de consulta. También puedes Seleccionar todo los campos a la vez utilizando la casilla de verificación.
-
Paginación: Para agregar una cláusula de paginación (un límite en el número de registros con un desplazamiento de registro opcional), puedes usar el menú desplegable para establecer el límite de paginación y el campo para ingresar un desplazamiento. Si no se especifica un desplazamiento, se establece en 0. Se admite una sola cláusula de paginación. Si no se incluye la cláusula de paginación, se devuelven todos los registros.
-
Aplicar: Haz clic para construir automáticamente la cláusula basada en las selecciones del menú desplegable y el valor ingresado. La cláusula de paginación construida automáticamente aparece en el cuadro de texto de la Cadena de consulta.
-
Eliminar: Haz clic para eliminar una cláusula de paginación que se ha aplicado.
-
-
Condiciones: Para agregar cláusulas condicionales, utiliza los campos a continuación como entrada para ayudar a construir las cláusulas, que luego aparecerán en el cuadro de texto de la Cadena de consulta.
-
Campo: Usa el menú desplegable para seleccionar un campo del objeto seleccionado.
-
Operador: Usa el menú desplegable para seleccionar un operador que sea apropiado para el tipo de dato del campo:
Operador Etiqueta Descripción = Igual != No igual IN (valor1, valor2) En En la lista de valores. IS NULL Es nulo No tiene valor. IS NOT NULL No es nulo Tiene un valor. LIKE 'cadena' Como Como cadena. LIKE 'cadena%' Comienza con Comienza con cadena. LIKE '%cadena' Termina con Termina con cadena. LIKE '%cadena%' Contiene Contiene cadena. < Menos que <= Menos o igual > Mayor que >= Mayor o igual -
Valor: Ingresa el valor deseado para usar con las selecciones del menú desplegable.
-
Agregar: Haz clic para construir automáticamente la cláusula basada en las selecciones del menú desplegable y el valor ingresado. La cláusula condicional se agrega al cuadro de texto Cadena de consulta.
-
Eliminar todo: Haz clic para eliminar todas las cláusulas condicionales ingresadas.
-
-
Cadena de consulta: A medida que seleccionas campos, especificas condiciones y estableces paginación, la declaración de consulta en este cuadro de texto se completa automáticamente con los campos seleccionados, condiciones y límites de paginación. Este campo es editable, lo que significa que puedes ingresar manualmente una declaración de consulta o editar la declaración completada automáticamente.
Nota
Los valores de cualquier variable global utilizada en la Cadena de consulta no se completan al usar el botón Probar consulta, incluso si se especifica un valor predeterminado. Los valores de las variables globales se obtendrán en tiempo de ejecución cuando se ejecute la consulta. Para probar la consulta con un valor de variable predeterminado, utiliza una variable de proyecto en su lugar.
-
Probar consulta: Haz clic para validar la consulta. Si la consulta es válida, se muestra un máximo de 50 registros recuperados de la consulta en una tabla. Si la consulta no es válida, se muestran mensajes de error relevantes. Si editas la Cadena de consulta manualmente, la consulta debe ser válida y validada a través de este botón para habilitar el botón Siguiente.
Nota
Durante el tiempo de ejecución de la operación, el límite de 50 registros no se aplica a menos que se especifique en el campo Paginación (descrito anteriormente).
-
Atrás: Haz clic para almacenar temporalmente la configuración de este paso y regresar al paso anterior.
-
Siguiente: Haz clic para almacenar temporalmente la configuración de este paso y continuar al siguiente paso. La configuración no se guardará hasta que hagas clic en el botón Finalizado en el último paso.
-
Descartar cambios: Después de realizar cambios, haz clic para cerrar la configuración sin guardar los cambios realizados en ningún paso. Un mensaje te pedirá que confirmes que deseas descartar los cambios.
Paso 4: Revisar los esquemas de datos
Se muestran los esquemas de solicitud o respuesta. Cada elemento de la interfaz de usuario de este paso se describe a continuación.
-
Esquemas de Datos: Estos esquemas de datos son heredados por transformaciones adyacentes y se muestran nuevamente durante el mapeo de transformaciones.
El conector de Google BigQuery utiliza la versión 25.4.0 del SDK de Google. Consulta la documentación del SDK para obtener información sobre los nodos y campos del esquema.
La actividad de Consulta utiliza JSON en su esquema de respuesta.
-
Actualizar: Haz clic en el ícono de actualizar o en la palabra Actualizar para regenerar esquemas desde el punto final de Google BigQuery. Esta acción también regenera un esquema en otras ubicaciones a lo largo del proyecto donde se hace referencia al mismo esquema, como en una transformación adyacente.
-
Atrás: Haz clic para almacenar temporalmente la configuración de este paso y regresar al paso anterior.
-
Terminado: Haz clic para guardar la configuración de todos los pasos y cerrar la configuración de la actividad.
-
Descartar Cambios: Después de realizar cambios, haz clic para cerrar la configuración sin guardar los cambios realizados en ningún paso. Un mensaje te pide que confirmes que deseas descartar los cambios.
Próximos pasos
Después de configurar una actividad de Consulta de Google BigQuery, completa la configuración de la operación agregando y configurando otras actividades o herramientas como pasos de operación. También puedes configurar la configuración de la operación, que incluye la capacidad de encadenar operaciones que están en los mismos o diferentes flujos de trabajo.
Las acciones del menú para una actividad son accesibles desde el panel del proyecto y el lienzo de diseño. Para más detalles, consulta el menú de acciones de actividad en Conceptos básicos del conector.
Las actividades de Consulta de Google BigQuery se pueden utilizar como fuente con estos patrones de operación:
- Patrón de transformación
- Patrón de archivo de dos objetivos (solo como la primera fuente)
- Patrón de archivo HTTP de dos objetivos (solo como la primera fuente)
- Patrón de dos transformaciones (solo como la primera fuente)
Para utilizar la actividad con funciones de scripting, escriba los datos en una ubicación temporal y luego use esa ubicación temporal en la función de scripting.
Cuando esté listo, despliegue y ejecute la operación y valide el comportamiento revisando los registros de operación.