Actividad de consulta de Google BigQuery
Introducción
Una actividad Query de Google BigQuery, que utiliza su conexión de Google BigQuery, consulta una tabla en un conjunto de datos en Google BigQuery y está destinado a usarse como fuente en una operación.
Crear una actividad de consulta de Google BigQuery
Se crea una instancia de una actividad Query de Google BigQuery a partir de una conexión de Google BigQuery utilizando su tipo de actividad Consulta.
Para crear una instancia de una actividad, arrastre el tipo de actividad al tela de diseño o copie el tipo de actividad y péguelo en el tela de diseño. Para obtener más detalles, consulte Crear una instancia de actividad en Reutilización de componentes.
Se puede editar una actividad Query de Google BigQuery existente desde estas ubicaciones:
- El tela de diseño (vea menú de acciones del componente en Lienzo de diseño).
- La pestaña Componentes del panel del proyecto (vea menú de acciones de componentes en la pestañaComponentes del panel Proyecto).
Configurar una actividad de consulta de Google BigQuery
Siga estos pasos para configurar una actividad Query de Google BigQuery:
-
Paso 1: Ingrese un nombre y seleccione el conjunto de datos
Proporcione un nombre para la actividad y seleccione el conjunto de datos. -
Paso 2: Seleccione la tabla
Seleccione la tabla. -
Paso 3: Crea tu consultar
Establezca condiciones en una consultar utilizando los campos de objeto y aplique paginación a una consultar. -
Paso 4: Revisar los esquemas de datos
Se muestran todos los esquemas de solicitud o respuesta.
Paso 1: Ingrese un nombre y seleccione el conjunto de datos
En este paso, proporcione un nombre para la actividad y seleccione el conjunto de datos. A continuación se describe cada elemento de la interfaz de usuario de este paso.
-
Nombre: Ingrese un nombre para identificar la actividad. El nombre debe ser único para cada actividad de Query de Google BigQuery y no debe contener barras diagonales.
/
o dos puntos:
. -
Seleccionar el conjunto de datos: Esta sección muestra los conjuntos de datos disponibles en el extremo de Google BigQuery.
-
Conjunto de datos seleccionado: Después de seleccionar un conjunto de datos, este aparece aquí.
-
Buscar: Ingrese el valor de cualquier columna en el cuadro de búsqueda para filtrar la lista de conjuntos de datos. La búsqueda no distingue entre mayúsculas y minúsculas. Si los conjuntos de datos ya se muestran dentro de la tabla, los resultados de la tabla se filtran en tiempo real con cada pulsación de tecla. Para volver a cargar los conjuntos de datos desde el extremo durante la búsqueda, ingrese los criterios de búsqueda y luego actualice, como se describe a continuación.
-
Actualizar: Haga clic en el ícono de actualización o la palabra Actualizar para volver a cargar los conjuntos de datos desde el extremo de Google BigQuery. Esto puede resultar útil si se han agregado conjuntos de datos a Google BigQuery. Esta acción actualiza todos los metadatos utilizados para crear la tabla de conjuntos de datos que se muestra en la configuración.
-
Selección de un conjunto de datos: Dentro de la tabla, haga clic en cualquier parte de una fila para seleccionar un conjunto de datos. Solo se puede seleccionar un conjunto de datos. La información disponible para cada conjunto de datos se obtiene del extremo de Google BigQuery:
-
Nombre: El nombre del conjunto de datos.
-
Descripción: La descripción del conjunto de datos.
-
Consejo
Si la tabla no se completa con los conjuntos de datos disponibles, la conexión de Google BigQuery puede no funcionar correctamente. Asegúrese de estar conectado volviendo a abrir la conexión y volviendo a probar las credenciales.
-
-
Guardar y salir: Si está habilitado, haga clic para guardar la configuración de este paso y cerrar la configuración de la actividad.
-
Siguiente: Haga clic para almacenar temporalmente la configuración de este paso y continuar con el siguiente paso. La configuración no se guardará hasta que haga clic en el botón Terminado en el último paso.
-
Descartar cambios: Después de realizar cambios, haga clic para cerrar la configuración sin guardar los cambios realizados en ningún paso. Un mensaje le solicitará que confirme que desea descartar los cambios.
Paso 2: Seleccionar la tabla
En este paso, seleccione la tabla. A continuación se describe cada elemento de la interfaz de usuario de este paso.
-
Seleccionar la tabla: Esta sección muestra las tablas disponibles en el extremo de Google BigQuery.
-
Conjunto de datos seleccionado: Aquí se incluye el conjunto de datos seleccionado en el paso anterior.
-
Tabla seleccionada: Después de seleccionar una tabla, esta aparece aquí.
-
Buscar: Ingrese el valor de cualquier columna en el cuadro de búsqueda para filtrar la lista de tablas. La búsqueda no distingue entre mayúsculas y minúsculas. Si ya se muestran tablas dentro de la tabla, los resultados de la tabla se filtran en tiempo real con cada pulsación de tecla. Para volver a cargar las tablas desde el extremo al realizar una búsqueda, ingrese los criterios de búsqueda y luego actualice, como se describe a continuación.
-
Actualizar: Haga clic en el ícono de actualización o la palabra Actualizar para volver a cargar las tablas desde el extremo de Google BigQuery. Esto puede resultar útil si se han agregado tablas a Google BigQuery. Esta acción actualiza todos los metadatos utilizados para crear la tabla de tablas que se muestra en la configuración.
-
Selección de una tabla: Dentro de la tabla, haga clic en cualquier parte de una fila para seleccionar una tabla. Solo se puede seleccionar una tabla. La información disponible para cada tabla se obtiene del extremo de Google BigQuery:
-
Nombre: El nombre de la tabla.
-
Descripción: La descripción de la tabla.
-
Consejo
Si la tabla no se completa con las tablas disponibles, la conexión de Google BigQuery puede no funcionar correctamente. Asegúrese de estar conectado volviendo a abrir la conexión y volviendo a probar las credenciales.
-
-
Atrás: Haga clic para almacenar temporalmente la configuración de este paso y volver al paso anterior.
-
Siguiente: Haga clic para almacenar temporalmente la configuración de este paso y continuar con el siguiente paso. La configuración no se guardará hasta que haga clic en el botón Terminado en el último paso.
-
Descartar cambios: Después de realizar cambios, haga clic para cerrar la configuración sin guardar los cambios realizados en ningún paso. Un mensaje le solicitará que confirme que desea descartar los cambios.
Paso 3: Crea tu consultar
En este paso, se crea una declaración de consultar estableciendo condiciones para los campos de objeto y aplicando paginación, ya sea a través del generador de consultar o ingresando manualmente una declaración de consultar. A continuación, se describe cada elemento de la interfaz de usuario de este paso.
Nota
Puede omitir el generador de consultar e ingresar una declaración de consultar en el campo Cadena de consulta.
Sugerencia
Campos con un ícono de variable admite el uso de variables globales, variables del proyecto y variables Jitterbit. Comience escribiendo un corchete abierto [
en el campo o haciendo clic en el icono de la variable para mostrar una lista de las variables existentes entre las que elegir.
-
Buscar: Ingrese cualquier parte del nombre de un campo en el cuadro de búsqueda para filtrar la lista de campos del objeto seleccionado. La búsqueda no distingue entre mayúsculas y minúsculas. Los resultados de la lista se filtran en tiempo real con cada pulsación de tecla.
-
Actualizar: Haga clic en el icono de actualización o la palabra Actualizar para volver a cargar los campos del objeto desde el extremo de Google BigQuery.
-
Seleccionar todo: Al utilizar el cuadro de búsqueda para filtrar, puede utilizar esta casilla de verificación para seleccionar todos los campos visibles a la vez.
-
Seleccionar campos: Seleccione las casillas de verificación de los campos que desea incluir en la consultar para que se agreguen automáticamente a la declaración de consultar en la cadena de consulta. También puede Seleccionar todos los campos a la vez utilizando la casilla de verificación.
-
Paginación: Para agregar una cláusula de paginación (un límite en la cantidad de registros con un desplazamiento de registro opcional), puede usar el menú desplegable para establecer el límite de paginación y el campo para ingresar un desplazamiento. Si no se especifica un desplazamiento, el valor predeterminado es 0. Se admite una sola cláusula de paginación. Si no se incluye la cláusula de paginación, se devuelven todos los registros.
-
Aplicar: Haga clic para construir automáticamente la cláusula en función de las selecciones del menú desplegable y el valor ingresado. La cláusula de paginación construida automáticamente aparece en el cuadro de texto Cadena de consulta.
-
Eliminar: Haga clic para eliminar una cláusula de paginación que se haya aplicado.
-
-
Condiciones: Para agregar cláusulas condicionales, utilice los campos a continuación como entrada para ayudar a construir las cláusulas, que luego aparecen en el cuadro de texto Cadena de consulta.
-
Campo: Utilice el menú desplegable para seleccionar un campo del objeto seleccionado.
-
Operador: Utilice el menú desplegable para seleccionar un operador que sea apropiado para el tipo de datos del campo:
Operador Etiqueta Descripción = Es igual a != No es igual a IN (valor1, valor2) In En lista de valores. IS NULL Es nulo No tiene valor. NO ES NULO No es nulo Tiene un valor. ME GUSTA 'string' Me gusta Me gusta string. LIKE 'string%' Comienza con Comienza con string. LIKE '%string' Termina con Termina con string. ME GUSTA '%string%' Contiene Contiene string. < Menos que <= Menor o igual > Mayor que >= Mayor o igual -
Valor: Ingrese el valor deseado para usar con las selecciones desplegables.
-
Agregar: Haga clic para construir automáticamente la cláusula en función de las selecciones del menú desplegable y el valor ingresado. La cláusula condicional se agrega al cuadro de texto Cadena de consulta.
-
Eliminar todo: Haga clic para eliminar todas las cláusulas condicionales ingresadas.
-
-
Cadena de consulta: A medida que selecciona campos, especifica condiciones y establece la paginación, la declaración de consultar en este cuadro de texto se completa automáticamente con los campos, las condiciones y los límites de paginación seleccionados. Este campo es editable, lo que significa que puede ingresar manualmente una declaración de consultar o editar la declaración completada automáticamente.
Nota
Los valores de cualquier variable global utilizadas en la Cadena de consulta no se completan cuando se utiliza el botón Probar consulta, incluso si se especifica un valor predeterminado. Los valores de las variables globales se obtendrán en tiempo de ejecución cuando se ejecute la consultar. Para probar la consultar con un valor de variable predeterminado, utilice una variable de proyecto en cambio.
-
Consulta de prueba: Haga clic para validar la consultar. Si la consultar es válida, se mostrará en una tabla un máximo de 50 registros recuperados de la consultar. Si la consultar no es válida, se mostrarán los mensajes de error correspondientes. Si edita la cadena de consulta manualmente, la consultar debe ser válida y validarse mediante este botón para habilitar el botón Siguiente.
Nota
Durante el tiempo de ejecución de la operación, el límite de 50 registros no se aplica a menos que se especifique en el campo Paginación (descrito anteriormente).
-
Atrás: Haga clic para almacenar temporalmente la configuración de este paso y regresar al paso anterior.
-
Siguiente: Haga clic para guardar temporalmente la configuración de este paso y continuar con el siguiente. La configuración no se guardará hasta que haga clic en el botón Finalizado en el último paso.
-
Descartar cambios: Después de realizar los cambios, haga clic para cerrar la configuración sin guardar los cambios realizados en ningún paso. Un mensaje le solicitará que confirme que desea descartar los cambios.
Paso 4: Revisar los esquemas de datos
Se muestran todos los esquemas de solicitud o respuesta. A continuación se describe cada elemento de la interfaz de usuario de este paso.
-
Esquemas de datos: Estos esquemas de datos son heredados por transformaciones adyacentes y se muestran nuevamente durante el mapeo de transformación.
El conector de Google BigQuery utiliza la versión 25.4.0 del SDK de Google. Consulte la documentación del SDK para obtener información sobre los nodos y campos del esquema.
La actividad Consulta utiliza JSON en su esquema de respuesta.
-
Actualizar: Haga clic en el ícono de actualización o la palabra Actualizar para regenerar esquemas desde el extremo de Google BigQuery. Esta acción también regenera un esquema en otras ubicaciones en todo el proyecto donde se hace referencia al mismo esquema, como en una transformación adyacente.
-
Atrás: Haga clic para almacenar temporalmente la configuración de este paso y regresar al paso anterior.
-
Terminado: Haga clic para guardar la configuración de todos los pasos y cerrar la configuración de la actividad.
-
Descartar cambios: Después de realizar los cambios, haga clic para cerrar la configuración sin guardar los cambios realizados en ningún paso. Un mensaje le solicitará que confirme que desea descartar los cambios.
Próximos pasos
Después de configurar una actividad de Consulta de Google BigQuery, complete la configuración de la operación agregando y configurando otras actividades, transformaciones o secuencias de comandos como pasos de la operación. También puede configurar los ajustes de la operación, que incluyen la capacidad de encadenar operaciones que se encuentran en el mismo flujo de trabajo o en flujos de trabajo diferentes.
Se puede acceder a las acciones del menú de una actividad desde el panel del proyecto y el tela de diseño. Para obtener más información, consulte menú de acciones de la actividad en Conceptos básicos del conector.
Las actividades Query de Google BigQuery se pueden usar como fuente con estos patrones de operación:
- Patrón de Transformación
- Patrón de archivo de dos objetivos (solo como primera fuente)
- Patrón de archivo HTTP de dos destinos (solo como primera fuente)
- Patrón de dos transformaciones (solo como primera fuente)
Para utilizar la actividad con funciones de script, escriba los datos en una ubicación temporal y luego use esa ubicación temporal en la función de script.
Cuando esté listo, desplegar y ejecute la operación y validar el comportamiento comprobando los registros de operación.