Atividade de Transferência de Dados do Google BigQuery
Introdução
Uma atividade de Transferência de Dados do Google BigQuery, utilizando sua conexão do Google BigQuery, transfere dados de uma fonte de dados para um conjunto de dados no Google BigQuery e é destinada a ser usada como um destino para consumir dados em uma operação.
Criar uma atividade de Transferência de Dados do Google BigQuery
Uma instância de uma atividade de Transferência de Dados do Google BigQuery é criada a partir de uma conexão do Google BigQuery usando seu tipo de atividade Transferência de Dados.
Para criar uma instância de uma atividade, arraste o tipo de atividade para a tela de design ou copie o tipo de atividade e cole-o na tela de design. Para mais detalhes, veja Criar uma instância de atividade ou ferramenta em Reutilização de componentes.
Uma atividade de Transferência de Dados do Google BigQuery existente pode ser editada a partir destes locais:
- A tela de design (veja Menu de ações do componente em Tela de design).
- A aba Componentes do painel do projeto (veja Menu de ações do componente em Aba Componentes do painel do projeto).
Configurar uma atividade de Transferência de Dados do Google BigQuery
Siga estas etapas para configurar uma atividade de Transferência de Dados do Google BigQuery:
-
Etapa 1: Insira um nome e selecione a fonte de dados
Forneça um nome para a atividade e selecione a fonte de dados. -
Etapa 2: Selecione o conjunto de dados
Selecione o conjunto de dados. -
Etapa 3: Selecione a tabela
Selecione a tabela. -
Etapa 4: Revise os esquemas de dados
Quaisquer esquemas de solicitação ou resposta são exibidos.
Passo 1: Insira um nome e selecione a fonte de dados
Neste passo, forneça um nome para a atividade e selecione a fonte de dados. Cada elemento da interface do usuário deste passo é descrito abaixo.
-
Nome: Insira um nome para identificar a atividade. O nome deve ser exclusivo para cada atividade de Transferência de Dados do Google BigQuery e não deve conter barras
/
ou dois pontos:
. -
Selecionar a Fonte de Dados: Esta seção exibe as fontes de dados disponíveis no endpoint do Google BigQuery, seja Amazon S3 ou Google Cloud Storage.
-
Fonte de Dados Selecionada: Após uma fonte de dados ser selecionada, ela é listada aqui.
-
Pesquisar: Insira o valor de qualquer coluna na caixa de pesquisa para filtrar a lista de fontes de dados. A pesquisa não diferencia maiúsculas de minúsculas. Se as fontes de dados já estiverem exibidas na tabela, os resultados da tabela são filtrados em tempo real a cada tecla pressionada. Para recarregar as fontes de dados do endpoint ao pesquisar, insira os critérios de pesquisa e, em seguida, atualize, conforme descrito abaixo.
-
Atualizar: Clique no ícone de atualizar ou na palavra Atualizar para recarregar as fontes de dados do endpoint do Google BigQuery. Isso pode ser útil se fontes de dados foram adicionadas ao Google BigQuery. Esta ação atualiza todos os metadados usados para construir a tabela de fontes de dados exibida na configuração.
-
Selecionando uma Fonte de Dados: Dentro da tabela, clique em qualquer lugar em uma linha para selecionar uma fonte de dados. Apenas uma fonte de dados pode ser selecionada. As informações disponíveis para cada fonte de dados são obtidas do endpoint do Google BigQuery:
-
Nome: O nome da fonte de dados.
-
Descrição: A descrição da fonte de dados.
-
Dica
Se a tabela não for preenchida com fontes de dados disponíveis, a conexão do Google BigQuery pode não ter sido bem-sucedida. Certifique-se de que está conectado reabrindo a conexão e retestando as credenciais.
-
-
Salvar e Sair: Se habilitado, clique para salvar a configuração para esta etapa e fechar a configuração da atividade.
-
Próximo: Clique para armazenar temporariamente a configuração para esta etapa e continuar para a próxima etapa. A configuração não será salva até que você clique no botão Concluído na última etapa.
-
Descartar Alterações: Após fazer alterações, clique para fechar a configuração sem salvar as alterações feitas em qualquer etapa. Uma mensagem pede para você confirmar que deseja descartar as alterações.
Etapa 2: Selecionar o conjunto de dados
Nesta etapa, selecione o conjunto de dados. Cada elemento da interface do usuário desta etapa é descrito abaixo.
-
Selecionar o Conjunto de Dados: Esta seção exibe os conjuntos de dados disponíveis no endpoint do Google BigQuery.
-
Fonte de Dados Selecionada: A fonte de dados selecionada na etapa anterior é listada aqui.
-
Conjunto de Dados Selecionado: Após um conjunto de dados ser selecionado, ele é listado aqui.
-
Pesquisar: Insira o valor de qualquer coluna na caixa de pesquisa para filtrar a lista de conjuntos de dados. A pesquisa não diferencia maiúsculas de minúsculas. Se os conjuntos de dados já estiverem exibidos na tabela, os resultados da tabela são filtrados em tempo real a cada tecla pressionada. Para recarregar conjuntos de dados do endpoint ao pesquisar, insira os critérios de pesquisa e, em seguida, atualize, conforme descrito abaixo.
-
Atualizar: Clique no ícone de atualizar ou na palavra Atualizar para recarregar conjuntos de dados do endpoint do Google BigQuery. Isso pode ser útil se conjuntos de dados foram adicionados ao Google BigQuery. Esta ação atualiza todos os metadados usados para construir a tabela de conjuntos de dados exibida na configuração.
-
Selecionando um Conjunto de Dados: Dentro da tabela, clique em qualquer lugar em uma linha para selecionar um conjunto de dados. Apenas um conjunto de dados pode ser selecionado. As informações disponíveis para cada conjunto de dados são obtidas do endpoint do Google BigQuery:
- Nome: O nome do conjunto de dados.
-
-
Descrição: A descrição do conjunto de dados.
Dica
Se a tabela não for preenchida com conjuntos de dados disponíveis, a conexão do Google BigQuery pode não ter sido bem-sucedida. Certifique-se de que está conectado reabrindo a conexão e testando novamente as credenciais.
-
Voltar: Clique para armazenar temporariamente a configuração para esta etapa e retornar à etapa anterior.
-
Próximo: Clique para armazenar temporariamente a configuração para esta etapa e continuar para a próxima etapa. A configuração não será salva até que você clique no botão Concluído na última etapa.
-
Descartar Alterações: Após fazer alterações, clique para fechar a configuração sem salvar as alterações feitas em qualquer etapa. Uma mensagem solicita que você confirme que deseja descartar as alterações.
Etapa 3: Selecionar a tabela
Nesta etapa, selecione a tabela. Cada elemento da interface do usuário desta etapa é descrito abaixo.
Dica
Campos com um ícone variável suportam o uso de variáveis globais, variáveis de projeto e variáveis Jitterbit. Comece digitando um colchete aberto [
no campo ou clicando no ícone de variável para exibir uma lista das variáveis existentes para escolher.
-
Selecionar a Tabela: Esta seção exibe as tabelas disponíveis no endpoint do Google BigQuery.
-
Conjunto de Dados Selecionado: O conjunto de dados selecionado na etapa anterior é listado aqui.
-
Tabela Selecionada: Após uma tabela ser selecionada, ela é listada aqui.
-
Pesquisar: Insira o valor de qualquer coluna na caixa de pesquisa para filtrar a lista de tabelas. A pesquisa não diferencia maiúsculas de minúsculas. Se as tabelas já estiverem exibidas na tabela, os resultados da tabela são filtrados em tempo real a cada tecla pressionada. Para recarregar tabelas do endpoint ao pesquisar, insira os critérios de pesquisa e, em seguida, atualize, conforme descrito abaixo.
-
-
Atualizar: Clique no ícone de atualizar ou na palavra Atualizar para recarregar as tabelas do endpoint do Google BigQuery. Isso pode ser útil se tabelas foram adicionadas ao Google BigQuery. Esta ação atualiza todos os metadados usados para construir a tabela de tabelas exibida na configuração.
-
Selecionando uma Tabela: Dentro da tabela, clique em qualquer lugar em uma linha para selecionar uma tabela. Apenas uma tabela pode ser selecionada. As informações disponíveis para cada tabela são obtidas do endpoint do Google BigQuery:
-
Nome: O nome da tabela.
-
Descrição: A descrição da tabela
Dica
Se a tabela não for preenchida com tabelas disponíveis, a conexão do Google BigQuery pode não ter sido bem-sucedida. Certifique-se de que está conectado reabrindo a conexão e testando novamente as credenciais.
-
-
Nome de Exibição: Defina um nome de exibição para a transferência de dados.
-
Voltar: Clique para armazenar temporariamente a configuração para esta etapa e retornar à etapa anterior.
-
Próximo: Clique para armazenar temporariamente a configuração para esta etapa e continuar para a próxima etapa. A configuração não será salva até que você clique no botão Concluído na última etapa.
-
Descartar Alterações: Após fazer alterações, clique para fechar a configuração sem salvar as alterações feitas em qualquer etapa. Uma mensagem pede que você confirme que deseja descartar as alterações.
Etapa 4: Revisar os esquemas de dados
Quaisquer esquemas de solicitação ou resposta são exibidos. Cada elemento da interface do usuário desta etapa é descrito abaixo.
-
Esquemas de Dados: Esses esquemas de dados são herdados por transformações adjacentes e são exibidos novamente durante o mapeamento de transformações.
O conector do Google BigQuery usa a versão 25.4.0 do Google SDK. Consulte a documentação do SDK para obter informações sobre os nós e campos do esquema.
Importante
O valor utilizado para o campo
custom_schedule
deve ser uma string que siga o formato definido na documentação do Google sobre agendamento de jobs com cron.yml sem preceder comschedule:
. Por exemplo,a cada 12 horas
outoda segunda-feira 09:00
.A atividade Transferência de Dados utiliza JSON em seus esquemas de solicitação e resposta.
-
Atualizar: Clique no ícone de atualizar ou na palavra Atualizar para regenerar esquemas do endpoint do Google BigQuery. Esta ação também regenera um esquema em outros locais ao longo do projeto onde o mesmo esquema é referenciado, como em uma transformação adjacente.
-
Voltar: Clique para armazenar temporariamente a configuração para esta etapa e retornar à etapa anterior.
-
Concluído: Clique para salvar a configuração de todas as etapas e fechar a configuração da atividade.
-
Descartar Alterações: Após fazer alterações, clique para fechar a configuração sem salvar as alterações feitas em qualquer etapa. Uma mensagem pede para você confirmar que deseja descartar as alterações.
Próximas etapas
Após configurar uma atividade de Transferência de Dados do Google BigQuery, complete a configuração da operação adicionando e configurando outras atividades ou ferramentas como etapas da operação. Você também pode configurar as configurações da operação, que incluem a capacidade de encadear operações que estão no mesmo ou em diferentes fluxos de trabalho.
As ações do menu para uma atividade estão acessíveis a partir do painel do projeto e da tela de design. Para mais detalhes, veja o menu de ações da atividade em Conceitos básicos do conector.
As atividades de Transferência de Dados do Google BigQuery podem ser usadas como um alvo com esses padrões de operação:
- Padrão de transformação
- Padrão de duas transformações (como o primeiro ou segundo alvo)
Para usar a atividade com funções de script, escreva os dados em um local temporário e, em seguida, use esse local temporário na função de script.
Quando estiver pronto, implante e execute a operação e valide o comportamento verificando os logs da operação.