Atividade de Consulta do Amazon Redshift
Introdução
Uma atividade de Consulta do Amazon Redshift, utilizando sua conexão do Amazon Redshift, recupera registros de uma tabela no Amazon Redshift e é destinada a ser usada como uma fonte para fornecer dados em uma operação.
Criar uma atividade de Consulta do Amazon Redshift
Uma instância de uma atividade de Consulta do Amazon Redshift é criada a partir de uma conexão do Amazon Redshift usando seu tipo de atividade Consulta.
Para criar uma instância de uma atividade, arraste o tipo de atividade para a tela de design ou copie o tipo de atividade e cole-o na tela de design. Para mais detalhes, veja Criar uma instância de atividade ou ferramenta em Reutilização de componentes.
Uma atividade de Consulta do Amazon Redshift existente pode ser editada a partir destes locais:
- A tela de design (veja Menu de ações do componente em Tela de design).
- A aba Componentes do painel do projeto (veja Menu de ações do componente em Aba Componentes do painel do projeto).
Configurar uma atividade de Consulta do Amazon Redshift
Siga estas etapas para configurar uma atividade de Consulta do Amazon Redshift:
-
Etapa 1: Insira um nome e selecione um esquema
Forneça um nome para a atividade e selecione um esquema. -
Etapa 2: Selecione um objeto
Selecione um objeto a ser consultado. -
Etapa 3: Construa sua consulta
Defina condições em uma consulta usando os campos do objeto e aplique paginação a uma consulta. -
Etapa 4: Revise os esquemas de dados
Quaisquer esquemas de solicitação ou resposta gerados a partir do endpoint são exibidos.
Passo 1: Insira um nome e selecione um esquema
Neste passo, forneça um nome para a atividade e selecione um esquema. Cada elemento da interface do usuário deste passo é descrito abaixo.
-
Nome: Insira um nome para identificar a atividade. O nome deve ser exclusivo para cada atividade de Consulta do Amazon Redshift e não deve conter barras (
/
) ou dois pontos (:
). -
Selecionar um Esquema: Esta seção exibe os esquemas disponíveis no endpoint do Amazon Redshift. Ao reabrir uma configuração de atividade existente, apenas o esquema selecionado é exibido em vez de recarregar toda a lista de esquemas.
-
Nome do Esquema Selecionado: Após um esquema ser selecionado, ele é listado aqui.
-
Pesquisar: Insira o valor de qualquer coluna na caixa de pesquisa para filtrar a lista de esquemas. A pesquisa não diferencia maiúsculas de minúsculas. Se os esquemas já estiverem exibidos na tabela, os resultados da tabela são filtrados em tempo real a cada tecla pressionada. Para recarregar esquemas do endpoint ao pesquisar, insira critérios de pesquisa e, em seguida, atualize, conforme descrito abaixo.
-
Atualizar: Clique no ícone de atualizar ou na palavra Atualizar para recarregar esquemas do endpoint do Amazon Redshift. Isso pode ser útil se esquemas foram adicionados ao Amazon Redshift. Esta ação atualiza todos os metadados usados para construir a tabela de esquemas exibida na configuração.
-
Selecionando um Esquema: Dentro da tabela, clique em qualquer lugar em uma linha para selecionar um esquema. Apenas um esquema pode ser selecionado. As informações disponíveis para cada esquema são obtidas do endpoint do Amazon Redshift:
- Esquema: O nome do esquema do Amazon Redshift.
Dica
Se a tabela não for preenchida com esquemas disponíveis, a conexão do Amazon Redshift pode não ter sido bem-sucedida. Certifique-se de que está conectado reabrindo a conexão e testando novamente as credenciais.
-
-
Salvar e Sair: Se habilitado, clique para salvar a configuração para esta etapa e fechar a configuração da atividade.
-
Próximo: Clique para armazenar temporariamente a configuração para esta etapa e continuar para a próxima etapa. A configuração não será salva até que você clique no botão Concluído na última etapa.
-
Descartar Alterações: Após fazer alterações, clique para fechar a configuração sem salvar as alterações feitas em qualquer etapa. Uma mensagem pede para você confirmar que deseja descartar as alterações.
Etapa 2: Selecionar um objeto
Nesta etapa, selecione um objeto. Cada elemento da interface do usuário desta etapa é descrito abaixo.
-
Selecionar um Objeto: Esta seção exibe os objetos disponíveis no endpoint do Amazon Redshift. Ao reabrir uma configuração de atividade existente, apenas o objeto selecionado é exibido em vez de recarregar toda a lista de objetos.
-
Nome do Esquema Selecionado: O nome do esquema selecionado na etapa anterior é listado aqui.
-
Selecionar um Nome de Objeto: Após um objeto ser selecionado, ele é listado aqui.
-
Pesquisar: Insira o valor de qualquer coluna na caixa de pesquisa para filtrar a lista de objetos. A pesquisa não diferencia maiúsculas de minúsculas. Se os objetos já estiverem exibidos na tabela, os resultados da tabela são filtrados em tempo real a cada tecla pressionada. Para recarregar objetos do endpoint ao pesquisar, insira os critérios de pesquisa e, em seguida, atualize, conforme descrito abaixo.
-
Atualizar: Clique no ícone de atualizar ou na palavra Atualizar para recarregar objetos do endpoint do Amazon Redshift. Isso pode ser útil se objetos foram adicionados ao Amazon Redshift. Esta ação atualiza todos os metadados usados para construir a tabela de objetos exibida na configuração.
-
Selecionando um Objeto: Dentro da tabela, clique em qualquer lugar de uma linha para selecionar um objeto. Apenas um objeto pode ser selecionado. As informações disponíveis para cada objeto são obtidas do endpoint do Amazon Redshift:
-
Nome do Objeto: O nome do objeto do Amazon Redshift.
-
Tipo: O tipo do objeto do Amazon Redshift.
-
Catálogo: O catálogo do objeto do Amazon Redshift.
-
Dica
Se a tabela não for preenchida com objetos disponíveis, a conexão com o Amazon Redshift pode não ter sido bem-sucedida. Certifique-se de que está conectado reabrindo a conexão e testando novamente as credenciais.
-
-
Voltar: Clique para armazenar temporariamente a configuração para esta etapa e retornar à etapa anterior.
-
Próximo: Clique para armazenar temporariamente a configuração para esta etapa e continuar para a próxima etapa. A configuração não será salva até que você clique no botão Concluído na última etapa.
-
Descartar Alterações: Após fazer alterações, clique para fechar a configuração sem salvar as alterações feitas em qualquer etapa. Uma mensagem pede para você confirmar que deseja descartar as alterações.
Etapa 3: Construa sua consulta
Nesta etapa, defina condições em uma consulta usando os campos do objeto e aplique paginação a uma consulta. Cada elemento da interface do usuário desta etapa é descrito abaixo.
Dica
Campos com um ícone de variável suportam o uso de variáveis globais, variáveis de projeto e variáveis Jitterbit. Comece digitando um colchete aberto [
no campo ou clicando no ícone de variável para exibir uma lista das variáveis existentes para escolher.
-
Pesquisar: Digite qualquer parte do nome de um campo na caixa de pesquisa para filtrar a lista de campos para o objeto selecionado. A pesquisa não diferencia maiúsculas de minúsculas. Os resultados listados são filtrados em tempo real a cada tecla pressionada.
-
Atualizar: Clique no ícone de atualizar ou na palavra Atualizar para recarregar os campos do objeto do endpoint do Amazon Redshift.
-
Selecionar Todos: Ao usar a caixa de pesquisa para filtrar, você pode usar esta caixa de seleção para selecionar todos os campos visíveis de uma vez.
-
Selecionar Campos: Selecione as caixas de seleção dos campos que você deseja incluir na consulta para que eles sejam adicionados automaticamente à instrução SELECT na String da Consulta. Você também pode Selecionar Todos os campos de uma vez usando a caixa de seleção.
-
Paginação: Para adicionar uma cláusula de paginação (um limite no número de registros com um deslocamento opcional), você pode usar o menu suspenso para definir o limite de paginação e o campo para inserir um deslocamento. Se um deslocamento não for especificado, o padrão é 0. Uma única cláusula de paginação é suportada. Se a cláusula de paginação não for incluída, todos os registros são retornados.
-
Aplicar: Clique para construir automaticamente a cláusula com base nas seleções do menu suspenso e no valor inserido. A cláusula de paginação construída automaticamente aparece na caixa de texto da String da Consulta.
-
Remover: Clique para remover uma cláusula de paginação que foi aplicada.
-
-
Condições: Para adicionar cláusulas condicionais, use os campos abaixo como entrada para ajudar a construir as cláusulas, que então aparecem na caixa de texto da String da Consulta.
-
Objeto: Campo: Use o menu suspenso para selecionar um campo do objeto selecionado.
-
Operador: Use o menu suspenso para selecionar um operador que seja apropriado para o tipo de dado do campo:
Operador Rótulo Descrição = Igual != Diferente LIKE 'string' Como Como string LIKE 'string%' Começa com Começa com string LIKE '%string' Termina com Termina com string LIKE '%string%' Contém Contém string < Menor que <= Menor ou igual > Maior que >= Maior ou igual
-
-
Valor: Insira o valor desejado a ser utilizado com as seleções do dropdown.
-
Adicionar: Clique para construir automaticamente a cláusula com base nas seleções do dropdown e no valor inserido. A cláusula condicional é adicionada à caixa de texto String de Consulta.
-
Remover Todos: Clique para remover todas as cláusulas condicionais inseridas.
-
String de Consulta: À medida que você seleciona campos, especifica condições e define paginação, a declaração de consulta nesta caixa de texto é preenchida automaticamente com os campos selecionados, condições e limites de paginação.
-
Testar Consulta: Clique para validar a consulta. Se a consulta for válida, um máximo de 50 registros recuperados da consulta é exibido em uma tabela. Se a consulta não for válida, mensagens de erro relevantes são exibidas.
Nota
Durante a execução, o limite de 50 registros não é aplicado, a menos que seja especificado no campo Paginação (descrito anteriormente).
-
Voltar: Clique para armazenar temporariamente a configuração para esta etapa e retornar à etapa anterior.
-
Próximo: Clique para armazenar temporariamente a configuração para esta etapa e continuar para a próxima etapa. A configuração não será salva até que você clique no botão Concluído na última etapa.
-
Descartar Alterações: Após fazer alterações, clique para fechar a configuração sem salvar as alterações feitas em qualquer etapa. Uma mensagem pede para você confirmar que deseja descartar as alterações.
Etapa 4: Revisar os esquemas de dados
Quaisquer esquemas de solicitação ou resposta gerados a partir do endpoint são exibidos. Cada elemento da interface do usuário desta etapa é descrito abaixo.
-
Esquemas de Dados: Esses esquemas de dados são herdados por transformações adjacentes e são exibidos novamente durante o mapeamento de transformação.
Nota
Os dados fornecidos em uma transformação têm prioridade sobre a configuração da atividade.
O conector Amazon Redshift utiliza o Amazon Redshift JDBC Driver versão 2.1.0.28 e os Comandos SQL do Amazon Redshift. Consulte a documentação do Amazon Redshift e a documentação do Visão Geral do Sistema Amazon Redshift para informações adicionais.
O esquema de dados da resposta depende da consulta que foi especificada. Neste exemplo, consiste nos seguintes nós e campos:
-
Resposta
Campo/Nó do Esquema de Resposta Notas accounts
Nó das contas sendo consultadas balance
Valor da conta consultada id
ID da conta consultada name
Nome da conta consultada
-
-
Atualizar: Clique no ícone de atualizar ou na palavra Atualizar para regenerar esquemas do endpoint do Amazon Redshift. Esta ação também regenera um esquema em outros locais ao longo do projeto onde o mesmo esquema é referenciado, como em uma transformação adjacente.
-
Voltar: Clique para armazenar temporariamente a configuração para esta etapa e retornar à etapa anterior.
-
Concluído: Clique para salvar a configuração de todas as etapas e fechar a configuração da atividade.
-
Descartar Alterações: Após fazer alterações, clique para fechar a configuração sem salvar as alterações feitas em qualquer etapa. Uma mensagem pede para você confirmar que deseja descartar as alterações.
Próximas etapas
Após configurar uma atividade de Consulta do Amazon Redshift, complete a configuração da operação adicionando e configurando outras atividades ou ferramentas como etapas da operação. Você também pode configurar as configurações da operação, que incluem a capacidade de encadear operações que estão no mesmo ou em diferentes fluxos de trabalho.
As ações de menu para uma atividade estão acessíveis a partir do painel do projeto e da tela de design. Para detalhes, veja o menu de ações da atividade em Noções básicas sobre conectores.
As atividades Query do Amazon Redshift podem ser usadas como uma fonte com esses padrões de operação:
- Padrão de transformação
- Padrão de arquivo com dois alvos (apenas como a primeira fonte)
- Padrão de arquivo HTTP com dois alvos (apenas como a primeira fonte)
- Padrão de duas transformações (apenas como a primeira fonte)
Para usar a atividade com funções de script, escreva os dados em um local temporário e, em seguida, use esse local temporário na função de script.
Quando estiver pronto, implante e execute a operação e valide o comportamento verificando os logs da operação.