Ir para o conteúdo

Atividade de Cópia do Amazon Redshift

Introdução

Uma atividade Copy do Amazon Redshift, usando sua conexão do Amazon Redshift, insere registros em uma tabela no Amazon Redshift e deve ser usado como destino para consumir dados em uma operação.

Criar uma Atividade de Cópia do Amazon Redshift

Uma instância de uma atividade Copy do Amazon Redshift é criada a partir de uma conexão do Amazon Redshift usando seu tipo de atividade Copy.

Para criar uma instância de uma atividade, arraste o tipo de atividade para a quadro de design ou copie o tipo de atividade e cole-o na quadro de design. Para obter detalhes, consulte Criando uma instância de atividade em Reutilização de componentes.

Uma atividade Copy existente do Amazon Redshift pode ser editada nestes locais:

Configurar uma Atividade de Cópia do Amazon Redshift

Siga estas etapas para configurar uma atividade Copy do Amazon Redshift:

Etapa 1: Insira um Nome e Selecione um Esquema

Nesta etapa, forneça um nome para a atividade e selecione um esquema. Cada elemento da interface do usuário desta etapa é descrito abaixo.

Etapa 1 da configuração da atividade de cópia do Amazon Redshift

  • Nome: Insira um nome para identificar a atividade. O nome deve ser exclusivo para cada atividade Copy do Amazon Redshift e não deve conter barras (/) ou dois pontos (:).

  • Selecione um esquema: Esta seção exibe esquemas disponíveis no endpoint do Amazon Redshift. Ao reabrir uma configuração de atividade existente, apenas o esquema selecionado é exibido em vez de recarregar toda a lista de esquema.

    • Nome do esquema selecionado: Depois que um esquema é selecionado, ele é listado aqui.

    • Pesquisa: Insira o valor de qualquer coluna na caixa de pesquisa para filtrar a lista de esquemas. A busca não diferencia maiúsculas de minúsculas. Se os esquemas já estiverem exibidos na tabela, os resultados da tabela serão filtrados em tempo real a cada pressionamento de tecla. Para recarregar esquemas do endpoint durante a pesquisa, insira os critérios de pesquisa e atualize, conforme descrito abaixo.

    • Atualizar: Clique no ícone de atualização Ícone de atualização ou a palavra Atualizar para recarregar esquemas do endpoint do Amazon Redshift. Isso pode ser útil se esquemas tiverem sido adicionados ao Amazon Redshift. Esta ação atualiza todos os metadados usados para construir a tabela de esquemas exibidos na configuração.

    • Selecionando um esquema: Na tabela, clique em qualquer lugar de uma linha para selecionar um esquema. Apenas um esquema pode ser selecionado. As informações disponíveis para cada esquema são obtidas no endpoint do Amazon Redshift:

    Dica

    Se a tabela não for preenchida com esquemas disponíveis, a conexão do Amazon Redshift pode não ser bem-sucedido. Certifique-se de que você esteja conectado reabrindo a conexão e testando novamente as credenciais.

  • Salvar e sair: Se habilitado, clique para salvar a configuração para esta etapa e fechar a configuração da atividade.

  • Próximo: Clique para armazenar temporariamente a configuração para esta etapa e continuar para a próxima etapa. A configuração não será salva até que você clique no botão Concluído na última etapa.

  • Descartar alterações: Após fazer alterações, clique para fechar a configuração sem salvar as alterações feitas em nenhuma etapa. Uma mensagem solicita que você confirme que deseja descartar as alterações.

Etapa 2: Selecione uma Tabela

Nesta etapa, selecione uma tabela. Cada elemento da interface do usuário desta etapa é descrito abaixo.

Etapa 2 da configuração da atividade de cópia do Amazon Redshift

  • Selecione uma tabela: Esta seção exibe tabelas disponíveis no endpoint do Amazon Redshift. Ao reabrir uma configuração de atividade existente, apenas a tabela selecionada é exibida em vez de recarregar toda a lista de tabelas.

    • Nome do esquema selecionado: O nome do esquema selecionado na etapa anterior está listado aqui.

    • Selecione o nome da tabela: Depois que uma tabela é selecionada, ela é listada aqui.

    • Pesquisa: Insira o valor de qualquer coluna na caixa de pesquisa para filtrar a lista de tabelas. A busca não diferencia maiúsculas de minúsculas. Se as tabelas já estiverem exibidas na tabela, os resultados da tabela serão filtrados em tempo real a cada pressionamento de tecla. Para recarregar tabelas do endpoint durante a pesquisa, insira os critérios de pesquisa e atualize, conforme descrito abaixo.

    • Atualizar: Clique no ícone de atualização Ícone de atualização ou a palavra Atualizar para recarregar tabelas do endpoint do Amazon Redshift. Isso pode ser útil se tabelas tiverem sido adicionadas ao Amazon Redshift. Esta ação atualiza todos os metadados usados para construir a tabela de tabelas exibida na configuração.

    • Selecionando uma tabela: Dentro da tabela, clique em qualquer lugar de uma linha para selecionar uma tabela. Apenas uma tabela pode ser selecionada. As informações disponíveis para cada tabela são obtidas no endpoint do Amazon Redshift:

    Dica

    Se a tabela não for preenchida com tabelas disponíveis, a conexão do Amazon Redshift pode não ser bem-sucedido. Certifique-se de que você esteja conectado reabrindo a conexão e testando novamente as credenciais.

  • Voltar: Clique para armazenar temporariamente a configuração desta etapa e retornar à etapa anterior.

  • Próximo: Clique para armazenar temporariamente a configuração desta etapa e continuar para a próxima etapa. A configuração não será salva até que você clique no botão Concluído na última etapa.

  • Descartar alterações: Após fazer alterações, clique para fechar a configuração sem salvar as alterações feitas em nenhuma etapa. Uma mensagem solicita que você confirme que deseja descartar as alterações.

Etapa 3: Especifique as Configurações

Nesta etapa, especifique as configurações do bucket AWS desejado. Cada elemento da interface do usuário desta etapa é descrito abaixo.

Etapa 3 da configuração da atividade de cópia do Amazon Redshift

Dica

Campos com um ícone de variável Ícone de variável suporte usando variáveis globais, variáveis do projeto e variáveis Jitterbit. Comece digitando um colchete aberto [ no campo ou clicando no ícone da variável para exibir uma lista das variáveis existentes para escolher.

  • Abordagem: Especifique a abordagem de credenciais a ser usada para o bucket AWS, uma entre Baseada em função ou Baseada em chave:.

    • Baseado em função: Se estiver usando a abordagem Baseada em função para acessar o bucket da AWS:

      • Credenciais Função IAM: Insira a papel IAM associada às credenciais.
    • Baseado em chave: Se estiver usando a abordagem Baseada em chave para acessar o bucket da AWS:

      • ID da chave de acesso da AWS: Insira o ID da chave de acesso da AWS.
      • Chave de acesso secreta da AWS: Insira a chave de acesso secreta da AWS.
  • De: Insira o bucket da Amazon do qual os dados serão copiados.

  • Região: Insira a região Amazon do bucket de onde os dados serão copiados.

  • Delimitador: Insira o delimitador que será usado ao copiar os dados.

  • Voltar: Clique para armazenar temporariamente a configuração desta etapa e retornar à etapa anterior.

  • Próximo: Clique para armazenar temporariamente a configuração desta etapa e continuar para a próxima etapa. A configuração não será salva até que você clique no botão Concluído na última etapa.

  • Descartar alterações: Após fazer as alterações, clique para fechar a configuração sem salvar as alterações feitas em nenhuma etapa. Uma mensagem solicita que você confirme que deseja descartar as alterações.

Etapa 4: Revise os Esquemas de Dados

Quaisquer esquemas de solicitação ou resposta gerados a partir do endpoint serão exibidos. Cada elemento da interface do usuário desta etapa é descrito abaixo.

Etapa 4 da configuração da atividade de cópia do Amazon Redshift

  • Esquemas de dados: Esses esquemas de dados são herdados por transformações adjacentes e são exibidos novamente durante o mapeamento de transformação.

    Nota

    Os dados fornecidos em uma transformação têm precedência sobre a configuração da atividade.

    O conector Amazon Redshift usa o Driver JDBC do Amazon Redshift versão 2.1.0.28 e Comandos SQL do Amazon Redshift. Consulte a documentação do Amazon Redshift e a Visão geral do sistema Amazon Redshift documentação para informações adicionais.

    Os esquemas de dados de solicitação e resposta consistem nestes nós e campos:

    • Solicitação

      Campo/Nó do Esquema de Solicitação Notas
      accounts A tabela que foi selecionada para a qual os registros devem ser copiados
      approach A abordagem que foi selecionada em Etapa 3: Especificar configurações
      delimiter Identificadores delimitados começam e terminam com aspas duplas (")
      from O bucket do Amazon Redshift do qual os registros serão copiados
      awsSecretAccessKey Chave de acesso secreta da conta AWS especificada
      awsAccessKeyId ID da chave de acesso da conta AWS especificada
      iamRole papel IAM da conta AWS especificada
      region Região para a conta AWS especificada
    • Resposta

      Campo/Nó do Esquema de Resposta Notas
      accounts Nó que representa a tabela selecionada em Etapa 2: Selecionar uma tabela
      desc String contendo o número de linhas copiadas com sucesso
      error Mensagem de string descrevendo qualquer erro encontrado
      status Booleano indicando sucesso ou fracasso
  • Atualizar: Clique no ícone de atualização Ícone de atualização ou a palavra Atualizar para regenerar esquemas do endpoint do Amazon Redshift. Esta ação também regenera um esquema em outros locais do projeto onde o mesmo esquema é referenciado, como em uma transformação adjacente.

  • Voltar: Clique para armazenar temporariamente a configuração desta etapa e retornar à etapa anterior.

  • Concluído: Clique para salvar a configuração de todas as etapas e fechar a configuração da atividade.

  • Descartar alterações: Após fazer as alterações, clique para fechar a configuração sem salvar as alterações feitas em nenhuma etapa. Uma mensagem solicita que você confirme que deseja descartar as alterações.

Próximos Passos

Depois de configurar uma atividade Copy do Amazon Redshift, conclua a configuração da operação adicionando e configurando outras atividades, transformações ou scripts como etapas da operação. Você também pode definir as configurações de operação, que incluem a capacidade de encadear operações que estejam no mesmo fluxo de trabalho ou em workflows diferentes.

As ações de menu de uma atividade podem ser acessadas no painel do projeto e na quadro de design. Para obter detalhes, consulte menu de ações de atividades em Noções básicas do conector.

As atividades Copy do Amazon Redshift podem ser usadas como destino com estes padrões de operação:

Para usar a atividade com funções de script, grave os dados em um local temporário e use esse local temporário na função de script.

Quando estiver pronto, implantar e execute a operação e validar o comportamento verificando os logs de operação.