Atividade Upsert do Amazon Redshift
Introdução
Uma atividade Upsert do Amazon Redshift, utilizando sua conexão do Amazon Redshift, atualiza um objeto existente ou cria um novo objeto no Amazon Redshift, e é destinada a ser usada como um alvo para consumir dados em uma operação.
Criar uma atividade Upsert do Amazon Redshift
Uma instância de uma atividade Upsert do Amazon Redshift é criada a partir de uma conexão do Amazon Redshift usando seu tipo de atividade Upsert.
Para criar uma instância de uma atividade, arraste o tipo de atividade para a tela de design ou copie o tipo de atividade e cole-o na tela de design. Para detalhes, veja Criar uma instância de atividade ou ferramenta em Reutilização de componentes.
Uma atividade Upsert do Amazon Redshift existente pode ser editada a partir destes locais:
- A tela de design (veja Menu de ações do componente em Tela de design).
- A aba Componentes do painel do projeto (veja Menu de ações do componente em Aba Componentes do painel do projeto).
Configurar uma atividade Upsert do Amazon Redshift
Siga estas etapas para configurar uma atividade Upsert do Amazon Redshift:
-
Etapa 1: Insira um nome e selecione um esquema
Forneça um nome para a atividade e selecione um esquema. -
Etapa 2: Selecione uma tabela
Selecione a tabela contendo o registro que deve ser upsertado. -
Etapa 3: Revise os esquemas de dados
Quaisquer esquemas de solicitação ou resposta gerados a partir do endpoint são exibidos.
Passo 1: Insira um nome e selecione um esquema
Neste passo, forneça um nome para a atividade e selecione um esquema. Cada elemento da interface do usuário deste passo é descrito abaixo.
-
Nome: Insira um nome para identificar a atividade. O nome deve ser exclusivo para cada atividade Upsert do Amazon Redshift e não deve conter barras (
/
) ou dois pontos (:
). -
Selecionar um Esquema: Esta seção exibe os esquemas disponíveis no endpoint do Amazon Redshift. Ao reabrir uma configuração de atividade existente, apenas o esquema selecionado é exibido em vez de recarregar toda a lista de esquemas.
-
Nome do Esquema Selecionado: Após um esquema ser selecionado, ele é listado aqui.
-
Pesquisar: Insira o valor de qualquer coluna na caixa de pesquisa para filtrar a lista de esquemas. A pesquisa não diferencia maiúsculas de minúsculas. Se os esquemas já estiverem exibidos na tabela, os resultados da tabela são filtrados em tempo real a cada tecla pressionada. Para recarregar esquemas do endpoint ao pesquisar, insira os critérios de pesquisa e, em seguida, atualize, conforme descrito abaixo.
-
Atualizar: Clique no ícone de atualizar ou na palavra Atualizar para recarregar esquemas do endpoint do Amazon Redshift. Isso pode ser útil se esquemas foram adicionados ao Amazon Redshift. Esta ação atualiza todos os metadados usados para construir a tabela de esquemas exibida na configuração.
-
Selecionando um Esquema: Dentro da tabela, clique em qualquer lugar de uma linha para selecionar um esquema. Apenas um esquema pode ser selecionado. As informações disponíveis para cada esquema são obtidas do endpoint do Amazon Redshift:
- Esquema: O nome do esquema do Amazon Redshift.
Dica
Se a tabela não for preenchida com esquemas disponíveis, a conexão do Amazon Redshift pode não ter sido bem-sucedida. Certifique-se de que você está conectado reabrindo a conexão e testando novamente as credenciais.
-
-
Salvar e Sair: Se habilitado, clique para salvar a configuração para esta etapa e fechar a configuração da atividade.
-
Próximo: Clique para armazenar temporariamente a configuração para esta etapa e continuar para a próxima etapa. A configuração não será salva até que você clique no botão Concluído na última etapa.
-
Descartar Alterações: Após fazer alterações, clique para fechar a configuração sem salvar as alterações feitas em qualquer etapa. Uma mensagem pede para você confirmar que deseja descartar as alterações.
Etapa 2: Selecionar uma tabela
Nesta etapa, selecione uma tabela. Cada elemento da interface do usuário desta etapa é descrito abaixo.
-
Selecionar uma Tabela: Esta seção exibe as tabelas disponíveis no endpoint do Amazon Redshift. Ao reabrir uma configuração de atividade existente, apenas a tabela selecionada é exibida em vez de recarregar toda a lista de tabelas.
-
Nome do Esquema Selecionado: O nome do esquema selecionado na etapa anterior é listado aqui.
-
Selecionar Nome da Tabela: Após uma tabela ser selecionada, ela é listada aqui.
-
Pesquisar: Insira o valor de qualquer coluna na caixa de pesquisa para filtrar a lista de tabelas. A pesquisa não diferencia maiúsculas de minúsculas. Se as tabelas já estiverem exibidas dentro da tabela, os resultados da tabela são filtrados em tempo real a cada tecla pressionada. Para recarregar tabelas do endpoint ao pesquisar, insira os critérios de pesquisa e, em seguida, atualize, conforme descrito abaixo.
-
Atualizar: Clique no ícone de atualizar ou na palavra Atualizar para recarregar tabelas do endpoint do Amazon Redshift. Isso pode ser útil se tabelas foram adicionadas ao Amazon Redshift. Esta ação atualiza todos os metadados usados para construir a tabela de tabelas exibida na configuração.
-
Selecionando uma Tabela: Dentro da tabela, clique em qualquer lugar em uma linha para selecionar uma tabela. Apenas uma tabela pode ser selecionada. As informações disponíveis para cada tabela são obtidas do endpoint do Amazon Redshift:
-
Nome da Tabela: O nome da tabela do Amazon Redshift.
-
Esquema: O nome do esquema do Amazon Redshift.
-
Catálogo: O nome do catálogo do Amazon Redshift.
-
Dica
Se a tabela não for preenchida com tabelas disponíveis, a conexão do Amazon Redshift pode não ter sido bem-sucedida. Certifique-se de que está conectado reabrindo a conexão e testando novamente as credenciais.
-
-
Voltar: Clique para armazenar temporariamente a configuração para esta etapa e retornar à etapa anterior.
-
Próximo: Clique para armazenar temporariamente a configuração para esta etapa e continuar para a próxima etapa. A configuração não será salva até que você clique no botão Concluído na última etapa.
-
Descartar Alterações: Após fazer alterações, clique para fechar a configuração sem salvar as alterações feitas em qualquer etapa. Uma mensagem solicita que você confirme que deseja descartar as alterações.
Etapa 3: Revisar os esquemas de dados
Quaisquer esquemas de solicitação ou resposta gerados a partir do endpoint são exibidos. Cada elemento da interface do usuário desta etapa é descrito abaixo.
-
Esquemas de Dados: Esses esquemas de dados são herdados por transformações adjacentes e são exibidos novamente durante o mapeamento de transformação.
Nota
Os dados fornecidos em uma transformação têm precedência sobre a configuração da atividade.
O conector do Amazon Redshift utiliza o Driver JDBC do Amazon Redshift versão 2.1.0.28 e Comandos SQL do Amazon Redshift. Consulte a documentação do Amazon Redshift e a documentação do Visão Geral do Sistema do Amazon Redshift para informações adicionais.
Os esquemas de dados de solicitação e resposta consistem nestes nós e campos.
Nota
Os esquemas de dados de solicitação e resposta variam dependendo da tabela que está sendo retornada:
-
Solicitação
Campo/Nó do Esquema de Solicitação Notas accounts
Nó da tabela a ser upsertada name
Nome da conta a ser upsertada balance
Valor da conta a ser upsertada -
Resposta
Campo/Nó do Esquema de Resposta Notas accounts
Nó representando a tabela selecionada em Passo 2: Selecionar uma tabela desc
String contendo o número de linhas atualizadas com sucesso error
Mensagem em string descrevendo qualquer erro, se encontrado status
Booleano indicando sucesso ou falha
-
-
Atualizar: Clique no ícone de atualizar ou na palavra Atualizar para regenerar esquemas do endpoint do Amazon Redshift. Esta ação também regenera um esquema em outros locais ao longo do projeto onde o mesmo esquema é referenciado, como em uma transformação adjacente.
-
Voltar: Clique para armazenar temporariamente a configuração para esta etapa e retornar à etapa anterior.
-
Concluído: Clique para salvar a configuração para todas as etapas e fechar a configuração da atividade.
-
Descartar Alterações: Após fazer alterações, clique para fechar a configuração sem salvar as alterações feitas em qualquer etapa. Uma mensagem pede para você confirmar que deseja descartar as alterações.
Próximas etapas
Após configurar uma atividade de Upsert do Amazon Redshift, complete a configuração da operação adicionando e configurando outras atividades ou ferramentas como etapas da operação. Você também pode configurar as definições da operação, que incluem a capacidade de encadear operações que estão no mesmo ou em diferentes fluxos de trabalho.
As ações do menu para uma atividade estão acessíveis a partir do painel do projeto e da tela de design. Para mais detalhes, consulte o menu de ações da atividade em Conceitos básicos do conector.
As atividades de Upsert do Amazon Redshift podem ser usadas como um destino com esses padrões de operação:
- Padrão de transformação
- Padrão de duas transformações (como o primeiro ou segundo destino)
Para usar a atividade com funções de script, escreva os dados em um local temporário e, em seguida, use esse local temporário na função de script.
Quando estiver pronto, implante e execute a operação e valide o comportamento verificando os logs da operação.