Eu uso uma transformação de coluna derivada para substituir um valor assim que uma condição em duas outras colunas for atendida. Como posso ver no fluxo de dados com que frequência um valor muda com essa substituição? Existe uma maneira de mostrar isso na seta de saída ou de que outra forma posso mostrar as alterações dentro do fluxo de dados?
PS (não necessário para perguntas e respostas)
Quero verificar se a entrada da string é igual à saída da pesquisa. Mas às vezes, nomes (nomes e sobrenomes) têm mais de um nome no valor, como Taylor-Smith contra Smith ou Bob Thomas contra Bob. As pessoas podem se casar ou, às vezes, preencher seus dois primeiros nomes, de modo que os dados podem não corresponder a duas contas de dados mestre.
(DT_BOOL)(FINDSTRING(name,[Lookup.name],1)) ? 1 : [score_name]
O valor da coluna score_name
é substituído 1
assim que for name
encontrado dentro de Lookup.name
, caso contrário o valor é mantido entre 0 e 1.
"Nome na pesquisa?":
Você poderia pegar qualquer outro exemplo, como Substituir valores da coluna? , a questão não depende do que é feito.
Melhor escolha: Criar novas colunas é mais fácil do que substituir colunas
Em vez de substituir colunas, é muito mais fácil criar novas Colunas Derivadas para cada condição sem qualquer Divisão Condicional e então mostrar o número de alterações dos valores entre o antigo e o novo após um Multicast e uma Divisão Condicional. Se você quiser substituir uma coluna, basta descartar a antiga e manter a nova.
Não recomendado: divisão e mesclagem condicional
Faça uma divisão condicional e divida os dados pela condição:
Existem pelo menos duas setas de saída cinza:
As setas de saída mostram o número de linhas da divisão no fluxo de dados, que é o objetivo em questão, e a divisão evita substituir 1 por 1 (no meu exemplo) para que você possa ver quantos valores mudam pela substituição . Para a substituição, crie uma Coluna Derivada para a seta de saída onde a condição é atendida e substitua o valor por 1 (no meu exemplo). Não há mais nenhuma condição necessária, pois isso foi feito pela Divisão Condicional. Depois, classifique ambos pela mesma chave e use o componente Merge para anexá-los novamente.
Se você tiver três setas de saída cinza, precisará de dois componentes Merge seguidos para reunir tudo em um conjunto de dados novamente.
Eu tinha 8 condições que foram construídas em cima de quatro condições principais e as dividi em quatro rodadas, e essa configuração se tornou uma confusão de componentes. Eu não posso recomendar isso.