Adicionar número de série para atividade de cópia ao blob

Question

thichxai

Asked: 2024-12-23 10:04:43 +0800 CST2024-12-23 10:04:43 +0800 CST 2024-12-23 10:04:43 +0800 CST

O fluxo de dados ADF contém nomes de arquivos em um único coletor de arquivo

772

Estou comparando o título em movies.csv, que corresponde ao elemento title nos arquivos json, e então anexando o nome do arquivo a list.txt no sink. Suponha que "Big Hero" e "Moana" sejam correspondentes em file1.json e file5.json. No entanto, o ADF retorna tanto o file1.json quanto o file5.json inteiros para o sink.

Quero ver apenas os nomes de arquivo "file1.json" e "file5.json" em list.txt.

título.csv:

O Rei Leão
Grande Herói
Moana

o resultado final em list.txt (sink):

arquivo1.json
arquivo5.json

Configuração do fluxo de dados do ADF:

opção de origem>coluna para armazenar nome do arquivo>lista

derivedColumn1>Columns>Title e expressão lower(trim(record.metadata.Title))

lookup1>fluxo primário> derivedColumn1

lookup1>fluxo de pesquisa> sourceCSV

filter1>filtrar em> isNull(sourceCSV@title) == false()

sink>dados da coluna>lista

1 respostas

Voted

score 0 · Answer 1 · 2024-12-24T18:31:55+08:00

Best Answer

2024-12-24T18:31:55+08:002024-12-24T18:31:55+08:00

Quero ver apenas os nomes de arquivo "file1.json" e "file5.json" em list.txt.

Depois de obter as linhas necessárias, você pode usar a transformação select para obter apenas a filenamecoluna necessária.

Antes da pesquisa, certifique-se de que as linhas no seu arquivo csv de origem sejam alteradas para minúsculas usando uma transformação de coluna derivada.

insira a descrição da imagem aqui

Agora, depois de usar a transformação de filtro, use a transformação de seleção com mapeamento baseado em regras, conforme mostrado abaixo.

name=='filename'

insira a descrição da imagem aqui

Agora, adicione seu arquivo de texto como coletor no fluxo de dados e execute o fluxo de dados a partir do pipeline.

Ele irá gerar o arquivo de texto de destino conforme o esperado.

insira a descrição da imagem aqui

0

O fluxo de dados ADF contém nomes de arquivos em um único coletor de arquivo

Vue 3: Erro na criação "Identificador esperado, mas encontrado 'import'" [duplicado]

Por que esse código Java simples e pequeno roda 30x mais rápido em todas as JVMs Graal, mas não em nenhuma JVM Oracle?

Qual é o propósito de `enum class` com um tipo subjacente especificado, mas sem enumeradores?

Como faço para corrigir um erro MODULE_NOT_FOUND para um módulo que não importei manualmente?

`(expression, lvalue) = rvalue` é uma atribuição válida em C ou C++? Por que alguns compiladores aceitam/rejeitam isso?

Quando devo usar um std::inplace_vector em vez de um std::vector?

Um programa vazio que não faz nada em C++ precisa de um heap de 204 KB, mas não em C

PowerBI atualmente quebrado com BigQuery: problema de driver Simba com atualização do Windows

AdMob: MobileAds.initialize() - "java.lang.Integer não pode ser convertido em java.lang.String" para alguns dispositivos

Estou tentando fazer o jogo pacman usando apenas o módulo Turtle Random e Math

O fluxo de dados ADF contém nomes de arquivos em um único coletor de arquivo

1 respostas

relate perguntas