Adicionar número de série para atividade de cópia ao blob

Question

Patterson

Asked: 2025-02-24 21:34:44 +0800 CST2025-02-24 21:34:44 +0800 CST 2025-02-24 21:34:44 +0800 CST

Conexões de fluxos de trabalho do Databricks com recursos locais

772

Tenho revisado os fluxos de trabalho do Databricks. Li muitos blogs sobre os fluxos de trabalho do Databricks, mas não consigo encontrar nenhuma revisão comparando os fluxos de trabalho ao Azure Data Factory. Pode ser que os dois serviços sejam completamente diferentes, mas penso que os fluxos de trabalho estão posicionados para fazer o trabalho do ADF.

Alguém pode me informar se, por exemplo, os Workflows têm o mesmo número de conectores que o ADF? É possível conectar-se a um SQL Server local similar à maneira como você pode se conectar a um SQL Server/banco de dados local com o agente Self-Hosted Runtime do ADF?

1 respostas

Voted

Dileep Raj Narayan Thumula · Answer 1 · 2025-02-25T17:47:32+08:00

Os fluxos de trabalho do Azure Data Factory (ADF) e do Databricks atendem a propósitos diferentes e têm recursos diferentes.

Azure Data Factory: O Azure Data Factory é usado principalmente para integração, migração e orquestração de dados, fornecendo uma plataforma para conectar, ingerir e preparar dados de várias fontes.

Databricks Workflows: Os Databricks Workflows fornecem uma solução de orquestração totalmente gerenciada que é perfeitamente integrada à plataforma Databricks. É acessível por meio de várias interfaces, incluindo a IU de Workflows, APIs poderosas e a CLI do Databricks. Isso permite que os usuários projetem, executem, monitorem e solucionem problemas de pipelines de dados sem o fardo de gerenciar a infraestrutura. Com recursos de monitoramento integrados, como visualizações de tabela e matriz de execuções de fluxo de trabalho, ele permite a rápida identificação e resolução de problemas.

Os fluxos de trabalho do Databricks são perfeitos para gerenciar as partes de transformação e processamento do seu pipeline de dados, especialmente quando todo o trabalho pesado acontece dentro do Databricks. Se seus dados já estiverem armazenados no Azure Data Lake (ADLS), você poderá facilmente lê-los, processá-los e gravá-los de volta sem precisar de uma ferramenta de orquestração externa.

Você também pode usar fluxos de trabalho para extrair dados de fontes de nuvem, APIs da web ou outras plataformas compatíveis com o Databricks, o que o torna uma opção flexível para lidar com pipelines de dados.

Como você mencionou

capacidade de se conectar a um SQL Server local da mesma forma que você pode se conectar a um SQL Server/banco de dados local com o agente de tempo de execução auto-hospedado do ADF?

Se você precisar extrair dados de fontes locais que exigem um tempo de execução de integração auto-hospedado ou de fontes de dados que os conectores JDBC do Databricks não manipulam com eficiência, é melhor usar uma ferramenta ETL dedicada, como o Azure Data Factory, para o trabalho.

Referência: Orquestração - Databricks Workflow VS Azure Data Factory Databricks Workflow: Um serviço de orquestração totalmente gerenciado para Lakehouse

Conexões de fluxos de trabalho do Databricks com recursos locais

Reformatar números, inserindo separadores em posições fixas

Por que os conceitos do C++20 causam erros de restrição cíclica, enquanto o SFINAE antigo não?

Problema com extensão desinstalada automaticamente do VScode (tema Material)

Vue 3: Erro na criação "Identificador esperado, mas encontrado 'import'" [duplicado]

Qual é o propósito de `enum class` com um tipo subjacente especificado, mas sem enumeradores?

Como faço para corrigir um erro MODULE_NOT_FOUND para um módulo que não importei manualmente?

`(expression, lvalue) = rvalue` é uma atribuição válida em C ou C++? Por que alguns compiladores aceitam/rejeitam isso?

Um programa vazio que não faz nada em C++ precisa de um heap de 204 KB, mas não em C

PowerBI atualmente quebrado com BigQuery: problema de driver Simba com atualização do Windows

AdMob: MobileAds.initialize() - "java.lang.Integer não pode ser convertido em java.lang.String" para alguns dispositivos

Conexões de fluxos de trabalho do Databricks com recursos locais

1 respostas

relate perguntas