Northwind — Engenharia de Analytics

Este repositório é o ponto de partida utilizado no livro Engenharia de Analytics para praticar:

A preparação do ambiente descrita no Capítulo 12 (Databricks + GitHub + dbt Cloud).
A modelagem dimensional guiada no Capítulo 15, com dbt executando os modelos Northwind.

O código aqui presente contém as seeds com os dados da Northwind. A branch de recursos a estrutura de staging, intermediate e marts e os exemplos de testes/documentação mostrados no livro. Use‑o como referência ou como base para seu fork ao longo dos capítulos.

Capítulo 12 – Configurando o ambiente

12.1 Databricks (Seção {ref}`config_ambiente`)

Crie uma conta Free Edition no Databricks e use o Serverless Starter Warehouse.
No menu Catalog, crie os catálogos raw, dev e prod para isolar os ambientes conforme indicado no livro.
Gere dois Access Tokens em User Settings → Developer: dbt-developer (para desenvolvimento) e dbt-production (para o target prod).
Anote o Server Hostname e o HTTP Path disponíveis na aba Connection details do warehouse; eles serão usados pelo dbt.

12.2 GitHub (Seção {ref}`github`)

Faça login no GitHub e crie um fork de github.com/engdeanalytics/northwind.
Guarde a URL do seu fork (https://github.com/<usuario>/<repo>); ela será conectada ao dbt Cloud.
Opcional: clone o seu fork (git clone ...) para acompanhar o código localmente e adicione o upstream apontando para o repositório oficial.

12.3 dbt Cloud (Seção {ref}`dbt_platform`)

No dbt Cloud, crie um novo projeto e escolha Databricks como plataforma.
Informe Host, HTTP Path, Token (dbt-developer) e o catálogo dev. Use um schema exclusivo, como dbt_<seu_usuario>.
Conecte o fork criado na etapa anterior e finalize o assistente.
No dbt Cloud IDE, rode dbt deps, dbt seed (caso ainda não tenha carregado os dados) e dbt run/dbt test para validar o ambiente conforme o capítulo.

Usando dbt Core + VS Code com Databricks

Se preferir replicar as etapas do capítulo 15 localmente (dbt Core + VS Code), siga o fluxo orientado no livro:

Preparação
- Tenha Python 3.8+ instalado e crie um ambiente virtual: python -m venv .venv && source .venv/bin/activate.
- Instale o adaptador Databricks: pip install dbt-databricks.
- Clone o fork deste repositório e abra a pasta /northwind no VS Code.

Profile do dbt

No arquivo ~/.dbt/profiles.yml, configure o profile northwind com os valores coletados na Seção 12.1:

northwind:
  target: dev
  outputs:
    dev:
	  type: databricks
	  catalog: dev
	  schema: dbt_<seu_usuario>
	  host: adb-XXXXXXXXXXXX.azuredatabricks.net
	  http_path: /sql/1.0/warehouses/<WAREHOUSE_ID>
	  token: dapiXXXXXXXXXXXXXXXX
	  threads: 4

Quando for promover para produção, adicione o target prod reutilizando o token dbt-production e o catálogo prod.

VS Code
- Selecione o interpretador Python do .venv e use o terminal integrado para executar os comandos dbt.
- Extensões úteis: Python, SQLTools e dbt Power User para navegação rápida entre modelos.
Execução
- Valide a conexão com dbt debug.
- Carregue as seeds (dbt seed) exatamente como demonstrado no capítulo.

Ao seguir estas instruções você reproduz o laboratório completo descrito no livro, usando o Databricks como data warehouse e o projeto Northwind como base de código única para o Capítulo 12 e para os exercícios de modelagem do Capítulo 15.

Name		Name	Last commit message	Last commit date
Latest commit History 17 Commits
analyses		analyses
macros		macros
models/example		models/example
seeds		seeds
snapshots		snapshots
tests		tests
.gitignore		.gitignore
README.md		README.md
dbt_project.yml		dbt_project.yml

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Northwind — Engenharia de Analytics

Capítulo 12 – Configurando o ambiente

12.1 Databricks (Seção {ref}`config_ambiente`)

12.2 GitHub (Seção {ref}`github`)

12.3 dbt Cloud (Seção {ref}`dbt_platform`)

Usando dbt Core + VS Code com Databricks

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Folders and files

Latest commit

History

Repository files navigation

Northwind — Engenharia de Analytics

Capítulo 12 – Configurando o ambiente

12.1 Databricks (Seção {ref}config_ambiente)

12.2 GitHub (Seção {ref}github)

12.3 dbt Cloud (Seção {ref}dbt_platform)

Usando dbt Core + VS Code com Databricks

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

12.1 Databricks (Seção {ref}`config_ambiente`)

12.2 GitHub (Seção {ref}`github`)

12.3 dbt Cloud (Seção {ref}`dbt_platform`)

Packages