Python · Open Source · PyPI
CEPEA, CONAB, IBGE, NASA POWER, USDA, B3 e mais 34 fontes — 40 origens, uma API unificada com fallback automático, cache inteligente e contratos versionados.
Prova, não promessa
O painel ao lado não é mockup: o CEPEA divulga, o agrobr busca, a página atualiza — todo pregão, com fallback automático, cache DuckDB e contrato validado.
from agrobr import datasets
df = await datasets.preco_diario("soja")
# 10 pregões · CEPEA → Notícias Agrícolas → cache
Camada Semântica
Datasets abstraem múltiplas fontes com fallback automático. Quando CEPEA retorna 403, o agrobr busca Notícias Agrícolas. Quando o servidor cai, serve do cache.
Infraestrutura
Fonte primária falha → tenta secundária → serve do cache. Transparente.
Cache local para CEPEA indicadores (smart TTL, expira 18h). Snapshots opcionais para reprodutibilidade.
Schema garantido por dataset. Breaking changes só em major. Semver.
httpx nativo com sync wrapper. Funciona em Jupyter, FastAPI e Airflow.
Modelos tipados. Sanity checks estatísticos. Fingerprinting de layout.
Reprodutibilidade total via contextvars. Para papers e auditorias.
Fontes de dados
Cada fonte tem seu próprio parser com versionamento, fingerprinting e tratamento de encoding. Você só vê o DataFrame.
em âmbar: licença não-comercial ou restrita — detalhes em docs/licenses
Começar
MIT License (código). 6.400+ testes passando. 40 fontes. 36 datasets.