Pular para o conteúdo principal

Tutorial de BigQuery para iniciantes: da configuração à primeira consulta

Entenda o que é o BigQuery, como ele funciona, suas diferenças em relação a data warehouses tradicionais e como usar o console do BigQuery para consultar datasets públicos fornecidos pelo Google.
Atualizado 21 de mai. de 2026  · 9 min lido

Meu contato com big data começou há mais de 10 anos, quando eu era engenheiro de software em Ad-Tech. Naquela época, os conjuntos de dados começaram a crescer rápido e explodir de tamanho. Ao mesmo tempo, isso trouxe uma grande oportunidade — e também um desafio. Consultas para responder perguntas básicas, porém essenciais, de relatórios passaram a levar horas.

Como resposta, passei a usar bancos de dados orientados a colunas, como o BigQuery, em 2013. Por serem baseados em nuvem, eles nos permitiram executar cargas analíticas com bom desempenho e custo-benefício, além de escalar recursos quando necessário. Nos últimos anos, liderei um grande time de engenheiros de dados que construiu um data warehouse no BigQuery com mais de 10 PB para acompanhar um catálogo em rápido crescimento de produtos para casa e necessidades analíticas cada vez maiores.

Hoje, como CTO da DataCamp, lidero times de engenharia e de conteúdo que ajudam nossos usuários a aprender e praticar exatamente essas habilidades (entre muitas outras). Estou convencido de que data warehouses em nuvem, como o BigQuery, podem tornar muitos fluxos de trabalho muito mais eficientes. Por isso, quero compartilhar minhas experiências com você neste tutorial.

Neste guia, você vai aprender o que é o BigQuery, como ele funciona e em que ele difere dos data warehouses tradicionais. Você também vai aprender a usar o console do BigQuery para consultar conjuntos de dados públicos fornecidos pelo Google, com um exemplo prático de como consultar o Google Trends para acompanhar assuntos em alta.

Resumo (TL;DR)

  • O BigQuery é o data warehouse totalmente gerenciado e sem servidor do Google Cloud que permite consultar petabytes de dados usando SQL padrão
  • Ele separa armazenamento de computação, permitindo que cada um escale de forma independente, sem gestão de infraestrutura
  • O sandbox gratuito oferece 1 TiB de consultas por mês e acesso a datasets públicos, sem precisar de cartão de crédito
  • O BigQuery usa um formato de armazenamento colunar otimizado para cargas analíticas (OLAP), diferente de bancos orientados a linhas para OLTP
  • O BigQuery ML permite criar e implementar modelos de machine learning diretamente no warehouse usando SQL

O que é o BigQuery?

O BigQuery é um data warehouse totalmente gerenciado e sem servidor, desenvolvido pelo Google para armazenar e analisar dados em grande escala. As organizações o utilizam para executar consultas analíticas em petabytes de dados usando SQL, sem precisar gerenciar infraestrutura.

Você pode interagir com o BigQuery pelo console do Google Cloud, pela ferramenta de linha de comando bq ou por bibliotecas cliente para Python, Java, Go, Node.js, C#, PHP e Ruby.

O BigQuery também inclui machine learning integrado (BigQuery ML), que permite criar e executar modelos de ML diretamente no warehouse usando SQL. Você também pode importar modelos treinados externamente no Vertex AI ou em outros frameworks.

Este tutorial é voltado para analistas de dados, engenheiros de dados e administradores de data warehouse que estão começando com o BigQuery. Se quiser se aprofundar depois, nosso curso Introduction to BigQuery aborda otimização de consultas e fluxos de trabalho avançados. Você também pode conferir nosso guia do BigQuery Sandbox e o tutorial completo de data warehousing no GCP

Data warehouse tradicional vs. em nuvem

Um data warehouse tradicional é implantado on‑premise, normalmente exigindo altos custos iniciais, uma equipe qualificada para gerenciá-lo e planejamento rigoroso para atender ao aumento de demanda, devido à rigidez no escalonamento de recursos em data centers tradicionais.

Já um data warehouse em nuvem é gerenciado e hospedado por um provedor de serviços de nuvem. Exemplos incluem Google BigQuery, Amazon Redshift e Snowflake.

Vantagens dos data warehouses em nuvem

Normalmente, um data warehouse em nuvem oferece várias vantagens em relação aos tradicionais:

  • São projetados para escala e para aproveitar a flexibilidade do ambiente de nuvem
  • Apresentam mais velocidade e melhor desempenho
  • Preços flexíveis e o ambiente em nuvem permitem otimização de custos (por exemplo, reduzir a escala em períodos de baixa demanda)
  • Podem ser totalmente ou parcialmente gerenciados, o que reduz custos operacionais

Bancos orientados a linhas vs. colunas

Exemplo de banco orientado a linhas:

image20.jpg

Exemplo de banco orientado a colunas:

image17.png

Bancos orientados a linhas funcionam bem para buscas de registros completos, inserções e atualizações. Mas têm dificuldades com cargas analíticas.

Por exemplo, se você consulta três colunas de uma tabela com 50 colunas, um banco orientado a linhas ainda lê todas as 50 colunas de cada linha. Um banco orientado a colunas lê somente as três colunas necessárias — muito mais rápido para análises como previsão de demanda de produtos ou relatórios ad hoc.

Bancos orientados a linhas costumam ser mais adequados para processamento de transações online (OLTP), enquanto bancos orientados a colunas são ideais para processamento analítico online (OLAP).

OLTP vs. OLAP

  • OLTP é um tipo de sistema de banco de dados usado em aplicações orientadas a transações. “Online” significa que esses sistemas devem responder e processar solicitações do usuário em tempo real (ou seja, processar transações).
  • O termo contrasta com processamento analítico online (OLAP), que foca em análise de dados.

Resumo da comparação:

 

Banco orientado a linhas

Banco orientado a colunas

Armazenamento

Por linha

Por coluna

Recuperação de dados

Registros completos

Colunas relevantes

Aplicação típica

OLTP

OLAP

Operações rápidas

Inserção, updates, buscas

Consultas para fins de relatório

Carga de dados

Geralmente um registro por vez

Geralmente em lote

Opções populares

Postgres, MySQL, Oracle, Microsoft SQL Server

Snowflake, Google BigQuery, Amazon Redshift

Como o BigQuery funciona?

O BigQuery separa seu mecanismo de computação do armazenamento, permitindo que cada um escale de forma independente. Resultado: você consegue consultar terabytes de dados em segundos e petabytes em minutos.

Quando o BigQuery executa uma consulta, o mecanismo distribui o trabalho em paralelo, varre as tabelas relevantes no armazenamento, consolida os resultados e retorna o conjunto final de dados.

image13.png

Principais recursos do BigQuery em 2026

Desde o lançamento, o Google adicionou vários recursos que expandem o BigQuery além de um data warehouse tradicional:

  • BigQuery ML — Crie, treine e implante modelos de machine learning usando SQL. Suporta regressão linear, classificação, previsão de séries temporais e mais.
  • Gemini no BigQuery — Assistência com IA para escrever consultas, entender esquemas e gerar insights de dados em linguagem natural.
  • BigQuery Studio — Um espaço de trabalho unificado para SQL, notebooks Python e Spark dentro do console do BigQuery.
  • Consultas federadas — Consulte dados no Cloud SQL, Cloud Storage, Bigtable e outras fontes sem movê-los para o BigQuery.
  • BigQuery Omni — Execute análises do BigQuery em dados armazenados na AWS ou Azure sem copiá-los para o Google Cloud.

Como começar no BigQuery

O sandbox do BigQuery permite testar o BigQuery sem informar um cartão de crédito ou criar uma conta de faturamento. Nesta seção, vou mostrar como acessar o BigQuery e configurar seu primeiro projeto usando o sandbox.

O BigQuery pode ser acessado pelo Google Cloud Console. Você precisa fazer login com uma conta Google (ou criar uma). Depois do login, uma tela de boas-vindas deve aparecer:

image4.png

Você encontra o BigQuery no menu à esquerda. Ao clicar, você verá a tela abaixo:

image1.png

Usando o sandbox do BigQuery

Para usar o sandbox do BigQuery, primeiro crie um projeto clicando em “Select Project”.

image14.png

Depois, clique em “New Project”:

image3.png

Você precisará informar um nome para o projeto; neste guia, estamos usando datacamp-guide-project

image7.png

Agora, um aviso do sandbox é exibido na página do BigQuery, indicando que você ativou o sandbox com sucesso.

image16.png

Com o sandbox do BigQuery ativado, você já pode usar seu novo projeto para carregar dados e fazer consultas, além de consultar os conjuntos de dados públicos do Google.

Crie um dataset e uma tabela

Antes de criar uma tabela, você precisa criar um dataset no seu novo projeto. Um dataset é um contêiner de alto nível usado para organizar e controlar o acesso a um conjunto de tabelas e views. Para criar um dataset, clique no ícone “Actions” do projeto:

image18.png

Para este guia, vamos preencher o “Dataset ID” com “main”.

image8.png

Você pode criar uma tabela usando SQL. O BigQuery utiliza o GoogleSQL, que é compatível com ANSI.

CREATE TABLE datacamp-guide-project.main.users (
  id INT64 NOT NULL,
  first_name STRING NOT NULL,
  middle_name STRING,
  last_name STRING NOT NULL,
  active_account BOOL NOT NULL
);

Você também pode usar a interface do BigQuery Console:

image19.png

Observação: não é possível inserir dados no ambiente de sandbox. Se quiser testar inserções, é preciso ativar o período de avaliação gratuito. As próximas seções focam em consultar conjuntos de dados públicos disponibilizados como parte do Google Cloud.

Consultar um dataset público usando o BigQuery Console

Para consultar um dataset público, siga os passos abaixo:

1. Clique em “Add” ao lado de Explorer.

image10.png

2. Em seguida, escolha um dataset.

image2.png

3. Pesquise por “Google Trends” e selecione Google Trends; depois clique no botão “View dataset”.

image6.png

4. bigquery-public-data aparecerá com uma longa lista de datasets. Marque bigquery-public-data com estrela para que ele fique “fixo” no Explorer

image5.png

Usaremos a tabela top_terms:

image12.png

Clique na tabela top_terms para abrir e inspecione as abas Details e Preview para conhecer melhor os dados de top_terms.

image9.png

image21.png

Você pode consultar o dataset. Exemplo abaixo para buscar termos que ficaram em primeira posição nas últimas duas semanas:

SELECT
  term
FROM
  bigquery-public-data.google_trends.top_terms
WHERE
  rank = 1
  AND refresh_date >= DATE_SUB(CURRENT_DATE(), INTERVAL 2 WEEK)
GROUP BY
  term

Resultados (podem variar):

image11.png

Preços do BigQuery

A precificação do BigQuery tem dois componentes principais: computação (processamento de consultas) e armazenamento.

Componente Camada gratuita Preço pago
Consultas sob demanda 1 TiB por mês US$ 6,25 por TiB
Armazenamento (ativo) 10 GiB US$ 0,02 por GiB/mês
Armazenamento (longo prazo) 10 GiB US$ 0,01 por GiB/mês
Inserções em streaming N/D US$ 0,05 por 200 MB

Para times com cargas previsíveis, o BigQuery também oferece preços em taxa fixa por meio de reservas de capacidade (BigQuery Editions). Consulte a página oficial de preços para valores atualizados.

Considerações finais

O BigQuery é um dos pontos de entrada mais acessíveis para data warehousing em nuvem. O sandbox oferece um ambiente sem riscos para experimentar, e o 1 TiB de consultas gratuitas por mês permite explorar datasets públicos sem gastar nada. Quando precisar de mais, o teste gratuito do Google Cloud oferece US$ 300 em créditos.

Se quiser evoluir a partir do que aprendeu aqui, recomendo o curso Introduction to BigQuery na DataCamp, que aborda otimização de consultas e trabalho com datasets maiores. Para uma visão mais ampla de engenharia de dados, a trilha Data Engineer in Python cobre todo o pipeline, da ingestão ao data warehousing.

Você também pode ver como o BigQuery se compara a alternativas em nossas comparações BigQuery vs Redshift e BigQuery vs Snowflake, ou se preparar para entrevistas com nosso guia de perguntas de entrevista sobre BigQuery.


Eduardo Oliveira's photo
Author
Eduardo Oliveira
LinkedIn

Diretor de Tecnologia da DataCamp e Gerente Geral da Plataforma de Aprendizagem. Na minha função, gerencio as equipes que se concentram em desenvolver a tecnologia e o currículo que impulsiona a experiência dos alunos do DataCamp.

Tópicos

Comece com engenharia de dados hoje mesmo!

Programa

Engenheiro de dados associado em SQL

30 h
Aprenda os fundamentos da engenharia de dados: projeto de banco de dados e armazenamento de dados, trabalhando com tecnologias como PostgreSQL e Snowflake!
Ver detalhesRight Arrow
Iniciar curso
Ver maisRight Arrow
Relacionado

blog

O que é o Power BI? - Guia do Power BI para iniciantes

Saiba mais sobre as origens e o desenvolvimento dessa revolucionária ferramenta de business intelligence. Descubra por que os setores de todo o mundo confiam no Power BI para visualizar seus dados e informar sua tomada de decisões.

Wendy Gittleson

12 min

blog

O que é o Tableau - O guia completo do Tableau

Descubra essa ferramenta dinâmica de business intelligence, incluindo como ela foi criada, o que ela pode fazer e como aprender a usá-la pode levar sua carreira para o próximo nível.

Wendy Gittleson

15 min

Tutorial

Tutorial do Power BI para iniciantes

Aprenda os conceitos básicos do Power BI e como criar um relatório básico com este tutorial passo a passo.
DataCamp Team's photo

DataCamp Team

Tutorial

Exemplos e tutoriais de consultas SQL

Se você deseja começar a usar o SQL, nós o ajudamos. Neste tutorial de SQL, apresentaremos as consultas SQL, uma ferramenta poderosa que nos permite trabalhar com os dados armazenados em um banco de dados. Você verá como escrever consultas SQL, aprenderá sobre
Sejal Jaiswal's photo

Sejal Jaiswal

Tutorial

Tutorial do MySQL: Um guia abrangente para iniciantes

Descubra o que é o MySQL e como começar a usar um dos sistemas de gerenciamento de banco de dados mais populares.
Javier Canales Luna's photo

Javier Canales Luna

Tutorial

Primeiros passos com o AWS Athena: Um guia prático para iniciantes

Este guia prático ajudará você a começar a usar o AWS Athena. Explore sua arquitetura e seus recursos e saiba como consultar dados no Amazon S3 usando SQL.
Tim Lu's photo

Tim Lu

Ver maisVer mais