track
Min första kontakt med big data var för över tio år sedan när jag arbetade som mjukvaruingenjör inom Ad-Tech. Då började dataseten växa snabbt och explodera i storlek. Samtidigt innebar det stora möjligheter men också utmaningar. Frågor för att besvara grundläggande men kritiska rapporteringsfrågor tog plötsligt timmar.
Som svar på detta började jag använda kolumnorienterade databaser som BigQuery 2013. Eftersom de är molnbaserade kunde vi köra analytiska laster med god prestanda och kostnadseffektivitet, och skala resurser vid behov. De senaste åren har jag lett ett stort team av dataingenjörer som byggde ett BigQuery-datalager på över 10 PB för att hänga med i en snabbt växande katalog av heminredningsprodukter och ökande analytiska behov.
Nu, som CTO på DataCamp, leder jag olika teknik- och innehållsteam som hjälper våra användare att lära sig och öva just de här färdigheterna (bland mycket annat). Jag är övertygad om att molnbaserade datalager som BigQuery kan göra många arbetsflöden betydligt effektivare. Därför vill jag dela mina erfarenheter med dig i den här handledningen.
I den här guiden lär du dig vad BigQuery är, hur det fungerar och hur det skiljer sig från traditionella datalager. Du får lära dig att använda BigQuery-konsolen för att fråga publika dataset som tillhandahålls av Google, med ett praktiskt exempel på hur du frågar Google Trends för att lära dig om populära ämnen.
TL;DR
- BigQuery är Googles helt hanterade, serverlösa datalager i molnet som låter dig fråga petabyte av data med standard-SQL
- Det separerar lagring från beräkning, så varje del kan skalas oberoende utan infrastrukturhantering
- Den kostnadsfria sandboxen ger dig 1 TiB frågor per månad och tillgång till publika dataset utan att något kreditkort krävs
- BigQuery använder ett kolumnärt lagringsformat optimerat för analytiska (OLAP) arbetslaster, till skillnad från radorienterade OLTP-databaser
- Med BigQuery ML kan du bygga och driftsätta maskininlärningsmodeller direkt i lagret med SQL
Vad är BigQuery?
BigQuery är ett helt hanterat, serverlöst datalager utvecklat av Google för lagring och analys av data i stor skala. Organisationer använder det för att köra analytiska frågor över petabyte av data med SQL, utan att behöva hantera någon infrastruktur.
Du kan interagera med BigQuery via Google Cloud-konsolen, kommandoradsverktyget bq eller klientbibliotek för Python, Java, Go, Node.js, C#, PHP och Ruby.
BigQuery innehåller även inbyggd maskininlärning (BigQuery ML), som låter dig skapa och köra ML-modeller direkt i lagret med SQL. Du kan också importera externt tränade modeller från Vertex AI eller andra ramverk.
Den här handledningen är för dataanalytiker, dataingenjörer och administratörer av datalager som vill komma igång med BigQuery. Om du vill gå djupare efteråt täcker vår kurs Introduction to BigQuery frågeoptimering och avancerade arbetsflöden. Du kan också utforska vår guide till BigQuery Sandbox och vår kompletta handledning för data warehousing på GCP.
Traditionellt kontra molnbaserat datalager
Ett traditionellt datalager distribueras on-premise, vilket vanligtvis kräver höga startkostnader, ett kompetent team för att hantera det och noggrann planering för att möta ökande efterfrågan på grund av den rigida naturen hos traditionell resurskalning i datacenter.
Ett molnbaserat datalager, däremot, hanteras och hostas av en molnleverantör. Exempel inkluderar Google BigQuery, Amazon Redshift och Snowflake.
Fördelar med molnbaserade datalager
Ett molnbaserat datalager har i regel flera fördelar jämfört med traditionella datalager:
- De är byggda för skala och för att dra nytta av flexibiliteten i molnmiljön
- De har förbättrad hastighet och prestanda
- Flexibel prissättning och en molnmiljö möjliggör kostnadsoptimering (t.ex. skala ned vid låg efterfrågan)
- De kan vara helt eller delvis hanterade, vilket minskar driftkostnaderna.
Rad- kontra kolumnorienterade databaser
Exempel på en radorienterad databas:

Exempel på en kolumnorienterad databas:

Radorienterade databaser fungerar bra för uppslag av hela rader, insättning av poster och uppdateringar. Men de har det svårare med analytiska arbetslaster.
Om du till exempel frågar tre kolumner från en tabell med 50 kolumner läser en radorienterad databas ändå alla 50 kolumner för varje rad. En kolumnorienterad databas läser bara de tre kolumner du behöver, vilket är mycket snabbare för analyser som produktprognoser eller ad hoc-rapportering.
Radorienterade databaser lämpar sig i regel väl för online transaction processing (OLTP), och kolumnorienterade databaser för online analytical processing (OLAP).
OLTP kontra OLAP
- OLTP är en typ av databassystem som används i transaktionsorienterade applikationer. "Online" betyder att sådana system förväntas svara på användarförfrågningar och behandla dem i realtid (dvs. hantera transaktioner).
- Begreppet står i kontrast till online analytical processing (OLAP), som i stället fokuserar på dataanalys.
Sammanfattning av jämförelsen:
|
Radorienterad databas |
Kolumnorienterad databas |
||||||
|
Lagring |
Per rad |
Per kolumn |
|||||
|
Datahämtning |
Fullständiga poster |
Relevanta kolumner |
|||||
|
Typisk användning |
OLTP |
OLAP |
|||||
|
Snabba operationer |
Insättning, uppdateringar, uppslag |
Frågor för rapporteringsändamål |
|||||
|
Lasta data |
Vanligtvis en post i taget |
Vanligtvis i batch |
|||||
|
Populära alternativ |
Postgres, MySQL, Oracle, Microsoft SQL Server |
Snowflake, Google BigQuery, Amazon Redshift |
|||||
Hur fungerar BigQuery?
BigQuery separerar sin beräkningsmotor från lagringen, så att varje del kan skalas oberoende. Resultatet: du kan fråga terabyte av data på sekunder och petabyte på minuter.
När BigQuery kör en fråga distribuerar frågemotorn arbetet parallellt, skannar relevanta tabeller i lagringen, sammanfogar resultaten och returnerar den slutliga datamängden.

Viktiga BigQuery-funktioner 2026
Sedan BigQuery lanserades har Google lagt till flera funktioner som tar det bortom ett traditionellt datalager:
- BigQuery ML — Bygg, träna och driftsätt maskininlärningsmodeller med SQL. Stöd för linjär regression, klassificering, tidsserieprognoser med mera.
- Gemini i BigQuery — AI-assistans för att skriva frågor, förstå scheman och generera datainsikter med naturligt språk.
- BigQuery Studio — En enhetlig arbetsyta för SQL, Python-notebooks och Spark i BigQuery-konsolen.
- Federerade frågor — Fråga data i Cloud SQL, Cloud Storage, Bigtable och andra källor utan att flytta dem till BigQuery.
- BigQuery Omni — Kör BigQuery-analys på data som lagras i AWS eller Azure utan att kopiera dem till Google Cloud.
Så kommer du igång med BigQuery
BigQuery-sandboxen låter dig prova BigQuery utan att ange kreditkort eller skapa ett faktureringskonto. I det här avsnittet går jag igenom hur du får åtkomst till BigQuery och sätter upp ditt första projekt med sandboxen.
Du kommer åt BigQuery via Google Cloud Console. Du behöver logga in med ett Google-konto (eller skapa ett). När du loggat in bör en välkomstskärm visas:

Du hittar BigQuery i den vänstra menyraden. Klicka på det för att komma till följande vy:

Använda BigQuery-sandboxen
För att använda BigQuery-sandboxen skapar du först ett projekt genom att klicka på ”Select Project”.

Klicka sedan på ”New Project”:

Du behöver ange ett projektnamn; i den här guiden använder vi datacamp-guide-project

Ett meddelande om sandbox visas nu på BigQuery-sidan, vilket visar att du har aktiverat BigQuery-sandboxen.

Nu när BigQuery-sandboxen är aktiverad kan du använda ditt nya projekt för att ladda data och köra frågor samt fråga Googles publika dataset.
Skapa ett dataset och en tabell
Innan du skapar en tabell behöver du skapa ett dataset i ditt nya projekt. Ett dataset är en behållare på högsta nivån som används för att organisera och styra åtkomst till en uppsättning tabeller och vyer. För att skapa ett dataset, klicka på projektets ”Actions”-ikon:

I den här guiden fyller vi i ”Dataset ID” med ”main”.

Du kan skapa en tabell med SQL. BigQuery använder GoogleSQL, som följer ANSI-standarden.
CREATE TABLE datacamp-guide-project.main.users (
id INT64 NOT NULL,
first_name STRING NOT NULL,
middle_name STRING,
last_name STRING NOT NULL,
active_account BOOL NOT NULL
);
Du kan också använda gränssnittet i BigQuery Console:

Observera: Det går inte att infoga data i en sandbox-miljö. Om du vill prova att infoga data behöver du aktivera den kostnadsfria provperioden. Nästa avsnitt fokuserar på att fråga publika dataset som ingår i Google Cloud.
Fråga ett publikt dataset med BigQuery Console
Följ stegen nedan för att fråga ett publikt dataset:
1. Klicka på ”Add” bredvid Explorer.

2. Välj sedan ett dataset.

3. Sök efter ”Google Trends” och välj Google Trends, följt av att klicka på knappen ”View dataset”.

4. bigquery-public-data visas med en lång lista över dataset. Stjärnmarkera bigquery-public-data så att det blir ”klistrigt” i explorern

Ett praktiskt exempel med Google Trends-datasetet
Vi använder tabellen top_terms:

Klicka på tabellen top_terms för att öppna den och granska flikarna Details och Preview för att lära dig mer om datan i top_terms.


Du kan fråga datasetet, exempel nedan för att hämta termer som rankade på första plats under de senaste två veckorna:
SELECT
term
FROM
bigquery-public-data.google_trends.top_terms
WHERE
rank = 1
AND refresh_date >= DATE_SUB(CURRENT_DATE(), INTERVAL 2 WEEK)
GROUP BY
term
Resultat (varierar):

BigQuery-prissättning
BigQuerys prissättning har två huvudkomponenter: beräkning (frågebearbetning) och lagring.
| Komponent | Kostnadsfritt nivå | Betald prissättning |
|---|---|---|
| On-demand-frågor | 1 TiB per månad | $6.25 per TiB |
| Lagring (aktiv) | 10 GiB | $0.02 per GiB/månad |
| Lagring (långsiktig) | 10 GiB | $0.01 per GiB/månad |
| Strömmande insättningar | Ej tillämpligt | $0.05 per 200 MB |
För team med förutsägbara arbetslaster erbjuder BigQuery även flat-rate-prissättning via kapacitetsreservationer (BigQuery Editions). Se den officiella prissidan för aktuella priser.
Avslutande tankar
BigQuery är en av de mest lättillgängliga ingångarna till datalagring i molnet. Sandboxen ger dig en riskfri miljö att experimentera i, och 1 TiB kostnadsfria frågor per månad innebär att du kan utforska publika dataset utan att spendera något. När du behöver mer ger Google Clouds kostnadsfria provperiod 300 dollar i krediter.
Om du vill bygga vidare på det du lärt dig här rekommenderar jag kursen Introduction to BigQuery på DataCamp, som täcker frågeoptimering och arbete med större dataset. För en bredare bild av data engineering täcker spåret Data Engineer in Python hela kedjan från insamling till datalagring.
Du kan också utforska hur BigQuery står sig mot alternativ i våra jämförelser BigQuery vs Redshift och BigQuery vs Snowflake, eller förbereda dig för intervjuer med vår guide till intervjufrågor om BigQuery.