Come estrarre efficacemente dati da più tabelle in SQL

Quando si recuperano informazioni da un database utilizzando SQL, è importante estrarre dati da più tabelle in modo efficiente. In questo articolo, partiremo dalle basi delle clausole JOIN, passando per l’uso delle sottoquery, delle funzioni finestra e l’ottimizzazione degli indici, per spiegare nel dettaglio come estrarre dati in modo efficiente da più tabelle.

Indice

Basi delle clausole JOIN

La clausola JOIN in SQL viene utilizzata per combinare ed estrarre dati correlati da più tabelle. Le JOIN principali includono INNER JOIN, LEFT JOIN e RIGHT JOIN. Vediamo come usarle e quali sono le differenze.

INNER JOIN

L’INNER JOIN unisce i record di entrambe le tabelle che soddisfano la condizione specificata. I record che non soddisfano la condizione vengono esclusi.

SELECT A.column1, B.column2
FROM tableA A
INNER JOIN tableB B ON A.id = B.id;

LEFT JOIN

Il LEFT JOIN unisce tutti i record della tabella a sinistra e i record della tabella a destra che soddisfano la condizione specificata. Se non ci sono record corrispondenti nella tabella a destra, viene restituito NULL.

SELECT A.column1, B.column2
FROM tableA A
LEFT JOIN tableB B ON A.id = B.id;

RIGHT JOIN

Il RIGHT JOIN unisce tutti i record della tabella a destra e i record della tabella a sinistra che soddisfano la condizione specificata. Se non ci sono record corrispondenti nella tabella a sinistra, viene restituito NULL.

SELECT A.column1, B.column2
FROM tableA A
RIGHT JOIN tableB B ON A.id = B.id;

Metodi di unione di più tabelle

Quando si uniscono più tabelle per estrarre dati, ci sono alcuni punti chiave che possono migliorare l’efficienza delle query.

Uso di più clausole JOIN

È possibile utilizzare più clausole JOIN in sequenza per unire più tabelle. Ecco un esempio di unione di tre tabelle.

SELECT A.column1, B.column2, C.column3
FROM tableA A
INNER JOIN tableB B ON A.id = B.id
INNER JOIN tableC C ON B.id = C.id;

Considerare la priorità delle condizioni

L’ordine delle JOIN e la priorità delle condizioni possono influire sulle prestazioni delle query. Iniziare l’unione con la tabella che contiene meno dati può migliorare le prestazioni.

Miglioramento delle prestazioni

Per migliorare le prestazioni quando si uniscono più tabelle, è importante considerare i seguenti aspetti.

Uso degli indici

Creare indici sulle colonne utilizzate nelle condizioni di unione può migliorare significativamente le prestazioni delle query.

Normalizzazione dei dati ed eliminazione della ridondanza

Normalizzare i dati durante la progettazione delle tabelle ed eliminare la ridondanza consente un’estrazione dati più efficiente.

Uso delle sottoquery

Le sottoquery (query annidate) sono query inserite all’interno di altre query. Utilizzare le sottoquery consente di esprimere in modo conciso query complesse che estraggono dati da più tabelle.

Basi delle sottoquery

Le sottoquery vengono solitamente utilizzate all’interno delle clausole SELECT, WHERE o FROM. Ecco un esempio di utilizzo di una sottoquery per estrarre dati che soddisfano una condizione specifica.

SELECT column1
FROM tableA
WHERE column2 IN (SELECT column2 FROM tableB WHERE condition);

Sottoquery scalari

Una sottoquery scalare restituisce un singolo valore. Ecco un esempio di utilizzo di una sottoquery scalare per estrarre dati.

SELECT column1,
       (SELECT column2 FROM tableB WHERE tableB.id = tableA.id) AS column2_alias
FROM tableA;

Sottoquery correlate

Una sottoquery correlata viene eseguita in base a ciascuna riga della query esterna. Ecco un esempio di utilizzo di una sottoquery correlata per estrarre dati.

SELECT column1
FROM tableA
WHERE EXISTS (SELECT 1 FROM tableB WHERE tableB.id = tableA.id AND condition);

Sottoquery nella clausola FROM

Utilizzare una sottoquery nella clausola FROM consente di creare tabelle temporanee e di estrarre dati basati su di esse.

SELECT sub.column1, sub.column2
FROM (SELECT column1, column2 FROM tableA WHERE condition) sub;

Uso delle funzioni finestra

Le funzioni finestra sono strumenti potenti per eseguire aggregazioni e analisi su set di dati specifici all’interno di una query. Utilizzandole, è possibile estrarre dati in modo efficiente da più tabelle e condurre analisi dettagliate.

Basi delle funzioni finestra

Le funzioni finestra utilizzano la clausola OVER per calcolare su specifiche parti del risultato della query. Esempi tipici di funzioni finestra includono ROW_NUMBER, RANK, DENSE_RANK, SUM, AVG e altre.

SELECT column1,
       ROW_NUMBER() OVER (PARTITION BY column2 ORDER BY column3) AS row_num
FROM tableA;

Clausola PARTITION BY

La clausola PARTITION BY suddivide la finestra in gruppi specifici. Ciò consente di eseguire aggregazioni o analisi all’interno di ciascun gruppo.

SELECT column1,
       SUM(column2) OVER (PARTITION BY column3) AS sum_by_group
FROM tableA;

Clausola ORDER BY

La clausola ORDER BY viene utilizzata per ordinare i dati all’interno della finestra. Ciò consente di eseguire classificazioni o calcoli cumulativi.

SELECT column1,
       RANK() OVER (PARTITION BY column2 ORDER BY column3 DESC) AS rank_by_group
FROM tableA;

Specificare il frame finestra

Il frame finestra specifica l’intervallo di righe su cui viene eseguito il calcolo. Il frame può essere definito utilizzando ROWS o RANGE.

SELECT column1,
       SUM(column2) OVER (ORDER BY column3 ROWS BETWEEN 1 PRECEDING AND 1 FOLLOWING) AS moving_sum
FROM tableA;

Ottimizzazione degli indici

Per estrarre efficacemente dati da più tabelle, l’ottimizzazione degli indici è fondamentale. Utilizzare correttamente gli indici può migliorare notevolmente le prestazioni delle query.

Basi degli indici

Gli indici sono strutture dati che consentono di cercare dati in una tabella in modo efficiente. È consigliabile creare indici sulle chiavi primarie, chiavi esterne e colonne frequentemente utilizzate nelle condizioni di ricerca.

CREATE INDEX idx_column1 ON tableA(column1);

Uso degli indici compositi

Utilizzare indici composti che combinano più colonne può migliorare le prestazioni di query complesse.

CREATE INDEX idx_column1_column2 ON tableA(column1, column2);

Gestione degli indici

È importante anche gestire correttamente gli indici. Rimuovere gli indici inutili e ricostruire periodicamente gli indici per prevenire la frammentazione dovuta ad aggiunte o aggiornamenti di dati.

-- Rimozione di un indice
DROP INDEX idx_column1 ON tableA;

-- Ricostruzione di un indice
ALTER INDEX idx_column1 REBUILD;

Ottimizzazione delle query

Verificare il piano di esecuzione delle query per assicurarsi che gli indici vengano utilizzati correttamente. Apportare modifiche o aggiunte agli indici in base al piano di esecuzione.

-- Visualizzazione del piano di esecuzione
EXPLAIN SELECT column1 FROM tableA WHERE column1 = 'value';

Esempi pratici

Di seguito vengono presentati esempi concreti di query SQL per estrarre efficacemente dati da più tabelle. Attraverso scenari reali, verrà mostrato come applicare le tecniche apprese.

Unione di informazioni sui clienti e sugli ordini

Ecco un esempio di unione di una tabella contenente informazioni sui clienti con una tabella contenente informazioni sugli ordini, per estrarre gli ordini effettuati in un periodo specifico.

SELECT customers.customer_id, customers.name, orders.order_id, orders.order_date, orders.amount
FROM customers
INNER JOIN orders ON customers.customer_id = orders.customer_id
WHERE orders.order_date BETWEEN '2024-01-01' AND '2024-12-31';

Aggregazione utilizzando una sottoquery

Ecco un esempio di utilizzo di una sottoquery per calcolare l’importo totale degli ordini per ciascun cliente e estrarre le informazioni sui clienti in base a tale importo.

SELECT customer_id, name, total_amount
FROM (
    SELECT customers.customer_id, customers.name, SUM(orders.amount) AS total_amount
    FROM customers
    INNER JOIN orders ON customers.customer_id = orders.customer_id
    GROUP BY customers.customer_id, customers.name
) AS customer_totals
WHERE total_amount > 1000;

Classificazione utilizzando funzioni finestra

Ecco un esempio di utilizzo di funzioni finestra per classificare gli ordini di ciascun cliente in base all’importo dell’ordine.

SELECT customer_id, name, order_id, amount,
       RANK() OVER (PARTITION BY customer_id ORDER BY amount DESC) AS order_rank
FROM customers
INNER JOIN orders ON customers.customer_id = orders.customer_id;

Ricerca veloce utilizzando indici compositi

Ecco un esempio di utilizzo di un indice composito per cercare in modo efficiente per nome del cliente e data dell’ordine.

-- Creazione di un indice composito
CREATE INDEX idx_name_order_date ON orders(customer_name, order_date);

-- Ricerca utilizzando l'indice composito
SELECT order_id, customer_name, order_date, amount
FROM orders
WHERE customer_name = 'John Doe'
AND order_date BETWEEN '2024-01-01' AND '2024-12-31';

Conclusione

Per estrarre dati in modo efficiente da più tabelle, è necessario sfruttare una varietà di tecniche e abilità SQL. Combinando correttamente le tecniche spiegate in questo articolo, dalle basi delle clausole JOIN all’ottimizzazione degli indici, è possibile massimizzare le prestazioni delle query. Utilizzate le metodologie presentate per estrarre dati in modo efficiente nei vostri progetti.