
RAG e diritto: come funziona davvero la ricerca AI aumentata nel contesto legale
Cos'è il RAG, perché è l'architettura AI più adatta al diritto, e cosa distingue uno strumento affidabile da uno che inventa le fonti.
Hai sentito parlare di AI nel diritto. Forse hai già provato qualche strumento. Forse ti sei chiesto come mai certi sistemi citano le fonti e altri no, perché alcune risposte sembrano affidabili e altre meno, e cosa significhi esattamente quando un fornitore dice che il proprio strumento "non allucina".
Dietro a tutte queste domande c'è un concetto tecnico chiamato: RAG, ovvero Retrieval-Augmented Generation. È l'architettura che distingue gli strumenti AI utilizzabili professionalmente da quelli che non lo sono, e capirla non richiede una formazione tecnica. Richiede dieci minuti e una buona metafora.
Iniziamo dal problema: cosa fa un'AI senza RAG
Per capire perché il RAG esiste, bisogna capire cosa succede senza di esso.
I modelli linguistici che alimentano strumenti come ChatGPT (e molti altri) vengono addestrati su enormi quantità di testo: libri, articoli, siti web, documenti di ogni tipo. Da questo addestramento imparano a generare testo coerente, grammaticalmente corretto, spesso convincente.
Ma c'è un problema fondamentale: una volta terminato l'addestramento, questi modelli non sanno più cosa è successo nel mondo. Non hanno accesso a nuove informazioni. E soprattutto, non sanno cosa non sanno.
Questo porta a un fenomeno chiamato allucinazione: il modello genera risposte plausibili anche quando non ha le informazioni per rispondere correttamente. In pratica, inventa.
Questo erché è progettato per produrre testo coerente, e a volte produce testo coerente che non corrisponde alla realtà. I numeri sono stati misurati: uno studio Stanford RegLab pubblicato nel Journal of Empirical Legal Studies nel 2025 (il primo a testare sistematicamente gli strumenti AI legali), ha trovato tassi di allucinazione tra il 43% e il 58% nei modelli generalisti su query legali. I sistemi RAG-based verticali scendono al 17-33%: meglio, ma non zero, e la differenza tra le due architetture è esattamente ciò che questo articolo spiega.
Nel diritto, questo è un problema serio. Un modello linguistico generico a cui chiedi una sentenza della Cassazione del 2024 potrebbe fornirti un numero di sentenza che sembra reale, una massima che sembra pertinente, una citazione che sembra autentica… e che non esiste, come successo al Tribunale di Siracusa nel marzo 2026. Se hai tempo e metodo per verificare ogni fonte, puoi gestirlo. Ma il tempo è esattamente ciò che uno strumento AI dovrebbe farti risparmiare. E se non verifichi, il rischio è usare in un atto professionale qualcosa che non esiste.
La soluzione: cercare prima di rispondere
Il Retrieval-Augmented Generation, in italiano "generazione aumentata dal recupero", risolve questo problema in modo efficace: invece di chiedere all'AI di ricordare qualcosa, le chiede di cercare.
Il funzionamento si può spiegare con un'analogia semplice. Immagina di dover rispondere a una domanda complessa su un tema che non conosci a memoria. Hai due opzioni: improvvisare basandoti su ciò che ricordi vagamente, oppure andare in biblioteca, trovare i libri giusti, leggerli, e costruire la risposta su ciò che hai trovato. Il RAG è la seconda opzione. Prima cerca, poi risponde. E cita le fonti perché sa esattamente da dove vengono le informazioni.
Come funziona passo per passo
Quando poni una domanda a un sistema RAG come Lexroom, nel giro di pochi secondi accadono quattro cose in sequenza:
- Il sistema capisce cosa stai chiedendo.
La tua domanda in linguaggio naturale viene analizzata per identificare il problema giuridico sottostante, le aree del diritto coinvolte, i concetti chiave. Non si tratta di una ricerca per parole chiave esatte: il sistema capisce che "recesso anticipato dal contratto" e "scioglimento anticipato" sono concetti correlati, anche se usano parole diverse. - Il sistema cerca nell'archivio.
Invece di attingere a ciò che ha "memorizzato" durante l'addestramento, il sistema cerca in un archivio di fonti giuridiche verificate: sentenze, normativa, provvedimenti, massime. Questa ricerca avviene per similarità di significato, non per corrispondenza letterale di parole. - Il sistema seleziona le fonti più pertinenti.
Tra i documenti trovati, vengono selezionati quelli più rilevanti per la domanda specifica. La qualità di questa selezione è critica: dipende dalla qualità dell'archivio e dalla precisione con cui il sistema capisce la domanda. - Il sistema genera la risposta radicata nelle fonti.
Solo a questo punto entra in gioco la generazione del testo. Ma non è testo generato liberamente: è una risposta costruita sui documenti recuperati nel passaggio precedente. Ogni affermazione è ancorata a una fonte specifica, che viene citata perché il sistema sa esattamente da dove viene.
Il risultato: se la fonte non esiste nell'archivio, il sistema non risponde come se esistesse. Non inventa. Questo è il principio su cui è costruita Lexroom: se non c'è la fonte, non c'è la risposta.
Perché le fonti citate cambiano tutto per un avvocato
In molti contesti, le citazioni delle fonti sono una comodità. Nel diritto sono un requisito.
Un avvocato non può includere un'affermazione giuridica in un atto processuale senza sapere da dove viene. Non può consegnare un parere senza che sia verificabile. Non può giustificare una scelta strategica senza poterla documentare. La responsabilità professionale, che è personale e nominale, richiede che ogni affermazione possa essere tracciata fino alla sua fonte.
Un sistema RAG fornisce questa tracciabilità strutturalmente come conseguenza diretta di come funziona. Lexroom, ad esempio, accompagna ogni risposta con le fonti citate e permette di accedere ai testi integrali (sentenze, articoli di legge, provvedimenti) direttamente dalla risposta.
Questo cambia anche il modo in cui si verifica il lavoro. Invece di partire da zero per controllare ogni affermazione, puoi partire dalle fonti già citate e verificare che siano pertinenti, aggiornate, e interpretate correttamente. Il tempo di verifica si riduce perché la materia prima è già organizzata.
Non tutti i sistemi RAG sono uguali: cosa fa la differenza
Capire il RAG significa anche capire che l'architettura da sola non garantisce la qualità. La qualità dipende da ciò su cui il RAG opera, ovvero l'archivio:
La qualità delle fonti — Un archivio che include sentenze della Cassazione, normativa vigente e provvedimenti delle autorità competenti produce risposte con un peso professionale molto diverso rispetto a uno che include anche contenuti generici o non verificati. Nel diritto, la distinzione tra fonti primarie e secondarie è la differenza tra ciò che si può usare e ciò che non si può usare.
L'aggiornamento continuo — Il diritto cambia. Una sentenza delle Sezioni Unite può ribaltare un orientamento consolidato. Una riforma può rendere obsoleta una norma che citavi da anni. Un archivio che non viene aggiornato con regolarità diventa progressivamente meno affidabile, e un sistema RAG operante su fonti vecchie produce risposte vecchie, anche se tecnicamente "citate".
La copertura per area tematica — Il diritto tributario e il diritto penale condividono pochi concetti. Un sistema che non distingue tra le aree tematiche può produrre ricerche meno precise perché il contesto di ricerca non è definito. Lexroom organizza le fonti in moduli tematici (civile, penale, lavoro, privacy, tributario, compliance e molti altri) proprio per questo motivo: la pertinenza aumenta quando l'archivio è strutturato come il lavoro reale.
Le domande da fare quando valuti uno strumento AI legale
Ora che capisci come funziona il RAG, puoi fare le domande giuste a qualsiasi fornitore.
- Quali fonti compongono l'archivio, per area tematica? Un fornitore serio fornisce questa informazione senza esitazione.
- Con quale frequenza vengono aggiornate? Settimanalmente, mensilmente, in tempo reale? La risposta cambia il valore dello strumento per il lavoro corrente.
- Cosa succede quando la fonte non esiste? Il sistema lo dice chiaramente, o genera una risposta comunque?
- Le fonti sono accessibili integralmente? La citazione deve rimandare al testo integrale. Se il sistema cita ma non permette di verificare, la tracciabilità è parziale.
- I documenti che carico sono al sicuro? L’eventuale Libreria Privata deve essere segregata e crittografata. E i documenti non devono essere usati per addestrare modelli.
Perché nel diritto questo conta più che altrove
In molti settori, usare un'AI che a volte sbaglia è accettabile. Si corregge, si impara, si va avanti. Nel diritto, un errore non verificato ha conseguenze concrete: per il cliente, per la reputazione professionale, per la responsabilità deontologica. Le linee guida del CCBE (il Consiglio degli Ordini Forensi d'Europa) sono esplicite su questo punto: l'avvocato rimane l'unico responsabile dei contenuti prodotti, indipendentemente dallo strumento utilizzato. Non è una posizione conservatrice nei confronti della tecnologia; è la descrizione corretta di come la tecnologia si inserisce in una professione che ha al centro la responsabilità personale.
Il RAG non elimina la necessità di verifica professionale, ma riduce drasticamente il rischio di partire da informazioni inesistenti, e fornisce la struttura per verificare in modo efficiente ciò che è stato trovato.
Non è una questione di fiducia nello strumento. È una questione di come lo strumento è costruito: se cita le fonti perché le ha davvero trovate, puoi controllare. Se genera senza cercare, non puoi controllare nulla, perché non c'è niente da controllare.
Vuoi approfondire come Lexroom applica questi principi nella pratica quotidiana? Continua a seguirci per ottenere approfondimenti periodici e concreti su AI e diritto.
Scopri Lexroom.
Compila il form.
Richiedi una Demo Gratuita.
Scopri come Lexroom può trasformare il tuo Lavoro Legale.
Durante la prova vedrai come funziona Lexroom e come integrarlo nel tuo flusso di lavoro.