Patrizia Licata
Di Patrizia Licata

ChatGPT: le nuove sfide della strategia sui dati nell’era dell’IA generativa

In primo piano
Mar 27, 202414 minuti
Intelligenza artificialeGovernance dei datiGenerative AI

I CIO lavorano per portare le loro imprese a una gestione matura dei dati che possa rivelarsi in grado di aprire nuove opportunità di crescita. L’intelligenza artificiale ha reso evidente la necessità di una strategia che includa concetti come qualità del dato, data ownership, condivisione e interoperabilità: solo così potrà diventare un asset che genera valore per il business. La governance dal dato diventa (anche) la governance dell’IA.

Credito: Getty Images

Le aziende italiane investono in infrastrutture, software e servizi per la gestione e l’analisi dei dati (+18% nel 2023, pari a 2,85 miliardi di euro, secondo l’Osservatorio Big Data & Business Analytics della School of Management del Politecnico di Milano), ma quante sono giunte alla data maturity?

Il Data Strategy Index incluso nel report rileva che solo il 20% delle grandi aziende italiane ha una strategia avanzata sui dati. La quota è, tuttavia, in crescita rispetto al 15% del 2022. Inoltre, considerando anche Pmi e micro-imprese, si restringe la percentuale delle imprese “immature” (32%). Ciò si deve anche alla spinta dell’intelligenza artificiale generativa: ChatGPT ha messo in evidenza come non mai l’importanza di avere a disposizione dati di buona qualità per addestrare gli algoritmi. Insomma: mentre i CIO lavorano per costruire una solida data strategy aziendale, l’intelligenza artificiale e la Generative AI alzano ulteriormente la sfida.

“La qualità del dato viene ottenuta definendo un processo che coinvolge tutti gli attori aziendali e gli strumenti di misurazione appositi”, evidenzia Francesco Saverio Colasuonno, Data & Analytics Office Manager di INAIL. “Le azioni successive per il miglioramento della data quality possono essere sia di processo che applicative e includono la definizione di un modello organizzativo intorno alla data governance, assegnando ruoli e compiti chiari alle varie figure coinvolte (data scientist, data engineering, data owner, data steward, eccetera)”.

Ciò permette di avere un’accountability (chi è responsabile della correttezza del dato?) e di indirizzare in modo corretto i percorsi di formazione per chi dovrà ricoprire specifici ruoli lungo la catena del valore del dato.

“I dati sono un grande asset aziendale, e la loro gestione e analisi è il processo di ricerca e quantificazione del valore di quell’asset. L’implementazione dell’output dell’analisi di quei dati, nella strategia di business, è l’attivazione di quel valore. E l’IT è lo strumento che permette tutto il processo”, afferma Gianpaolo Vitulano, Enterprise Data Architect e senior manager con esperienze, tra l’altro, in aziende della sanità e della manifattura.

Da questo punto di vista, secondo Vitulano, l’arrivo di ChatGPT introduce una grande opportunità: “La Gen AI aiuta nella data governance e, di conseguenza, nell’attivazione del valore di business dei dati”.

Come misurare la maturità della data strategy

Il Data Strategy Index del Politecnico di Milano valuta la maturità delle aziende misurando tre ambiti: data management & architecture (mezzi, competenze e processi per la gestione tecnologica, integrazione dei dati e governance del patrimonio informativo); business intelligence e descriptive analytics (strumenti e competenze di base per una BI pervasiva); e data science (analisi predittive e di ottimizzazione partendo dall’analisi dei dati).

Nella Pubblica amministrazione c’è un ulteriore parametro che entra nella data governance: la maturità sugli open data. Il nostro Paese si è classificato, nel 2023, al 7° posto nella graduatoria dei Paesi UE, con un livello di maturità del 92% (un punto percentuale in più rispetto alla passata edizione). Questo indice misura la capacità degli Stati di portare avanti la pubblicazione e il riutilizzo dei dati aperti, in linea con la Direttiva sugli open data (UE) 2019/1024. È basato su test di autovalutazione, ma può dare un’indicazione di quanto sia cruciale, anche per le PA, avere delle strategie sui dati con precise policy, misurazioni dell’impatto e capacità di assicurarne la qualità.

INAIL, che possiede un enorme patrimonio di dati, è una delle PA che ha attuato con decisione una governance dei dati, che include proprio i requisiti dell’interoperabilità, nonché progetti di IA e sperimentazioni con l’IA generativa. La data strategy e la data governance si basano non solo sulle tecnologie, ma anche sugli aspetti culturali e organizzativi: per questo, dal 2015, l’Istituto nazionale per l’assicurazione contro gli infortuni sul lavoro ha trasformato la sua funzione IT in un vero dipartimento digitale.

“Èla dimostrazione”, sottolinea Colasuonno, “chel’innovazione tecnologica e quella organizzativa devono andare a braccetto: non ci sono progetti di innovazione organizzativa che prescindono dalla tecnologia e, allo stesso modo, la digitalizzazione porta con sé innovazione nell’organizzazione e nei processi”.

I gruppi di lavoro e l’ecosistema dei dati

La strategia dei dati di INAIL si traduce, operativamente, in un impianto progettuale articolato in 10 “cantieri”, ognuno dei quali è incentrato su un focus specifico della strategia sui dati (architetture, data fabric, data mesh, IA, BI, integrazione con piattaforme nazionali, qualità del dato, modelli semantici, e così via), con gruppi di lavoro che includono rappresentanti sia dell’IT che del business più in generale. 

“Sarebbe un grave errore per l’IT pensare di condurre i progetti di data governance in autonomia, senza l’apporto prezioso delle direzioni di business”, dichiara Colasuonno. “Oggi non si può più procedere a compartimenti stagni: l’IT deve coinvolgere il business nella gestione dei dati, dare a queste funzioni fiducia e autonomia nella lettura e nell’analisi delle informazioni. A tal fine gioca un ruolo chiave adottare un lessico comune, abbattendo le distanze tra le due funzioni”.

La strategia sui dati definita da INAIL nel 2023 è strettamente legata al paradigma degli open data. L’obiettivo è di sviluppare le capacità tecnologiche ed esecutive legate alla gestione e all’uso dei dati non solo nell’istituto, ma anche nell’intero ecosistema, perché INAIL dialoga necessariamente con il resto della Pubblica amministrazione. La strategia sui dati è stata, dunque, condivisa con gli enti che assicurano la governance dei dati nella PA, in particolare il Dipartimento per la trasformazione digitale, l’AgID e l’Istat. Per garantire l’interoperabilità, vengono adottate piattaforme dati pubbliche, come la PDND (Piattaforma Digitale Nazionale Dati).

“Nel processo di digitalizzazione si sta affermando il concetto di ‘altruismo dei dati’: le informazioni non sono degli enti, ma dei cittadini e delle imprese, che devono avere la possibilità di utilizzarle, nel rispetto della privacy e della sicurezza”, spiega Colasuonno. “D’altra parte, i dati open danno la possibilità agli operatori pubblici e privati di creare servizi e prodotti ad hoc basati sui dati, per esempio, finalizzati alla prevenzione degli infortuni e al care management a beneficio della salute e della sicurezza”.

Il ruolo della data platform nei processi mission-critical

La corretta implementazione di una strategia dei dati permette alle aziende di accedere a un patrimonio di conoscenza che è funzionale ai risultati economici, evidenzia l’Enterprise Data Architect Vitulano. “Si possono individuare processi in cui è possibile ridurre costi e tempi introducendo maggiore automazione, così come i mercati più promettenti per il tipo di prodotto che si vuole offrire, oppure i clienti su cui agire perché a rischio churn, nonché i fornitori che offrono la materia prima di maggiore qualità, e così via”, sottolinea Vitulano.

Colasuonno conferma che la strategia sui dati “è strettamente connessa e funzionale alla strategia digitale”: deve servire a obiettivi che vanno oltre le implementazioni IT. Il percorso inizia individuando i “critical data”, ovvero i dati fondamentali per perseguire gli obiettivi di digitalizzazione, e prosegue con l’individuazione delle capability tecnologiche, culturali e organizzative da sviluppare. Dalla definizione del metodo consegue la scelta tecnologica, che per INAIL significa architetture scalabili che abilitano la virtualizzazione dei dati. Nella data strategy, infatti, il CIO spesso si trova a dover fare una scelta tra duplicazione fisica del dato, oppure architettura logica con dato virtualizzato.

“Per noi il dato virtualizzato fa la differenza. La data platform che abbiamo scelto, fornita da Denodo, è per noi un importante abilitatore tecnologico, perché risponde alla necessità di INAIL di creare rapidamente soluzioni di BI che usano dati da fonti diverse e con la caratteristica della dinamicità”, osserva il manager. “Al momento stiamo sperimentando la nuova data platform per un numero selezionato di applicazioni mission-critical, come il processo di autoliquidazione. Ma ci aspettiamo di estenderla ad altri use-case”.

Il data lake e la BI per la valorizzazione del dato

Sono tante le PA impegnate sulla valorizzazione dei dati, all’interno della loro trasformazione digitale. Regione Toscana, per esempio, sta portando avanti la sua strategia basandosi su un data store pubblico, regolamentato da un percorso normativo regionale dedicato all’innovazione, all’open government e alla valorizzazione dei dati aperti. Nel corso del 2023 l’ente ha avviato un ampio progetto, in ambito POR FESR (Programma operativo regionale sostenuto dal Fondo europeo di sviluppo regionale) 21-27, che prevede il consolidamento del data lake regionale e la promozione di iniziative data-driven nei Comuni toscani (entro giugno 2024 è prevista l’uscita di un avviso di 1,4 milioni di euro, a cui seguiranno altri investimenti di Regione Toscana). L’intero progetto è stato disegnato coinvolgendo società dei servizi pubblici, Comuni e Province, ovvero l’intero ecosistema, perché il successo del journey dell’innovazione si lega alla capacità dei vari interlocutori di procedere insieme.

“Per noi un’adeguata governance è fondamentale, con un orizzonte di medio-lungo termine e azioni operative nel breve termine che, coinvolgendo gli stakeholder, dimostrino l’utilità dell’approccio data-driven e promuovano l’uso corretto dei dati per migliorare il governo dei processi e del territorio e supportare le decisioni”, evidenzia Stefano Ciuoffo, Assessore Regione Toscana a Infrastrutture digitali e Innovazione, alle Partecipate, Semplificazione Politiche Istituzionali, Rapporto con gli Enti Locali, Legalità, Sicurezza e Immigrazione. L’Assessore sottolinea anche il valore degli open data nel promuovere la trasparenza e far nascere processi partecipativi sulla base del patrimonio informativo aperto: un altro modo per coinvolgere l’ecosistema.

“Naturalmente la governance contiene, by design, accorgimenti di tutela dei dati personali e di sicurezza informatica”, prosegue Ciuoffo.

Al momento, Regione Toscana ha un data lake regionale e diversi sistemi di business intelligence a supporto dei principali interlocutori (Sanità, processi legati all’Agricoltura, ai processi ERP interni, alla mobilità e al turismo regionali, e così via). A questa base informativa sta affiancando, in misura crescente, altre tecnologie data-oriented, come i droni e le tecnologie satellitari per i rilievi e per l’arricchimento del patrimonio informativo regionale e l’IA, nella forma di machine learning per le analisi predittive sui big data regionali nelle diverse aree.

“Il 2024 – annuncia Ciuoffo – sarà l’anno in cui Regione Toscana aggiornerà la data strategy regionale per dare un’ulteriore spinta alla valorizzazione dei dati in tutti i livelli: negli enti locali, verso i cittadini e le imprese e nei confronti delle Direzioni, degli Enti e delle Agenzie Regionali, anche in relazione all’impulso derivante dall’intelligenza artificiale”.

La governance dell’intelligenza artificiale e la Gen AI

Anche in INAIL, la data strategy implementata da Colasuonno getta le fondamenta tecnologiche e organizzative che permettono all’ente di valorizzare i dati con la business intelligence, l’analisi predittiva e l’intelligenza artificiale.

INAIL usa l’IA già da alcuni anni. Per esempio, ha sviluppato vari progetti, basati sul machine learning, in ottica di efficientamento dei processi istituzionali, tra cui le aree del personale, del bilancio tecnico attuariale, dell’antifrode e della vigilanza ispettiva, dell’avvocatura, degli incentivi alle imprese e dell’area medico-legale. In particolare, in quest’ultimo ambito, il patrimonio di dati dell’ente, che contiene decenni di valutazioni su infortuni, grado di invalidità, cure necessarie, e così via, può addestrare modelli che aiutano i medici a decidere a quale casistica appartiene un determinato infortunio.

Oggi, l’ente sta esplorando l’uso della Gen AI applicato alla ricerca e alla fruizione (da parte degli utenti di INAIL, ma anche di imprese e cittadini) della sua ampia base di conoscenza interna, usando il linguaggio naturale.

“L’INAIL intende cogliere le opportunità che l’IA offre alla PA e all’interno Paese, ma sempre nel rispetto dei diritti fondamentali della persona”, dichiara Colasuonno. “L’intelligenza artificiale va usata in modo etico, non discriminatorio, conforme alle regole della privacy e tale da mitigare i rischi che comporta”.

Tra questi, evidenzia il dirigente, c’è anche l’abuso della tecnologia IA – per cui si spende in modo esagerato a fronte del valore atteso – o, al contrario, un impiego minimo che impedisce di trarne vantaggio. L’equilibrio tra i due estremi si ottiene – ancora una volta – con la governance: “Una governance dell’intelligenza artificiale”, chiarisce Colasuonno, “che è strettamente connessa alla governance dei dati”.

Il compito del CIO: garantire la qualità e la fruibilità dei dati

Vitulano conferma: il CIO ha il ruolo strategico di istituire una precisa governance che fa leva sulla qualità del dato.

“In molti casi, a meno che non siano utenti tecnici, non si può dare al business un dato grezzo, perché potrebbe essere irriconoscibile e, soprattutto, alterato dai vari processi che subisce per essere messo a disposizione. Occorre quindi vagliarlo e certificarlo, in modo che l’utente finale abbia la sicurezza di utilizzare un dato che sia corretto, affidabile e riconoscibile. Questo è un aspetto molto importante del processo di digitalizzazione industriale, e come IT manager, ho sempre puntato su strumenti avanzati di automazione per l’input – che altrimenti è un compito soggetto a errori, costoso e comunque senza valore aggiunto – e su una chiara nomenclatura, per passare dal glossario alla business intelligence e alla visualizzazione sugli analytics products”. 

Questi ultimi sono gli strumenti interattivi con cui si interfacciano le figure del business: la qualità e l’accessibilità del prodotto finale è centrale per il processo decisionale ed è responsabilità del team tecnico di implementare le adeguate soluzioni per assicurare l’affidabilità del dato.

Nelle sue esperienze di CIO, Vitulano ha sempre lavorato sulla nomenclatura dei dati, come quando era manager in un’azienda internazionale del settore sanitario. Qui il processo di gestione puntuale dei dati è stato fondamentale per garantire, da un lato, la loro sicurezza, per via della loro classificazione (dati personali e sensibili), e dall’altro il corretto funzionamento della soluzione IT nel processo di delivery del valore di business, ovvero la capacità di condividerli centralmente con vari utilizzatori (sia interni che esterni).

GPT: più efficienza per la data governance?

Oggi, però, con i modelli GPT, la governance dei dati potrebbe raggiungere nuovi livelli di efficienza. “L’IA generativa può fornire un framework per gestire e organizzare i dati e assicurare che siano accurati, coerenti e al sicuro”, spiega Vitulano. “I modelli GPT possono essere un prezioso complemento alle soluzioni di data catalog per mappare e classificare i data asset, attivare e monitorare la data governance, accrescere la qualità delle decisioni basate sui dati e garantire una migliore conformità”.

Un altro uso di GPT per la data governance potrebbe essere nella forma di supporto agli utenti nella ricerca dei dati e nella loro condivisione con le parti autorizzate. Vitulano fa un esempio: il CIO potrebbe aver costruito un analytics product e la Gen AI avrebbe la capacità di aumentarne il valore rendendo velocemente accessibili le informazioni e le analisi, o addirittura fornendo suggerimenti sul possibile riuso di alcune informazioni, come i KPI, per un altro progetto.

“GPT ha il potenziale di aumentare l’efficienza nell’uso dei data asset, evitando duplicazioni, e la velocità nell’accesso alle informazioni e nel decision-making”, dichiara Vitulano. “In questo modo, indirettamente, GPT potrebbe favorire una data-driven culture, in cui tutte le persone hanno un ruolo nel contribuire al successo dell’azienda”.

Ma mai senza la governance: nell’applicazione dell’intelligenza artificiale e del suo sottoinsieme generativo, il CIO deve prevedere e affrontare sia la questione dell’integrazione nei sistemi aziendali esistenti sia quelle della correttezza ei dati usati per l’addestramento dei sistemi di IA, da cui dipende il risultato e la fiducia del business nell’informazione fornita. 

“Un dato errato è più dannoso di un dato mancante”, conclude Colasuonno di INAIL, “perché porta a decisioni sbagliate. Anche nell’addestramento dei modelli di intelligenza artificiale, la correttezza e la qualità dei dati è la base per un training e un risultato affidabili. Lo stabilisce anche l’AI Act europeo”. 

Patrizia Licata
Di Patrizia Licata
Scrittore Collaboratore

Giornalista professionista e scrittrice. Dopo la laurea in Lettere all’Università La Sapienza di Roma, ho iniziato a lavorare come freelance sui temi dell’innovazione e dell'economia digitale. Scrivo anche di automobili, energia, risorse umane e lifestyle. Da una ventina d’anni collaboro con le principali testate italiane su carta e web.

Altro da questo autore