Le fonti di alternative data (o alt data) sono oggi integrate nei processi business delle imprese in una vasta gamma di settori. Secondo un’indagine del 2022 dello studio legale Lowenstein Sandler, il 92% delle organizzazioni di investimento, dagli hedge fund e private equity al capitale di rischio, utilizza gli alternative data in misura moderata o significativa per informare il processo decisionale. Gli intervistati si aspettano inoltre che il loro utilizzo degli alt data aumenterà entro il 2022. In genere, questi dati provengono dal consumo di altri processi aziendali come attività sui social media, immagini satellitari, dati di localizzazione, transazioni con carta di credito e web scraping.

Sebbene gli alternative data possano essere utilizzati all’interno di un’organizzazione (dal marketing e vendite fino alle funzioni finanziarie e strategiche), i dipartimenti IT sono spesso responsabili della gestione e della proprietà dei dati di terze parti. Nel 2019, Forrester Research ha rilevato che il 56% delle acquisizioni di alt data era gestito da CIO e CDO che lavoravano all’interno dell’IT.

L’approvvigionamento, l’archiviazione e la gestione di alt data crea quindi nuove sfide per i responsabili IT e può comportare costi significativi e inutili come quelli analizzati di seguito.

Costi di selezione del fornitore

Secondo il sondaggio di Lowenstein Sandler, i costi di selezione dei fornitori sono la preoccupazione più importante che hanno gli utenti di alt data. I costi vengono sostenuti per il lungo processo di verifica dei fornitori di alt data e per garantire che i dati forniti siano di qualità sufficiente. Ciò è particolarmente importante quando i dati devono essere un elemento centrale di qualsiasi processo aziendale e non sono facilmente sostituibili. In tali situazioni, è fondamentale che gli acquirenti siano certi del fatto che il fornitore continuerà a offrire questi dati nel prossimo futuro.

Un modo per mitigare questi rischi è rivolgersi ai consorzi di settore per identificare fonti di dati affidabili. È probabile infatti che altre aziende operanti nello stesso settore abbiano esigenze simili e possano condividere idee e best practices.

Trovare personale adeguatamente qualificato

Secondo un sondaggio di Quanthub, nel 2020 c’era una carenza di 250.000 data scientist. Alla fine di aprile 2022, il sito di annunci di lavoro Indeed.com elencava 2.700 posti vacanti per data scientist nel solo Regno Unito. Questa carenza di professionisti adeguatamente qualificati sta costringendo ad aumentare gli stipendi e rende più difficile trattenere in azienda il personale specializzato.

E i data scientist non sono l’unico personale necessario per integrare gli alt data in un’azienda. Forrester Research raccomanda infatti alle aziende di utilizzare i servizi di “cacciatori di dati”, il cui ruolo è rintracciare alt data validi e convalidare queste fonti per accuratezza e integrità. Il fornitore europeo Munich Re, ad esempio, impiega un team di 20 cacciatori di dati proprio per questo scopo.

Le potenziali soluzioni a questa carenza di competenze includono la formazione del personale esistente, la cui conoscenza dell’azienda e delle sue esigenze offre loro un vantaggio rispetto ai nuovi assunti. Creare partnership con college e università che offrono corsi di data science ed esplorare le possibilità di collocamento degli studenti e programmi di formazione per laureati è un altro modo per costruire una pipeline di skill e competenze avanzate.

big-data-healthcare

Accertamento della proprietà dei dati

La natura degli alt data e le loro origini in fonti non tradizionali possono rendere la convalida della proprietà dei dati più difficile rispetto ai dati derivanti da fornitori affermati e affidabili. Ciò è particolarmente vero quando più origini dati sono state combinate prima dell’acquisto; possono infatti sorgere difficoltà in merito alle licenze, alle leggi sulla proprietà intellettuale e alle normative sulla protezione dei dati.

Questi problemi possono essere mitigati selezionando fornitori di fiducia che offrano ai clienti un certo grado di trasparenza nei metodi di approvvigionamento dei dati. Naturalmente, utilizzare i dati interni ove possibile è un altro modo per ridurre il rischio.

Aggiornamento dei modelli per elaborare gli alt data

Il mantenimento dei modelli di dati per garantire la coerenza e la gestione degli errori man mano che si verificano è un costo significativo che molte aziende sottovalutano. Idera calcola che la manutenzione in genere rappresenti il 50-80% dei budget di sviluppo. L’aggiunta di nuove fonti di dati ai modelli può aggiungere costi significativi a budget limitati.

Un’attenta modellazione dei dati all’inizio e l’incorporazione di un certo grado di flessibilità nella progettazione dei modelli possono semplificare questo processo.

Strumenti appropriati per archiviare gli alt data

Un quarto degli intervistati al sondaggio di Lowenstein ha citato la mancanza di strumenti e tecniche per archiviare gli alt data come una seria preoccupazione. Parte del problema risiede nella mancanza di coerenza tra le diverse fonti in termini di frequenza di aggiornamenti, API e formati di dati.

La pulizia dei dati per garantire che i modelli funzionino senza problemi e producano risultati coerenti e affidabili può rappresentare un costo significativo. Le opzioni sempre crescenti per lo storage, dai sistemi on-premise alle soluzioni cloud e ibride, e la sicurezza che funzionino in modo efficiente per i requisiti di acquisizione dei modelli di dati aggiungono un ulteriore livello di complessità e costi all’equazione.

Poiché i dati continuano a fornire una fonte di vantaggio competitivo per le aziende in grado di sfruttarne il potenziale commerciale, l’importanza degli alt data è destinata ad aumentare. È importante capire che mentre l’accesso a molte fonti di dati alternativi può costare poco o nulla, potrebbero esserci altri costi, a volte sostanziali, per rendere questi dati adatti allo scopo e integrarli nei flussi di lavoro stabiliti.