Con la nuova rubrica Big Data, Small Talks, dedicata ad alcuni membri del nostro team di Data Engineering, vogliamo svelare il dietro le quinte del complesso universo dei dati e dare un volto ai professionisti che guidano l’innovazione digitale per i nostri clienti.
In questa serie di interviste conosceremo meglio alcuni dei nostri Bitrockers, svelando la loro passione, competenza e l’approccio metodologico che adottano per affrontare i progetti tecnologici più sfidanti.
Il nostro primo Ambassador è Nicola Manca, Junior Data Engineer: conosciamolo meglio.
Come collabori con gli altri team per garantire che i dati siano usati in modo efficace e coerente?
La collaborazione parte sempre dalla chiara definizione dei dati: cosa arriva, in che formato, e con quali garanzie di qualità. Usiamo una documentazione condivisa e stabiliamo momenti di allineamento quando necessario. L’obiettivo principale è evitare che ambiguità e incomprensioni sui dati portino a un “bottleneck” e rallentino gli sviluppi a valle.
Quale tecnologia emergente nel mondo dei dati pensi avrà un impatto maggiore nel prossimo futuro?
Data Mesh e Data Fabric sono entrambi avanzamenti verso un ecosistema sempre più “data-driven”, in cui i dati diventano una risorsa accessibile, affidabile e utile alle decisioni aziendali.
Il Data Mesh è un modello organizzativo che decentralizza l’ownership dei dati sui vari domini aziendali, promuovendo collaborazione e responsabilità diffusa. Questo approccio ha sicuramente dei vantaggi importanti in termini di qualità e fiducia reciproca, per cui credo avrà un grosso impatto nella gestione del dato. Il Data Fabric, invece, è un’architettura che unifica e connette dati distribuiti su diversi sistemi senza spostarli, semplificando governance, sicurezza e accesso in contesti complessi e con grandi volumi di dati.
Questi due approcci possono anche essere combinati, utilizzando il Data Fabric come infrastruttura tecnica e il Data Mesh come modello di governance, così da permettere specialmente alle aziende enterprise di beneficiare enormemente dei vantaggi di entrambi.
Qual è l’approccio del team Data Engineering di Bitrock all’integrazione di modelli di AI nei progetti dei clienti?
Ogni progetto e ogni cliente ovviamente hanno delle specificità che vanno considerate nel definire una strategia operativa. Tuttavia, nel corso della mia esperienza ho potuto apprendere una serie di best practice che permettono di affrontare il lavoro in modo organizzato e ottimizzato.
Si parte sempre da una necessità di business e si valuta se può essere risolvibile con l’AI. Poi si valuta la cosiddetta data readiness, ovvero se i dati a nostra disposizione sono adatti per addestrare un modello di Machine Learning. Si fa un’analisi esplorativa dei dati per capire quali informazioni contengono e come si possano utilizzare al meglio.
Successivamente, è necessario costruire, a partire dai dati, delle feature utili al problema in questione e impiegarle per addestrare dei modelli, anche usando diverse architetture ML, per valutare i risultati preliminari. Se i risultati sono promettenti, allora si procede a una fase esplorativa più intensa, in cui si cerca il migliore approccio possibile per l’addestramento. Da qui in poi, si inizia a creare la pipeline di MLOps di training, test, deployment e monitoring, che poi sarà adoperata anche in produzione.
Qual è, secondo te, la competenza “non tecnica” più importante per un Data Engineer?
Direi la comunicazione. Spesso è necessario tradurre un concetto tecnico in un messaggio comprensibile e utile per chi non ha competenze specifiche sui dati, e questo non è sempre facile. Non si deve sottovalutare l’impatto di una buona comunicazione degli insight sulla qualità e l’efficacia delle decisioni aziendali che ne derivano.
Come viene incoraggiata la curiosità e la sperimentazione all’interno del tuo team?
Organizziamo degli spazi di discussione interni su nuove idee, tool o progetti sperimentali. Quando un membro del team ha piacere di elaborare una presentazione su un qualsiasi argomento che può interessare tutti, ci prendiamo uno slot per riunirci, ascoltare, e discutere. Inoltre, nel canale del team spesso si condividono risorse come articoli, seminari, – e molto altro – per rimanere aggiornati sugli argomenti di interesse.
Ringraziamo nuovamente Nicola per averci accompagnato in questa prima immersione nel mondo del Data Engineering, dalla quale è emerso come la gestione dei dati sia ormai il fulcro di ogni progetto di innovazione, richiedendo non solo competenza tecnica, ma anche una profonda capacità di collaborazione e comunicazione.
La passione e l’esperienza che i nostri professionisti mettono in campo ogni giorno sono la garanzia di un approccio non solo tecnologicamente avanzato, ma anche allineato con le reali necessità di business dei nostri clienti.Hai un progetto di trasformazione digitale complesso o desideri semplicemente capire come i Big Data possano diventare una risorsa accessibile e strategica? Contattaci