Qualità essenziali di un Data Scientist

Pubblicato: 2017-01-12
Mostra il sommario
Pensiero statistico
Abilità di programmazione
Una mente curiosa
Natura orientata ai risultati
Creatività
Comprensione delle banche dati
Grandi capacità di comunicazione
Fame di dati

I big data sono in crescita dagli albori della tecnologia dell'informazione. Ora, i dati che creiamo a giorni alterni equivalgono a tutti i dati che abbiamo accumulato fino al 2003. Questa enorme quantità di dati ha intuizioni inestimabili non solo per le aziende, ma per l'intera razza umana stessa. L'analisi dei big data sta aiutando il settore sanitario con la ricerca da un po' di tempo ormai. Inoltre, i big data potrebbero anche risolvere il puzzle del cancro a breve.

E se ti dicessi che i Big Data sono in realtà solo una pila di dati che non ha senso se non sai come usarli? È qui che entrano in gioco i data scientist. Per dare un senso ai big data, abbiamo bisogno di data scientist e di quelli validi per essere precisi. E non lasciarti ingannare dal titolo di "data scientist", ci sono alcune qualità che un data scientist dovrebbe possedere per essere chiamato tale. Se stai cercando di assumere un data scientist o hai intenzione di diventarlo tu stesso, ecco le qualità che dovresti cercare o possedere.

scienziato dei dati

Pensiero statistico

Trasformare i dati in informazioni è il compito principale di un data scientist. Il know-how della statistica è quindi una qualità che va da sé. Guardare le cose con una mentalità quantitativa è importante per rimanere neutrali e tenere lontani i pregiudizi durante la gestione dei dati. Un buon data scientist comprende che la profondità e l'affidabilità degli insight aumentano in proporzione alla quantità di dati e si astiene dal trarre conclusioni con dati inadeguati. Con un'enorme quantità di dati, tendenze e approfondimenti emergono come numeri. L'amore per i numeri è quindi necessario per essere un vero scienziato dei dati. Un data scientist dovrebbe essere in grado di interrogare grandi quantità di dati per ricavare informazioni utili e quindi applicare tecniche di modellazione predittiva per anticipare le tendenze future. Una buona tenuta delle statistiche è necessaria per preparare report e tracciare le linee d'azione consigliate in base alle informazioni dettagliate.

Abilità di programmazione

Un data scientist lavorerebbe con diversi team per creare pipeline, strumenti, moduli, pacchetti, siti Web, dashboard e molto altro. Ciò non significa che un data scientist debba essere un programmatore esperto, ma la comprensione degli algoritmi e di come funzionano i codici può fare molto nel lavoro di un data scientist. Quando il sistema non è in grado di fornirti le giuste tendenze o approfondimenti, è il momento di rimboccarsi le maniche e scrivere del codice. Questo sarebbe impossibile senza alcune capacità di programmazione e flessibilità tecnica.

Python è accettato come il linguaggio di programmazione più versatile e compatibile ed è ideale per la gestione di database e query di tipo MapReduce. Essendo facile da imparare la lingua e open-source, l'apprendimento di Python non dovrebbe essere un grosso ostacolo tra te e il tuo sogno di scienza dei dati.

Avere eccellenti "capacità di pseudo-codice" è considerato anche da molte organizzazioni durante l'assunzione di un data scientist. "Abilità di pseudo codice" è la capacità di scrivere come una query o un algoritmo dovrebbe funzionare in un inglese semplice. Questa capacità di risoluzione dei problemi è essenziale per diventare un data scientist. La scienza dei dati è un settore in cui i gold standard cambiano a un ritmo allarmante, il che sottolinea l'importanza di avere più competenze di quelle richieste dallo scenario attuale.

Una mente curiosa

Sebbene la scienza dei dati sia un campo abbastanza vecchio, le scoperte vengono fatte di tanto in tanto. La spinta a trovare nuovi modi per risolvere un vecchio problema è la ragione alla base di questo. Uno scienziato dei dati dovrebbe sempre mantenere una mente curiosa per fare attenzione a un modo nuovo e migliore per acquisire, unire ed elaborare i dati e trovare strumenti per ottenere informazioni migliori. Un data scientist ideale non dovrebbe mai smettere di essere curioso poiché i dati nascondono segreti che confesserebbe solo ai curiosi. Un vero scienziato dei dati non sta cercando di vedere come i dati dimostrino che i suoi pregiudizi sono giusti, ma invece sta cercando le verità nascoste nel profondo.

Con i dati, a volte le cose possono diventare piuttosto difficili e solo la curiosità può guidarti verso i risultati. Ecco perché la curiosità è una delle qualità più essenziali di un data scientist.

Natura orientata ai risultati

L'analisi dei dati riguarda più i risultati che il processo stesso. Non importa come porti i risultati con i dati purché ci siano i risultati attesi. I data scientist potrebbero dover seguire più di una strada per risolvere determinati problemi a volte. Essere bloccati da piccoli ostacoli non è una buona qualità per un data scientist. Essere orientati ai risultati aiuta in questi casi in cui la forte determinazione a convertire i dati in risultati diventa la forza trainante per se stessi. I data scientist, in generale, sono persone che si spostano da un problema all'altro mentre si destreggiano tra diversi compiti contemporaneamente. Nient'altro che il risultato può fermarli dallo sforzo.

Creatività

La creatività potrebbe sembrare quella strana in questo elenco. La verità è che è una delle qualità più importanti per un data scientist. Le persone creative non hanno paura di sbagliare, sperimentano cose nuove e osano esplorare nuovi territori. Trovano opportunità nei loro fallimenti e possono facilmente cambiare direzione. Tutti questi sono essenziali per la scienza dei dati.

Spesso classifichiamo le persone in emisfero sinistro e destro. Le scienze hard come i big data sono raramente associate alla creatività e questo è un grosso errore. I data scientist si trovano da qualche parte tra le due categorie e hanno bisogno di una vena di creatività per trovare nuovi approcci e modi per gestire i dati. Le statistiche e i database non sono ciò che riguarda la scienza dei dati, è lo storytelling che rende l'output finale dell'analisi utile ai decisori.

La creatività da sola non può fare un data scientist, ovviamente. Qualcuno in grado di preparare report facili da consumare, attraenti e accattivanti potrebbe non essere sempre la soluzione migliore per il ruolo di un data scientist. I data scientist possono essere chiamati risolutori di problemi creativi.

Comprensione delle banche dati

Indipendentemente dal fatto che tu stia lavorando con dati strutturati, non strutturati o entrambi insieme, un buon data scientist deve avere un'idea fondamentale sul funzionamento dei database. Inoltre, una conoscenza di base dei database colonnari e relazionali può fare molto per rendere più semplice il lavoro di un data scientist. Molti dei magazzini aziendali utilizzano ancora i tradizionali database relazionali. Anche i data scientist dovranno essere coinvolti nella configurazione di questi database, sebbene ci sarà personale tecnico per eseguire l'attività. Il know-how nello sviluppo di un'infrastruttura di database in grado di gestire dati non strutturati è come una ciliegina sulla torta.

Grandi capacità di comunicazione

Un data scientist lavorerà principalmente con la tecnologia, l'analisi e gli uomini d'affari allo stesso tempo. Spesso funge da traduttore per tutte le parti coinvolte. Gestire il gergo tecnico e aziendale allo stesso tempo e sapere cosa usare con chi richiede forti capacità comunicative. L'output dell'analisi di solito non è carino, almeno per qualcuno che non è un data scientist. Le intuizioni e le tendenze sono bloccate all'interno dei numeri e dovrebbero essere interpretate e comunicate al team aziendale e alle parti interessate in un modo che comprendano. Un grande scienziato dei dati dovrebbe essere in grado di tradurre il complesso output dell'analisi in una forma più semplice, compresa da persone di diversa estrazione, utilizzando narrazione, metafore e mezzi di comunicazione visivi.

Fame di dati

Un grande data scientist è sempre affamato di più dati. La ricerca dei dati è una senza obiettivi prefissati poiché più dati sono sempre dati migliori. Un data scientist dovrebbe continuare a cercare più fonti di dati, modi migliori per acquisirli e metodi innovativi per elaborarli. La spinta ad acquisire più dati è qualcosa che un data scientist deve possedere poiché i dati sono il carburante per l'analisi.