Dans la communauté des Data scientist, on parle encore de la blague racontée par Hal Varian, et qui a fait beaucoup rire en son temps. L’économiste en chef de Google avait déclaré en 2009 que « Devenir Statisticiens sera la carrière la plus « sexy » dans les 10 prochaines années ». Aujourd’hui, 17 ans après, il est très clair que sa prédiction humoristique s’est avérée exacte !

Considérons que le salaire annuel moyen pour un « Data Scientist » aujourd’hui est de 118.000$ (source : Glassdoor) et si on le compare avec le salaire annuel moyen d’un développeur (67.000$), il devient donc intéressant de jeter un coup d’œil sur ces « nouveaux » emplois autour du big data.

Les entreprises génèrent des masses de données avec des volumes exponentiels chaque jour, et elles ont encore beaucoup de mal à en tirer de la valeur. Selon McKinsey, en 2018, les Etats-Unis seuls serons confrontés à une pénurie de plus de 150.000 Data scientists et de 1,5 million de « Data-savvy » Managers.

Mais peut être comme moi, vous connaissez déjà tout cela !  Vous avez déjà lu ou entendu ces statistiques. En fait, vous avez même peut être fait un premier pas important – Ouvrir votre navigateur et googler le mot « Data scientist ». Et donc, selon moi, vous méritez une petite tape sur le dos ! Et maintenant, il reste la partie la plus dure : Comment y arriver ?

Il ne faut pas se leurrer – l’apprentissage de ces compétences et, le Graal, trouver un emploi en tant que Data scientist n’est pas chose facile. Ca ne va pas se faire du jour au lendemain, et il est important de focaliser son énergie et savoir sur quoi se concentrer.

Role du data scientist

Développer une expertise d’analyse

Commencez par acquérir de solides base en statistiques. Une fois que vous êtes initié avec les fondamentaux, il pourrait être utile de s’attaquer à des cours de statistique plus avancée, de Marchine Learning, ou de Natural Language Processing et principalement maîtriser le codage en PythonSi vous êtes encore étudiant, suivez des cours dans ces matières le plus possible. Dans le cas contraire, développer une expertise dans au moins l’un de ces domaines, et essayer de faire des initiations dans les autres.

En savoir plus :

Le Data scientist est passionné par le code

On ne va pas y aller par quatre chemins. Des compétences poussés en algorithmique, développement et hacking vont être beaucoup plus important que de maîtriser des cours théorique de mathématique. Pour vos débuts en tant que Data scientist, une grande partie de votre travail consistera à travailler avec une masse importante de données « moche » et non structurés et de les mettre sous une forme exploitable. Et la meilleure, chaque masse de données sera différente. Apprendre Python ou R est P.R.I.M.O.R.D.I.A.L !

En savoir plus : Comparing Python and R for Data Science

Apprenez à raconter une histoire (avec des données)

Premièrement, il faut avoir des bases solides en statistiques. Deuxièmement, vous devez être en mesure d’exprimer vos analyses d’une façon compréhensible pour les humains. Vos clients ou collègues ne vont pas toujours comprendre des termes comme « p-value ». Vous devez bien expliquer vos résultats, pourquoi ils sont importants et pourquoi quelqu’un devrait leur faire confiance et surtout d’une manière que les profanes vont comprendre. Les techniques de visualisation vont beaucoup vous aider à illustrer votre « histoire ».

En savoir plus : How to Tell a Powerful Story with Data Visualization

Cherchez un mentor

C’est à mon sens la partie la plus essentielle et qui vous fera gagner beaucoup de temps. bien entendu vous devez avoir les fondamentaux théoriques et pratiques. C’est une approche pragmatique, axée sur la pratique et qui est la meilleure lorsque vous êtes en phase d’apprentissage. Vous allez faire des erreurs et avoir quelqu’un avec de l’expérience pour en parler, examiner votre travail, et vous maintenir engagé dans votre processus d’apprentissage va vous faciliter la tâche.

En savoir plus : Nate Silver on Finding a Mentor, Teaching Yourself Statistics, and Not Settling in Your Career

Construire un portefeuille solide

Réaliser des projets est non seulement la meilleure façon d’apprendre, mais c’est aussi un excellent moyen de mettre en valeur les compétences que vous aurez acquises. Les meilleures entreprises veulent que vous démontrez que vous pouvez travailler de bout en bout sur des problèmes de données: de la collecte et le nettoyage des données, à l’analyse et surtout la communication claire de vos résultats. Un moyen efficace de commencer à construire son portefeuille est de s’inscrire dans certaines compétitions de Data Science.

En savoir plus : Tips for Data Science Competitions

Bonus

Comme vous l’avez vu tous les liens mentionnés sont en anglais. Eh oui, il faut comprendre la langue de Shakespeare. c’est une compétence essentielle et même sine qua non. Toute la littérature autour de ces sujets encore nouveaux n’est qu’en anglais.  Les Mooc existants sur le sujet sont aussi qu’en anglais et surtout vous devez communiquer avec des mentors en anglais la langue universelle.

De toutes les façons si vous visez un emploi en tant que Data Scientist, sachez que vous allez probablement l’exercer dans un contexte international et sûrement aux Etas unis.

Si vous avez aimé cet article, partagez-le sur Facebook, Twitter ou par email ! Puis laissez un commentaire pour dire ce qu’il vous a apporté ;) .