Data scientist, Ph.D. Versailles, France

Might be available

(Updated 2020-06-23)

Data scientist, Ph.D.

Versailles, France

Native French, Fluent English, Spanish, Beginner Italian, Japanese

  • Intelligence artificielle
  • Machine learning
  • Python

Skills (25)

Machine Learning

PANDAS

ALGORITHME

Python

data

NUMPY

MLLib

Java

Scikit-learn

Git

PostgreSQL

SQLAchemy

SQL

STATISTIQUES

Spark

KERAS

ROBOTIQUE

jMeter

C++

Hadoop

Flask

NLP

Deep Learning

R

MATLAB

Professional Experience

Data Engineer Fullstack
Generali

2020-01 - 2020-05

Le programme Chrysalide est un programme de transformation numérique de la branche santé-prévoyance collective de Generali. Au sein de ce programme, l’objectif du projet THUGS est de réaliser un tarificateur, destiné aux services de souscriptions et de technique-assurance (actuaires), qui permet de générer une étude du prix de l’assurance collective pour un client potentiel, en fonction de ses caractéristiques et besoin. L’équipe, composée de développeurs, actuaires, business analysts, testeurs et PPO, fonctionnait en mode Agile.

• Restructuration du format des données en entrée et sortie

• Formation des actuaires de l’équipe au développement Python

• Développement de modules fonctionnels

• Développement de l’UI de test

• Tests unitaires

• Méthodologie Agile/Scrum

Environnement technique : Python 3 (numpy, pandas, flask, sqlalchemy), JavaScript, React, PostgreSQL, GitLab, JIRA, Docker, Splunk, Jmeter

Dev Commando Python

2019-04 - Present

(Freelance) - Depuis Avril 2019
Société Générale Corporate and Investment Banking
L'objectif de l'équipe commando est d'intervenir rapidement sur les besoins applicatifs des équipes fonctionnelles en salles de marché. Deux projets ont été traités en parallèle: la réalisation d'applications de contrôles pour les équipes middle office chargées des produits exotiques, et le développement applicatif pour le suivi de la fusion des activités de marché de CommerzBank, fraîchement acquises par la Société Générale. L'équipe était composée de 15 à 18 développeurs, répartis au sein de 3 squads de 5 à 7 membres.
• Contrôle automatique des produits exotiques
• Acquisition des produits de CommerzBank
• Parsing des documents contractuels
• Support technique pour les équipes du middle office
• Méthodologie Agile/Scrum
Environnement technique: Python 3, GitHub, JIRA, Jenkins, Docker, VBA
Data Scientist (Freelance)
Nokia

2018-09 - 2019-03

L'objectif du projet RPA FM était de permettre la résolution automatique des alarmes sur les infrastructures 2G/3G/4G des clients (Vodafone India et Bharti Africa). Le début de la mission marquait le commencement d'une nouvelle phase pour le projet, avec d'une part un audit du modèle de machine learning existant en vue de l'adapter aux futures évolutions du projet, et d'autre part une première série de livraison aux clients avec le recrutement d'une équipe dédiée.
_ Audit du projet:
• Analyse du modèle de machine learning existant
• Analyse de l'architecture du projet
• Suggestions de corrections urgentes et d'axes d'amélioration
• Collaboration avec l'équipe chargée de la V2 pour la mise en place d'un nouveau modèle de machine learning pour les évolutions futures
_ Livraison:
• Recrutement d'une équipe de développeurs pour la production des premiers livrables
• Répartition des alarmes entre les membres de l'équipe
• Parsing des logs
• Développement des alarmes qui m'étaient attribuées
• Suivi quotidien avec l'équipe fonctionnelle indienne
Environnement technique: Python 2, Pyspark, SQL, Amazon S3, MLlib, Gitlab, JIRA, Docker, Anglais
Ingénieur étude et développement
Orange

2017-01 - 2018-07

L'équipe POM, composée d'une vingtaine de testeurs, et de deux développeurs, a pour mission de s'assurer du bon fonctionnement des offres de téléphonie mobile avant la sortie du nouveau catalogue, et de détecter les dysfonctionnements une fois le catalogue lancé. Cette mission implique de tester un nombre très important de scénarios. Le projet Gotam consistait en la création d'une plateforme Python permettant d'automatiser, paralléliser et planifier ces tests, afin d'augmenter de manière significative la couverture des scénarios avant les sorties des catalogues.
• Développement d'une plateforme de tests des offres mobiles, en pré-production et en production.
• Migration de la plateforme de Windows vers Linux.
• Automatisation des tests d'offres postpayées.
• Parsing des résultats de tests.
• Mise en place d'une base de données MongoDB pour stocker les configurations des tests et leurs résultats.
Environnement technique: Python 2, MongoDB, Git, shell, PuTTy, mRemoteMG, NodeJS
Data Scientist

2015-01 - 2017-01

Projet Perso
Roboprono est un projet de robot rentable sur les paris sportifs et hippiques.
• Récupération en ligne de données historique pour entraîner les MLP
• Scrapping des cotes
• Sélection des données utiles
• Entraînement d'un MLP par type de pari
• Première versions avec les paris basiques du football
• Ajout des paris simples des courses hippiques
• Ajouts successifs de paris football plus complexes et de paris d'autres sports
• Vente de pronostiques
Environnement technique: Java, Python, numpy, pandas, scikit-learn, scrapy
Ingénieur de recherche en intelligence artificielle
PICOM

2012-10 - 2016-11

Le rôle du Pôle de Compétitivité des Industries du Commerce est de mettre en relation les grandes entreprises du retail avec des laboratoires publiques de la région Hauts-de-France afin de travailler sur des sujets communs. Le projet était la réalisation, au sein du DIA (Département d'Informatique et Automatique), d'un simulateur d'espaces de vente dirigé par des données réelles. J'étais responsable de la conception et de la réalisation, en autonomie, du projet. J'ai pu bénéficier, pendant 6 mois, du soutien d'un stagiaire que j'encadrais. Le simulateur était un système multi-agents qui décrivait le comportement déambulatoire et d'achat d'une surface de vente. Il était basé sur des données réelles (trajectoires et tickets de caisse) d'un supermarché californien, et de connaissances expertes issues de la littérature scientifique en marketing et psychologie.
• Conception d'un modèle d'agent client à partir de connaissances expertes
• Recherche de données réelles
• Clustering sur les trajectoires de clients afin d'obtenir des comportements déambulatoires types
• Règles d'association sur les tickets de caisse pour obtenir des paniers d'achat réalistes
• Développement from scratch du simulateur en Java
• Encadrement d'un stagiaire
• Encadrement de cours
• Communication scientifique (publication et conférence)
Environnement technique: Java, Matlab, Python, Git, Anglais
Machine Learning Engineer
INRIA

2012-03 - 2012-09

L'équipe TAO de l'INRIA est une équipe de recherche spécialisée dans l'apprentissage automatique, notamment via des algorithmes génétiques. L'algorithme mEDEA est un algorithme évolutionnaire conçu au laboratoire qui dirigeait l'évolution d'un essaim de robots. Ma mission consistait à proposer et implémenter (afin de tester) des modifications de l'algorithme afin d'obtenir une spécialisation des comportements des robots au sein de l'essaim. L'essaim était constitué de cent robots virtuels dans un simulateur développé en C++.
• Proposition d'évolutions pour l'algorithme évolutionnaire mEDEA
• Implémentation de ces évolutions dans le simulateur
• Dataviz et analyse statistique des logs
• Conclusion sur les mécanismes menant à la spécialisation des comportements
Environnement technique: C++, Python, SVN, R
NLP Engineer
LIMSI-CNRS

2011-01 - 2011-05

L'objectif de la mission était la réalisation d'un corpus associant des phrases françaises complexes à des phrases plus simples de même sens. Les phrases étaient obtenues en récupérant le contenu d'articles de Wikipédia et de Vikidia (sorte de Wikipédia pour pré-adolescents). Le corpus obtenu à par la suite été utilisé pour réaliser un système de simplification automatique de phrases en français, à destination des étrangers apprenant le français et des personnes possédant des difficultés pour le langage.
• Scrapping des articles de Wikipédia et Vikidia
• Conception d'un algorithme d'alignement des phrases, combinant similarité cosinus et TF*IDF
• Réalisation automatique du corpus
Environnement technique: Java, Python, Perl

Academic Background

Doctorat en Informatique
École des Mines de Douai

2012-01 - 2016-01

Master 2
Université Paris-Sud XI

2011-01 - 2012-01

Contact contractor

/