It looks like you are in United States. Would you like to go to https://onsiter.com/us/ instead?
Peut être disponible
(Mis à jour 2019-12-19)Data scientist
Fresnes, France
Natif Chinese, English, Intermédiaire French
- Statistical analysis
- Machine learning
- 8+ Data analyst
Compétences (7)
DATA SCIENCE
Machine Learning
Python
R
SQL
Deep Learning
SAS
Expérience professionnelle
DATA SCIENTIST
Veolia Environnement S.A
2018-02 - 2019-10
• J'ai mené le projet la prévision de la charge de chauffage dans les zones urbaines. Le travail comprend:
- J'ai fourni des prévisions probabilistes pour guider les décisions sur le fonctionnement de la chaudière
sur les sites locaux.
- J'ai développé un système de surveillance pour les évaluations de prédiction et le diagnostic de modèle.
- J'ai travaillé sur la détection d'anomalies sur des données chronologiques de charge calorifique.
• J'ai maintenu et mis à jour l'application Web Shiny R pour la modélisation de référence énergétique.
• J'ai supervisé des data scientists juniors sur l'exploration et la modélisation de données.
• J'ai développé les meilleures pratiques des API python pour l'analyse de séries temporal.
Toutes les tâches sont exécutées sur Google Cloud Platform, avec python et SQL pour les exécutions.Les tâches prin-
cipales impliquent l'analyse de series temporelles avec une modélisation statistique et des algorithmes de machine
learning.
Institut national de la santé et de la recherche médicale Paris, France
- J'ai fourni des prévisions probabilistes pour guider les décisions sur le fonctionnement de la chaudière
sur les sites locaux.
- J'ai développé un système de surveillance pour les évaluations de prédiction et le diagnostic de modèle.
- J'ai travaillé sur la détection d'anomalies sur des données chronologiques de charge calorifique.
• J'ai maintenu et mis à jour l'application Web Shiny R pour la modélisation de référence énergétique.
• J'ai supervisé des data scientists juniors sur l'exploration et la modélisation de données.
• J'ai développé les meilleures pratiques des API python pour l'analyse de séries temporal.
Toutes les tâches sont exécutées sur Google Cloud Platform, avec python et SQL pour les exécutions.Les tâches prin-
cipales impliquent l'analyse de series temporelles avec une modélisation statistique et des algorithmes de machine
learning.
Institut national de la santé et de la recherche médicale Paris, France
CHERCHEUR POSTDOCTORAL SENIOR
2016-06 - 2018-01
J'ai travaillé sur une étude d'observation pour comprendre les composants génétiques de la dysplasie fibro-
musculaire (DFM). Le travail comprenait:
- J'ai effectué le contrôle de la qualité des données de génotype pangénomique, l'imputation du génotype
paginal dans des échantillons de cas et de contrôle. (Taille des données: ~ 70 Gb)
- J'effectué une analyse de diagnostic sur les données génotypiques imputées et analyse de polarisation
sur des estimations d'association à partir des données de génotype imputées.
- J'ai effectué une méta-analyse sur la dissection d'artères coronaires spontanées au sein de groupes de recherche internationaux travaillant en collaboration.
Les travaux ont été réalisés avec les logiciels R, PLINK et autres logiciels basés sur le langage C et concernaient
principalement la modélisation statistique et les algorithmes du machine learning.
musculaire (DFM). Le travail comprenait:
- J'ai effectué le contrôle de la qualité des données de génotype pangénomique, l'imputation du génotype
paginal dans des échantillons de cas et de contrôle. (Taille des données: ~ 70 Gb)
- J'effectué une analyse de diagnostic sur les données génotypiques imputées et analyse de polarisation
sur des estimations d'association à partir des données de génotype imputées.
- J'ai effectué une méta-analyse sur la dissection d'artères coronaires spontanées au sein de groupes de recherche internationaux travaillant en collaboration.
Les travaux ont été réalisés avec les logiciels R, PLINK et autres logiciels basés sur le langage C et concernaient
principalement la modélisation statistique et les algorithmes du machine learning.
CHERCHEUR POSTDOCTORAL
University of Toronto
2013-09 - 2016-04
J'ai travaillé sur une étude longitudinale sur la santé environnementale et une étude génétique transversale.
Les travaux comprenaient principalement:
- Analyses d'associations conduites sur les expositions environnementales et leurs influences sur les ré-
sultats neurocomportementaux chez les enfants mexicains.
- J'ai mené une analyse d'association sur le profil de méthylation de l'ADN et les taux de lipoprotéines A
en circulation dans les familles canadiennes françaises.
- J'ai effectué une simulation Monte Carlo pour un test d'association génétique avec une distribution cen-
surée à gauche dans le trait.
- J'ai assisté des collègues pour l'analyse de données et des présentations scientifiques. Les travaux ont
été effectués en R pour des tâches d'analyse.
Les travaux comprenaient principalement:
- Analyses d'associations conduites sur les expositions environnementales et leurs influences sur les ré-
sultats neurocomportementaux chez les enfants mexicains.
- J'ai mené une analyse d'association sur le profil de méthylation de l'ADN et les taux de lipoprotéines A
en circulation dans les familles canadiennes françaises.
- J'ai effectué une simulation Monte Carlo pour un test d'association génétique avec une distribution cen-
surée à gauche dans le trait.
- J'ai assisté des collègues pour l'analyse de données et des présentations scientifiques. Les travaux ont
été effectués en R pour des tâches d'analyse.
ASSISTANT DE RECHERCHE (EN TANT QUE CANDIDAT AU DOCTORAT)
University of Michigan
2008-01 - 2013-01
I Analyse de données dans 4 projets sur une période de quatre ans. Une étude d'observation clinique longi-
tudinale. Deux études de cohortes environnementales et une étude transversale cas-témoins.
• Cogéré un projet d'étude; cJ'ai effectué le traitement des échantillons biologiques en laboratoire et super-
visé les étudiants pour le traitement des échantillons; J'ai préparé des documents pour l'examen éthique des études, des propositions de subvention assistées telles que l'analyse statistique.
• J'ai publié 8 résumés dans des revues scientifiques et 11 présentations lors de conférences scientifiques.
tudinale. Deux études de cohortes environnementales et une étude transversale cas-témoins.
• Cogéré un projet d'étude; cJ'ai effectué le traitement des échantillons biologiques en laboratoire et super-
visé les étudiants pour le traitement des échantillons; J'ai préparé des documents pour l'examen éthique des études, des propositions de subvention assistées telles que l'analyse statistique.
• J'ai publié 8 résumés dans des revues scientifiques et 11 présentations lors de conférences scientifiques.
Parcours scolaire
University of Toronto
University of Toronto
2019-12 - 2014-01
PHD
University of Michigan
2008-01 - 2013-01