Lieu : Paris · Contrat : CDI · Rémunération : A négocier
Pure player de la data, namR est un producteur de données contextuelles géolocalisées qui a pour mission de décrire le monde par la donnée.
Depuis octobre 2017, namR crée, transforme et valorise des données pour produire des attributs originaux et inédits qui permettent aux acteurs publics et privés de valoriser leur patrimoine, de piloter efficacement leurs transformations et de fluidifier la prise de décision.
namR a créé une technologie innovante qui caractérise qualitativement et quantitativement le bâti et les territoires. Ces milliards de données à forte valeur ajoutée sont agrégées dans la plus grande base de données contextuelles de France.
namR propose ainsi trois lignes de services pour le pilotage :
- de la performance énergétique et environnementale du bâti qui consiste à augmenter la connaissance patrimoniale (ciblage des bâtiments au meilleur potentiel de rénovation énergétique, qualification du parc immobilier, optimisation des stratégies renouvelables, potentiel de désartificialisation des sols)
- du risque environnemental et extra financier pour une maîtrise du risque écologique et climatique, une définition des trajectoires carbone, un dérisquage des souscriptions
- de l’efficacité commerciale et opérationnelle en apportant une connaissance approfondie des clients et prospects dans le cadre d’actions marketing.
namR a obtenu 3 distinctions :
- Climate Opportunity: Tech for Climate Change Mitigation décerné par Cognition X
- le Prix de l’Innovation Numérique de Greentech innovation et Capgemini.
- lauréat du programme French Tech Green 20
Notre équipe regroupe une cinquantaine de talents principalement autour de la data.
Ce qui rapproche les collaborateurs de namR, c’est l’envie de travailler dans une entreprise engagée autour des questions environnementales et passionée par les challenges que l’on rencontre dans une société de deeptech.
Forte de 3 équipes techniques de 40 personnes au total et de diverses expertises en Machine Learning, Computer Vision, Natural Language Processing, notre société collecte des données disponibles et non-personnelles pour construire une librairie de jeux de données uniques et actionnables pour une prise de décision ou de structuration de nouvelles opportunités.
En tant que Data Scientist spécialisé.e géomatique chez namR, vos missions seront :
- Développer et améliorer des modèles de machine learning (Random Forest, XGBoost, lightGBM, etc) pour enrichir notre base de données : prédiction de la valeur de biens, de la consommation énergétique, du nombre de pièces, etc
- Appliquer du feature engineering à des données géospatiales : mesures de distances, intersection géométrique, indices de Moran ou Geary, etc. et ainsi enrichir notre feature store et améliorer le pouvoir prédictif de nos algorithmes ;
- Récupérer, analyser, traiter et nettoyer des datasets volumineux en vue de l’intégration de nouvelles données dans notre base ;
- Travailler sur des sujets NLP qui sont une autre spécialité de l’équipe et collaborer avec l’équipe Computer Vision sur des projets communs mêlant géomatique, imagerie et analyse textuelle ;
- Développer nos outils internes dans le cadre du nettoyage automatique de datasets issus de l’open data (clustering, détection d’outliers, etc) ;
-Visualiser et analyser nos données d’un point de vue géographique en vue d’évaluation qualité.
Formation
Master 2 ou Ecole d’ingénieurs en Data Science / Statistiques / Mathématiques / Mathématiques Appliquées / Doctorat Cifre.
Expérience
Expérience pratique d’au moins 2 ans sur un projet Data Science, Big Data.
Compétences
- Solide background en mathématique et statistique complété d’une bonne compétence en programmation et des bonnes pratiques
- Une expérience NLP serait appréciée ;
- Experience d’utilisation de Python et PostgreSQL dans le cadre de data analyse, traitement des données, etc.
- Expérience de développement de projet de modélisation (Simple OLS, Random Forest, XGBoost, LightGBM, etc) ;
- Maîtrise des méthodes supervisées et non supervisées (DBScan, K-Nearest Neighbors, etc) ;
- Excellente compétence d’analyse de données : interprétations des métriques, évaluation de modèles, test statistiques (khi-2, ANOVA, Pearson, etc), visualisation de données, évaluation de l’importance de features dans les modèles (permutation, LIME, SHAP) ;
- Une expérience avec l’écosystème GIS serait très appréciée : compréhension des systèmes de projections, les types de données et géometries. Utilisation d’outils comme PostGIS, Shapely, QGIS, etc.
https://www.welcometothejungle.com/fr/companies/nam-r/jobs/data-scientist-geo_paris?q=ff7f3325eae21abe38032af24a7282f0&o=1387266