top of page

Garantir la qualité des données, un enjeu primordial chez Homiwoo


Pour proposer des estimations fiables et précises à partir d’une quantité massive de data immobilière, Homiwoo se doit de vérifier la qualité des données. C’est l’un des rôles de Muneeb ul Hassan, data scientist dans l’entreprise depuis 2019.


Aider les professionnels de l’immobilier dans leur prise de décision, voilà le cœur de métier d’Homiwoo. Cet objectif repose sur la qualité des données fournies aux clients qui peuvent ainsi réaliser les meilleurs choix, notamment celui du prix d’un bien. L’enjeu est crucial pour les professionnels : une entreprise qui proposerait par exemple un prix de vente trop inférieur au marché subirait un manque à gagner, tandis qu’une autre qui se risquerait à un prix trop supérieur allongerait ainsi le temps nécessaire pour trouver un acquéreur.

Au sein d’Homiwoo, Muneeb ul Hassan est aux premières loges pour s’assurer de la fiabilité des informations. « Nous avons de la donnée en énorme quantité, il est donc nécessaire d’avoir un département qui s’assure que la data que nous fournissons à nos clients est de qualité, pour garantir leur confiance dans nos données », explique ce data scientist qui a rejoint l’entreprise fin 2019.

Son parcours est résolument international : après un bachelor au Pakistan en ingénierie des systèmes informatiques, il passe un an à Melbourne en Australie, effectue un stage en Allemagne puis enchaîne avec un master de recherche à Grenoble en intelligence artificielle et data science.


Corriger les erreurs humaines


Le travail de vérification opéré par Muneeb permet de fournir aux clients d’Homiwoo une estimation du prix d’un bien immobilier et de l’état du marché à un instant t. « Nous leur indiquons également la confiance qu’ils peuvent avoir dans cette donnée sur une échelle de 1 à 5, 5 étant la meilleure note. Parfois, nous pouvons affirmer que la donnée est fiable à 100% », rappelle le data scientist qui sait parfaitement qu’il vaut mieux avoir une donnée manquante qu’utiliser une donnée fausse !

Parmi les données qu’il manipule pour estimer les évolutions du marché on trouve les données officielles dites DVF (« Demandes de valeurs foncières»). Issues des actes notariés et des informations cadastrales, elles sont publiées par la direction générale des finances publiques et permettent de connaître les transactions immobilières intervenues au cours des cinq dernières années en France.

De temps à autres, des erreurs humaines peuvent toutefois perturber les données récoltées, par exemple en ce qui concerne les surfaces des biens vendus qui peuvent éventuellement être mal renseignées manuellement. En matière de prix, certaines transactions largement en dessous des prix du marché peuvent également altérer les données : de telles erreurs se répercutent ensuite sur les prix de vente et peuvent ainsi fausser des analyses.


La qualité des données, un enjeu business


Tout l’enjeu du travail de Muneeb consiste donc à détecter d'éventuelles anomalies pour les corriger via des algorithmes, afin de ne pas injecter des données de mauvaise qualité dans les résultats d’Homiwoo. « C’est un enjeu de réputation pour nous, et donc de business », déclare ce data scientist qui a développé en interne un outil, codé en Python, capable de vérifier automatiquement la fiabilité de la donnée. Le retour des utilisateurs est également essentiel : selon Muneeb, leur feedback est constructif et permet une amélioration constante.

Au-delà des échanges avec les utilisateurs, c’est surtout l’échange avec ses collègues qui permet à Muneeb de s’épanouir dans son job : « Le travail en équipe m’aide à progresser », confie celui qui a choisi d’intégrer Homiwoo à l’issue de son master de recherche par volonté de « participer à l’aventure d’une startup en croissance ». Pour ce passionné de machine learning soucieux d’apporter à Homiwoo des innovations constantes, son travail ne nécessite pas uniquement des compétences techniques : « Il faut surtout être très attentif aux détails ». La rigueur est donc de mise pour garantir la qualité des données. Un travail aux enjeux business indéniables.


Comments


bottom of page