top of page

Prix du marché : le défi de la modélisation


Comment estimer précisément la valeur réelle des prix du marché, alors même que nombre de données transactionnelles ne correspondent pas aux prix réels ? Adrien Bernhardt, CTO de Homiwoo, revient sur les principaux défis relevés pour répondre à cet enjeu décisif et sur les solutions déployées pour y répondre.


Pour construire et alimenter ses modèles, Homiwoo mobilise de nombreuses sources de données et parmi celles-ci, les transactions issues de la base de DVF (Demande de Valeur Foncière). Publiée deux fois par an par l’État, avec un décalage de 4 mois, celle-ci rassemble l’intégralité des transactions foncières en France, que celles-ci concernent des lotissements ou des terrains, construits ou non.


Le prix du marché, à la jonction de l’offre et de la demande


Mais cette quête d’informations ne constitue que la partie immergée de l’iceberg. « Ce qui nous intéresse fondamentalement chez Homiwoo, notre principal défi, ce n’est pas de donner le prix de la base de données DVF, mais de fournir les prix de marché », explique Adrien Bernhardt : « Soit de déterminer précisément le prix d’équilibre : la rencontre de l’offre et de la demande ».


Si les offres ont l’avantage d’être en grande partie publiques, le prix de vente ne correspond pas forcément au prix du marché. La durée de la réalisation de la vente est par exemple à intégrer : les biens mettant longtemps à s’écouler se révélant, de fait, supérieurs au prix de marché, quand ceux vendus instantanément peuvent, au contraire, être inférieurs à celui-ci. La demande soulève, elle, d’autres types de défis, à commencer par le fait qu’aucune base de données ne la répertorie. De même, un certain nombre de transactions répertoriées dans la base de données DVF ne correspondent pas au prix du marché. Pour de multiples raisons, un logement peut ne pas être vendu ou valorisé au prix de marché : liquidation d’une communauté suite à un divorce, liquidation d’une succession, situation financière difficile des vendeurs, etc.


« La difficulté de notre métier est de parvenir à intégrer ces différentes particularités pour déterminer la vraie valeur de marché à un lieu donné, pour aider le client à prendre des décisions quant à la commercialisation de leur bien immobilier, résume Adrien Bernhardt. Il nous faut intégrer le fait qu’aucune des sources de données à disposition n’est précisément représentative de la valeur réelle de marché ». Le data scientist estime ainsi que plus d’un tiers des biens sur le marché sont concernés par des écarts non négligeables. Un exemple concret : la vente par un bailleur social d’un appartement au locataire occupant se traduit par une décôte du prix de vente. Dès lors, quand un bailleur social demande des prix du marché à une adresse où des ventes sociales ont été effectuées, il serait inopérant de leur transmettre les prix effectifs à cette adresse, car les prix sont biaisés.


Une approche sans équivalent sur le marché


Alors que d’autres acteurs du marché se basent sur un jeu de données qu’ils optimisent en enlevant des erreurs, Homiwoo a fait le choix de développer une approche scientifique singulière, mobilisant tout le potentiel de l’Intelligence artificielle et du big data. « Nous avons développé un modèle sans équivalent, pensé pour répondre précisément aux besoins des acteurs de l’immobilier, précise Adrien Bernhardt. Notre modèle nous permet de trouver le juste milieu entre les différentes données disponibles qui représentent la réalité du marché apparent, et d’un bien commercialisé de manière optimale et soumis correctement à la loi de l’offre et de la demande. » C’est ainsi que les outils déployés par Homiwoo donnent accès à une forte variété d’indicateurs (prix, délai d’écoulement, typologie du marché, etc.), granularités et types de contextualisation. Une fourchette de prix extrêmement précise peut de cette manière être proposée aux clients. Dans un second temps, la donnée est travaillée de manière à ce que les valeurs en sortie soient adaptées à son cas d’utilisation – par exemple pour les multiples métiers du bailleur social : prix de vente HLM, loyers libres, prix de sortie pour un programme neuf, etc.


Difficile pour Adrien Bernhardt d’illustrer tout ce qui permet d’atteindre cet objectif. « Alors que la plupart des algorithmes de machine learning relèvent de l’apprentissage supervisé, l’absence de jeu de données représentant la réalité à modéliser nous oblige à réaliser des calculs hautement complexes. À titre comparatif, intégrer dans du machine learning l’évolution éventuelle du prix d’un bien entre le moment où il est commercialisé et l’instant t ne pose pas de difficultés particulières. Même dans une période aussi mouvementée que la nôtre, la question de la variabilité des prix est beaucoup moins compliquée à modéliser ». Pour construire les modèles précis, plusieurs approches sont mobilisées. Un axe particulier porte sur l’identification des erreurs dans les sources de données afin de pouvoir les corriger: surfaces mal déclarées, attributs ou adresses qui ne correspondent pas, etc. D’autres se révèlent peu pertinentes ou inutilisables pour calculer le prix de marché. Et Adrien Bernhardt de résumer : « toute la plus-value d’Homiwoo est de s’appuyer sur une compétence métiers pour comprendre la réalité en jeu, puis d’être capable de la modéliser… avec des données qui ne représentent pas cette réalité ».


Comentários


bottom of page