Offenes Haus (openhouse.gr) ist eine Immobilienplattform, die derzeit von veröffentlicht wird von Scratch Studio. Sein Unterscheidungsmerkmal basiert auf einer sehr intuitiven, aber meist vergessenen Tatsache, dass der Kauf oder die Miete einer Immobilie im Wesentlichen bedeutet, auch die Nachbarschaft zu kaufen oder zu mieten. Im heutigen städtischen Umfeld sind Gewerbe- und Wohnimmobilien alles andere als isoliert. Im Allgemeinen beeinflusst die Umgebung direkt oder indirekt den Wert ihrer Immobilien. Sie können sich zum Beispiel einen Fall vorstellen, in dem ein Haus mit X-Merkmalen im Stadtzentrum liegt, während ein anderes mit den gleichen X-Merkmalen irgendwo auf dem Land steht. Auch wenn sie strukturell identisch sein könnten, wäre ihre Preisbewertung völlig unterschiedlich. Dies magazine als extremes Beispiel erscheinen, aber wir beobachten ziemlich ähnliche Fälle bei Immobilien innerhalb derselben Stadt.
Mittlerweile sollte klar sein, wie wichtig es ist, nicht nur die Faktoren zu bestimmen, die den Wert einer Immobilie beeinflussen, sondern auch das Ausmaß dieses Einflusses irgendwie zu quantifizieren. Dazu benötigen wir natürlich menschliches Fachwissen in Bereichen wie Stadtplanung, Ingenieurwesen und Softwareentwicklung. Ohne die benötigten Daten lässt sich jedoch nicht viel erreichen. Deshalb meinen wir es bei fromScratch Studio auch so, wenn wir sagen, dass wir Daten lieben. Wir betrachten Daten als ein sehr wertvolles Intestine, das bei richtiger Behandlung enorme Auswirkungen auf die Endbenutzer haben kann. Und in unserem Fall kann der richtige Umgang mit Daten möglicherweise dazu beitragen, dass jemand irgendwo das Haus seines Lebens findet.
Im September 2022 haben wir beschlossen, einige Anstrengungen zu unternehmen, um zu untersuchen, wie sich Lärmbelästigung auf die Immobilienpreise auswirkt. Wir hatten bereits eine ziemlich große Datenbank mit Immobilien in der Stadt Thessaloniki, Griechenland, wo die Plattform hauptsächlich aktiv ist, und wir brauchten die tatsächlichen Lärmdaten. Es erübrigt sich zu erwähnen, dass keine offenen Datensätze zu finden waren. Wir konnten nicht einmal unvollständige oder unvollständige Datensätze finden. Wenn wir darüber nachdenken, sollte dies bis zu einem gewissen Grad erwartet werden. Die Messung der Lärmbelastung ist alles andere als trivial, da hierfür spezielle Geräte und geschultes Private erforderlich sind. Wir können dafür nicht einfach das öffentliche Internet ausrangieren.
Nach einigen Tagen unermüdlicher Suche im Web hatten wir schließlich das Glück, einige offizielle Studien des griechischen Ministeriums für Umwelt und Energie zu finden. Diese Studien konzentrierten sich auf drei verschiedene Gemeinden in Thessaloniki und lieferten Durchschnittswerte für die Lärmbelästigung bei Tag und Nacht in sehr detaillierten Heatmaps. In einigen Gemeinden gingen sie noch einen Schritt weiter und unterschieden den Lärm anhand seiner Quelle (Straßennetz, Flugwege usw.). Die Aufregung hielt nicht lange an. Es begann allmählich zu sinken, da wir die tatsächlichen Lärmmessungen nicht finden konnten, die im Wesentlichen das waren, was wir brauchten. Was können wir jetzt machen?
Nach einer Brainstorming-Sitzung änderte das Ingenieurteam die Frage von „Was können wir tun“ in „Was können wir mit diesen Heatmaps tun?“. Und dann beschlossen wir, uns auf die schwierige Reise zu begeben, das Rauschen aus diesen Heatmaps zu extrahieren. Es conflict ein ehrgeiziger Plan, aber die Idee, endlich über solche Daten zu verfügen, ließ ihn wunderschön aussehen. Der grundlegendste Punkt, den wir erkennen mussten, conflict die Tatsache, dass wir das Rauschen einfach nicht extrahieren können, ohne Informationen zu verlieren. Glücklicherweise benötigen wir in unserem Anwendungsfall keine excessive Präzision, wenn es um Lärm geht. Uns ist es wichtig, wie Lärm von Menschen tatsächlich wahrgenommen wird, denn darauf kommt es an, wenn jemand eine Nachbarschaft bewertet. Unser Ziel beschränkte sich additionally darauf, den Geräuschsinn zu extrahieren, der durch unseren technischen Ansatz völlig plausibel conflict. Wie zu erwarten conflict, liefen die Dinge nicht ganz wie geplant. Mit einigen zusätzlichen Konfigurationen und Optimierungen der Extraktionsmethode erhielten wir jedoch einen brandneuen Lärmempfindungsdatensatz für die Gegend von Thessaloniki. Endlich konnten wir mit der Arbeit an dem lustigen Teil beginnen.
Das Konzept bestand darin, ein maschinelles Lernmodell zu entwickeln, mit dem Immobilienpreise vorhergesagt werden können. Im ersten Fall wird das Modell mit den Funktionen trainiert, die wir bereits hatten. Im zweiten Fall wird das Modell mit denselben Merkmalen plus dem neuen Rauschindex trainiert. Auf diese Weise können wir die beiden Modelle hinsichtlich ihrer Genauigkeit praktisch vergleichen und untersuchen, ob Rauschen die Gesamtleistung verbessert oder beeinträchtigt. Darüber hinaus wollten wir die Auswirkungen von Lärm auf die Preise beleuchten. Technisch wird dies als Erklärbarkeit und Interpretierbarkeit bezeichnet. Im Klartext kann uns die Erklärbarkeit sagen, welche Merkmale (z. B. die Grundstücksgröße) bei der Vorhersage des Zielwerts (d. h. des Preises) als wichtig erachtet werden, während die Interpretierbarkeit versucht, das Ausmaß und die Richtung zu messen, in der a Die Funktion beeinflusst den Zielwert.
Welches Modell sollen wir trainieren? Wir verbringen viel Zeit (additionally Wochen) damit, die Literatur und die neuesten Tendencies zu recherchieren. Viele Methoden und Techniken wurden ausführlich evaluiert und diskutiert. Um es kurz zu machen: Wir haben uns für die Verwendung von Ensemble-Modellen entschieden, weil sie sich bei Immobiliendaten als sehr intestine erwiesen haben. Der nächste Schritt bestand darin, die gewünschte MLOps-Infrastruktur aufzubauen, die unsere Experimente hosten wird. Um den gesamten Trainingsprozess vollständig überwachen und effektiv überwachen zu können, müssen strenge Abläufe, Metriken und Bewertungsstandards vorhanden sein. Der von uns gewählte Ansatz ist in beschrieben Das Mittlerer Artikel.
Im allerersten Versuchsdurchlauf trainierten wir verschiedene Arten von Ensemble-Modellen mit unterschiedlichen Konfigurationen für die gesamte Area der drei Gemeinden, in denen wir Lärmdaten hatten. Leider waren die Ergebnisse ziemlich schlecht. Das Modell, das den Lärmindex berücksichtigte, schnitt etwas schlechter ab als das Basismodell. Das Vorhandensein von Rauschen als Merkmal trug nicht nur nicht zur Verbesserung der Vorhersagen bei, sondern machte die Sache sogar noch schlimmer! Wir haben begonnen, den Zusammenhang zwischen dem Preis professional Quadratmeter und dem Lärmempfinden zu untersuchen und haben festgestellt, dass tatsächlich kein Zusammenhang besteht, wenn wir alle drei Gemeinden als ein ungeteiltes Gebiet betrachten. Und wenn wir darüber nachdenken, ergibt das absolut Sinn. Jede Area einer Stadt hat ihre eigenen Werte, Bedürfnisse, Ziele und Zwecke.
Nehmen wir an, wir haben zwei Immobilien, von denen sich eine im Stadtzentrum und die andere in einem Vorort befindet. Wir gehen davon aus, dass sich Lärm auf die beiden Grundstücke unterschiedlich auswirken wird, da jemand, der ein Haus im Zentrum kaufen möchte, toleranter gegenüber Lärmbelästigung ist als jemand, der Häuser in den ruhigen Vororten sucht. Im Grunde opfert ein Käufer die Ruhe der Vororte, um Zugang zu allen Annehmlichkeiten zu haben, die ein Stadtzentrum bietet (öffentliche Dienstleistungen, Unterhaltung, Gewerbe usw.), während der andere genau das Gegenteil tut.
Vor diesem Hintergrund haben wir drei verschiedene Regionen ausgewählt, basierend auf ihrer Entfernung zum Stadtzentrum und der Anzahl der Immobilien, die wir in jeder Area hatten. Der Zusammenhang zwischen Quadratmeterpreis und Lärmwerten conflict deutlich deutlicher. Wir entschieden uns dafür, für jeden Bereich unterschiedliche Modelle zu trainieren, und die Ergebnisse waren im Vergleich zu den ersten Läufen weitaus besser. In allen Bereichen verbesserte das Vorhandensein der Geräuschfunktion die Leistung der Modelle erheblich. Das interessanteste Ergebnis conflict jedoch nicht der Leistungsgewinn, sondern die Artwork und Weise, wie sich Lärm auf die Preise in den einzelnen Regionen auswirkt. Genauer gesagt gab es Regionen mit diametral entgegengesetzten Korrelationen. Beispielsweise gibt es im Stadtzentrum von Thessaloniki in Regionen mit erhöhtem Lärm den ganzen Tag über teurere Immobilien. Auch dies ist höchstwahrscheinlich auf die Kommerzstruktur zurückzuführen, die das Stadtzentrum kennzeichnet. Im Gegensatz dazu sinken die Preise in den Vororten dramatisch, wenn wir in Gebiete mit erhöhter Lärmbelästigung ziehen.
Diese Korrelationen können durch die folgenden zwei Teilabhängigkeitsdiagramme dargestellt werden. Die Diagramme zeigen die Abhängigkeit zwischen dem Zielwert (Preis) und dem durchschnittlichen Tageslärm in Dezibel.
Lärmbelästigung ist additionally ein ziemlich eigenartiges Merkmal. Im Gegensatz dazu, sagen wir, die Größe einer Immobilie, die quick stets Lärm führt dazu, dass die Preise steigen, wenn er steigt, und die Preise sinken, wenn er sinkt. Daher lässt sich Lärm nicht allgemein interpretieren. Es kann grundsätzlich unterschiedliche Auswirkungen auf Immobilien in verschiedenen Gebieten derselben Stadt haben. Die Essenz des Wortes anders fasst Merkmale zusammen, die das tatsächliche Profil des Gebiets umreißen. Normalerweise stehen diese in direktem Zusammenhang mit der Kommerzialität, den angebotenen Dienstleistungen (öffentlich oder privat) und der Stadtplanung im Allgemeinen. Die Besonderheit von Lärm macht es etwas schwierig, damit zu arbeiten. Um sein Potenzial in einem maschinellen Lernmodell voll ausschöpfen zu können, sollten sich auch Stadtplanungsexperten mit nützlichen Erkenntnissen an dem Prozess beteiligen.
Und damit endet der Beginn einer langen Reise. Wir haben mit einem ehrgeizigen Plan begonnen, Daten zur Lärmbelastung in unsere Plattform zu integrieren, obwohl wir über keine solchen Daten verfügen. Nach einigem Graben und umfangreicher Recherche ist es unserem Technikteam gelungen, die Daten zu extrahieren und Modelle für maschinelles Lernen zu erstellen, die nicht nur die Immobilienpreise vorhersagen, sondern auch die Rolle des Lärms in diesem Prozess erklären können. Diese Forschungsreise hat neue Horizonte eröffnet, wie Lärmbelästigung genutzt werden kann, um genauere und robustere Modelle für maschinelles Lernen zu erstellen, und wie sich Lärm auf Immobilienpreise auswirkt.
Und das Beste daran ist, dass all dieses Wissen nicht nur irgendwo im Web in einer Zeitung verbleibt, sondern praktisch genutzt wird, um Benutzern dabei zu helfen, die Immobilie zu finden, die sie wirklich suchen.