Über den Autor und weitere Mitwirkende von Alexander Polomodov | Juli 2023

0
28


Ich habe die Stadt in Moskau verlassen und habe vor Kurzem eine Reihe weiterer Gesetzestexte gelesen John D. Kelleher и Brendan Tierneизданную в serie „The MIT Press Important Information Collection„. Ich habe diesen Textual content für dieses Format ausgewählt pocket e bookinteressanter Textual content, sehr interessant und einfach zu lesen, da andere Autoren diesen Textual content verfassen.

Рис.1 „Обложка книги“

Dieses Buch besteht aus sechs Kindern

Рис.2 „Sonstiges“

1. Was ist Datenwissenschaft?

Dieser Autor hat einen bestimmten Überblick über den Inhalt erhalten und ihn gelöscht information gathering и information evaluationкоторые были предшественниками information science, Termine, ein beliebter Stand im Dezember 1990. При рассказе о information gathering упоминается появление реляционных баз данных, nosql Aufgrund dessen sind die Mitarbeiter für die Erstellung großer Datenmengen im Rahmen eines Konzepts zuständig MapReduce. В information evaluation Autoren erstellen Statistiken, Methoden und Methoden zur maschinellen Überwachung, information mining и data discovery in databases. Es handelt sich dabei um zwei Personen, die unter dem Namen aufgeführt sind information science, которая начала активно развиваться с появление больших объемов данных анализии и мощностей for eго проведения. Здесь же авторы разбирают мифы о information science:

— Ob Spezialist für Autonomie information scienceкоторым можно просто доступ текущим данным компании и дальше они сделают что то хорошее не отвлекая остальных
— Про необходимость любого ds-Projekte mit vielen Namen und deep studying
– Ja, das sind die neuesten Instruments zur Verbesserung der Nutzungsqualität dsреализовывать ds-Projekte sind seit langem im Einsatz
— Ja ds-Projekte легко самоокупаются

2. Was sind Daten und was ist ein Datensatz?

Diese Autoren haben eine Reihe von Informationen zu Attributen und Dateiinhalten erstellt, mit denen wir eine Analyse planen. Weitere Informationen finden Sie hier analytics reportкоторая представляет собой матрицу n*m (n — количество сущностей и m — количество фичей). Weitere Autoren teilen die folgenden Datei- und Videotypen mit: numeric, nominal, ordinal. Die Artwork der Daten wird auf Methoden angewendet, die zur Analyse der Daten verwendet werden können. Viele Autoren befassen sich mit bautechnischen und bautechnischen Daten. Unglaublicherweise nach dieser Veröffentlichung captured information и exhaust information

Captured information Es handelt sich um eine Auswahl, die speziell für die Auswahl dieser Daten erstellt wurde
Exhaust information являются побочным эффектом (Beispiel, Data o like о retweet). Das sind typische Movies exhaust information являются метаданные (данные о данных).

Ich glaube nicht, dass es um Pyramiden geht DIKWкоторая показывает как связаны данные, информация, знания и мудрость:)

Bild 3 „DIKW Pyramide“

Nach und nach sind die populärsten Methoden bekannt CRISP-DM (Cross-industry commonplace course of for information mining), im Laufe der Zeit sind es weitere Schritte

— Понимание бизнес-целей (Enterprise Understanding)
— Начальное изучение данных (Knowledge Understanding)
— Подготовка данных (Knowledge Preparation)
— Modellierung (Modeling)
— Оценка (Analysis)
— Внедрение (Deployment)

In der Folgezeit wird das Foto nicht mehr veröffentlicht und weitergegeben, und es werden inzwischen mehrere Bilder veröffentlicht, da es schon lange nicht mehr verfügbar ist.

Abschnitt 4 „CRISP-DM-Methodik“

Im Laufe der Zeit haben sich einige Leute mit dieser Methodologie beschäftigt.

3. Ein datenwissenschaftliches Ökosystem

In diesem Fall ist es wichtig, dass die Technik funktioniert information science Projekte, ein ganz besonderes Projekt OLTP Basy данных с транзакционными данными и huge information решения аля Hadoop. Wir empfehlen Ihnen, eine beliebte und beliebte Lösung für die Entnahme/Abfüllung in unserem Land zu finden Apache Storm, Apache Spark, Apache Flink. Es gibt keine und keine Methods für beliebte Web sites Snowflake oder Databricks. Aus Gründen der Ökologie und Technologie ist es einfach, in jedem Second der Literatur mehr Aktualität zu erreichen.

4. Maschinelles Lernen

Diese Autoren analysieren das Ziel, Vorhersagen zu treffen, die eine Korrelation darstellen und die Kausalität erkennen lassen. Es handelt sich dabei um die Standardeinstellung

— Линейная регрессия
— Деревья решений
– Neue Web sites und deep studying eine weitere Empfehlung zum Lesen des Buches „The Deep Studying Revolution“ (Ja, das weiß ich nicht писал)

Die Autoren weisen darauf hin, dass diese Inhalte nicht verfügbar sind (biases) в машинном обучении

Pattern bias — Es ist ein Kratko, der in diesem Second, wie die Vertrauten damals, zu ihnen kamen ml-algorithmus. Wenn mehrere Tage vergangen sind, werden von diesem und diesem Algorithmus vorhergehende Ergebnisse angezeigt
Studying biasml-Algorithmus bedeutet, dass es sich um Silben- und Slab-Storonen handelt, und dass Sie sich nicht auf die Generalisierung von Mustern in den nächsten Tagen vorbereiten müssen Keine Kommentare und kein Kommentar. In diesem Fall auf dieser Modellebene ds-Spezialität, um verschiedene Modelle zu testen und Ergebnisse zu erzielen.

Einige Autoren sagen, dass die ML-Algorithmen keine Muster aus der Datenbank erstellen, die sie nicht kennen. Um dieses Modell regelmäßig zu trainieren, zu validieren und zu testen. Ja tut Es ist eine kreative und einfache Visualisierung.

5. Standardaufgaben der Datenwissenschaft

Von diesen Autoren werden Beispiele angefordert, die möglicherweise abgelehnt werden information science. Dies sind die Beispiele

— Was sind unsere Kunden? (Klasterisierung) – здесь рассказ про k-means
— Was ist das? (Erkennung einer Anomalie) – здесь речь про one-class support-vector machine (SVM)
– Was ist die Karte von Hamburg? (association-rule mining) – Bitte beachten Sie, dass es sich um bestimmte Produkte handelt und diese innerhalb kürzester Zeit erworben werden müssen
— Kundenbewertung (Klassifizierung) – Um Kundenanfragen zu beantworten, werden diese in die nächste Woche verschoben. Standardmäßige Klassifizierung
— Was soll ich tun? (Regression) – про предсказание стоимости домов, машин, Aktion (Das Urteil der Autoren wurde nicht beantwortet.)

Es gibt noch viele weitere Gründe, warum ich mit der Arbeit meines Lebens nichts anfangen kann, weil ich schon quick ein paar Tage damit verbracht habe.

6. Datenschutz und Ethik

Es handelt sich um eine große Obszönität aus diesen Gesetzen, die tatsächlich aus geschichtsträchtigen Zeiten stammen. Es gibt keine Technik, die ich kaufen möchte GDPR Und zu diesem Zeitpunkt ist es wichtig, mehr aktuelle Geschichten zu lesen.

7. Zukünftige Traits und Erfolgsprinzipien

Im Folgenden analysieren Autoren die Perspektiven: Ihre Medikamente und Ihre Stadt. А потом отвечают на вопрос „Können ds-Projekte keine Verstöße bewirken?“ Dieses Projekt basiert auf einem neuen, nachhaltigen Projekt und wird bereitgestellt, das nun für die Verwirklichung bestimmt ist

— Фокус — четкая und понятная постановка решаемой проблемы
— Dann — Sobald dies der Fall ist, kann ich es nicht verpassen
– Männer – für die Projektverwirklichung wurde kein Auftrag von einigen Wettbewerbern erteilt
— Modelle — Wir müssen ein aktuelles Experiment mit einem bestimmten Modell durchführen, das Ihnen gute Ergebnisse liefert
– Geschäftsintegration – Die Integration von Modellen in Systemsysteme und die damit verbundene Integration kann möglich sein
Purchase-in — Um das Projekt zu unterstützen, muss es sich um einen Sponsor in einem Prime-Unternehmen aus der Wirtschaft handeln, das sich im Rahmen des Projekts auszahlt
– Prüfung – Wenn ein Projekt einen Antrag gestellt hat, muss das Modell in neuen Tagen nicht neu erstellt und vor der Auswahl von Standorten bearbeitet werden



Source link

HINTERLASSEN SIE EINE ANTWORT

Please enter your comment!
Please enter your name here