Xavier Conort, Mitbegründer und CPO von FeatureByte – Interview Series

0
24


Xavier Conort ist ein visionärer Datenwissenschaftler mit mehr als 25 Jahren Datenerfahrung. Er begann seine Karriere als Aktuar in der Versicherungsbranche, bevor er in die Datenwissenschaft wechselte. Er ist ein hochrangiger Kaggle-Konkurrent und struggle Chief Knowledge Scientist bei DataRobot, bevor er FeatureByte mitbegründete.

FeatureByte ist auf der Mission, die Unternehmens-KI zu skalieren, indem KI-Daten radikal vereinfacht und industrialisiert werden. Die Characteristic-Engineering- und Administration-Plattform ermöglicht es Datenwissenschaftlern, hochmoderne Options und produktionsreife Datenpipelines innerhalb von Minuten – statt Wochen oder Monaten – zu erstellen und zu teilen.

Sie begannen Ihre Karriere als Aktuar in der Versicherungsbranche, bevor Sie zu Knowledge Science wechselten. Was hat diesen Wandel verursacht?

Ein entscheidender Second struggle der Gewinn des GE Flight Quest, eines von GE organisierten Wettbewerbs mit einem Preisgeld von 250.000 US-Greenback, bei dem die Teilnehmer Verspätungen von US-Inlandsflügen vorhersagen mussten. Einen Teil dieses Erfolgs verdanke ich einer wertvollen Versicherungspraxis: der 2-Stufen-Modellierung. Dieser Ansatz trägt dazu bei, Verzerrungen bei Merkmalen zu kontrollieren, die in den verfügbaren Trainingsdaten nicht ausreichend vertreten sind. Zusammen mit anderen Siegen bei Kaggle überzeugte mich dieser Erfolg davon, dass mein versicherungsmathematischer Hintergrund mir einen Wettbewerbsvorteil im Bereich Datenwissenschaft verschaffte.

Während meiner Kaggle-Reise hatte ich auch das Privileg, mit anderen begeisterten Datenwissenschaftlern in Kontakt zu treten, darunter Jeremy Achin und Tom De Godoy, die später die Gründer von DataRobot wurden. Wir hatten einen gemeinsamen Hintergrund im Versicherungswesen und hatten auf Kaggle bemerkenswerte Erfolge erzielt. Als sie schließlich starteten Datenroboter, einem auf AutoML spezialisierten Unternehmen, luden sie mich ein, als Chief Knowledge Scientist zu ihnen zu stoßen. Ihre Imaginative and prescient, die Finest Practices aus der Versicherungsbranche mit der Leistungsfähigkeit von zu kombinieren maschinelles Lernen hat mich begeistert und mir die Gelegenheit geboten, etwas Innovatives und Wirkungsvolles zu schaffen.

Bei DataRobot und maßgeblich am Aufbau ihrer Knowledge Science-Roadmap beteiligt. Vor welchen Datenherausforderungen standen Sie?

Die größte Herausforderung für uns struggle die unterschiedliche Qualität der Daten, die als Eingabe für unsere AutoML-Lösung bereitgestellt wurden. Dieses Drawback führte oft entweder zu einer zeitaufwändigen Zusammenarbeit zwischen unserem Crew und unseren Kunden oder zu enttäuschenden Ergebnissen in der Produktion, wenn es nicht angemessen angegangen wurde. Die Qualitätsprobleme hatten verschiedene Ursachen und erforderten unsere Aufmerksamkeit.

Eine der größten Herausforderungen ergab sich aus der allgemeinen Verwendung von Enterprise-Intelligence-Instruments zur Datenvorbereitung und -verwaltung. Obwohl diese Instruments für die Generierung von Erkenntnissen wertvoll sind, fehlen ihnen die erforderlichen Funktionen, um die punktuelle Korrektheit bei der Datenaufbereitung für maschinelles Lernen sicherzustellen. Infolgedessen könnten Lecks in den Trainingsdaten auftreten, die zu einer Überanpassung und einer ungenauen Modellleistung führen.

Eine weitere Herausforderung, die sich auf die Genauigkeit der Modelle während der Produktion auswirkte, struggle die fehlerhafte Kommunikation zwischen Datenwissenschaftlern und Dateningenieuren. Inkonsistenzen zwischen der Trainings- und der Produktionsphase, die aus einer Fehlausrichtung zwischen diesen beiden Groups resultieren, könnten sich auf die Modellleistung in einer realen Umgebung auswirken.

Was waren einige der wichtigsten Erkenntnisse aus dieser Erfahrung?

Meine Erfahrung bei DataRobot hat die Bedeutung der Datenaufbereitung beim maschinellen Lernen deutlich gemacht. Durch die Bewältigung der Herausforderungen bei der Generierung von Modelltrainingsdaten, wie z. B. Zeitpunktkorrektheit, Fachwissenslücken, Domänenwissen, Tooleinschränkungen und Skalierbarkeit, können wir die Genauigkeit und Zuverlässigkeit von Modellen für maschinelles Lernen verbessern. Ich bin zu dem Schluss gekommen, dass die Optimierung des Datenaufbereitungsprozesses und die Einbindung innovativer Technologien entscheidend dazu beitragen werden, das volle Potenzial der KI auszuschöpfen und ihre Versprechen einzulösen.

Wir haben auch von Ihrem Mitbegründer Razi Raziuddin gehört Könnten wir über die Entstehungsgeschichte hinter FeatureByte Ihre Model der Ereignisse erfahren?

Als ich meine Beobachtungen und Erkenntnisse mit meinem Mitbegründer Razi Raziuddin besprach, stellten wir fest, dass wir ein gemeinsames Verständnis der Herausforderungen bei der Datenaufbereitung für maschinelles Lernen hatten. Während unserer Diskussionen teilte ich Razi meine Erkenntnisse über die jüngsten Fortschritte in der MLOps-Group mit. Ich konnte das Aufkommen von Characteristic-Shops und Characteristic-Plattformen beobachten, die KI-orientierte Technologieunternehmen einführen, um die Latenz der Characteristic-Bereitstellung zu reduzieren, die Wiederverwendung von Options zu fördern oder die Characteristic-Materialisierung in Trainingsdaten zu vereinfachen und gleichzeitig die Konsistenz der Trainings-Bereitstellung sicherzustellen. Für uns struggle jedoch klar, dass es immer noch eine Lücke bei der Erfüllung der Bedürfnisse von Datenwissenschaftlern gab. Razi teilte mir seine Erkenntnisse darüber mit, wie der moderne Datenstapel BI und Analysen revolutioniert hat, aber nicht vollständig für die KI genutzt wird.

Sowohl Razi als auch mir wurde klar, dass wir die Möglichkeit hatten, einen erheblichen Einfluss zu erzielen, indem wir den Characteristic-Engineering-Prozess radikal vereinfachten und Datenwissenschaftlern und ML-Ingenieuren die richtigen Instruments und Benutzererfahrungen für nahtloses Characteristic-Experimentieren und Characteristic-Bereitstellung zur Verfügung stellten.

Was waren einige Ihrer größten Herausforderungen beim Übergang vom Datenwissenschaftler zum Unternehmer?

Der Übergang vom Datenwissenschaftler zum Unternehmer erforderte für mich einen Wechsel von einer technischen Perspektive zu einer breiteren geschäftsorientierten Denkweise. Während ich über solide Kenntnisse im Verstehen von Schwachstellen, beim Erstellen einer Roadmap, beim Ausführen von Plänen, beim Aufbau eines Groups und beim Verwalten von Budgets verfügte, stellte ich fest, dass es eines meiner größten Hindernisse struggle, die richtigen Botschaften zu verfassen, die wirklich bei unserer Zielgruppe ankamen.

Als Datenwissenschaftler lag mein Hauptaugenmerk schon immer auf der Analyse und Interpretation von Daten, um daraus wertvolle Erkenntnisse abzuleiten. Als Unternehmer musste ich jedoch mein Denken auf den Markt, die Kunden und das gesamte Unternehmen umstellen.

Glücklicherweise konnte ich diese Herausforderung meistern, indem ich die Erfahrung von jemandem wie meinem Mitbegründer Razi nutzte.

Wir haben von Razi gehört Warum ist Characteristic Engineering so schwierig? Was macht es Ihrer Meinung nach so herausfordernd?

Beim Characteristic Engineering gibt es zwei Hauptherausforderungen:

  1. Vorhandene Spalten transformieren: Dabei werden Daten in ein geeignetes Format für Machine-Studying-Algorithmen umgewandelt. Dabei kommen Techniken wie One-Scorching-Encoding, Characteristic-Skalierung und fortgeschrittene Methoden wie Textual content- und Bildtransformationen zum Einsatz. Das Erstellen neuer Options aus vorhandenen Options, wie z. B. Interaktionsfeatures, kann die Modellleistung erheblich verbessern. Beliebte Bibliotheken wie scikit-learn und Hugging Face bieten umfassende Unterstützung für diese Artwork von Characteristic-Engineering. Auch AutoML-Lösungen zielen darauf ab, den Prozess zu vereinfachen.
  2. Extrahieren neuer Spalten aus historischen Daten: Historische Daten sind in Problembereichen wie Empfehlungssystemen, Advertising and marketing, Betrugserkennung, Versicherungspreisen, Kreditbewertung, Nachfrageprognosen und Sensordatenverarbeitung von entscheidender Bedeutung. Das Extrahieren informativer Spalten aus diesen Daten ist eine Herausforderung. Beispiele hierfür sind die Zeit seit dem letzten Ereignis, Aggregationen über aktuelle Ereignisse und Einbettungen aus Ereignissequenzen. Diese Artwork von Characteristic-Engineering erfordert Domänenkenntnisse, Experimentierfreudigkeit, ausgeprägte Codierungs- und Knowledge-Engineering-Fähigkeiten sowie fundierte Kenntnisse in den Datenwissenschaften. Faktoren wie Zeitverlust, Umgang mit großen Datensätzen und effiziente Codeausführung müssen ebenfalls berücksichtigt werden.

Insgesamt erfordert Characteristic Engineering Fachwissen, Experimente und den Aufbau komplexer Advert-hoc-Datenpipelines, da es keine speziell dafür entwickelten Instruments gibt.

Können Sie uns mitteilen, wie FeatureByte Knowledge-Science-Experten unterstützt und gleichzeitig Characteristic-Pipelines vereinfacht?

FeatureByte unterstützt Knowledge-Science-Experten durch die Vereinfachung des gesamten Prozesses beim Characteristic-Engineering. Mit einem intuitiven Python-SDK ermöglicht es die schnelle Erstellung und Extraktion von Options aus XLarge-Ereignis- und Artikeltabellen. Die Berechnung wird effizient durchgeführt, indem die Skalierbarkeit von Datenplattformen wie Snowflake, DataBricks und Spark genutzt wird. Notebooks erleichtern das Experimentieren, während die gemeinsame Nutzung und Wiederverwendung von Funktionen Zeit spart. Die Prüfung stellt die Funktionsgenauigkeit sicher, während die sofortige Bereitstellung Probleme bei der Pipelineverwaltung beseitigt.

Zusätzlich zu diesen Funktionen, die unsere Open-Supply-Bibliothek bietet, bietet unsere Unternehmenslösung ein umfassendes Framework für die Verwaltung und Organisation von KI-Operationen im großen Maßstab, einschließlich Governance-Workflows und einer Benutzeroberfläche für den Funktionskatalog.

Was ist Ihre Imaginative and prescient für die Zukunft von FeatureByte?

Unsere ultimative Imaginative and prescient für FeatureByte ist es, den Bereich der Datenwissenschaft und des maschinellen Lernens zu revolutionieren, indem wir Benutzern die Möglichkeit geben, ihr volles kreatives Potenzial auszuschöpfen und einen beispiellosen Wert aus ihren Datenbeständen zu ziehen.

Wir freuen uns besonders über die rasanten Fortschritte bei der generativen KI und den Transformatoren, die unseren Nutzern eine Welt voller Möglichkeiten eröffnen. Darüber hinaus setzen wir uns für die Demokratisierung des Characteristic Engineerings ein. Generative KI hat das Potenzial, die Eintrittsbarriere für kreatives Characteristic-Engineering zu senken und es einem breiteren Publikum zugänglicher zu machen.

Zusammenfassend dreht sich unsere Imaginative and prescient für die Zukunft von FeatureByte um kontinuierliche Innovation, die Nutzung der Leistungsfähigkeit der generativen KI und die Demokratisierung des Characteristic-Engineerings. Unser Ziel ist es, die Anlaufstelle zu sein, die es Datenexperten ermöglicht, Rohdaten in umsetzbare Eingaben für maschinelles Lernen umzuwandeln und so branchenübergreifend Durchbrüche und Fortschritte voranzutreiben.

Haben Sie einen Rat für angehende KI-Unternehmer?

Definieren Sie Ihren Raum, bleiben Sie konzentriert und begrüßen Sie Neues.

Indem Sie den Raum definieren, den Sie besitzen möchten, können Sie sich differenzieren und in diesem Bereich eine starke Präsenz aufbauen. Erforschen Sie den Markt, verstehen Sie die Bedürfnisse und Schwachstellen potenzieller Kunden und streben Sie danach, eine einzigartige Lösung bereitzustellen, die diese Herausforderungen effektiv bewältigt.

Definieren Sie Ihre langfristige Imaginative and prescient und legen Sie klare kurzfristige Ziele fest, die mit dieser Imaginative and prescient übereinstimmen. Konzentrieren Sie sich darauf, ein starkes Fundament zu schaffen und in dem von Ihnen gewählten Raum einen Mehrwert zu schaffen.

Auch wenn es wichtig ist, konzentriert zu bleiben, scheuen Sie sich nicht davor, Neues anzunehmen und neue Ideen innerhalb Ihres definierten Raums zu erkunden. Der KI-Bereich entwickelt sich ständig weiter und modern Ansätze können neue Möglichkeiten eröffnen.

Vielen Dank für das tolle Interview, Leser, die mehr erfahren möchten, sollten vorbeischauen FeatureByte.



Source link

HINTERLASSEN SIE EINE ANTWORT

Please enter your comment!
Please enter your name here