Gewinner des VB Transform Innovation Showcase: Unstructured.io

Greifen Sie auf unsere On-Demand-Bibliothek zu, um VB Transform 2023-Sitzungen anzusehen. Melden Sie sich hier an

Unternehmen verfügen heute über große Mengen unstrukturierter Daten, die über viele Umgebungen verstreut sind.

Das „schmutzige Geheimnis“ besteht laut Bryan Raymond, Gründer und CEO von Unstructred.io, darin, dass Datenwissenschaftler all diese Daten oft immer noch genauso verarbeiten wie vor 20 Jahren, normalerweise durch manuelles Erstellen von Vorverarbeitungsrichtlinien.< /p>

„Datenwissenschaftler hassen Vorverarbeitung“, sagte er dem Publikum von VentureBeat Transform 2023. „Es ist, als würde man zum Zahnarzt gehen.“

Unstructured.io, das natürliche Sprache verwendet, um Daten aus ihrer Rohform in lernbereite Daten umzuwandeln, wurde als Unternehmen mit den höchsten Erfolgsaussichten im VentureBeat Transform 2023 Innovation Showcase ausgewählt.

Fall

VB Transform 2023 auf Anfrage

Haben Sie eine Sitzung von VB Transform 2023 verpasst? Melden Sie sich an, um auf die On-Demand-Bibliothek aller unserer vorgestellten Sitzungen zuzugreifen.

Jetzt registrieren Verbinden Sie Daten mit LLMs

Raymond beschrieb die Plattform seines Unternehmens als ETL (Extrahieren, Transformieren und Laden) für große Sprachmodelle (LLM).

„Wir betrachten uns gerne als die Spitze des Tunnels“, sagte er.

Unstructured.io verbindet Daten mit LLMs und nutzt eine Vielzahl von Technologien, darunter Computer Vision, Natural Language Processing (NLP) und Python-Skripting, um Komplexität zu extrahieren.

Unstrukturierte Daten werden kuratiert, von Artefakten bereinigt und für LLM vorbereitet, erklärte Raymond. Dies ist eine einfachere und schnellere Strategie, und Datenwissenschaftler müssen nicht Hunderte von Zeilen Analysecode schreiben.

Saubere, strukturierte Daten können schwer zu erfassen sein

Die Unternehmens-API des Tools ermöglicht browserbasierte Workflows für alle Arten von Entwicklern und unterstützt die Vorverarbeitung von über 25 Dateitypen und Tausenden von Formaten in über 100 Sprachen, sagte Raymond. Es ist als kostenlose API, als Google Colab-Notizbuch und auf GitHub verfügbar, wo seine Bibliothek Open-Source-Komponenten für die Vorverarbeitung von Textdokumenten wie PDF-, HTML- und Word-Dokumenten bereitstellt.

Raymond sagte, er sei auf die Idee für das Unternehmen gekommen, nachdem er bei seinem früheren Arbeitgeber „in der Daten-Engineering-Hölle feststeckte“. Allein die Beschaffung sauberer, strukturierter Daten habe Jahre gedauert, sagte er.

Unstructured.io wurde 2022 gegründet und das Unternehmen arbeitet derzeit „hart“ an Datenkonnektoren der Enterprise-Klasse, die widerstandsfähig gegenüber Unterbrechungen sind und neue Dateiversionen erkennen und problemlos parallelisieren können, sagte Raymond. Das Unternehmen verfügt derzeit über 15 Datenkonnektoren und plant, die Zahl auf über 30 zu erhöhen.

Das diesjährige VentureBeat Transform Innovation Showcase stellte 10 einzigartige Unternehmen in den Bereichen generative KI, maschinelles Lernen (ML) und Analyse vor ...

Gewinner des VB Transform Innovation Showcase: Unstructured.io

Greifen Sie auf unsere On-Demand-Bibliothek zu, um VB Transform 2023-Sitzungen anzusehen. Melden Sie sich hier an

Unternehmen verfügen heute über große Mengen unstrukturierter Daten, die über viele Umgebungen verstreut sind.

Das „schmutzige Geheimnis“ besteht laut Bryan Raymond, Gründer und CEO von Unstructred.io, darin, dass Datenwissenschaftler all diese Daten oft immer noch genauso verarbeiten wie vor 20 Jahren, normalerweise durch manuelles Erstellen von Vorverarbeitungsrichtlinien.< /p>

„Datenwissenschaftler hassen Vorverarbeitung“, sagte er dem Publikum von VentureBeat Transform 2023. „Es ist, als würde man zum Zahnarzt gehen.“

Unstructured.io, das natürliche Sprache verwendet, um Daten aus ihrer Rohform in lernbereite Daten umzuwandeln, wurde als Unternehmen mit den höchsten Erfolgsaussichten im VentureBeat Transform 2023 Innovation Showcase ausgewählt.

Fall

VB Transform 2023 auf Anfrage

Haben Sie eine Sitzung von VB Transform 2023 verpasst? Melden Sie sich an, um auf die On-Demand-Bibliothek aller unserer vorgestellten Sitzungen zuzugreifen.

Jetzt registrieren Verbinden Sie Daten mit LLMs

Raymond beschrieb die Plattform seines Unternehmens als ETL (Extrahieren, Transformieren und Laden) für große Sprachmodelle (LLM).

„Wir betrachten uns gerne als die Spitze des Tunnels“, sagte er.

Unstructured.io verbindet Daten mit LLMs und nutzt eine Vielzahl von Technologien, darunter Computer Vision, Natural Language Processing (NLP) und Python-Skripting, um Komplexität zu extrahieren.

Unstrukturierte Daten werden kuratiert, von Artefakten bereinigt und für LLM vorbereitet, erklärte Raymond. Dies ist eine einfachere und schnellere Strategie, und Datenwissenschaftler müssen nicht Hunderte von Zeilen Analysecode schreiben.

Saubere, strukturierte Daten können schwer zu erfassen sein

Die Unternehmens-API des Tools ermöglicht browserbasierte Workflows für alle Arten von Entwicklern und unterstützt die Vorverarbeitung von über 25 Dateitypen und Tausenden von Formaten in über 100 Sprachen, sagte Raymond. Es ist als kostenlose API, als Google Colab-Notizbuch und auf GitHub verfügbar, wo seine Bibliothek Open-Source-Komponenten für die Vorverarbeitung von Textdokumenten wie PDF-, HTML- und Word-Dokumenten bereitstellt.

Raymond sagte, er sei auf die Idee für das Unternehmen gekommen, nachdem er bei seinem früheren Arbeitgeber „in der Daten-Engineering-Hölle feststeckte“. Allein die Beschaffung sauberer, strukturierter Daten habe Jahre gedauert, sagte er.

Unstructured.io wurde 2022 gegründet und das Unternehmen arbeitet derzeit „hart“ an Datenkonnektoren der Enterprise-Klasse, die widerstandsfähig gegenüber Unterbrechungen sind und neue Dateiversionen erkennen und problemlos parallelisieren können, sagte Raymond. Das Unternehmen verfügt derzeit über 15 Datenkonnektoren und plant, die Zahl auf über 30 zu erhöhen.

Das diesjährige VentureBeat Transform Innovation Showcase stellte 10 einzigartige Unternehmen in den Bereichen generative KI, maschinelles Lernen (ML) und Analyse vor ...

What's Your Reaction?

like

dislike

love

funny

angry

sad

wow