Beispielhafte synthetische Parallelfelddaten, die eine Kartenansicht der Möglichkeiten der virtuellen Welt zeigen.

Warum braucht künstliche Intelligenz eine stetige Ernährung mit synthetischen Daten?

Sehen Sie sich die On-Demand-Classes vom Low-Code/No-Code Summit an, um zu erfahren, wie Sie erfolgreich innovativ sein und Effizienzen erzielen können, indem Sie Citizen Developer weiterbilden und skalieren. Schau jetzt.


Künstliche Intelligenz (KI) magazine die Welt, wie wir sie kennen, auffressen, aber Experten sagen, dass die KI selbst auch am Verhungern ist – und ihre Ernährung ändern muss. sagt ein Unternehmen synthetische Daten ist die richtige Antwort.

„Daten sind Nahrung für KI, aber KI ist heute unterernährt und unterernährt“, sagte Kevin McNamara, CEO und Mitbegründer des Anbieters einer Plattform für synthetische Daten. paralleles Feld, Die Gerade Stärke 30 Millionen Greenback in der zweiten Runde. Deshalb wachsen die Dinge so langsam. Aber wenn wir diese KI besser füttern können, werden die Modelle schneller und gesünder wachsen. Synthetische Daten sind wie Nahrung für das Coaching künstlicher Intelligenz.

Untersuchungen haben gezeigt, dass ca 90% der Bereitstellungen von KI und maschinellem Lernen (ML) schlagen fehl. a Datengen Ein Anfang dieses Jahres veröffentlichter Bericht deutete darauf hin, dass ein Großteil des Scheiterns auf einen Mangel an Trainingsdaten zurückzuführen conflict. Gefunden, dass 99% von Computer Vision Fachleute sagen, dass sie das ML-Projekt genau wegen fehlender Daten gestoppt haben, um es durchzuziehen. 100 % der Befragten gaben an, dass selbst Projekte, die aufgrund fehlender Daten nicht vollständig abgebrochen wurden, erhebliche Verzögerungen erlebten, die dazu führten, dass sie aus dem Ruder liefen.

In diesem Zusammenhang erwartet Gartner, dass synthetische Daten zunehmend als Ergänzung für KI- und Machine-Studying-Trainingszwecke verwendet werden. Riesige Forschungsprojekte, die bis 2024 mit synthetischen Daten beschleunigt werden sollen 60% von Projekten der künstlichen Intelligenz.

Vorfall

Sensible Safety Summit

Erfahren Sie am 8. Dezember mehr über die entscheidende Rolle von KI und maschinellem Lernen in der Cybersicherheit und branchenspezifische Fallstudien. Registrieren Sie sich noch heute für Ihren kostenlosen Verkehrspass.

Jetzt registrieren

Synthetische Daten werden durch maschinelle Lernalgorithmen generiert, die echte Daten aufnehmen, um Verhaltensmuster zu trainieren und simulierte Daten zu erstellen, die die statistischen Eigenschaften des ursprünglichen Datensatzes beibehalten. Die resultierenden Daten replizieren reale Bedingungen, sind aber im Gegensatz zu standardmäßigen anonymisierten Datensätzen nicht anfällig für die gleichen Nachteile wie echte Daten.

Künstliche Intelligenz aus der „Steinzeit“ holen

Es magazine ungewöhnlich klingen zu hören, dass eine so fortschrittliche Technologie wie künstliche Intelligenz in einer Artwork „Steinzeit“ steckt, aber das sieht McNamara so – und ohne die Einführung synthetischer Daten wird es so bleiben, sagt er.

„Im Second ist die Entwicklung von KI so ähnlich wie die Computerprogrammierung in den 60er oder 70er Jahren, als die Leute Lochkartenprogrammierung verwendeten – ein sehr arbeitsintensiver, manueller Prozess“, sagte er. “Nun, die Welt hat sich endlich davon wegbewegt und hin zur digitalen Programmierung. Das wollen wir für die Entwicklung der künstlichen Intelligenz tun.”

Laut McNamara sind die drei größten Hindernisse, die KI in der Steinzeit zu halten, folgende:

  1. Datensammlung aus der realen Welt – was nicht immer möglich ist. Selbst für etwas wie Wandern, das in Städten auf der ganzen Welt ziemlich häufig vorkommt, wird es für Unternehmen schnell unerreichbar, wenn Sie Millionen von Beispielen benötigen, um Ihren Algorithmus zu trainieren, um aus der realen Welt herauszukommen.
  2. Hashtag – was oft Tausende von Stunden menschlicher Zeit erfordert und ungenau sein kann, weil Menschen Fehler machen.
  3. Iteration über die Daten Sobald es benannt ist, müssen Sie Sensorkonfigurationen usw. festlegen und dann anwenden, um mit dem Coaching Ihrer KI zu beginnen.

“Dieser ganze Prozess ist sehr langsam”, sagte McNamara. „Wenn Sie diese Dinge sehr schnell ändern können, können Sie tatsächlich bessere Einstellungen und bessere Wege finden, um Ihre KI überhaupt erst zu entwickeln.“

Betreten Sie die richtige Bühne: synthetische Daten

Parallel Area funktioniert durch die Erstellung virtueller Welten auf der Grundlage von Karten, die als “digitale Cousins” von realen Szenarien und Geographien bezeichnet werden. Diese Welten können verändert und manipuliert werden, um beispielsweise mehr Spaziergänge oder Regen zu ermöglichen, um autonome Fahrzeuge zu trainieren.

Beispielhafte synthetische Parallelfelddaten, die eine Kartenansicht der Möglichkeiten der virtuellen Welt zeigen.

Da Welten eher digitale Cousins ​​als digitale Zwillinge sind, kann die Personalisierung manchmal schwer zu beschaffende Daten simulieren, die jedoch für die Schulung unerlässlich sind und die Unternehmen normalerweise selbst besorgen müssen. Die Plattform ermöglicht es Benutzern, sie über eine API an ihre Bedürfnisse anzupassen, sodass sie Faktoren verschieben oder genau so manipulieren können, wie sie es möchten. Dies beschleunigt den KI-Trainingsprozess und beseitigt Zeit- und Aufwandsbarrieren.

Das Unternehmen behauptet, dass es innerhalb weniger Stunden Trainingsdatensätze für seine Kunden bereithalten kann – Kunden wie das Toyota Analysis Institute, Google, Continental und Oven Planet.

„Kunden können in die Simulationswelt eintauchen und Dinge geschehen lassen oder Daten aus dieser Welt ziehen“, sagte McNamara. „Wir kennen die verschiedenen Arten von Anlageklassen und Szenarien, die eintreten können, sowie Möglichkeiten, wie Kunden ihre eigene Logik dessen, was sie sehen, wo sie es sehen und wie sich diese Dinge verhalten, kommunizieren können.“

Dann brauchen Kunden eine Möglichkeit, Daten aus dieser Welt in eine Konfiguration zu bringen, die zu ihrem Setup passt, erklärte er.

„Die Instruments zur Sensorkonfiguration und Etikettenkonfiguration ermöglichen es uns, die genaue Kamerakonfiguration oder die genaue Lidar- und Radarkonfiguration und -kennzeichnung zu replizieren, die der Kunde sieht“, sagte er.

Synthetische Daten, generative künstliche Intelligenz

Synthetische Daten sind nicht nur nützlich, um ein KI- und maschinelles Lernmodell zu trainieren, sie können auch angewendet werden, um die generative KI – eine bereits schnell wachsende Anwendung der Technologie – schneller weiterzuentwickeln.

Parallel Area freut sich auf diesen Bereich, wenn das Unternehmen mit neuem Kapital in das Jahr 2023 geht. Es hofft, die Daten zu verdoppeln, die die KI benötigt, um es zu trainieren, damit es zu einem leistungsfähigeren Werkzeug für die Erstellung von Inhalten werden kann. Sein F&E-Staff konzentriert sich auf die Vielseitigkeit und Detailgenauigkeit der synthetischen Datensimulationen, die es bereitstellen kann.

„Ich bin begeistert von der generativen KI in unserem Bereich“, sagte McNamara. “Wir sind nicht hier, um eine künstlerische Interpretation der Welt zu schaffen. Wir sind wirklich hier, um einen digitalen Cousin der Welt zu schaffen. Ich denke, generative KI ist wirklich effektiv, wenn es darum geht, Beispiele von Bildern aus der ganzen Welt zu betrachten und dann zu ziehen sie einzubringen und interessante Beispiele und neue Informationen aus synthetischen Daten zu schaffen. Und deshalb wird die generative KI ein großer Teil des technologischen Fortschritts sein, in den wir im kommenden Jahr investieren.“

Der Wert synthetischer Daten ist nicht auf künstliche Intelligenz beschränkt. Aufgrund der großen Datenmenge, die zum Erstellen realistischer virtueller Umgebungen benötigt wird, ist dies auch die einzig praktikable Übertragungsmöglichkeit Metaverse nach vorne.

Parallel Area ist Teil des schnell wachsenden Startup-Sektors für synthetische Daten, der Crunchbase Ich habe bereits erwähnt, dass Sie eine große Gruppe von Finanzierungen erleben. Datagen, Gretel AI und Largely AI sind einige seiner Konkurrenten, die im vergangenen Jahr ebenfalls mehrere Millionen gesammelt haben.

Die Mission von VentureBeat Es soll die digitale Stadtarena für technische Entscheider sein, um sich Wissen über die Technologie von Transformations- und Transaktionsunternehmen anzueignen. Entdecken Sie unsere Briefings.

#Warum #braucht #künstliche #Intelligenz #eine #stetige #Ernährung #mit #synthetischen #Daten

Leave a Comment

Your email address will not be published. Required fields are marked *