Das Potenzial von Milliarden Dollar an synthetischen Daten

Das Potenzial von Milliarden Dollar an synthetischen Daten

Besuchen Sie uns am 9. November, um auf dem Code-Low/No-Code Summit zu erfahren, wie Sie erfolgreich innovativ sein und Effizienz erreichen können, indem Sie Bürgerentwickler weiterbilden und skalieren. Hier registrieren.


Synthetische Daten In fünf bis zehn Jahren wird es eine riesige Industrie sein. Zum Beispiel Gartner Schätzungen Dass bis 2024 60 % der Daten für KI-Anwendungen synthetisch sein werden. Diese Artwork von Daten und die zu ihrer Erstellung verwendeten Instruments haben ein großes ungenutztes Investitionspotenzial. Hier ist der Grund.

Synthetische Daten können datenhungrige KI/maschinelles Lernen antreiben

Wir stehen buchstäblich an der Schwelle zu einer Revolution, wie maschinelles Lernen (ML) und Künstliche Intelligenz KI kann wachsen und mehr Anwendungen in allen Sektoren und Industrien haben.

Wir leben in einer Ära der steigenden Nachfrage nach ML-Algorithmen in jedem Aspekt unseres Lebens, von lustigen Gesichtsmaskierungs-Apps wie Filtern auf Instagram oder Snapchat bis hin zu äußerst nützlichen Apps, die unsere Arbeits- und Lebenserfahrung verbessern sollen, z. B. bei der Diagnose von Krankheiten oder der Empfehlung von Behandlungen. Zu den wichtigsten Möglichkeiten gehören Emotionserkennung und -bindung, verbesserte Heimatschutzfunktionen und eine bessere Erkennung von Anomalien in industriellen Kontexten.

Gleichzeitig dürsten Menschen und Unternehmen ML / KIAlgorithmenbasierte Produkte sind hungrig nach Daten, auf denen sie trainieren können. All dies bedeutet, dass wir zwangsläufig immer mehr unterschiedliche Datenanforderungen sehen werden, und vollständig hergestellte Daten sind der Schlüssel.

Vorfall

Low-Prime-Image / kein Image

Erfahren Sie am 9. November, wie Sie Low-Code-Software program unkompliziert erstellen, messen und verwalten, die alle erfolgreich macht. Registrieren Sie sich noch heute für Ihren kostenlosen Cross.

Hier registrieren

Aus schwerer Kraftfahrzeugdiebstahl für Google

Ich habe von selbstfahrenden Autos gehört, die die Verkehrsregeln durch Spiele wie lernen Grand Theft Auto V Virtuellen Verkehr studieren? Das battle eine frühe Model von ML mit synthetischen Daten. In ähnlicher Weise sind viele Techniker möglicherweise auf künstliche „gescannte Dokumente“ gestoßen, die zum Trainieren von Texterkennungs- und Knowledge-Mining-Modellen verwendet wurden.

Das Financial institution- und Finanzwesen ist einer der Sektoren, der für bestimmte Vorgänge bereits stark auf synthetische Daten angewiesen ist, während Technologiegiganten wie Google und Fb sie ebenfalls nutzen und von der außergewöhnlichen Effizienz profitieren, die sie bei der Arbeit von Projektmanagern und Datenwissenschaftlern erzielen können.

Tatsächlich erwarten wir, dass sich die Zahl der synthetischen Bilder und Datenpunkte im Laufe des nächsten Jahres verzehnfacht und in den nächsten Jahren hundertfach erhöht.

Datenbeschränkungen in der realen Welt

Diejenigen, die an der Spitze von ML stehen, wenden sich zunehmend synthetischen Daten zu, um die vielen Einschränkungen von Originaldaten oder Daten aus der realen Welt zu umgehen. Zum Beispiel Firma AI.Synthese Bietet eine Cloud-basierte Erstellungsplattform, die Millionen völlig unterschiedlicher kategorisierter Bilder von künstlichen Menschen bereitstellt. Synthesis AI battle in der Lage, viele der Herausforderungen zu bewältigen, die mit der chaotischen Realität von Originaldaten verbunden sind. Zunächst einmal macht das Unternehmen Daten billiger. Es kann für ein Unternehmen zu kostspielig sein, die benötigte Menge und Vielfalt an Daten zu generieren.

Kann man zum Beispiel jemanden aus jedem erdenklichen Blickwinkel fotografieren, in jeder möglichen Kombination von Kleidung und bei allen möglichen Lichtverhältnissen? Es wäre ein unvorstellbarer Arbeitsaufwand, dies im wirklichen Leben zu tun, aber synthetische Daten können so angepasst werden, dass sie unendliche Unterschiede berücksichtigen.

Das bedeutet auch, dass die Daten leicht einzuordnen sind. Stellen Sie sich vor, Sie versuchen, die Lichtquelle, ihre Helligkeit und ihren Abstand von einem Objekt in Bildern zu bestimmen, um einen Schattenentwicklungsalgorithmus zu trainieren. Es wäre so intestine wie unmöglich. mit Synthetische Datenhaben Sie diese Daten standardmäßig, da sie mit solchen Parametern erstellt wurden.

Darüber hinaus müssen sich Unternehmen auch mit strengen Einschränkungen bei der Nutzung von Actual-World-Daten auseinandersetzen. In der Vergangenheit haben Unternehmen Daten ohne die heute erwarteten Ebenen der Cybersicherheit ausgetauscht. Die Datenschutz-Grundverordnung (DSGVO) und andere Datenschutzvorschriften machen es für Unternehmen komplex, schwierig und manchmal unlawful, reale Daten mit Partnern und Lieferanten zu teilen.

In anderen Fällen ist es möglicherweise nicht möglich oder sicher, die Daten zu generieren. Echtzeit-3D-Engine-Produkt Unigen zählen als Kunde Didalian, das sich mit urbaner Luftmobilität befasst. Daedalean hat mit dem Coaching seiner eigenen autonom fliegenden Autos begonnen Unigine virtuelle Welten. Das ist absolut sinnvoll – es gibt noch keine sichere, reale Umgebung, um seine Produkte in großem Maßstab zu testen und die benötigten tiefen Datensätze zu erstellen. Ähnlicher Fall ist CarMaker برنامج Von IPG Automotive. dass es Version 10.0 Präsentiert eine verbesserte 3D-Visualisierung powered by UNIGINE 2 Sim, die physisches Rendering und realistische Kameraparameter bietet.

Künstliche Menschen und künstliche Dinge wurden in letzter Zeit von Technologiegiganten weit verbreitet. Amazonas Verwendung synthetischer Daten Um Alexa und Fb zu trainieren erworben Synthetischer Datengenerator AI.Reverie und Nvidia realisiert NVIDIA Omniverse Replikatoreine leistungsstarke Engine zur Generierung synthetischer Daten, die synthetische, physikalisch simulierte Daten zum Trainieren tiefer neuronaler Netze erzeugt.

Bekämpfung von Datenbias

Die realen Datenherausforderungen enden hier nicht. In einigen Bereichen verunreinigt eine enorme historische Verzerrung die Datensätze. So geraten globale Technologiegiganten in heißes Wasser, weil ihre Algorithmen schwarze Gesichter nicht richtig erkennen. Selbst jetzt, wo Experten für maschinelles Lernen sich des Bias-Issues bewusst sind, kann es schwierig sein, einen echten Datensatz zu vergleichen, der völlig frei von Bias ist.

Auch wenn ein realer Datensatz all die oben genannten Herausforderungen erklären kann, die eigentlich schwer vorstellbar sind, müssen Datenmodelle ständig verbessert und angepasst werden, um unvoreingenommen zu bleiben und eine Verschlechterung im Laufe der Zeit zu vermeiden. Dies bedeutet den ständigen Bedarf an neuen Daten.

Verstehen Sie die Gelegenheit

Synthetische Daten befinden sich in einem relativ frühen Entwicklungsstadium und sind kein Allheilmittel für jeden Anwendungsfall. Es steht immer noch vor technischen Herausforderungen und Einschränkungen, und seine Instruments und Requirements müssen noch standardisiert werden.

Synthetische Daten sind jedoch definitiv ein Beschleuniger für ML/KI-basierte Produkte, da sie in allen Branchen und Sektoren weiter expandieren, und wir werden definitiv viele neue Unternehmen und Offers in der Area sehen. Für alle, die tiefer in das Thema synthetische Daten eintauchen möchten, hier ist eine Datei Offene Community für synthetische Daten. Entdecken Sie eine Drehscheibe für synthetische Datensätze, Papiere, Code und die Menschen, die Pionierarbeit für deren Einsatz im maschinellen Lernen geleistet haben.

Sergey Toborov ist Associate bei Leta Capital.

Entscheidungsträger

Willkommen in der VentureBeat-Neighborhood!

DataDecisionMakers ist der Ort, an dem Experten, einschließlich technischer Personen, die mit Daten arbeiten, Ideen und Innovationen im Zusammenhang mit Daten austauschen können.

Wenn Sie über progressive Ideen und aktuelle Informationen, Greatest Practices und die Zukunft von Daten und Datentechnologie lesen möchten, besuchen Sie uns bei DataDecisionMakers.

Sie können sogar denken Einen Artikel beisteuern Dein eigenes!

Lesen Sie mehr von DataDecisionMakers

#Das #Potenzial #von #Milliarden #Greenback #synthetischen #Daten

Leave a Comment

Your email address will not be published. Required fields are marked *