Beim maschinellen Lernen können synthetische Daten echte Leistungsverbesserungen liefern |  MIT-Nachrichten

Beim maschinellen Lernen können synthetische Daten echte Leistungsverbesserungen liefern | MIT-Nachrichten

Einer Maschine beizubringen, menschliche Handlungen zu erkennen, hat viele potenzielle Anwendungen, z. B. die automatische Erkennung von Arbeitern, die auf einer Baustelle stürzen, oder die Befähigung eines Good-Residence-Roboters, Benutzergesten zu interpretieren.

Dazu trainieren Forscher maschinelle Lernmodelle mit riesigen Datensätzen von Movies, die Menschen bei Aktionen zeigen. Das Sammeln und Kategorisieren von Millionen oder Milliarden von Movies ist jedoch nicht nur teuer und mühsam, die Clips enthalten oft smart Informationen wie Gesichter oder Autokennzeichen von Personen. Die Verwendung dieser Movies kann auch gegen Urheberrechts- oder Datenschutzgesetze verstoßen. Dies setzt voraus, dass Videodaten in erster Linie öffentlich zugänglich sind – viele Datensätze sind Eigentum von Unternehmen und nicht frei nutzbar.

Daher wenden sich Forscher synthetischen Datensätzen zu. Es wird von einem Laptop erstellt, der 3D-Modelle von Szenen, Objekten und Menschen verwendet, um schnell viele verschiedene Clips bestimmter Aktionen zu erstellen – ohne die potenziellen Urheberrechtsprobleme oder ethischen Bedenken, die mit echten Daten einhergehen.

Aber sind synthetische Daten so „intestine“ wie echte Daten? Wie intestine schneidet ein mit diesen Daten trainiertes Modell ab, wenn es darum geht, echte menschliche Handlungen zu klassifizieren? Ein Forscherteam des MIT, des MIT-IBM Watson AI Lab und der Boston College versuchte, diese Frage zu beantworten. Sie erstellten einen synthetischen Datensatz aus 150.000 Movies, die eine Vielzahl menschlicher Handlungen erfassten, die sie zum Trainieren von Modellen für maschinelles Lernen verwendeten. Anschließend zeigten sie den Fashions sechs Datensätze aus echten Movies, um zu sehen, wie intestine sie die Aktionen in diesen Clips erkennen konnten.

Die Forscher fanden heraus, dass synthetisch trainierte Modelle bei Movies mit weniger Hintergrundobjekten besser abschneiden als Modelle, die mit echten Daten trainiert wurden.

Diese Arbeit könnte Forschern dabei helfen, synthetische Datensätze so zu verwenden, dass Modelle bei realen Aufgaben eine höhere Genauigkeit erreichen. Es könnte Wissenschaftlern auch dabei helfen, maschinelle Lernanwendungen zu identifizieren, die sich am besten für das Coaching mit synthetischen Daten eignen, um einige der ethischen, datenschutzrechtlichen und urheberrechtlichen Bedenken bei der Verwendung echter Datensätze auszuräumen.

“Das ultimative Ziel unserer Forschung ist es, das Vortraining mit echten Daten durch das Vortraining mit synthetischen Daten zu ersetzen. Das Erstellen einer Aktion in den synthetischen Daten ist mit Kosten verbunden, aber sobald Sie dies getan haben, können Sie eine unbegrenzte Anzahl von Bildern erstellen oder Movies, indem Sie den Modus, die Beleuchtung usw Papier Diese Forschungsdetails.

Dieses Papier ist vom Hauptautor Yo-whan „John“ Kim ’22; Odd Oliva, Director of Strategic Business Engagement am MIT Schwarzman Computing, Director des MIT-IBM Watson AI Lab und Senior Analysis Scientist am Laptop Science and Synthetic Intelligence Laboratory (CSAIL); und sieben weitere. Die Forschungsergebnisse werden auf der Konferenz „Neural Data Processing Methods“ vorgestellt.

Erstellen eines synthetischen Datensatzes

Die Forscher begannen mit der Zusammenstellung eines neuen Datensatzes unter Verwendung von drei öffentlich verfügbaren Datensätzen aus synthetischen Movies, die menschliche Handlungen erfassten. Ihr Datensatz mit dem Namen Artificial Procedures Pre-training and Transformation (SynAPT) enthält 150 Arbeitskategorien mit 1.000 Movies professional Kategorie.

Abhängig von der Verfügbarkeit von Clips mit sauberen Videodaten wählten sie so viele Bewegungskategorien wie möglich aus, z. B. winkende oder zu Boden fallende Personen.

Nachdem der Datensatz vorbereitet warfare, nutzten sie ihn, um drei maschinelle Lernmodelle für die Aktionserkennung vorab zu testen. Beim Vortraining wird ein Modell für eine Aufgabe trainiert, um ihm einen Vorsprung beim Erlernen der anderen Aufgaben zu verschaffen. Inspiriert von der Artwork und Weise, wie Menschen lernen – wir verwenden altes Wissen wieder, wenn wir etwas Neues lernen – kann ein vortrainiertes Modell Parameter verwenden, die es bereits gelernt hat, um eine neue Aufgabe mit einem neuen Datensatz schneller und effizienter zu lernen.

Sie testeten die vortrainierten Modelle anhand von sechs Datensätzen aus echten Movies, die jeweils Kategorien von Aktionen erfassten, die sich von denen in den Trainingsdaten unterschieden.

Die Forscher waren überrascht zu sehen, dass alle drei synthetischen Modelle Modelle übertrafen, die mit echten Movies auf vier der sechs Datensätze trainiert wurden. Die Genauigkeit warfare höher bei Datensätzen, die Movies mit „niedriger Szenenobjektverzerrung“ enthielten.

Niedrige Szenenobjektverzerrung bedeutet, dass das Modell die Aktion nicht erkennen kann, indem es den Hintergrund oder andere Objekte in der Szene betrachtet – es muss sich auf die Bewegung selbst konzentrieren. Wenn das Modell beispielsweise Tauchposen in Movies von Personen, die in einem Pool tauchen, bewerten soll, wäre es nicht in der Lage, eine Place zu bestimmen, indem es auf das Wasser oder Fliesen an der Wand schaut. Sie sollten sich auf die Bewegung und Place der Particular person konzentrieren, um die Aktion einzuordnen.

„In Movies mit geringer Voreingenommenheit des Szenenkörpers ist die zeitliche Dynamik der Aktionen wichtiger als das Erscheinungsbild der Objekte oder des Hintergrunds, und sie scheinen mit den Kompositionsdaten intestine erfasst zu sein“, sagt Ferris.

“Eine hohe Szenenverzerrung kann tatsächlich ein Hindernis sein. Das Modell könnte eine Aktion falsch klassifizieren, indem es ein Objekt betrachtet, nicht die Aktion selbst. Es kann das Modell verwirren”, erklärt Kim.

Leistungsschub

Basierend auf diesen Erkenntnissen wollen die Forscher weitere Kategorien zusätzlicher synthetischer Aktionen und Videoplattformen in zukünftige Arbeiten einbeziehen und schließlich einen Katalog vorgetesteter Modelle unter Verwendung synthetischer Daten erstellen, sagt Co-Autor Rameswar Panda, ein Mitglied der MIT-Forschung Mannschaft. -IBM Watson KI-Labor.

„Wir wollen Modelle bauen, die eine sehr ähnliche oder sogar bessere Leistung als die Modelle in der Literatur haben, aber ohne an diese Vorurteile oder Sicherheitsbedenken gebunden zu sein“, fügt er hinzu.

Sie wollen ihre Arbeit auch mit Forschung kombinieren, um genauere und realistischere synthetische Movies zu produzieren, die die Leistung der Modelle steigern können, sagt SouYoung Jin, Co-Autor und CSAIL. Sie interessiert sich auch dafür, wie Modelle anders lernen können, wenn sie mit synthetischen Daten trainiert werden.

“Wir verwenden synthetische Datensätze, um Datenschutzproblemen oder kontextuellen oder sozialen Vorurteilen vorzubeugen, aber was lernt das Modell tatsächlich? Weißt du etwas, das unvoreingenommen ist?”, sagt sie.

Nachdem sie nun das Potenzial für synthetische Movies demonstriert haben, hoffen sie, dass andere Forscher auf ihrer Arbeit aufbauen werden.

„Trotz der geringen Kosten für die Beschaffung intestine kommentierter synthetischer Daten haben wir derzeit keinen Datensatz in einem Umfang, der mit den größten mit echten Movies kommentierten Datensätzen mithalten kann, indem wir unterschiedliche Kosten und Bedenken bei echten Movies diskutieren und die Wirksamkeit synthetischer Daten demonstrieren , hoffen wir, Bemühungen in diese Richtung zu katalysieren“, fügt Co-Autor Samarth Mishra hinzu, ein Doktorand an der Boston College (BU).

Weitere Co-Autoren sind Hildi Kohney, Professorin für Informatik an der Goethe-Universität in Deutschland und außerordentliche Professorin am MIT-IBM Watson AI Laboratory. Leonid Karlinsky, Mitglied des Forschungsteams am MIT-IBM Watson AI Lab; Venkatesh Saligrama ist Professorin am Division of Electrical and Laptop Engineering der Boston College. und Kate Saenko, Assistenzprofessorin am Division of Laptop Science der Boston College und Beratungsprofessorin am MIT-IBM Watson AI Lab.

Diese Forschung wurde von der Protection Superior Analysis Initiatives Company LwLL sowie dem MIT-IBM Watson AI Laboratory und seinen Mitgliedsunternehmen Nexplore und Woodside unterstützt.

#Beim #maschinellen #Lernen #können #synthetische #Daten #echte #Leistungsverbesserungen #liefern #MITNachrichten

Leave a Comment

Your email address will not be published. Required fields are marked *