Drei Komponenten innovativen Datenmanagements

Drei Komponenten innovativen Datenmanagements

Drei Komponenten innovativen Datenmanagements

Information Governance muss nicht der Feind von Innovation sein. Die beiden Konzepte können in Harmonie existieren, aber sie erfordern einige wichtige Merkmale, um erfolgreich zu sein.

Wenn Sie den Begriff hören DatenüberwachungIst Ihre erste Idee eine der strengsten Richtlinien, die Sicherheit und Vorschriften über den geschäftlichen Wert stellen? Leider ist dies der Ansatz, den viele Organisationen bei der Verwaltung von Daten verfolgen. Sie konzentrieren sich stark auf die Einschränkung von Daten, um Sicherheits- und Regulierungsanforderungen zu erfüllen, die die Möglichkeit, aus Daten geschäftlichen Nutzen zu generieren, ausschließen. Die Zukunft der Information Governance muss darin bestehen, Wege zu finden, um Daten weiterhin zu schützen, dies jedoch auf eine Weise, die organisatorische Innovationen ermöglicht.

Obwohl eine starke Datenverwaltungsrichtlinie und eine starke Innovationskultur widersprüchlich zu sein scheinen, gibt es einige Kombinationen, die gemacht werden können, um dies zu ermöglichen. Drei der wichtigsten Praktiken und Prozesse für innovatives Datenmanagement sind Artificial Information, DataOps und Walled Backyard für Citizen Information Scientists.

Synthetische Daten

Der erste wichtige Vorteil innovativer Information Governance besteht darin, einen Datensatz bereitzustellen, der dem realen Datensatz statistisch ähnlich ist, ohne personal oder vertrauliche Daten preiszugeben. Dies kann mit synthetischen Daten erreicht werden.

Synthetische Daten werden unter Verwendung echter Daten für einen Seeding-Prozess generiert, der dann Daten generieren kann, die echt aussehen, es aber nicht sind. Variable Autoencoder (VAEs), Generative Adversarial Networks (GANs) und reale Simulationen generieren Daten, die eine Grundlage für Erfahrungen bilden können, ohne reale Daten preiszugeben und die Organisation unhaltbaren Risiken auszusetzen.

VAEs sind neuronale Netze, die aus Encodern und Decodern bestehen. Beim Verschlüsselungsprozess werden die Daten so transformiert, dass ihr Function-Set komprimiert wird. Während dieser Komprimierung werden die Merkmale transformiert und kombiniert, wodurch die Particulars der Originaldaten entfernt werden. Während des Dekodierungsprozesses wird die Function-Set-Komprimierung umgekehrt, was zu einem Datensatz führt, der dem Unique ähnlich, aber anders ist. Der Zweck dieses Prozesses besteht darin, eine Reihe von Codierern und Decodierern zu definieren, die Ausgabedaten erzeugen, die nicht direkt auf die ursprüngliche Datenquelle zurückgeführt werden können.

Betrachten Sie eine Analogie zu diesem Prozess: Nehmen Sie ein Buch und lassen Sie es durch einen Sprachinterpreter (Decoder) laufen und lassen Sie es dann umgekehrt durch einen Sprachinterpreter laufen (Decoder). Der resultierende Textual content wird ähnlich, aber unterschiedlich sein.

GANs sind eine komplexere Architektur, die aus einem Paar neuronaler Netze besteht. Ein neuronales Netz ist der Generator und das andere der Diskriminator. Der Generator verwendet Rohdaten, um neue Datensätze zu erstellen. Der Diskriminator wird dann verwendet, um zu bestimmen, ob der erzeugte Datensatz echt oder künstlich ist. Während eines iterativen Prozesses optimiert der Generator seine Ausgabe bis zu dem Punkt, an dem der Diskriminator nicht zwischen dem echten Datensatz und dem synthetischen Datensatz unterscheiden kann. An diesem Punkt kann der Generator Datensätze generieren, die von echten Daten nicht zu unterscheiden sind, aber für Datenexperimente verwendet werden können.

Zusätzlich zu diesen beiden Methoden verwenden einige Organisationen Spiel-Engines und physikbasierte Engines, um Datensätze basierend auf wissenschaftlichen Prinzipien zu simulieren und zu simulieren, wie reale Objekte mit wissenschaftlichen Prinzipien (wie Physik, Chemie und Biologie) interagieren. Während diese Virtualisierung ausgeführt wird, kann der resultierende Datensatz, bei dem es sich um die eigentlichen Daten handelt, zur Analyse und zum Experimentieren gesammelt werden.


#Drei #Komponenten #innovativen #Datenmanagements

Leave a Comment

Your email address will not be published. Required fields are marked *