{"id":5269,"date":"2023-07-04T13:56:30","date_gmt":"2023-07-04T11:56:30","guid":{"rendered":"http:\/\/nextbrain.ai\/?p=5269"},"modified":"2023-07-10T06:54:08","modified_gmt":"2023-07-10T04:54:08","slug":"introducing-the-open-source-project-nbsynthetic","status":"publish","type":"post","link":"https:\/\/nextbrain.ai\/de\/blog\/introducing-the-open-source-project-nbsynthetic","title":{"rendered":"Einf\u00fchrung des Open-Source-Projekts nbsynthetic"},"content":{"rendered":"<h4 class=\"wp-block-heading\">nbsynthetic : Eine einfache und robuste un\u00fcberwachte Synthetic Tabular Data Generation Python-Bibliothek<\/h4>\n\n\n\n<figure class=\"wp-block-image size-large\"><img fetchpriority=\"high\" decoding=\"async\" width=\"1024\" height=\"722\" src=\"http:\/\/nextbrain.ai\/wp-content\/uploads\/2023\/07\/nbsynthetic-1024x722.png\" alt=\"\" class=\"wp-image-5270\" srcset=\"https:\/\/nextbrain.ai\/wp-content\/uploads\/2023\/07\/nbsynthetic-1024x722.png 1024w, https:\/\/nextbrain.ai\/wp-content\/uploads\/2023\/07\/nbsynthetic-300x212.png 300w, https:\/\/nextbrain.ai\/wp-content\/uploads\/2023\/07\/nbsynthetic-768x541.png 768w, https:\/\/nextbrain.ai\/wp-content\/uploads\/2023\/07\/nbsynthetic-18x12.png 18w, https:\/\/nextbrain.ai\/wp-content\/uploads\/2023\/07\/nbsynthetic.png 1400w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<p>NextBrain.ai pr\u00e4sentiert <a href=\"https:\/\/towardsdatascience.com\/synthetic-tabular-data-generation-34eb94a992ed\" target=\"_blank\" rel=\"noreferrer noopener\">nbsynthetic<\/a>, ein Open-Source-Projekt, das eine einfache und stabile L\u00f6sung f\u00fcr die un\u00fcberwachte synthetische tabellarische Datenproduktion mithilfe einer Generative Adversarial Network (GAN)-Architektur basierend auf Keras bietet.<\/p>\n\n\n\n<p>Entwickelt f\u00fcr Einfachheit und Robustheit nutzt nbsynthetic eine unkomplizierte und stabile un\u00fcberwachte GAN-Architektur, die mit Keras erstellt wurde. Die spezifische Hyperparameteranpassung sorgt f\u00fcr Trainingsstabilit\u00e4t und minimiert gleichzeitig die Berechnungskosten.<\/p>\n\n\n\n<h5 class=\"wp-block-heading\">Vorteile von nbsynthetic<\/h5>\n\n\n\n<ol class=\"wp-block-list\">\n<li>Keine vorab definierte Zielvorgabe erforderlich: Als un\u00fcberwachtes Architektur eliminiert nbsynthetic die Notwendigkeit f\u00fcr Benutzer, ein vorab definiertes Ziel zu haben.<\/li>\n\n\n\n<li>Ideal f\u00fcr kleine Datens\u00e4tze: Es ist in erster Linie f\u00fcr kleine Datens\u00e4tze gedacht, die sowohl kontinuierliche als auch kategoriale Merkmale enthalten.<\/li>\n\n\n\n<li>CPU-Kompatibilit\u00e4t: Aufgrund seiner Einfachheit k\u00f6nnen die Modelle auf einer CPU ausgef\u00fchrt werden.<\/li>\n\n\n\n<li>Bequeme Datenaufbereitung: Die Bibliothek enth\u00e4lt Module zur schnellen Eingabedatenaufbereitung und Feature Engineering.<\/li>\n\n\n\n<li>Statistische Tests und Vergleich: nbsynthetic bietet Module zum Durchf\u00fchren statistischer Tests und zum Vergleichen von realen und synthetischen Daten mithilfe des Maximum Mean Discrepancy (MMD) statistischen Tests. Dieser Test misst die Distanz zwischen den Mittelwerten von zwei Proben, die in einen reproduzierenden Kernhilbertraum (RKHS) abgebildet werden.<\/li>\n\n\n\n<li>Plotting-Utilities: Plotting-Utilities sind enthalten, um die Wahrscheinlichkeitsverteilungen der originalen und synthetischen Daten zu vergleichen.<\/li>\n<\/ol>\n\n\n\n<p>Die Bedeutung der tabellarischen synthetischen Datengenerierung W\u00e4hrend die Generierung synthetischer Daten in Anwendungen wie Bild- und Sprachgenerierung an Popularit\u00e4t gewonnen hat, war die Entwicklung synthetischer tabellarischer Daten weniger ehrgeizig. Dennoch sind tabellarische Daten die h\u00e4ufigste Art von Daten weltweit und haben erhebliche Auswirkungen auf Branchen wie autonome Fahrzeuge, Gesundheitswesen und Finanzdienstleistungen. Synthetische tabellarische Daten k\u00f6nnen Datenschutzbedenken im Gesundheitswesen adressieren, synthetische genomische Datens\u00e4tze simulieren und Forschungsprojekte, die Patientendaten beinhalten, erleichtern.<\/p>\n\n\n\n<p>Die Bef\u00e4higung von Tabellenkalkulationsbenutzern: Jeden Tag nutzen fast 700 Millionen Menschen Tabellenkalkulationen, um mit kleinen Proben von tabellarischen Daten zu arbeiten. Diese Datens\u00e4tze werden jedoch oft als von schlechter Qualit\u00e4t angesehen, da sie unvollst\u00e4ndig sind oder an statistischer Signifikanz fehlen. Machine Learning-Techniken, wie GANs, k\u00f6nnen wertvolle Einblicke und Entscheidungsf\u00e4higkeiten f\u00fcr solche Anwendungen bieten. Leider konzentrieren sich aktuelle ML-Fortschritte haupts\u00e4chlich auf gro\u00dfe Datens\u00e4tze, wodurch eine erhebliche Anzahl potenzieller Benutzer, die mit kleinen Datens\u00e4tzen arbeiten, ausgeschlossen wird. Dar\u00fcber hinaus ist die Zuverl\u00e4ssigkeit von ML-Algorithmen, die auf Daten mit kleiner Stichprobengr\u00f6\u00dfe angewendet werden, ein Anliegen in der modernen Statistik.<\/p>\n\n\n\n<p><\/p>\n\n\n\n<h5 class=\"wp-block-heading\">Ein neuer tabellarischer GAN<\/h5>\n\n\n\n<p>Die Grenzen von GANs angehen: Die Kerntechnologie hinter nbsynthetic ist das Generative Adversarial Network (GAN). GANs bestehen aus zwei neuronalen Netzwerken, dem Generator und dem Diskriminator, die gegeneinander konkurrieren. Das gleichzeitige Training beider Modelle kann zu Instabilit\u00e4t und Modus-Kollaps f\u00fchren. Um diese Probleme anzugehen, verwendet nbsynthetic einen nicht-konditionalen GAN-Ansatz. Diese Konfiguration ist sehr vielseitig f\u00fcr aktive Tabellenkalkulationsbenutzer, die m\u00f6glicherweise Vorhersagen zu verschiedenen Merkmalen treffen m\u00f6chten.<\/p>\n\n\n\n<p>Bau eines einfachen und robusten GAN mit nbsynthetic Um ein einfaches und robustes un\u00fcberwachtes GAN sicherzustellen, ber\u00fccksichtigt nbsynthetic die folgenden \u00dcberlegungen:<\/p>\n\n\n\n<ol class=\"wp-block-list\">\n<li>Initialisierung: Zuf\u00e4llige Gewichtinitialisierung und Batch Normalization werden verwendet, um die Symmetrie zu brechen und das Lernen zu stabilisieren.<\/li>\n\n\n\n<li>Konvergenz: Anstelle von Convolutional Nets verwendet nbsynthetic eine einfache und dichte Architektur, die f\u00fcr tabellarische Daten mit kleiner Stichprobengr\u00f6\u00dfe geeignet ist.<\/li>\n\n\n\n<li>Aktivierungsfunktionen: LeakyReLU wird f\u00fcr sowohl das Generator- als auch das Diskriminator-Sequenzmodell verwendet. Eine tanh-Aktivierungsfunktion wird f\u00fcr den Generator verwendet, w\u00e4hrend der Diskriminator eine Sigmoid-Funktion nutzt.<\/li>\n\n\n\n<li>Optimierung: Stochastischer Gradientabstieg mit dem Adam-Optimizer wird eingesetzt, mit einer kleinen Lernrate und einem reduzierten Momentum-Term zur Verbesserung der Stabilit\u00e4t.<\/li>\n\n\n\n<li>Ger\u00e4uschinjektion: Ger\u00e4uschinjektion mit einem zuf\u00e4lligen Vektor fester L\u00e4nge<\/li>\n<\/ol>\n\n\n\n<hr class=\"wp-block-separator has-alpha-channel-opacity\"\/>\n\n\n\n<p>Sie k\u00f6nnen die Bibliothek auf Github finden <a href=\"https:\/\/github.com\/NextBrain-ai\/nbsynthetic\" target=\"_blank\" rel=\"noreferrer noopener\">hier<\/a>.<\/p>\n\n\n\n<p>Sie k\u00f6nnen auch eine sehr verst\u00e4ndliche Beschreibung der Bibliothek finden <a href=\"https:\/\/towardsdatascience.com\/synthetic-tabular-data-generation-34eb94a992ed\" target=\"_blank\" rel=\"noreferrer noopener\">hier<\/a>.&nbsp;<\/p>","protected":false},"excerpt":{"rendered":"<p>nbsynthetic : A Simple and Robust Unsupervised Synthetic Tabular Data Generation Python Library NextBrain.ai presents nbsynthetic, an open-source project that aims to provide a simple [&hellip;]<\/p>\n","protected":false},"author":3,"featured_media":5271,"comment_status":"closed","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[70],"tags":[],"class_list":["post-5269","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-blog"],"yoast_head":"<!-- This site is optimized with the Yoast SEO plugin v25.6 - https:\/\/yoast.com\/wordpress\/plugins\/seo\/ -->\n<title>Introducing the open source project nbsynthetic - NextBrain AI | No-Code Machine Learning<\/title>\n<meta name=\"description\" content=\"Discover the power of nbsynthetic, an open source project by NextBrain AI that allows you to build machine learning models without any coding. Start creating AI solutions today!\" \/>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/nextbrain.ai\/de\/blog\/introducing-the-open-source-project-nbsynthetic\" \/>\n<meta property=\"og:locale\" content=\"de_DE\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"Introducing the open source project nbsynthetic - NextBrain AI | No-Code Machine Learning\" \/>\n<meta property=\"og:description\" content=\"Discover the power of nbsynthetic, an open source project by NextBrain AI that allows you to build machine learning models without any coding. Start creating AI solutions today!\" \/>\n<meta property=\"og:url\" content=\"https:\/\/nextbrain.ai\/de\/blog\/introducing-the-open-source-project-nbsynthetic\" \/>\n<meta property=\"og:site_name\" content=\"NextBrain AI | No-Code Machine Learning\" \/>\n<meta property=\"article:published_time\" content=\"2023-07-04T11:56:30+00:00\" \/>\n<meta property=\"article:modified_time\" content=\"2023-07-10T04:54:08+00:00\" \/>\n<meta property=\"og:image\" content=\"https:\/\/nextbrain.ai\/wp-content\/uploads\/2023\/07\/nbsynthetic-1.png\" \/>\n\t<meta property=\"og:image:width\" content=\"1400\" \/>\n\t<meta property=\"og:image:height\" content=\"987\" \/>\n\t<meta property=\"og:image:type\" content=\"image\/png\" \/>\n<meta name=\"author\" content=\"Editor\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:creator\" content=\"@nextbrain_ai\" \/>\n<meta name=\"twitter:site\" content=\"@nextbrain_ai\" \/>\n<meta name=\"twitter:label1\" content=\"Verfasst von\" \/>\n\t<meta name=\"twitter:data1\" content=\"Editor\" \/>\n\t<meta name=\"twitter:label2\" content=\"Gesch\u00e4tzte Lesezeit\" \/>\n\t<meta name=\"twitter:data2\" content=\"3\u00a0Minuten\" \/>\n<!-- \/ Yoast SEO plugin. -->","yoast_head_json":{"title":"Einf\u00fchrung in das Open-Source-Projekt nbsynthetic - NextBrain AI | No-Code Machine Learning","description":"Entdecken Sie die Kraft von nbsynthetic, einem Open-Source-Projekt von NextBrain AI, das es Ihnen erm\u00f6glicht, Machine Learning-Modelle ohne Programmierung zu erstellen. Beginnen Sie noch heute mit der Erstellung von KI-L\u00f6sungen!","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/nextbrain.ai\/de\/blog\/introducing-the-open-source-project-nbsynthetic","og_locale":"de_DE","og_type":"article","og_title":"Introducing the open source project nbsynthetic - NextBrain AI | No-Code Machine Learning","og_description":"Discover the power of nbsynthetic, an open source project by NextBrain AI that allows you to build machine learning models without any coding. Start creating AI solutions today!","og_url":"https:\/\/nextbrain.ai\/de\/blog\/introducing-the-open-source-project-nbsynthetic","og_site_name":"NextBrain AI | No-Code Machine Learning","article_published_time":"2023-07-04T11:56:30+00:00","article_modified_time":"2023-07-10T04:54:08+00:00","og_image":[{"width":1400,"height":987,"url":"https:\/\/nextbrain.ai\/wp-content\/uploads\/2023\/07\/nbsynthetic-1.png","type":"image\/png"}],"author":"Editor","twitter_card":"summary_large_image","twitter_creator":"@nextbrain_ai","twitter_site":"@nextbrain_ai","twitter_misc":{"Verfasst von":"Editor","Gesch\u00e4tzte Lesezeit":"3\u00a0Minuten"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"Article","@id":"https:\/\/nextbrain.ai\/blog\/introducing-the-open-source-project-nbsynthetic#article","isPartOf":{"@id":"https:\/\/nextbrain.ai\/blog\/introducing-the-open-source-project-nbsynthetic"},"author":{"name":"Editor","@id":"https:\/\/nextbrain.ai\/#\/schema\/person\/9e7229bfa565ba937b3ca331672ff6a9"},"headline":"Introducing the open source project nbsynthetic","datePublished":"2023-07-04T11:56:30+00:00","dateModified":"2023-07-10T04:54:08+00:00","mainEntityOfPage":{"@id":"https:\/\/nextbrain.ai\/blog\/introducing-the-open-source-project-nbsynthetic"},"wordCount":589,"publisher":{"@id":"https:\/\/nextbrain.ai\/#organization"},"image":{"@id":"https:\/\/nextbrain.ai\/blog\/introducing-the-open-source-project-nbsynthetic#primaryimage"},"thumbnailUrl":"https:\/\/nextbrain.ai\/wp-content\/uploads\/2023\/07\/nbsynthetic-1.png","articleSection":["blog"],"inLanguage":"de"},{"@type":"WebPage","@id":"https:\/\/nextbrain.ai\/blog\/introducing-the-open-source-project-nbsynthetic","url":"https:\/\/nextbrain.ai\/blog\/introducing-the-open-source-project-nbsynthetic","name":"Einf\u00fchrung in das Open-Source-Projekt nbsynthetic - NextBrain AI | No-Code Machine Learning","isPartOf":{"@id":"https:\/\/nextbrain.ai\/#website"},"primaryImageOfPage":{"@id":"https:\/\/nextbrain.ai\/blog\/introducing-the-open-source-project-nbsynthetic#primaryimage"},"image":{"@id":"https:\/\/nextbrain.ai\/blog\/introducing-the-open-source-project-nbsynthetic#primaryimage"},"thumbnailUrl":"https:\/\/nextbrain.ai\/wp-content\/uploads\/2023\/07\/nbsynthetic-1.png","datePublished":"2023-07-04T11:56:30+00:00","dateModified":"2023-07-10T04:54:08+00:00","description":"Entdecken Sie die Kraft von nbsynthetic, einem Open-Source-Projekt von NextBrain AI, das es Ihnen erm\u00f6glicht, Machine Learning-Modelle ohne Programmierung zu erstellen. Beginnen Sie noch heute mit der Erstellung von KI-L\u00f6sungen!","breadcrumb":{"@id":"https:\/\/nextbrain.ai\/blog\/introducing-the-open-source-project-nbsynthetic#breadcrumb"},"inLanguage":"de","potentialAction":[{"@type":"ReadAction","target":["https:\/\/nextbrain.ai\/blog\/introducing-the-open-source-project-nbsynthetic"]}]},{"@type":"ImageObject","inLanguage":"de","@id":"https:\/\/nextbrain.ai\/blog\/introducing-the-open-source-project-nbsynthetic#primaryimage","url":"https:\/\/nextbrain.ai\/wp-content\/uploads\/2023\/07\/nbsynthetic-1.png","contentUrl":"https:\/\/nextbrain.ai\/wp-content\/uploads\/2023\/07\/nbsynthetic-1.png","width":1400,"height":987},{"@type":"BreadcrumbList","@id":"https:\/\/nextbrain.ai\/blog\/introducing-the-open-source-project-nbsynthetic#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Portada","item":"https:\/\/nextbrain.ai\/"},{"@type":"ListItem","position":2,"name":"Introducing the open source project nbsynthetic"}]},{"@type":"WebSite","@id":"https:\/\/nextbrain.ai\/#website","url":"https:\/\/nextbrain.ai\/","name":"NextBrain AI | No-Code Machine Learning","description":"Upgrade your decision-making","publisher":{"@id":"https:\/\/nextbrain.ai\/#organization"},"potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/nextbrain.ai\/?s={search_term_string}"},"query-input":{"@type":"PropertyValueSpecification","valueRequired":true,"valueName":"search_term_string"}}],"inLanguage":"de"},{"@type":"Organization","@id":"https:\/\/nextbrain.ai\/#organization","name":"NextBrain.ai","url":"https:\/\/nextbrain.ai\/","logo":{"@type":"ImageObject","inLanguage":"de","@id":"https:\/\/nextbrain.ai\/#\/schema\/logo\/image\/","url":"http:\/\/nextbrain.ai\/wp-content\/uploads\/2022\/01\/logoNext.png","contentUrl":"http:\/\/nextbrain.ai\/wp-content\/uploads\/2022\/01\/logoNext.png","width":270,"height":96,"caption":"NextBrain.ai"},"image":{"@id":"https:\/\/nextbrain.ai\/#\/schema\/logo\/image\/"},"sameAs":["https:\/\/x.com\/nextbrain_ai","https:\/\/www.linkedin.com\/company\/nextbrain-ai\/","https:\/\/www.youtube.com\/channel\/UCpRhfXZE3YEdfgp2K0U9kxQ","https:\/\/github.com\/NextBrain-ai"]},{"@type":"Person","@id":"https:\/\/nextbrain.ai\/#\/schema\/person\/9e7229bfa565ba937b3ca331672ff6a9","name":"Editor","image":{"@type":"ImageObject","inLanguage":"de","@id":"https:\/\/nextbrain.ai\/#\/schema\/person\/image\/","url":"https:\/\/secure.gravatar.com\/avatar\/73be8d0e17a7ada818802595af9a098a?s=96&d=mm&r=g","contentUrl":"https:\/\/secure.gravatar.com\/avatar\/73be8d0e17a7ada818802595af9a098a?s=96&d=mm&r=g","caption":"Editor"}}]}},"_links":{"self":[{"href":"https:\/\/nextbrain.ai\/de\/wp-json\/wp\/v2\/posts\/5269"}],"collection":[{"href":"https:\/\/nextbrain.ai\/de\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/nextbrain.ai\/de\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/nextbrain.ai\/de\/wp-json\/wp\/v2\/users\/3"}],"replies":[{"embeddable":true,"href":"https:\/\/nextbrain.ai\/de\/wp-json\/wp\/v2\/comments?post=5269"}],"version-history":[{"count":0,"href":"https:\/\/nextbrain.ai\/de\/wp-json\/wp\/v2\/posts\/5269\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/nextbrain.ai\/de\/wp-json\/wp\/v2\/media\/5271"}],"wp:attachment":[{"href":"https:\/\/nextbrain.ai\/de\/wp-json\/wp\/v2\/media?parent=5269"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/nextbrain.ai\/de\/wp-json\/wp\/v2\/categories?post=5269"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/nextbrain.ai\/de\/wp-json\/wp\/v2\/tags?post=5269"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}