{"id":5269,"date":"2023-07-04T13:56:30","date_gmt":"2023-07-04T11:56:30","guid":{"rendered":"http:\/\/nextbrain.ai\/?p=5269"},"modified":"2023-07-10T06:54:08","modified_gmt":"2023-07-10T04:54:08","slug":"introducing-the-open-source-project-nbsynthetic","status":"publish","type":"post","link":"https:\/\/nextbrain.ai\/es\/blog\/introducing-the-open-source-project-nbsynthetic","title":{"rendered":"Presentaci\u00f3n del proyecto de c\u00f3digo abierto nbsynthetic"},"content":{"rendered":"<h4 class=\"wp-block-heading\">nbsynthetic: Una biblioteca de Python simple y robusta para la generaci\u00f3n de datos tabulares sint\u00e9ticos no supervisados.<\/h4>\n\n\n\n<figure class=\"wp-block-image size-large\"><img fetchpriority=\"high\" decoding=\"async\" width=\"1024\" height=\"722\" src=\"http:\/\/nextbrain.ai\/wp-content\/uploads\/2023\/07\/nbsynthetic-1024x722.png\" alt=\"\" class=\"wp-image-5270\" srcset=\"https:\/\/nextbrain.ai\/wp-content\/uploads\/2023\/07\/nbsynthetic-1024x722.png 1024w, https:\/\/nextbrain.ai\/wp-content\/uploads\/2023\/07\/nbsynthetic-300x212.png 300w, https:\/\/nextbrain.ai\/wp-content\/uploads\/2023\/07\/nbsynthetic-768x541.png 768w, https:\/\/nextbrain.ai\/wp-content\/uploads\/2023\/07\/nbsynthetic-18x12.png 18w, https:\/\/nextbrain.ai\/wp-content\/uploads\/2023\/07\/nbsynthetic.png 1400w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<p>NextBrain.ai presenta <a href=\"https:\/\/towardsdatascience.com\/synthetic-tabular-data-generation-34eb94a992ed\" target=\"_blank\" rel=\"noreferrer noopener\">nbsynthetic<\/a>, un proyecto de c\u00f3digo abierto que tiene como objetivo proporcionar una soluci\u00f3n simple y estable para la generaci\u00f3n de datos tabulares sint\u00e9ticos no supervisados utilizando una arquitectura de Red Generativa Antag\u00f3nica (GAN) basada en Keras.<\/p>\n\n\n\n<p>Dise\u00f1ado para la simplicidad y robustez, nbsynthetic utiliza una arquitectura de GAN no supervisada sencilla y estable construida con Keras. La sintonizaci\u00f3n espec\u00edfica de los hiperpar\u00e1metros garantiza la estabilidad del entrenamiento mientras minimiza los costos computacionales.<\/p>\n\n\n\n<h5 class=\"wp-block-heading\">Ventajas de nbsynthetic<\/h5>\n\n\n\n<ol class=\"wp-block-list\">\n<li>No se requiere un objetivo predefinido: Como una arquitectura no supervisada, nbsynthetic elimina la necesidad de que los usuarios tengan un objetivo predefinido.<\/li>\n\n\n\n<li>Ideal para Conjuntos de Datos Peque\u00f1os: Est\u00e1 destinado principalmente a conjuntos de datos peque\u00f1os que contienen tanto caracter\u00edsticas continuas como categ\u00f3ricas.<\/li>\n\n\n\n<li>Compatibilidad de CPU: Debido a su simplicidad, los modelos se pueden ejecutar en una CPU.<\/li>\n\n\n\n<li>Preparaci\u00f3n de Datos Conveniente: La biblioteca incluye m\u00f3dulos para una r\u00e1pida preparaci\u00f3n de datos de entrada y creaci\u00f3n de caracter\u00edsticas.<\/li>\n\n\n\n<li>Pruebas estad\u00edsticas y comparaci\u00f3n: nbsynthetic ofrece m\u00f3dulos para realizar pruebas estad\u00edsticas y comparar datos reales y sint\u00e9ticos, utilizando la prueba estad\u00edstica de Discrepancia M\u00e1xima de Medias (MMD). Esta prueba mide la distancia entre las medias de dos muestras mapeadas en un espacio de Hilbert de n\u00facleo reproductor (RKHS).<\/li>\n\n\n\n<li>Utilidades de Gr\u00e1ficas: Se incluyen utilidades de gr\u00e1ficas para comparar las distribuciones de probabilidad de los datos originales y sint\u00e9ticos.<\/li>\n<\/ol>\n\n\n\n<p>La importancia de la generaci\u00f3n de datos sint\u00e9ticos tabulares. Aunque la generaci\u00f3n de datos sint\u00e9ticos ha ganado popularidad en aplicaciones como la generaci\u00f3n de im\u00e1genes y voz, el desarrollo de datos tabulares sint\u00e9ticos ha sido menos ambicioso. Sin embargo, los datos tabulares son el tipo m\u00e1s com\u00fan de datos en todo el mundo y tienen importantes implicaciones para industrias como los veh\u00edculos aut\u00f3nomos, la atenci\u00f3n m\u00e9dica y los servicios financieros. Los datos tabulares sint\u00e9ticos pueden abordar las preocupaciones de privacidad en la industria de la salud, simular conjuntos de datos gen\u00f3micos sint\u00e9ticos y facilitar proyectos de investigaci\u00f3n que involucren registros m\u00e9dicos de pacientes.<\/p>\n\n\n\n<p>Empoderando a los usuarios de hojas de c\u00e1lculo Cada d\u00eda, casi 700 millones de personas utilizan hojas de c\u00e1lculo para trabajar con peque\u00f1as muestras de datos tabulares. Sin embargo, estos conjuntos de datos a menudo se consideran de mala calidad debido a su incompletud o falta de significancia estad\u00edstica. Las t\u00e9cnicas de aprendizaje autom\u00e1tico, como las GAN, pueden ofrecer valiosos conocimientos y capacidades de toma de decisiones para tales aplicaciones. Desafortunadamente, los avances actuales en ML se centran principalmente en grandes conjuntos de datos, excluyendo a un n\u00famero significativo de usuarios potenciales que trabajan con peque\u00f1os conjuntos de datos. Adem\u00e1s, la fiabilidad de los algoritmos de ML aplicados a datos de tama\u00f1o de muestra peque\u00f1o es una preocupaci\u00f3n en la estad\u00edstica moderna.<\/p>\n\n\n\n<p><\/p>\n\n\n\n<h5 class=\"wp-block-heading\">Un nuevo GAN tabular<\/h5>\n\n\n\n<p>Abordando las Limitaciones de las GANs La tecnolog\u00eda fundamental detr\u00e1s de nbsynthetic es la Red Generativa Antag\u00f3nica (GAN). Las GANs constan de dos redes neuronales, el generador y el discriminador, que compiten entre s\u00ed. Entrenar ambos modelos simult\u00e1neamente puede llevar a inestabilidad y colapso de modo. Para abordar estos problemas, nbsynthetic adopta un enfoque de GAN no condicional. Esta configuraci\u00f3n es bastante vers\u00e1til para los usuarios activos de hojas de c\u00e1lculo que pueden querer hacer predicciones sobre diferentes caracter\u00edsticas.<\/p>\n\n\n\n<p>Construyendo un GAN Simple y Robusto con nbsynthetic Para garantizar un GAN no supervisado simple y robusto, nbsynthetic incorpora las siguientes consideraciones:<\/p>\n\n\n\n<ol class=\"wp-block-list\">\n<li>Inicializaci\u00f3n: Se utilizan la inicializaci\u00f3n de pesos aleatorios y la normalizaci\u00f3n por lotes para romper la simetr\u00eda y estabilizar el aprendizaje.<\/li>\n\n\n\n<li>Convergencia: En lugar de utilizar redes convolucionales, nbsynthetic adopta una arquitectura simple y densa adecuada para datos tabulares de tama\u00f1o de muestra peque\u00f1o.<\/li>\n\n\n\n<li>Funciones de activaci\u00f3n: Se utiliza LeakyReLU para los modelos secuenciales del generador y del discriminador. Se emplea una funci\u00f3n de activaci\u00f3n tanh para el generador, mientras que el discriminador utiliza una funci\u00f3n sigmoide.<\/li>\n\n\n\n<li>Optimizaci\u00f3n: Se emplea el descenso de gradiente estoc\u00e1stico con el optimizador Adam, con una tasa de aprendizaje peque\u00f1a y un t\u00e9rmino de momento reducido para mejorar la estabilidad.<\/li>\n\n\n\n<li>Inyecci\u00f3n de Ruido: Inyecci\u00f3n de ruido utilizando un vector aleatorio de longitud fija<\/li>\n<\/ol>\n\n\n\n<hr class=\"wp-block-separator has-alpha-channel-opacity\"\/>\n\n\n\n<p>Puedes encontrar la biblioteca en Github. <a href=\"https:\/\/github.com\/NextBrain-ai\/nbsynthetic\" target=\"_blank\" rel=\"noreferrer noopener\">aqu\u00ed<\/a>.<\/p>\n\n\n\n<p>Tambi\u00e9n puedes encontrar una descripci\u00f3n muy comprensible de la biblioteca. <a href=\"https:\/\/towardsdatascience.com\/synthetic-tabular-data-generation-34eb94a992ed\" target=\"_blank\" rel=\"noreferrer noopener\">aqu\u00ed<\/a>.&nbsp;<\/p>","protected":false},"excerpt":{"rendered":"<p>nbsynthetic : A Simple and Robust Unsupervised Synthetic Tabular Data Generation Python Library NextBrain.ai presents nbsynthetic, an open-source project that aims to provide a simple [&hellip;]<\/p>\n","protected":false},"author":3,"featured_media":5271,"comment_status":"closed","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[70],"tags":[],"class_list":["post-5269","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-blog"],"yoast_head":"<!-- This site is optimized with the Yoast SEO plugin v25.6 - https:\/\/yoast.com\/wordpress\/plugins\/seo\/ -->\n<title>Introducing the open source project nbsynthetic - NextBrain AI | No-Code Machine Learning<\/title>\n<meta name=\"description\" content=\"Discover the power of nbsynthetic, an open source project by NextBrain AI that allows you to build machine learning models without any coding. Start creating AI solutions today!\" \/>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/nextbrain.ai\/es\/blog\/introducing-the-open-source-project-nbsynthetic\" \/>\n<meta property=\"og:locale\" content=\"es_ES\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"Introducing the open source project nbsynthetic - NextBrain AI | No-Code Machine Learning\" \/>\n<meta property=\"og:description\" content=\"Discover the power of nbsynthetic, an open source project by NextBrain AI that allows you to build machine learning models without any coding. Start creating AI solutions today!\" \/>\n<meta property=\"og:url\" content=\"https:\/\/nextbrain.ai\/es\/blog\/introducing-the-open-source-project-nbsynthetic\" \/>\n<meta property=\"og:site_name\" content=\"NextBrain AI | No-Code Machine Learning\" \/>\n<meta property=\"article:published_time\" content=\"2023-07-04T11:56:30+00:00\" \/>\n<meta property=\"article:modified_time\" content=\"2023-07-10T04:54:08+00:00\" \/>\n<meta property=\"og:image\" content=\"https:\/\/nextbrain.ai\/wp-content\/uploads\/2023\/07\/nbsynthetic-1.png\" \/>\n\t<meta property=\"og:image:width\" content=\"1400\" \/>\n\t<meta property=\"og:image:height\" content=\"987\" \/>\n\t<meta property=\"og:image:type\" content=\"image\/png\" \/>\n<meta name=\"author\" content=\"Editor\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:creator\" content=\"@nextbrain_ai\" \/>\n<meta name=\"twitter:site\" content=\"@nextbrain_ai\" \/>\n<meta name=\"twitter:label1\" content=\"Escrito por\" \/>\n\t<meta name=\"twitter:data1\" content=\"Editor\" \/>\n\t<meta name=\"twitter:label2\" content=\"Tiempo de lectura\" \/>\n\t<meta name=\"twitter:data2\" content=\"3 minutos\" \/>\n<!-- \/ Yoast SEO plugin. -->","yoast_head_json":{"title":"Presentaci\u00f3n del proyecto de c\u00f3digo abierto nbsynthetic - NextBrain AI | No-Code Machine Learning","description":"Descubre el poder de nbsynthetic, un proyecto de c\u00f3digo abierto de NextBrain AI que te permite construir modelos de aprendizaje autom\u00e1tico sin necesidad de programar. \u00a1Empieza a crear soluciones de IA hoy mismo!","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/nextbrain.ai\/es\/blog\/introducing-the-open-source-project-nbsynthetic","og_locale":"es_ES","og_type":"article","og_title":"Introducing the open source project nbsynthetic - NextBrain AI | No-Code Machine Learning","og_description":"Discover the power of nbsynthetic, an open source project by NextBrain AI that allows you to build machine learning models without any coding. Start creating AI solutions today!","og_url":"https:\/\/nextbrain.ai\/es\/blog\/introducing-the-open-source-project-nbsynthetic","og_site_name":"NextBrain AI | No-Code Machine Learning","article_published_time":"2023-07-04T11:56:30+00:00","article_modified_time":"2023-07-10T04:54:08+00:00","og_image":[{"width":1400,"height":987,"url":"https:\/\/nextbrain.ai\/wp-content\/uploads\/2023\/07\/nbsynthetic-1.png","type":"image\/png"}],"author":"Editor","twitter_card":"summary_large_image","twitter_creator":"@nextbrain_ai","twitter_site":"@nextbrain_ai","twitter_misc":{"Escrito por":"Editor","Tiempo de lectura":"3 minutos"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"Article","@id":"https:\/\/nextbrain.ai\/blog\/introducing-the-open-source-project-nbsynthetic#article","isPartOf":{"@id":"https:\/\/nextbrain.ai\/blog\/introducing-the-open-source-project-nbsynthetic"},"author":{"name":"Editor","@id":"https:\/\/nextbrain.ai\/#\/schema\/person\/9e7229bfa565ba937b3ca331672ff6a9"},"headline":"Introducing the open source project nbsynthetic","datePublished":"2023-07-04T11:56:30+00:00","dateModified":"2023-07-10T04:54:08+00:00","mainEntityOfPage":{"@id":"https:\/\/nextbrain.ai\/blog\/introducing-the-open-source-project-nbsynthetic"},"wordCount":589,"publisher":{"@id":"https:\/\/nextbrain.ai\/#organization"},"image":{"@id":"https:\/\/nextbrain.ai\/blog\/introducing-the-open-source-project-nbsynthetic#primaryimage"},"thumbnailUrl":"https:\/\/nextbrain.ai\/wp-content\/uploads\/2023\/07\/nbsynthetic-1.png","articleSection":["blog"],"inLanguage":"es"},{"@type":"WebPage","@id":"https:\/\/nextbrain.ai\/blog\/introducing-the-open-source-project-nbsynthetic","url":"https:\/\/nextbrain.ai\/blog\/introducing-the-open-source-project-nbsynthetic","name":"Presentaci\u00f3n del proyecto de c\u00f3digo abierto nbsynthetic - NextBrain AI | No-Code Machine Learning","isPartOf":{"@id":"https:\/\/nextbrain.ai\/#website"},"primaryImageOfPage":{"@id":"https:\/\/nextbrain.ai\/blog\/introducing-the-open-source-project-nbsynthetic#primaryimage"},"image":{"@id":"https:\/\/nextbrain.ai\/blog\/introducing-the-open-source-project-nbsynthetic#primaryimage"},"thumbnailUrl":"https:\/\/nextbrain.ai\/wp-content\/uploads\/2023\/07\/nbsynthetic-1.png","datePublished":"2023-07-04T11:56:30+00:00","dateModified":"2023-07-10T04:54:08+00:00","description":"Descubre el poder de nbsynthetic, un proyecto de c\u00f3digo abierto de NextBrain AI que te permite construir modelos de aprendizaje autom\u00e1tico sin necesidad de programar. \u00a1Empieza a crear soluciones de IA hoy mismo!","breadcrumb":{"@id":"https:\/\/nextbrain.ai\/blog\/introducing-the-open-source-project-nbsynthetic#breadcrumb"},"inLanguage":"es","potentialAction":[{"@type":"ReadAction","target":["https:\/\/nextbrain.ai\/blog\/introducing-the-open-source-project-nbsynthetic"]}]},{"@type":"ImageObject","inLanguage":"es","@id":"https:\/\/nextbrain.ai\/blog\/introducing-the-open-source-project-nbsynthetic#primaryimage","url":"https:\/\/nextbrain.ai\/wp-content\/uploads\/2023\/07\/nbsynthetic-1.png","contentUrl":"https:\/\/nextbrain.ai\/wp-content\/uploads\/2023\/07\/nbsynthetic-1.png","width":1400,"height":987},{"@type":"BreadcrumbList","@id":"https:\/\/nextbrain.ai\/blog\/introducing-the-open-source-project-nbsynthetic#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Portada","item":"https:\/\/nextbrain.ai\/"},{"@type":"ListItem","position":2,"name":"Introducing the open source project nbsynthetic"}]},{"@type":"WebSite","@id":"https:\/\/nextbrain.ai\/#website","url":"https:\/\/nextbrain.ai\/","name":"NextBrain AI | Aprendizaje Autom\u00e1tico Sin C\u00f3digo","description":"Mejora tu toma de decisiones","publisher":{"@id":"https:\/\/nextbrain.ai\/#organization"},"potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/nextbrain.ai\/?s={search_term_string}"},"query-input":{"@type":"PropertyValueSpecification","valueRequired":true,"valueName":"search_term_string"}}],"inLanguage":"es"},{"@type":"Organization","@id":"https:\/\/nextbrain.ai\/#organization","name":"NextBrain.ai","url":"https:\/\/nextbrain.ai\/","logo":{"@type":"ImageObject","inLanguage":"es","@id":"https:\/\/nextbrain.ai\/#\/schema\/logo\/image\/","url":"http:\/\/nextbrain.ai\/wp-content\/uploads\/2022\/01\/logoNext.png","contentUrl":"http:\/\/nextbrain.ai\/wp-content\/uploads\/2022\/01\/logoNext.png","width":270,"height":96,"caption":"NextBrain.ai"},"image":{"@id":"https:\/\/nextbrain.ai\/#\/schema\/logo\/image\/"},"sameAs":["https:\/\/x.com\/nextbrain_ai","https:\/\/www.linkedin.com\/company\/nextbrain-ai\/","https:\/\/www.youtube.com\/channel\/UCpRhfXZE3YEdfgp2K0U9kxQ","https:\/\/github.com\/NextBrain-ai"]},{"@type":"Person","@id":"https:\/\/nextbrain.ai\/#\/schema\/person\/9e7229bfa565ba937b3ca331672ff6a9","name":"Editor","image":{"@type":"ImageObject","inLanguage":"es","@id":"https:\/\/nextbrain.ai\/#\/schema\/person\/image\/","url":"https:\/\/secure.gravatar.com\/avatar\/73be8d0e17a7ada818802595af9a098a?s=96&d=mm&r=g","contentUrl":"https:\/\/secure.gravatar.com\/avatar\/73be8d0e17a7ada818802595af9a098a?s=96&d=mm&r=g","caption":"Editor"}}]}},"_links":{"self":[{"href":"https:\/\/nextbrain.ai\/es\/wp-json\/wp\/v2\/posts\/5269"}],"collection":[{"href":"https:\/\/nextbrain.ai\/es\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/nextbrain.ai\/es\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/nextbrain.ai\/es\/wp-json\/wp\/v2\/users\/3"}],"replies":[{"embeddable":true,"href":"https:\/\/nextbrain.ai\/es\/wp-json\/wp\/v2\/comments?post=5269"}],"version-history":[{"count":0,"href":"https:\/\/nextbrain.ai\/es\/wp-json\/wp\/v2\/posts\/5269\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/nextbrain.ai\/es\/wp-json\/wp\/v2\/media\/5271"}],"wp:attachment":[{"href":"https:\/\/nextbrain.ai\/es\/wp-json\/wp\/v2\/media?parent=5269"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/nextbrain.ai\/es\/wp-json\/wp\/v2\/categories?post=5269"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/nextbrain.ai\/es\/wp-json\/wp\/v2\/tags?post=5269"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}