[Sejong=NewsPim] Reporter Kyoungtae Yi = Established in 2021, CUBIG is a startup developing next-generation data solutions based on synthetic data technology that enables high-performance artificial intelligence (AI) training without personal information. With the bold approach of "solving data problems without accessing original data," they are gaining attention both domestically and internationally by providing safe yet effective AI learning environments for high-risk industries such as finance, healthcare, public sector, and defense.
CUBIG's core technology is divided into three main areas. First, DTS (Data Transform System) is a multimodal, domain-less synthetic data generation technology that creates high-quality synthetic data of various types including tables, text, images, and time-series data without accessing original data. This technology creates data without personal information based on Differential Privacy (DP), safely supplying datasets necessary for AI learning and analysis.
![]() |
CUBIG's DataXpert is a no-code synthetic data-based agent platform that enables anyone to perform high-performance AI analysis and decision-making without sensitive real data. [Photo=CUBIG] 2025.06.03 biggerthanseoul@newspim.com |
Second is DataXpert, a synthetic data-based agent platform. It enables anyone to perform high-performance AI analysis and decision-making without sensitive real data, and is designed to allow even non-developers to safely conduct advanced analysis through natural language-based queries and visualization reports. Through this, anyone from marketers to policy makers to general planners can gain insights based on synthetic data.
Third is LLM Capsule, a privacy solution that fundamentally blocks personal information leakage issues that can occur when using public LLMs (e.g., ChatGPT). This solution operates in users' laptop environments, detecting and encapsulating (de-identifying) sensitive information in document content in real-time to fundamentally prevent external transmission. Particularly, its ability to operate even in network-separated environments is leading to rapid adoption expansion in public institutions and financial institutions.
CUBIG's growth trajectory is also steep. They have currently completed applications for 8 domestic patents (1 registered) and 2 international patents, proving their technological capabilities through numerous domestic and international paper presentations and AI technology project implementations. They are also collaborating with various institutions including SKT, Hana Bank, Woori Bank, Naver Cloud, the military, and university hospitals, with some having completed actual PoC (Proof of Concept) and entering contract stages.
In terms of business model, CUBIG operates both SaaS (subscription) and On-Premise (installation) models in parallel, establishing a diversified revenue structure through AI analysis solution integration and synthetic data distribution platform operations. Particularly, through their data marketplace 'Azoo,' they provide an environment where anyone can trade synthetic data, securing both scalability and sustainability of data-based business.
From a global strategy perspective, CUBIG targets European and North American markets as their main focus, drawing a blueprint to leap to become the world's number one private synthetic data platform through overseas sales activation using Google SEO, securing global data buyers, and expanding B2B partnerships.
In an era where AI operates based on data, CUBIG is creating new standards for AI ethics and personal information protection by realizing 'high-performance AI analysis without access to original data.' CUBIG's synthetic data technology is positioning itself as a core solution leading data innovation, beyond being a simple substitute.
biggerthanseoul@newspim.com
[VivaTech 2025] ⑥ CUBIG « Concevoir l'avenir de la sécurité des données IA »
[Sejong=NewsPim] Journaliste Kyoungtae Yi = Créée en 2021, CUBIG est une startup développant des solutions de données de nouvelle génération basées sur la technologie de données synthétiques qui permet l'entraînement d'intelligence artificielle (IA) haute performance sans informations personnelles. Avec l'approche audacieuse de « résoudre les problèmes de données sans accéder aux données originales », ils attirent l'attention tant au niveau national qu'international en fournissant des environnements d'apprentissage IA sûrs mais efficaces pour les industries à haut risque telles que la finance, la santé, le secteur public et la défense.
La technologie principale de CUBIG se divise en trois domaines principaux. Premièrement, DTS (Data Transform System) est une technologie de génération de données synthétiques multimodale et sans domaine qui crée des données synthétiques de haute qualité de divers types incluant les tableaux, textes, images et données de séries temporelles sans accéder aux données originales. Cette technologie crée des données sans informations personnelles basées sur la Confidentialité Différentielle (DP), fournissant en toute sécurité des jeux de données nécessaires pour l'apprentissage et l'analyse IA.
Deuxièmement, DataXpert est une plateforme d'agents basée sur des données synthétiques. Elle permet à quiconque d'effectuer des analyses et prises de décision IA haute performance sans données réelles sensibles, et est conçue pour permettre même aux non-développeurs de mener en toute sécurité des analyses avancées grâce à des requêtes en langage naturel et des rapports de visualisation. Grâce à cela, quiconque, des marketeurs aux responsables politiques en passant par les planificateurs généraux, peut obtenir des insights basés sur des données synthétiques.
Troisième est LLM Capsule, une solution de confidentialité qui bloque fondamentalement les problèmes de fuite d'informations personnelles qui peuvent survenir lors de l'utilisation de LLM publics (par exemple, ChatGPT). Cette solution fonctionne dans l'environnement des ordinateurs portables des utilisateurs, détectant et encapsulant (désidentifiant) les informations sensibles dans le contenu des documents en temps réel pour empêcher fondamentalement la transmission externe. En particulier, sa capacité à fonctionner même dans des environnements séparés du réseau conduit à une expansion rapide de l'adoption dans les institutions publiques et les institutions financières.
La trajectoire de croissance de CUBIG est également abrupte. Ils ont actuellement complété les demandes pour 8 brevets nationaux (1 enregistré) et 2 brevets internationaux, prouvant leurs capacités technologiques grâce à de nombreuses présentations de papiers nationaux et internationaux et des implémentations de projets technologiques IA. Ils collaborent également avec diverses institutions incluant SKT, Hana Bank, Woori Bank, Naver Cloud, l'armée et les hôpitaux universitaires, certains ayant complété des PoC (Preuve de Concept) réels et entrant dans les phases de contrat.
En termes de modèle d'affaires, CUBIG opère les modèles SaaS (abonnement) et On-Premise (installation) en parallèle, établissant une structure de revenus diversifiée grâce à l'intégration de solutions d'analyse IA et aux opérations de plateforme de distribution de données synthétiques. Particulièrement, grâce à leur marché de données 'Azoo,' ils fournissent un environnement où quiconque peut échanger des données synthétiques, sécurisant à la fois l'évolutivité et la durabilité des affaires basées sur les données.
D'un point de vue stratégique global, CUBIG cible les marchés européens et nord-américains comme leur focus principal, dessinant un plan pour bondir vers devenir la plateforme de données synthétiques privée numéro un au monde grâce à l'activation des ventes à l'étranger utilisant Google SEO, la sécurisation d'acheteurs de données globaux et l'expansion des partenariats B2B.
À une époque où l'IA fonctionne basée sur les données, CUBIG crée de nouvelles normes pour l'éthique IA et la protection des informations personnelles en réalisant 'l'analyse IA haute performance sans accès aux données originales.' La technologie de données synthétiques de CUBIG se positionne comme une solution principale menant l'innovation des données, au-delà d'être un simple substitut.
biggerthanseoul@newspim.com
※ This article was written with sponsorship from the Korea Institute of Startup & Entrepreneurship Development.