2025년 7월, 서울에서 열린 인공지능(AI) 업계 간담회 현장에서는 한 목소리가 울려 퍼졌습니다.
“데이터가 없으면 AI는 성공할 수 없습니다.”
이날 간담회에 참석한 네이버클라우드, 삼성SDS, KT, SKT 등 주요 기업들은 공통적으로 ‘데이터 접근과 활용의 어려움’을 지적하며, 소버린AI(주권 AI)의 성공을 위해 데이터 인프라와 규제의 전면적인 재설계가 필요하다고 강조했습니다.
‘소버린AI(Sovereign AI)’란, 외국 기술에 의존하지 않고 자국 내에서 AI 모델을 개발하고 활용할 수 있는 자율성과 주권을 확보한 AI 체계를 의미합니다.
국가 전략 기술로서 점차 부상하고 있으며, 데이터 주권·AI 인프라·보안성·국산화가 핵심입니다.
중국과 미국의 거대한 AI 생태계에 비해, 한국은 여전히 데이터 인프라, GPU 자원, 규제 체계에서 뒤처져 있습니다. 특히 "데이터를 쓸 수가 없다"는 현장의 외침은 단순한 하소연이 아니라, 우리나라 AI 생태계의 뿌리부터 흔들릴 수 있다는 경고였습니다.
구분 | 한국 | 미국 | EU | 중국 |
기본 법제 | 개인정보보호법, 정보통신망법 등 | 주(state)별 프라이버시법 (ex. CCPA) | GDPR (포괄적 개인정보보호규정) | 데이터보안법, 개인정보보호법 |
가명정보 활용 | 제한적 허용, 재식별 가능성 엄격 기준 | 가명·익명처리 후 비교적 자유롭게 활용 | 조건부 허용, 고위험 AI는 사전평가 필요 | 국가 승인 아래 활용 가능, 강력한 정부 감독 |
데이터 반출 | 원칙적으로 금지 또는 엄격 제한 | 비교적 자유로움 (기업 자율) | 역외이전 시 적정성 평가 필요 | 대부분 금지, 정부 승인 필요 |
공공데이터 개방 | 일부 제한적 개방, 품질·형식 문제 | 광범위 개방, 오픈데이터 정책 활발 | EU 데이터 전략에 따라 개방 확대 | 정부 주도 통합, AI 훈련용 데이터도 포함 |
산업 데이터 활용 | 재식별 우려 시 활용 불가 | 업종별 자율 규정 많음 | 산업별로 세분화된 규정 | 통제된 범위 내 공동 활용 권장 |
AI 규제 동향 | 선시행 후규제 도입 추진 중 (AI 기본법 논의) | 자율 규제 중심, 사후책임 구조 | AI Act 입법 진행 중, 위험기반 분류 | AI에 대한 직접 규제보다 데이터 통제 중심 |
AI는 데이터가 있어야 학습하고, 진화하며, 현장에 적용될 수 있습니다.
하지만 지금의 국내 현실은 다음과 같은 문제가 큽니다.
반면, 미국은 활용 중심의 규제이며, 중국은 오히려 국가 주도로 AI 개발용 데이터를 공동 학습에 활용하도록 돕고 있습니다.
항목 | 딥시크(DeepSeek) | 타 오픈소스 기반 기업 | 차이점 요약 |
GPU 종류 | NVIDIA A100 (동일) | NVIDIA A100 (동일) | 💡 인프라는 동일 |
사용 소프트웨어 | 자체 최적화된 LLM 추론 엔진 및 파이프라인 | 범용 오픈소스 기반 추론 코드 | 💡 최적화 여부 차이 |
추론 속도 | 빠름 (경량화 + 파이프라인 최적화) | 느림 (비표준 구조) | ⚡ 성능 효율 차이 |
GPU 사용량 | 적음 (배치 효율화, 메모리 관리 우수) | 많음 (비효율적 처리) | 💰 비용 절감 효과 |
서비스 단가 | 낮음 (효율 기반 가격 책정 가능) | 높음 (운영비용 반영) | 💸 사용자 접근성 개선 |
운영 안정성 | 높음 (자체 시스템 최적화) | 상대적으로 낮음 (불안정 요소 존재) | 🔧 신뢰성 차이 |
주요 시사점 | 소프트웨어가 인프라 비용 절감의 핵심 | GPU만으론 효율 확보 어려움 | ✅ SW 경쟁력이 본질 |
다음은 간담회에서 제시된 핵심 성공 조건 5가지입니다.
조건 | 설명 |
① 데이터 규제 유연화 | 사전 허가 중심이 아닌, 사후 책임 중심의 제도 설계 필요 |
② 인프라 현대화 | GPU 도입·데이터센터 인허가 절차 간소화 |
③ 활용 가능한 고품질 데이터셋 확보 | AI 학습에 적합한 목적 기반 데이터 구축 |
④ AX(Application Transformation) 기반 실전 활용 | 산업 현장 중심의 실전형 AI 전환 유도 |
⑤ 국산 반도체 활성화 | NPU 도입 시 인센티브 부여 등 기술 자립 유도 |
소버린AI는 정부만의 과제가 아닙니다.
기업은 다음과 같은 항목을 준비해야 실질적인 경쟁력을 확보할 수 있습니다.
또한, AI 모델 자체뿐 아니라 AI를 어떻게 잘 ‘활용’하는지도 중요한 경쟁력입니다. 파운데이션 모델만큼, 그 활용 방식과 서비스 설계가 핵심입니다.
체크포인트 항목 | 주요 내역 | 실제 사례 | 비고 |
1️⃣ 데이터 자산 현황 파악 | 데이터 위치, 구조, 형식, 접근권한 정리 | 삼성SDS: 전사 데이터맵 정비 프로젝트 | 데이터 카탈로그 도입 필수 |
2️⃣ 가명처리 및 재식별 방지 체계 수립 | 가명정보 기준 설정, 법적 자문 확보 | 네이버클라우드: 의료 데이터 활용을 위한 가명처리 체계 적용 | 개인정보보호위원회 가이드라인 준수 필요 |
3️⃣ 외부 협력 데이터셋 확보 전략 | 협력사/기관과 API 연동, 데이터 교환 정책 수립 | 업스테이지: 공공기관과 협업형 AI 학습용 데이터 구축 | 법적 제휴계약 및 기술적 암호화 필요 |
4️⃣ GPU 및 인프라 최적화 | 자체 추론엔진 도입, 클라우드-온프레미스 혼합 운용 | 딥시크: SW 최적화로 동일 GPU 대비 비용 절감 | GPU만으로 경쟁력 확보 어려움, SW 중요 |
5️⃣ AX(Application Transformation) 기반 적용 | 실제 산업 업무에 적용 가능한 유스케이스 설계 | KT: 통신망 이상탐지 AI 고도화 | 파운데이션 모델만큼 활용 시나리오 중요 |
6️⃣ AI 내재화를 위한 인재 확보 | MLOps 엔지니어, 데이터 전략가, AI PM 채용 및 육성 | SKT: T랩 중심의 AI 전담 조직 운영 | 인프라보다 조직문화 및 리더십이 더 중요 |
7️⃣ 수출형 SaaS/API 모델 기획 | 내수 중심 솔루션을 글로벌 적용 가능 구조로 전환 | 뤼튼: API 기반 생성형 AI 글로벌 진출 | 멀티언어/멀티리전 고려 필요 |
소버린AI는 단순히 기술 독립을 의미하는 것이 아닙니다.
그 본질은 ‘국가가 스스로 데이터를 이해하고, 활용하며, 책임질 수 있는 체계’를 만드는 데 있습니다.
데이터 인프라, 규제, 활용, 산업 전환까지 연결된 구조에서,
정부는 실효성 있는 정책과 인센티브를 제공하고,
기업은 자율적 혁신과 실전형 데이터 전략을 마련해야 할 때입니다.
“데이터를 잘 쓰는 나라만이 AI 주권을 가질 수 있습니다.”
이제 그 출발점에 서야 할 시점입니다.