본문 바로가기
Dim영역

오픈AI는 ‘토큰’만 가져가는데…사용자 정보 '통째로' 가져가는 딥시크

숏뉴스
숏 뉴스 AI 요약 기술은 핵심만 전달합니다. 전체 내용의 이해를 위해 기사 본문을 확인해주세요.

불러오는 중...

닫기
언론사 홈 구독
언론사 홈 구독
뉴스듣기 스크랩 글자크기

글자크기 설정

닫기
인쇄

이용자 개인정보부터 입력한 데이터·시리얼 넘버까지
데이터 수집 중단토록 하는 '옵트아웃' 설정 없어
앱 다운 막혔지만 기존 이용자는 그대로
웹페이지도 계속해서 접근 가능

오픈AI는 ‘토큰’만 가져가는데…사용자 정보 '통째로' 가져가는 딥시크
AD
원본보기 아이콘

중국의 생성형 AI 딥시크가 다른 AI 서비스와 구별되는 특징은 필요한 정보만 식별하는 ‘토큰화’ 과정을 거치지 않고 ‘통째로’ 이용자 정보를 수집한다는 점이다.


사용자 정보 전부 취합

18일 딥시크의 개인정보 처리방침을 보면 ‘문자, 채팅 기록, 올린 파일’과 같은 사용자 입력정보와 ‘기기 및 네트워크 정보, 위치정보, 결제정보’를 포함한 자동수집정보를 그대로 수집할 수 있다. 가입할 때 입력한 이름과 생년월일, 이메일 주소와 같은 계정정보도 수집한다.

특히 딥시크 출시 초기 키보드 입력 패턴까지 수집해 논란이 있었는데, 지난 14일 수집 대상에서 제외했다. 키보드 입력 패턴은 이용자 개인을 특정할 수 있을 뿐 아니라 비밀번호처럼 사용자가 입력한 중요 정보를 유추하는 데 쓰일 수 있어 민감정보로 분류된다.


이는 다른 AI기업의 정보수집과는 차이가 있다. 오픈AI의 챗GPT도 사용자가 입력한 텍스트나 업로드한 파일, 기기 식별자 등은 마찬가지로 수집한다. 하지만 누구로부터 수집한 정보인지 알 수 없도록 ‘토큰화’하는 과정을 거친다. ‘토큰화’란 필요한 정보만 안전하게 활용할 수 있게 해주는 방법이다. 예를 들어 편의점에서 영수증에 카드번호 전체 대신 마지막 4자리만 보여주는 것과 비슷한 방식이다. 이 과정을 거쳐 사용자 식별 정보는 제거되고, 입력된 데이터만 남아 서비스 개선에 활용된다.


AI 업계 관계자는 딥시크의 개인정보 처리방침에 대해 "내가 입력한 디지털 정보가 모두 넘어간다고 보면 된다"고 지적하며 "미국 등 선진국은 개인정보 보호법에 특정 개인의 데이터를 활용하는 것에 대한 규제가 명시돼 있어 수집과 활용이 불가능한 상황"이라고 설명했다.

오픈AI는 ‘토큰’만 가져가는데…사용자 정보 '통째로' 가져가는 딥시크 원본보기 아이콘

정보 활용 기간도 명시 안 해, 거부권도 없어

사용자가 입력한 정보를 생성형 AI 학습에 활용하지 않도록 정보 수집을 거부하는 ‘옵트아웃’ 설정을 제공하지 않는 점도 문제로 지적된다. 챗GPT를 비롯해 제미나이(구글), 클로바X(네이버) 같은 AI 서비스들은 사용자가 거부하면 대화 내용과 입력한 데이터를 AI 서비스 개선에 활용하지 않는다. 옵트아웃 옵션은 각 서비스 설정에서 쉽게 정할 수 있다. 하지만 딥시크는 이런 서비스 설정을 제공하지 않는다. 사용자가 서비스를 이용하며 입력한 정보가 서비스 개선을 위한 데이터로 모조리 활용된다는 얘기다.


수집한 데이터를 저장하는 기간도 명확하지 않다. 딥시크는 개인정보 처리방침에서 정보 보관 기간에 대해 ‘서비스를 제공하는 데 필요한 기간 동안’이라고만 명시했다. 수집된 데이터의 삭제 기한 역시 ‘더 이상 필요하지 않을 경우’로 모호하다. 반면 챗GPT와 클로바X는 사용자가 입력한 데이터의 보유 기간을 최대 30일로 정했다. 제미나이는 데이터 보유 기간을 사용자가 직접 정할 수 있고 클로바X는 입력했던 데이터를 사용자가 직접 삭제할 수 있는 기능도 제공한다.


개인정보는 중국 내 서버에 저장

딥시크의 개인정보와 데이터가 중국 내 서버에 저장된다는 점도 우려를 낳는다. 딥시크 약관만 놓고 보면 중국으로 개인정보를 전송하는 건 가능하다. 약관에는 ‘서버는 중화인민공화국에 있으며 사용자 개인 데이터는 중국 내 당사 서버에서 처리 및 저장될 수 있다’고 돼 있다.


하지만 중국 현행법상 국가기관이 자국 내 서버에 저장된 정보를 요구하면 해당 업체는 제공해야 한다는 점이 문제다. 정보 유출 우려를 떨쳐내기 어렵다는 뜻이다. 개인정보보호위원회는 이미 딥시크 사용자 정보가 중국 사회관계망서비스(SNS) 틱톡 모회사인 ‘바이트댄스’에 넘어간 것으로 확인됐다고 밝혔다. 장동인 한국과학기술원(KAIST·카이스트) AI대학원 책임교수도 "딥시크가 수집되는 개인정보는 알아서 쓰겠다고 고지를 해놓은 상황이라 주의해야 한다"고 말했다.


개인정보위가 딥시크에 내린 권고로 신규 앱 다운로드는 중단됐지만, 이번 조치의 실효성을 두고도 논란이 일 것으로 보인다. 이미 딥시크 앱을 내려받은 이용자들은 계속해서 앱을 이용할 수 있는 데다가, 딥시크 웹 페이지는 이번 조치 대상에서 제외됐기 때문이다. 앱 분석 서비스 와이즈앱·리테일에 따르면 딥시크 앱의 지난달 넷째 주 이용자 수는 121만명으로 집계됐다. 이는 같은 기간 생성형 AI 앱 가운데 챗GPT(493만명)에 이어 두 번째로 많은 수치다. 개인정보위 관계자는 "기존에 (딥시크 앱을) 다운로드받아 이용하는 이용자의 경우 사업자 측에서 특별히 할 수 있는 조치가 없어 각자 개인정보 입력에 신중해야 한다"며 "인터넷은 성격상 차단이 쉽지 않다"고 설명했다.





이명환 기자 lifehwan@asiae.co.kr
박유진 기자 genie@asiae.co.kr
전영주 기자 ange@asiae.co.kr
AD

<ⓒ투자가를 위한 경제콘텐츠 플랫폼, 아시아경제(www.asiae.co.kr) 무단전재 배포금지>

간격처리를 위한 class

많이 본 뉴스 !가장 많이 읽힌 뉴스를 제공합니다. 집계 기준에 따라 최대 3일 전 기사까지 제공될 수 있습니다.

언론사 홈 구독
언론사 홈 구독
top버튼

한 눈에 보는 오늘의 이슈