앤스로픽이 그동안 공개를 미뤄온 최상위급 AI 모델을 일반 이용자에게 내놨다.

로이터연합뉴스

로이터연합뉴스

AD
원본보기 아이콘

9일(현지시간) 앤스로픽은 새 AI 모델 '클로드 페이블5'와 보안 특화 모델 '클로드 미토스5'를 출시한다고 밝혔다. 페이블5는 일반 이용자용 모델이다. 미토스5는 보안 검증을 거친 기관에만 제한적으로 제공된다.


두 모델은 기반은 사실상 같지만 제공 방식은 다르다. 페이블5에는 악용 가능성이 큰 분야에 안전장치가 적용됐다. 악성 해킹에 활용될 수 있는 사이버보안 관련 질의가 들어오면 페이블5가 직접 답하지 않고 기존 최상위 모델이던 '오퍼스4.8'이 대신 처리한다. 이용자에게도 이 사실을 알린다.

앤스로픽은 안전하고 빠른 출시를 위해 해당 장치를 보수적으로 설정했다고 밝혔다. 이 때문에 정상적인 요청까지 차단될 수 있지만 실제 작동 비율은 전체 세션의 5% 미만이라고 설명했다. 이 같은 제한은 사이버보안뿐 아니라 생물무기 등에 악용될 수 있는 생물학·화학 관련 질의에도 적용된다. 경쟁 AI 모델의 기능을 추출하려는 무단 '증류' 의심 요청도 제한 대상에 포함된다.


제한이 없는 미토스5는 보안 협의체 '프로젝트 글래스윙'을 통해 검증된 기관에만 제공된다. 이에 따라 이 프로젝트 참여 기관으로 알려진 삼성전자와 SK하이닉스, SK텔레콤, 한국인터넷진흥원(KISA) 등도 미토스5 접속권을 받을 가능성이 있다.

앤스로픽은 페이블·미토스 모델에서 발생하는 데이터를 30일간 보존하는 새 정책도 마련했다. 이 데이터는 새로운 공격을 막거나 오탐 사례를 가려내는 데 활용된다.


새 모델의 성능은 앞서 공개된 '미토스 미리보기'보다 높았다. 사이버보안 역량을 측정하는 '익스플로잇벤치'에서 미토스5는 78%를 기록했다. 오픈AI GPT-5.5의 34%, 앤스로픽 오퍼스4.8의 40%, 미토스 미리보기의 69%를 모두 웃돌았다.


분야별 박사급 지능을 평가하는 '인류의 마지막 시험'에서는 도구를 사용하지 않는 조건에서 59%를 기록했다. 기존 미토스 미리보기의 56.8%보다 높다. 터미널 환경 코딩 능력을 평가하는 '터미널-벤치 2.1'에서도 88%를 기록해 GPT-5.5의 83.4%를 앞섰다.


일반 코딩 성능에서도 높은 점수를 보였다. 페이블5는 'SWE-벤치 프로'에서 80.3%를 기록했다. GPT-5.5는 58.6%, 구글 제미나이 3.1 프로는 54.2%였다. 지식 업무 능력을 평가하는 'GDPval-AA'에서도 1932점을 받아 GPT-5.5와 제미나이3.1 프로를 넘어섰다.

AD

페이블5는 이날부터 이용할 수 있다. 오는 22일까지는 기존 유료 구독자에게 추가 비용 없이 제공된다. 이후에는 별도 요금을 내야 사용할 수 있다. 앤스로픽은 서버 용량이 충분히 확보되면 페이블5를 다시 기존 구독에 포함할 계획이라고 밝혔다.


유현석 기자 guspower@asiae.co.kr

<ⓒ투자가를 위한 경제콘텐츠 플랫폼, 아시아경제(www.asiae.co.kr) 무단전재 배포금지>

함께 보면 좋은 기사

새로보기

내 안의 인사이트 깨우기

취향저격 맞춤뉴스

많이 본 뉴스

당신을 위한 추천 콘텐츠

놓칠 수 없는 이슈