앤트로픽이 브라우저 기반 AI 활용 실험에 나섰다.

앤트로픽은 27일 ‘클로드’를 크롬 확장 프로그램 형태로 제공한다고 밝혔다. 앤트로픽에 따르면, 이번 조치는 파일럿 형태로 운영되며 일정 관리, 이메일 작성, 웹사이트 테스트 등에서 이미 활용도를 입증한 ‘브라우저-사용 AI’ 개념을 본격 검증하기 위한 단계다.
앤트로픽은 블로그를 통해 “브라우저에서의 AI 활용은 필연적”라며 “대다수 업무가 브라우저에서 이뤄지는 만큼, AI가 버튼 클릭이나 양식 작성까지 수행할 수 있다면 훨씬 강력한 도구가 될 것”이라고 강조했다. 다만, 브라우저 환경에서의 AI 활용은 새로운 보안 위협을 수반하는 만큼 안전 장치 확보가 핵심 과제로 떠올랐다.
실제로 브라우저 AI가 직면하는 대표적 위험은 ‘프롬프트 인젝션(prompt injection)’ 공격이다. 악성 행위자가 웹사이트, 이메일, 문서 속에 은밀한 지시를 삽입해 AI가 사용자의 의도와 무관한 행동을 하도록 유도하는 방식이다. 앤트로픽은 레드팀(red-teaming) 실험을 통해 29개 공격 시나리오, 123개 테스트 케이스를 수행했으며, 안전 장치가 없는 상태에서 공격 성공률은 23.6%에 달했다. 한 사례로, 보안팀을 사칭한 이메일이 “메일함 정리 차원에서 모든 이메일 삭제”를 요구했을 때 클로드는 실제로 이를 수행했다.
그러나 새 방어 체계 적용 후 클로드는 해당 이메일을 ‘피싱 공격 의심’으로 분류하고 실행을 거부했다. 또한 금융·성인·불법 콘텐츠 사이트 차단, 고위험 행동 사전 확인, 고급 분류기를 통한 의심 지시 탐지 등 다층적 보호 장치를 도입했다. 그 결과 공격 성공률은 11.2%로 크게 줄었으며, 브라우저 특유의 공격(보이지 않는 DOM 필드, URL·탭 제목 삽입 등)에 대해서는 성공률을 35.7%에서 0%까지 낮췄다.
이번 기능은 클로드 맥스(Max) 요금제 사용자 1,000명을 대상으로 진행되며, 대기자 명단을 통해 참여할 수 있다. 사용자는 크롬 웹스토어에서 확장을 설치하고 클로드 계정으로 인증해 사용할 수 있다. 앤트로픽은 금융·법률·의료 등 민감한 사이트에서는 적용하지 말라고 권장했다.
앤트로픽은 “내부 실험만으로는 실제 브라우저 사용 환경의 복잡성을 모두 담을 수 없다”며 “사용자 피드백을 통해 보안 분류기를 정교화하고 새로운 공격 패턴에 대비해 나갈 것”이라고 밝혔다.
jihyun.lee@foundryco.com