AI Tech Briefing

AI에게 익명 글을 보여줘도 정말 익명일까

짧은 글 조각만으로도 작성자 단서가 남을 수 있다는 신호가 커지고 있다. Claude Opus 4.7이 실제 저자를 맞혔다는 공개 사례에 더해, 공개 도메인 텍스트로 해 본 작은 문체 분류 실험도 익명성이 계정 정보 삭제만으로 끝나지 않을 수 있음을 보여준다.

2026-05-01

왜 중요한가

공개 글이 많은 사람은 글버릇 자체가 단서가 될 수 있다.
AI 채팅은 익명으로 느껴지기 쉽지만, 대화 내용만으로 작성자나 소속, 자주 드나드는 커뮤니티를 추정할 여지가 있다.
모델의 설명이 그럴듯해 보여도 사후에 맞춰 낸 이야기일 수 있다. 그래서 핵심은 ‘왜 그렇게 맞혔나’보다 ‘그런 추정을 허용해도 되나’에 가깝다.
최근 AI 소식이 에이전트와 도구 쪽에 몰려 있었던 만큼, 이번 신호는 인터페이스와 프라이버시 관점에서 따로 볼 만하다.

핵심 관찰

공개 사례에서는 Claude Opus 4.7이 짧은 글 일부를 보고 실제 저자를 맞혔다고 보고됐다.
별도로 진행한 작은 실험에서는 Project Gutenberg의 공개 도메인 텍스트 5명을 대상으로 약 180단어 글 조각을 분류했다.
단순한 문자 4-gram 기준 실험에서도 50개 중 31개를 맞혀, 무작위 추정보다 높은 결과가 나왔다.
이 실험은 Claude 사례를 재현한 것은 아니지만, 짧은 글에도 저자 식별 신호가 남을 수 있다는 전제는 확인해 준다.

해석

이번 신호의 핵심은 AI가 이름이나 계정 정보 없이도 글의 버릇을 근거로 사람을 좁혀 갈 수 있다는 점이다.

특히 공개 글이 많이 쌓인 사람일수록 ‘익명으로 쓴 문장’과 ‘이미 공개된 문장’ 사이의 닮은꼴이 더 큰 단서가 될 수 있다.

그래서 익명 제보, 내부 설문, 리뷰, 회고를 AI로 처리하는 제품과 조직은 작성자 추정을 민감한 추론으로 보고 제한할 필요가 있다.

누구에게 도움이 되나

언론/커뮤니티/연구팀: 익명 제보와 내부 설문을 AI로 처리할 때 deanonymization 위험 고지가 필요하다.
기업/HR: 익명 리뷰나 내부 피드백 작성자 추정은 윤리·법무 리스크가 크다.
제품팀: AI가 사용자 정체성을 추측하는 행동을 민감 추론으로 분류하고 제한하는 UI/정책 설계가 필요하다.

어디에 바로 써볼 수 있나

AI privacy/evaluation에서 uthorship inference from small text samples를 별도 위험군으로 다룰 수 있다.
익명 피드백, 리뷰, 내부 회고를 AI에 넣을 때 작성자 추정 가능성을 고려해야 한다.
사용자가 제공한 텍스트에서 신원/작성자 추정을 하지 않는 guardrail과 eval을 만들 수 있다.
익명 제보와 내부 설문을 AI로 처리할 때 deanonymization 위험 고지가 필요하다.
익명 리뷰나 내부 피드백 작성자 추정은 윤리·법무 리스크가 크다.
AI가 사용자 정체성을 추측하는 행동을 민감 추론으로 분류하고 제한하는 UI/정책 설계가 필요하다.

주요 출처

공식 repo / docs

주의점

원 사례는 개인 보고라서 통제된 벤치마크로 보기는 어렵다.
이번에 직접 해 본 실험도 최신 대형 모델이 아니라 단순한 문체 분류 기준이다.
후보가 정해진 상태에서 맞히는 것과, 넓은 인터넷에서 실제 사람을 찾아내는 것은 난도가 다르다.
공개 글이 적거나 글의 장르가 다르거나 의도적으로 문체를 바꾼 경우에는 결과가 크게 달라질 수 있다.
실제 사람을 대상으로 반복적인 작성자 추정 실험을 하는 것은 프라이버시 침해가 될 수 있어 수행하지 않았다.

다음에 볼 포인트

AI 제품들이 작성자·소속·커뮤니티 추정을 민감한 추론으로 분류하고 막는지 볼 것.
익명 피드백이나 내부 설문을 AI에 넣을 때, 작성자 추정 위험을 고지하는 흐름이 생기는지 볼 것.