AI Tech Briefing

AI에게 익명 글을 보여줘도 정말 익명일까

짧은 글 조각만으로도 작성자 단서가 남을 수 있다는 신호가 커지고 있다. Claude Opus 4.7이 실제 저자를 맞혔다는 공개 사례에 더해, 공개 도메인 텍스트로 해 본 작은 문체 분류 실험도 익명성이 계정 정보 삭제만으로 끝나지 않을 수 있음을 보여준다.

2026-05-01

왜 중요한가

  • 공개 글이 많은 사람은 글버릇 자체가 단서가 될 수 있다.
  • AI 채팅은 익명으로 느껴지기 쉽지만, 대화 내용만으로 작성자나 소속, 자주 드나드는 커뮤니티를 추정할 여지가 있다.
  • 모델의 설명이 그럴듯해 보여도 사후에 맞춰 낸 이야기일 수 있다. 그래서 핵심은 ‘왜 그렇게 맞혔나’보다 ‘그런 추정을 허용해도 되나’에 가깝다.
  • 최근 AI 소식이 에이전트와 도구 쪽에 몰려 있었던 만큼, 이번 신호는 인터페이스와 프라이버시 관점에서 따로 볼 만하다.

핵심 관찰

  • 공개 사례에서는 Claude Opus 4.7이 짧은 글 일부를 보고 실제 저자를 맞혔다고 보고됐다.
  • 별도로 진행한 작은 실험에서는 Project Gutenberg의 공개 도메인 텍스트 5명을 대상으로 약 180단어 글 조각을 분류했다.
  • 단순한 문자 4-gram 기준 실험에서도 50개 중 31개를 맞혀, 무작위 추정보다 높은 결과가 나왔다.
  • 이 실험은 Claude 사례를 재현한 것은 아니지만, 짧은 글에도 저자 식별 신호가 남을 수 있다는 전제는 확인해 준다.

해석

이번 신호의 핵심은 AI가 이름이나 계정 정보 없이도 글의 버릇을 근거로 사람을 좁혀 갈 수 있다는 점이다.

특히 공개 글이 많이 쌓인 사람일수록 ‘익명으로 쓴 문장’과 ‘이미 공개된 문장’ 사이의 닮은꼴이 더 큰 단서가 될 수 있다.

그래서 익명 제보, 내부 설문, 리뷰, 회고를 AI로 처리하는 제품과 조직은 작성자 추정을 민감한 추론으로 보고 제한할 필요가 있다.

누구에게 도움이 되나

  • 언론/커뮤니티/연구팀: 익명 제보와 내부 설문을 AI로 처리할 때 deanonymization 위험 고지가 필요하다.
  • 기업/HR: 익명 리뷰나 내부 피드백 작성자 추정은 윤리·법무 리스크가 크다.
  • 제품팀: AI가 사용자 정체성을 추측하는 행동을 민감 추론으로 분류하고 제한하는 UI/정책 설계가 필요하다.

어디에 바로 써볼 수 있나

  • AI privacy/evaluation에서 uthorship inference from small text samples를 별도 위험군으로 다룰 수 있다.
  • 익명 피드백, 리뷰, 내부 회고를 AI에 넣을 때 작성자 추정 가능성을 고려해야 한다.
  • 사용자가 제공한 텍스트에서 신원/작성자 추정을 하지 않는 guardrail과 eval을 만들 수 있다.
  • 익명 제보와 내부 설문을 AI로 처리할 때 deanonymization 위험 고지가 필요하다.
  • 익명 리뷰나 내부 피드백 작성자 추정은 윤리·법무 리스크가 크다.
  • AI가 사용자 정체성을 추측하는 행동을 민감 추론으로 분류하고 제한하는 UI/정책 설계가 필요하다.

주요 출처

공식 repo / docs

주의점

  • 원 사례는 개인 보고라서 통제된 벤치마크로 보기는 어렵다.
  • 이번에 직접 해 본 실험도 최신 대형 모델이 아니라 단순한 문체 분류 기준이다.
  • 후보가 정해진 상태에서 맞히는 것과, 넓은 인터넷에서 실제 사람을 찾아내는 것은 난도가 다르다.
  • 공개 글이 적거나 글의 장르가 다르거나 의도적으로 문체를 바꾼 경우에는 결과가 크게 달라질 수 있다.
  • 실제 사람을 대상으로 반복적인 작성자 추정 실험을 하는 것은 프라이버시 침해가 될 수 있어 수행하지 않았다.

다음에 볼 포인트

  • AI 제품들이 작성자·소속·커뮤니티 추정을 민감한 추론으로 분류하고 막는지 볼 것.
  • 익명 피드백이나 내부 설문을 AI에 넣을 때, 작성자 추정 위험을 고지하는 흐름이 생기는지 볼 것.