생성 AI문화 동질화피드백 루프모델 붕괴재현성

문화를 동질화하는 것은 AI 보조가 아니다. 루프다.

IOV LABS가 AI 매개 문화 동질화를 통제 실험으로 측정했다. 정적 AI 보조는 집단 다양성을 평평하게 두지만, 군중의 인기작을 되비추는 반영 루프는 여섯 세대에 걸쳐 10~12% 무너뜨린다. 뻔한 해법은 실패한다: 다양한 AI 어드바이저도 막지 못한다.

두 발견이 2년째 서로를 맴돌았다. Doshi와 Hauser(2024)는 AI 아이디어를 받은 작가가 더 좋은 개별 작품을 쓰지만 서로 더 비슷해진다는 것을 보였다. Shumailov 연구진(2024)은 자기 출력으로 재학습한 모델이 붕괴한다는 것을 보였다. IOV LABS는 이 둘을 하나의 질문으로 합쳤다. 공유된 모델이 반복적 창작 과정 안에 들어앉을 때, 집단 전체의 다양성은 시간에 따라 줄어드는가, 그리고 무엇이 그것을 실제로 추동하는가?

우리는 통제된 짝지음 실험을 만들었다. 전통·기질·어조가 의도적으로 다른 창작자 페르소나 12명이 고정된 테마에 대해 세대마다 짧은 글 하나씩, 여섯 세대 동안 만들고, 이를 세 개 테마에서 반복한다. 같은 페르소나가 네 조건에서 돌기 때문에, 차이가 있다면 그것은 다른 군중이 아니라 AI가 만든 것이다.

100–102%

혼자·정적 AI에서 다양성 유지

10–12%

반영 루프에서 다양성 손실

p=0.007

다양 어드바이저도 붕괴

해리(dissociation)

핵심은 "AI가 동질화한다"가 아니다. 더 날카롭고, 책임을 특정 지점에 둔다. *정적* AI 어드바이저, 즉 아이디어는 제안하지만 군중이 무엇을 만드는지는 결코 보지 않는 보조와 함께 쓸 때, 집단의 의미적 다양성은 사실상 그대로다. 여섯 세대 뒤에도 초기 분산의 100~102%가 남는다. 붕괴는 오직 어드바이저가 집단의 최근 인기작을 보고 "같은 결로" 제안하라고 요청받을 때만 나타난다. 그 반영 루프가 비등방성 보정 의미 분산을 10~12% 떨어뜨린다. 동질화하는 것은 보조가 아니다. 루프다.

혼자 (AI 없음)

100%

AI 정적 (기억 없음)

102%

AI 반영 루프

90%

반영 + 다양 어드바이저

88%

여섯 세대 뒤 유지된 집단 다양성, 조건별 (100%면 동질화 없음)

듣지 않는 해법

"AI가 다 똑같이 만든다"에 대한 반사적 처방은 "AI를 더 다양하게 만들라"다. 우리는 바로 그 가설을, 한 명 대신 다양한 AI 어드바이저 패널을, 사전등록했다. 단일 라운드에서 다양한 페르소나가 다양성을 지킨다는 선행연구를 따른 것이다. 반복 하에서 그것은 실패한다. 다양 패널은 단일 어드바이저보다 오히려 약간 더 다양성을 잃고, 그 하락은 놀랄 만큼 일관된다(p = 0.007). 이유는 구조적이다. 어드바이저 다양성은 매 라운드에 들어오는 일회성 교란인 반면, 반영은 매 라운드 가해지는 힘으로, 군중이 이미 수렴한 쪽으로 끌어당긴다. 일회성 교란은 반복되는 힘을 상쇄할 수 없다. 중요한 레버는 목소리가 아니라 반영이다.

왜 놓치기 쉬운가

이 수렴은 의미적이지 어휘적이 아니다. distinct-2 같은 표면 지표는 평평하게 유지되므로, n-그램 다양성을 쓰는 연구자라면 아무 일도 없다고 결론지을 것이다. 집단은 같은 단어로 수렴하지 않는다. 다른 단어로 같은 생각에 수렴한다. 오직 의미 임베딩만이 그 수축을 보이게 한다. 그리고 교차 가문 심사자가 블라인드로 매긴 개별 품질은, 집단 다양성이 가장 낮은 바로 그 조건에서 가장 높다. 모든 작가가 더 좋은 작품을 얻지만, 문화는 스스로를 놀라게 할 변이를 잃는다. 아무도 그 손실을 체감하지 못한다. 루프가 없었다면 존재했을 더 다양한 문화는 결코 관측되지 않기 때문이다.

집단을 동질화하는 것은 AI 보조가 아니라 군중을 되비추는 AI의 루프다. AI를 더 다양하게 만드는 것으로는 그 루프가 깨지지 않는다.

우리는 음성 결과를 공개로 두고, 지표 의존성을 정직하게 보고하며, 시드·모델 스냅샷·명령 하나 재현을 함께 제공한다. 논문 전문과 코드, 데이터는 모두 공개되어 있다.

GitHub (직접 실행)논문