AI가 책 두 권으로 노벨상 작가의 문체를 모방했다: 창작의 미래는?

2024년 노벨 문학상 수상자 한강. 부커상 수상자 살만 루슈디.
이들 거장의 문체를 AI가 단 두 권의 책만으로 모방할 수 있다면 믿으시겠습니까? 더 놀라운 건, 독자들이 실제 전문 작가보다 AI가 쓴 글을 더 선호했다는 사실입니다.
스토니브룩 대학과 컬럼비아 법대 연구팀이 발표한 최신 연구는 문학계에 충격을 던졌습니다. 이 연구는 단순한 기술적 성취를 넘어, 창작의 본질과 저작권법, 그리고 작가라는 직업의 미래에 대한 근본적인 질문을 던지고 있습니다.
실험의 설계: 인간 vs AI, 누가 더 나은 모방자인가
연구팀은 한강, 살만 루슈디를 포함해 노벨상, 부커상, 퓰리처상 수상자 등 총 50명의 저명한 작가를 선정했습니다. 그리고 두 그룹에게 같은 미션을 주었죠.
인간 팀: 미국 최고 수준의 MFA(Master of Fine Arts, 창작 석사) 프로그램에서 선발된 28명의 창작 전문가들. 이들은 문학 이론과 창작 기법을 체계적으로 훈련받은 차세대 작가들입니다.
AI 팀: GPT-4o, Claude 3.5 Sonnet, Gemini 1.5 Pro. 세 가지 최신 AI 모델이 두 가지 방식으로 테스트되었습니다.
In-context prompting: 기본 AI에게 몇 가지 예시와 지시만 제공
Fine-tuning: 특정 작가의 전체 작품으로 AI를 집중 학습
미션은 명확했습니다. 각 작가의 스타일로 최대 450단어의 글을 작성하라.
그리고 159명의 독자(전문가 28명, 일반 독자 131명)가 블라인드 테스트로 평가했습니다. 누가 썼는지 전혀 모르는 상태에서 두 글을 비교해 선호도를 선택하는 방식이었죠.
예상을 뒤엎은 결과
1단계: 일반 AI는 처참하게 패배
In-context prompting을 사용한 기본 AI의 결과는 예상대로였습니다.
전문가들의 평가에서 문체 재현도 0.16배 (인간이 6배 더 우수)
글 퀄리티 0.13배 (인간이 약 8배 더 우수)
전문가들은 AI가 쓴 글을 즉시 알아차렸습니다. 흔한 클리셰, 부자연스럽게 공손한 표현, 예측 가능한 전개. AI 특유의 '냄새'가 역력했죠.
일반 독자들도 명확한 선호를 보이지는 않았지만, 대체로 인간이 쓴 글에 더 호감을 보였습니다.
2단계: 파인튜닝 후 상황은 완전히 역전
그런데 각 작가의 전체 작품으로 파인튜닝한 AI는 놀라운 결과를 보여줬습니다.
전문가 평가:
문체 재현도에서 AI 선택 비율 8.16배 증가
글 퀄리티에서 AI 선택 비율 1.87배 증가
일반 독자 평가:
압도적으로 AI 생성 텍스트를 선호
더 충격적인 사실은, 최신 AI 탐지 도구조차 속았다는 겁니다.
일반 AI 텍스트: 97% 탐지
파인튜닝 AI 텍스트: 단 3% 탐지
파인튜닝은 AI 특유의 스타일적 결함들을 거의 완벽하게 제거했습니다. 클리셰 밀도, 부자연스러운 공손함, 예측 가능성. 모두 사라졌죠.
가장 놀라운 발견: 책의 권수는 중요하지 않다
연구팀이 발견한 가장 놀라운 사실은 따로 있었습니다.
무라카미 하루키처럼 수십 권의 책을 쓴 다작 작가나, 토니 툴라티뮤테처럼 단 두 권만 출판한 작가나, AI의 모방 능력에는 차이가 없었습니다.
학습 데이터의 양은 중요하지 않았어요. 두 권이면 충분했습니다.
이는 AI가 단순히 방대한 데이터를 암기하는 것이 아니라, 작가 특유의 문체적 패턴과 리듬을 본질적으로 학습한다는 의미입니다.
경제적 충격: $81 vs $25,000
연구팀은 경제적 측면도 분석했습니다.
AI 파인튜닝 + 10만 단어 소설 생성 비용: $81 전문 작가 고용 비용: $25,000
99.7%의 비용 절감.
물론 이 계산에는 AI가 생성한 원고를 편집하고 다듬는 인간의 추가 작업이 포함되지 않았습니다. 하지만 그 비용을 고려하더라도 격차는 여전히 압도적입니다.
법적 지진: 공정사용 논쟁의 새로운 국면
이 연구가 발표된 시점은 의미심장합니다. 현재 미국에서는 AI 기업들을 상대로 한 대규모 저작권 소송이 진행 중입니다.
뉴욕 타임스 vs OpenAI
작가 길드 vs 여러 AI 기업
Anthropic의 15억 달러 규모 합의 (2024년)
AI 기업들의 핵심 방어 논리는 "공정사용(Fair Use)"입니다. 저작권이 있는 책으로 AI를 학습시키는 것은 교육적 목적이며, 원작을 그대로 복제하지 않기 때문에 허용되어야 한다는 주장이죠.
연구팀의 명확한 입장
하지만 이번 연구는 그 논리에 정면으로 반박합니다.
미국 저작권법의 공정사용 판단 4가지 기준 중 4번째는 이렇습니다: "원작의 잠재적 시장이나 가치에 미치는 영향"
연구팀은 이렇게 결론지었습니다:
"독자들이 AI 생성 텍스트를 선호한다는 실증적 증거는, AI가 원작의 시장을 대체할 수 있음을 명확히 보여줍니다. 특정 작가를 모방하도록 파인튜닝된 AI는 공정사용으로 인정되어서는 안 됩니다."
연구팀은 두 가지 AI를 구분해야 한다고 제안합니다:
범용 AI 모델: 광범위한 데이터로 학습. 다양한 용도. 공정사용 인정 가능.
작가별 파인튜닝 모델: 특정 작가 모방 목적. 원작 시장 직접 대체. 공정사용 불인정.
작가들에게 던지는 질문
이 연구는 작가들에게 불편한 질문을 던집니다.
당신의 문체는 무엇인가요?
평생 갈고닦은 고유한 목소리가 단 $81, 두 권의 책으로 복제될 수 있다면, 작가의 정체성은 어디에 있을까요?
독자들은 무엇을 원하는가?
독자들이 AI 버전을 선호한다는 건, 그들이 진짜로 원하는 게 "작가"가 아니라 "그 스타일의 이야기"라는 뜻일까요?
창작의 가치는?
작가의 가치가 문체에만 있지 않다는 건 명백합니다. 하지만 시장은 그렇게 생각하지 않을 수 있습니다.
이것은 시작일 뿐
이 연구에는 한계도 있습니다.
최대 450단어의 짧은 텍스트만 테스트
장편 소설의 복잡한 구조, 캐릭터 일관성, 플롯 전개는 미검증
AI 출력물을 완성된 작품으로 만드는 인간의 편집 작업 비용 미포함
하지만 기술은 계속 발전합니다. 오늘 450단어에서 성공했다면, 내일은 10만 단어도 가능할 수 있습니다.
우리는 어디로 가야 하는가
이 연구가 주는 메시지는 명확합니다.
기술적으로 가능하다고 해서 법적, 윤리적으로 허용되어야 하는 것은 아닙니다.
AI는 놀라운 도구입니다. 하지만 그 도구가 창작자의 생존권을 위협하고, 문학 시장을 왜곡하는 방식으로 사용된다면, 우리는 규제를 고민해야 합니다.
연구팀이 제안한 것처럼:
특정 작가 모방용 AI는 금지하거나
AI 생성 텍스트에는 명확한 라벨을 부착하거나
작가들에게 정당한 보상 체계를 마련하거나
선택지는 있습니다. 문제는 우리가 어떤 미래를 원하느냐는 것이죠.
마치며
AI는 이제 작가의 문체를 모방하는 수준을 넘어, 독자들이 선호하는 글을 쓰기 시작했습니다.
이것이 창작의 민주화일까요, 아니면 창작의 종말일까요?
그 답은 아직 우리 손에 있습니다.
더 많은 AI 트렌드와 인사이트가 궁금하다면?
틸노트 클립을 써보세요. 지금 보고 있는 웹 사이트나 유튜브를 클릭 한번에 정리된 노트로 만들어줍니다. 무료로 사용할 수 있습니다!
매일 전세계 AI 정보를 받고 싶다면?
AI 스퀘어 단톡방에 참여하세요. 벌써 1000여명 이상이 함께하고 있습니다. 비번은 tilnote 👉 https://open.kakao.com/o/gK4NY6fg
참고 자료:
Chakrabarty, T., Ginsburg, J. C., & Dhillon, P. (2025). "Readers Prefer Outputs of AI Trained on Copyrighted Books over Expert Human Writers." arXiv preprint arXiv:2510.13939. https://arxiv.org/abs/2510.13939