―론문 평가, 최종 권한은 누구에게 있는가
2025년 졸업 시즌이 본격화된 가운데 다수 대학이 졸업 론문 내 인공지능(AI) 생성 콘텐츠 허용 비률에 대한 명확한 요구를 공식화했다. 일부 학교는 심지어 ‘AI생성률’ 수치가 론문 합격의 절대적 기준이 된다고 명시했다.
분명 이 같은 규정은 표절 방지라는 취지에서 나온 것이다. AI가 워낙 강력해지다 보니 론문 작성에 AI를 악용하는 사례가 늘고 있기 때문이다. AI로 대필을 하거나 사례를 꾸미고 데이터를 조작하는 경우도 있다. 하지만 AI 감지 규정은 새로운 문제를 생성 시켰다. 소셜 플래트홈에는 “직접 쓴 론문인데 AI 생성으로 판정된다.”는 졸업생들의 하소연이 이어지고 있다. 반면 AI로 론문을 작성한 이들은 ‘AI 생성률’을 낮추는 꼼수를 공유하고 있다. 쉼표를 줄이고 련결어를 삭제하며 문단 구조를 뒤섞고 구어체 표현을 늘리는 등의 방법이다. 심지어 일부 업체는 AI 감지 시스템의 허점을 리용하여 ‘AI 생성률 낮추기 써비스’를 판매하며 ‘감지·조작·재감지’라는 신종 산업까지 생겨났다.
관계자에 따르면 ‘AI 생성률’ 감지 시스템은 어휘 사용 빈도, 문장 구조, 론리적 표현 등 특징을 분석해 AI 모델 출력물과 류사도를 비교하는 방식으로 작동한다. 하지만 여기에는 근본적인 모순이 있다. AI 생성 콘텐츠 자체가 인간의 언어를 모방한 것이기 때문이다. AI는 규범적이고 론리적인 글쓰기를 추구하는데 이는 정작 학술적 글쓰기의 요구사항과도 맞닿아 있다. 따라서 AI 감지 시스템은 선천적 한계를 가질 수밖에 없다. 순수 창작물이 AI 생성으로 오판되거나 반대로 AI 생성물이 기술적 허점을 리용해 검사를 피해가는 경우가 발생할 수 있다.
실제로 주자청의 명작 〈하당월색〉을 주요 론문 검사 시스템에 돌려본 결과 전체 60% 이상이 AI 생성으로 의심된다는 판정이 나왔다. 한 대학 교사는 소셜 플래트홈에서 연구팀이 3년간 현장 조사를 통해 작성한 론문 단락이 ‘AI 생성물’로 의심된다고 표시되였다고 토로하기도 했다.
‘AI 생성률’ 검사 논란은 기술 변혁시기에 교육계가 직면한 하나의 도전이다. 우리는 AI의 부정적 영향을 차단하려는 확실한 방안을 원하지만 AI가 AI를 탐지하도록 하는 것은 본질적으로 ‘기술적 미신’이다. 이 시스템은 창의적인 작가들이 무의미한 수정을 하게 만들어 결국 평범하거나 형편없는 글을 창출할 위험성이 있다.
AI 감지 시스템의 결과는 참고 자료일 뿐 최종 판단은 학술위원회의 몫이다. 한 교사는 “학생이 직접 쓴 글인지 AI가 생성한 글인지는 가르치는 사람이 금방 안다.”고 말했다. 교사들은 학생들의 평소 실력과 연구 과정을 가장 잘 리해하고 있기 때문이다. 교육 과정을 바탕으로 한 전문적 판단은 어떤 AI 모델보다 우월하다. 게다가 론문의 질을 가늠하는 기준은 이미 학계에 정립되여 있다. 표현의 ‘AI 특유의 냄새’를 따지기보다 독창적인 사고와 혁신적인 관점, 적절한 연구 방법, 신뢰할 만한 데이터와 결론 등에 집중하는 것이 옳다. 결국 론문에 공정한 점수를 줄 수 있는 것은 지도교수와 심사위원이지 그 어떤 AI 도구도 아니다.
우리가 양성해야 할 것은 AI 검사를 통과할 줄 아는 ‘글쟁이’가 아니라 독자적 사고력과 창의성을 갖춘 인재이다. AI가 학술 생산과 평가 과정에 개입할 수는 있지만 그 역할은 어디까지나 보조적이여야 한다. 어떤 경우에도 학문적 평가에서 인간의 주체성은 대체 불가능하다.
/과학기술일보
编辑:최화