우리는 왜 AI에게 답이 아니라 논쟁을 요구해야 하는가

우리는 지금 잘못된 방식으로 생각하는 법을 배우고 있다.

이 문장은 과장처럼 들릴 수 있다. 그러나 현재 대규모 언어모델(LLM)을 사용하는 방식, 특히 교육 맥락에서의 사용은, 사고를 확장하기보다 축소시키는 방향으로 작동하고 있다. 우리는 질문을 던지고, 답을 받고, 그것을 정리한다. 이 과정은 효율적이다. 그러나 효율성과 사고는 종종 서로 반대 방향을 향한다.

효율적인 사고는 빠르게 끝나는 사고이다. 철학적 사고는 끝나지 않는 사고이다.

이 지점에서 우리는 하나의 선택을 해야 한다. LLM을 "정답 기계"로 사용할 것인가, 아니면 "사유를 지속시키는 장치"로 사용할 것인가. 나는 후자를 선택해야 한다고 주장한다.

1. 답을 소비하는 순간, 사고는 멈춘다

LLM이 제공하는 답은 대부분 충분히 그럴듯하다. 때로는 매우 정교하고, 설득력 있으며, 인간이 쓴 글과 구별하기 어려울 정도이다. 문제는 바로 그 지점에 있다. 너무 잘 만들어진 답은, 더 이상 질문을 요구하지 않는다.

사용자는 그 답을 검토하기보다 받아들이고, 정리하고, 자신의 언어로 재서술한다. 이 과정에서 외형적인 학습은 일어난다. 그러나 내적인 사고는 거의 일어나지 않는다. 왜냐하면 사고는 본질적으로 저항에서 발생하기 때문이다. 철학은 항상 무언가에 저항하는 행위였다. 주장에 저항하고, 개념에 저항하고, 스스로의 직관에 저항한다. 그러나 완성된 답은 저항의 여지를 제거한다. 그래서 우리는 묻지 않게 된다.

이 현상은 직관적 추측이 아니라 신경과학적으로도 관찰되고 있다. 2025년 MIT 미디어랩의 Kosmyna 등은 54명의 참여자를 대상으로, LLM을 사용한 에세이 작성이 뇌 활동에 미치는 영향을 EEG로 측정했다. 참여자들은 세 집단으로 나뉘었다. LLM 사용 집단, 검색엔진 사용 집단, 그리고 어떠한 도구도 사용하지 않는 집단이었다. 결과는 일관적이었다. LLM에 의존한 집단은 뇌 연결성이 가장 약했고, 도구 없이 작성한 집단은 가장 넓고 강한 신경 네트워크를 보여주었다. 연구진은 이 현상을 "인지 부채(cognitive debt)"라고 명명했다. 외부 도구에 사고를 위탁할수록, 사고를 담당하는 신경 회로가 약화된다는 것이다. 더 주목할 점은, LLM을 사용한 참여자들이 자신이 방금 작성한 에세이의 내용조차 제대로 기억하지 못했다는 사실이다. 그들은 자기 글에 대한 심리적 소유감도 현저히 낮았다.

이 연구가 시사하는 바는 분명하다. LLM이 제공하는 답의 품질이 높을수록, 사용자의 인지적 참여는 오히려 낮아진다. 우리는 더 좋은 글을 "받지만", 더 적게 "생각한다."

Daniel Kahneman이 제시한 이중 처리 이론의 틀로 보면 이 현상의 구조가 더 명확해진다. Kahneman은 인간의 사고를 두 체계로 구분했다. 시스템 1은 빠르고 자동적이며 직관적인 사고이고, 시스템 2는 느리고 의도적이며 분석적인 사고이다. LLM에게 답을 요청하고 그것을 수용하는 과정은 전형적인 시스템 1의 작동 방식이다. 답이 그럴듯하게 보이면, 시스템 2는 개입하지 않는다. 검토할 동기가 사라지기 때문이다.

그런데 철학적 사고란 본질적으로 시스템 2의 영역이다. 전제를 의심하고, 논증의 구조를 분석하고, 반례를 구성하는 일은 의식적 노력 없이는 불가능하다. LLM의 답을 소비하는 방식은 시스템 2의 활성화를 억제하며, 결과적으로 비판적 사고 능력 자체를 위축시킨다. Microsoft와 Carnegie Mellon 대학교의 공동 연구(Lee et al., 2025)는 이 문제의 규모를 구체적으로 보여주었다. 지식 노동자들이 AI 도구를 사용하는 과업 중 약 40%에서, 비판적 사고를 전혀 수행하지 않았다고 보고한 것이다.

2. 철학은 "대화"이지, "결론 생산"이 아니다

철학 교육이 오랫동안 유지해온 가장 중요한 형식은 논문도, 강의도 아니라 대화였다. 소크라테스는 책을 쓰지 않았다. 그는 대화를 만들었다. 그리고 그 대화의 핵심은 언제나 동일했다. 상대의 주장에 직접 답하라. 이 단순한 규칙이 철학을 가능하게 했다. 논점이 흩어지지 않고, 하나의 문제를 끝까지 밀고 갈 수 있게 했기 때문이다.

그러나 오늘날 학생들이 작성하는 많은 글은 이 규칙을 따르지 않는다. 여러 관점을 나열하고, 다양한 반론을 소개하며, 균형 잡힌 결론을 제시한다. 겉으로는 훌륭해 보이지만, 실제로는 아무 논증도 끝까지 수행되지 않는다. LLM을 사용하는 방식도 마찬가지이다. 질문을 바꾸고, 주제를 옮기고, 더 많은 내용을 끌어온다. 그 결과 우리는 더 많이 알게 되지만, 아무것도 깊이 생각하지 않게 된다.

이 문제는 학생 개인의 게으름으로 환원될 수 없다. LLM과의 상호작용 자체가 "거래적 학습 모델(transactional model of learning)"을 강화하기 때문이다. 한 연구에서 프로그래밍 과제를 수행하는 학생들의 LLM 사용 패턴을 분석한 결과, 학생들은 LLM이 생성한 첫 번째 코드를 거의 수정 없이 그대로 제출하는 경향을 보였다. 대안을 탐색하거나 디버깅 과정을 거치는 경우는 드물었다. 이는 구성주의적 학습 이론이 강조하는 능동적 의미 구성과 정확히 반대되는 양상이다. LLM을 탐구의 도구가 아니라 완성된 해답의 공급처로 사용할 때, 학습자의 역할은 축소되고 사고의 깊이는 얕아진다.

소크라테스적 대화가 효과적이었던 이유는, 대화 상대가 답을 주지 않았기 때문이다. 질문을 던졌기 때문이다. 그리고 그 질문은 항상 방금 나온 주장에 대한 질문이었다. 이 구조는 논점의 이탈을 방지하고, 사고의 연속성을 강제한다. 문제는 현재의 LLM 사용 방식이 이 구조와 정반대라는 점이다. 사용자는 질문하고, LLM은 답하고, 사용자는 다시 다른 질문으로 넘어간다. 대화가 아니라 정보의 병렬 소비가 일어난다.

3. 그래서 우리는 LLM과 "논쟁"해야 한다

내가 제안하는 방식은 단순하다. 그러나 그 효과는 근본적이다.

LLM에게 하나의 입장을 맡기고, 당신은 반대 입장을 맡아라. 그리고 다음의 규칙을 따르라. 새로운 주제를 꺼내지 말 것. 방금 나온 주장에 직접 답할 것. 개념이 모호하면 정의를 요구할 것. 논증이 부족하면 근거를 요구할 것.

이 방식은 LLM을 더 똑똑하게 만드는 것이 아니라, 사용자를 더 사고하게 만든다. 왜냐하면 이 구조에서는 더 이상 도망칠 수 없기 때문이다. 논점을 바꾸는 것도, 새로운 이야기를 던지는 것도 허용되지 않는다. 남는 것은 단 하나이다. 지금 이 주장에 대해, 당신은 무엇을 말할 것인가? 이 질문은 불편하다. 그러나 바로 그 불편함이 사고를 만들어낸다.

이 접근의 이론적 근거는 이미 축적되고 있다. Ye 등(2024)은 21명의 현직 철학자를 인터뷰하여, LLM이 비판적 사고 도구로서 어떤 가능성과 한계를 가지는지를 조사했다. 철학자들의 평가는 명확했다. 현재의 LLM은 비판적 사고의 도구로서 불충분하다. 그 이유는 LLM이 "자기성(selfhood)"— 기억, 신념, 일관성 —과 "주도성(initiative)"— 호기심, 능동성 —을 결여하고 있기 때문이라는 것이었다. 그러나 이 연구는 동시에, LLM이 세 가지 역할을 수행할 잠재력이 있다고 제안했다. "대화 상대(Interlocutor)"로서 입장을 취하고 사용자에게 반박하는 역할, "감시자(Monitor)"로서 사용자의 논증을 점검하는 역할, 그리고 "응답자(Respondent)"로서 특정 철학적 입장을 대변하는 역할이다.

여기서 핵심은, LLM이 스스로 비판적으로 사고할 수 있느냐가 아니라, 사용자가 비판적으로 사고하도록 유도하는 구조를 만들 수 있느냐라는 점이다. "대화 상대" 역할의 LLM은 중립을 유지하는 대신 판단을 내리고 입장을 취한다. 사용자의 모든 응답에 동의하는 대신, 반박하거나 이의를 제기한다. 수동적으로 질문에 답하는 대신, 자신의 관심사를 추구하며 역으로 질문을 던진다. 이것은 현재 대부분의 LLM이 작동하는 방식과 정확히 반대이며, 바로 그 반대가 교육적으로 필요한 것이다.

4. LLM은 권위가 아니라, 다루어야 할 대상이다

많은 사용자는 여전히 LLM의 답을 "더 나은 답"으로 간주한다. 이 인식은 바뀌어야 한다. LLM의 출력은 유창하고 자신감 있게 보이지만, 그 이면의 작동 원리는 확률적 텍스트 생성이다. 의미를 이해하는 것이 아니라, 패턴을 재생산하는 것이다. Bender 등(2021)은 이를 "확률적 앵무새(stochastic parrot)"라 표현했다. 학습된 언어적 형식을 반복할 뿐, 그 의미나 목적을 파악하지는 못한다는 것이다. 유창한 문장이 정확한 사고를 보장하지 않는다는 사실은, LLM의 응답을 신뢰의 대상이 아니라 검토의 대상으로 다루어야 하는 근거가 된다.

따라서 사용자는 LLM과의 대화에서 단순한 질문자가 아니라, 대화를 조직하는 역할을 수행해야 한다. 짧게 답하라고 요구하고, 한 가지 논점만 다루라고 제한하며, 입장을 유지하라고 반복해서 상기시켜야 한다. LLM은 종종 장황해지고, 논점을 흐리며, 자기 입장조차 유지하지 못한다. 이러한 특성은 결함이기도 하지만, 교육적 맥락에서는 역설적인 기회이기도 하다. 사용자가 대화의 질을 능동적으로 관리해야 한다는 조건이, 비판적 사고의 훈련 그 자체가 되기 때문이다.

나는 이것을 현대적 의미의 소크라테스적 태도라고 부르고 싶다. 소크라테스는 답을 주지 않았다. 그는 대화를 통제했다. 상대의 모호한 정의를 지적하고, 논증의 빈 곳을 파고들었으며, 끝까지 하나의 문제를 놓지 않았다. LLM과의 논쟁에서 사용자가 수행해야 하는 역할이 바로 이것이다.

5. 사고는 한 번으로 끝나지 않는다

LLM과의 논쟁이 가치 있는 것은 그것이 대화에서 끝나지 않기 때문이다. 오히려 대화는 시작에 가깝다.

대화를 다시 읽고, 핵심 논점을 추리고, 불필요한 부분을 제거하고, 자신의 입장을 재구성해야 한다. 이때 우리는 두 번째 사고를 수행하게 된다. 첫 번째 사고는 즉흥적이다. 논쟁의 압력 속에서 떠오르는 직관과 반응이다. 두 번째 사고는 반성적이다. 자신이 무엇을 말했는지, 그 말이 정당화 가능한지, 더 나은 표현이 있는지를 검토하는 과정이다. 이 둘이 결합될 때, 비로소 하나의 견고한 논증이 형성된다.

이 이중 구조는 교육학에서 오랫동안 강조해온 것이기도 하다. 구성주의적 학습 이론에 따르면, 학습은 정보의 수동적 수용이 아니라 의미의 능동적 구성이다. 그리고 이 구성은 경험, 상호작용, 반성을 통해 이루어진다. LLM과의 논쟁은 "상호작용"의 계기를 제공하고, 대화 이후의 정리 작업은 "반성"의 계기를 제공한다. 답을 받아 정리하는 방식에서는 이 두 계기가 모두 약화된다.

또한 이 과정에서 사용자는 메타인지(metacognition)를 훈련하게 된다. 자기 자신의 사고 과정을 사고하는 능력, 즉 "내가 왜 이렇게 주장했는가", "이 전제는 어디에서 왔는가", "나의 논증에 빈틈은 없는가"를 묻는 능력이다. 소크라테스적 질문법이 메타인지 능력을 향상시킨다는 점은 다수의 연구에서 확인된 바 있다.

6. 우리가 길러야 할 것은 "지식"이 아니라 "지속력"이다

교육은 종종 무엇을 얼마나 알고 있는지를 측정하려 한다. 그러나 철학적 사고에서 더 중요한 것은 전혀 다른 능력이다. 하나의 논증을 끝까지 붙잡고 갈 수 있는가.

이 능력을 나는 "사고의 지속력"이라 부르겠다. 이것은 단순한 집중력이나 인내심과는 다르다. 하나의 논점이 제기되었을 때, 그것을 회피하지 않고, 다른 주제로 전환하지 않으며, 자신의 입장이 도전받는 불편함을 견디면서 논증을 이어가는 능력이다. 이 능력은 단순한 지식으로 대체될 수 없다. 아무리 많은 철학적 개념을 알고 있어도, 하나의 논증을 끝까지 따라가는 훈련이 없다면 그 지식은 피상적 나열에 머문다.

그리고 바로 이 능력이 LLM과의 구조화된 논쟁을 통해 훈련될 수 있다. 새로운 주제로의 전환이 금지되고, 방금 나온 주장에 직접 응답해야 하며, 모호한 개념은 즉시 정의를 요구받는 환경에서, 사용자는 사고를 지속하지 않을 수 없게 된다.

Georgia Tech의 "Socratic Mind" 프로젝트는 이 원리를 실제로 구현한 사례이다. 이 프로젝트는 AI 기반의 소크라테스적 질문 시스템을 통해 학생들의 비판적 사고와 의사소통 능력을 평가한다. 단순히 정답을 요구하는 것이 아니라, 학생들에게 자신의 답변을 설명하고, 정당화하며, 방어하도록 요구하는 구조이다. 이 시스템의 설계 원리는 본 에세이에서 주장하는 바와 정확히 일치한다. 답을 주는 것이 아니라, 답에 대한 설명을 요구하는 것. 결론이 아니라, 결론에 이르는 과정을 가시화하는 것.

결론: 우리는 AI를 사용하는 것이 아니라, AI를 통해 사고를 훈련해야 한다

LLM은 이미 충분히 강력하다. 문제는 그것이 아니라, 우리가 그것을 어떻게 사용하는가이다.

답을 받기 위해 사용할 것인가, 아니면 생각을 계속하기 위해 사용할 것인가. 이 선택은 기술의 문제가 아니다. 태도의 문제이다.

현재의 지배적인 사용 패턴은 전자이다. 질문을 던지고, 답을 받고, 그것을 소비한다. 이 패턴은 효율적이지만, 사고를 대체한다.

MIT의 연구가 보여주었듯이, 이 대체는 신경 수준에서 측정 가능한 비용을 수반한다. 인지 부채는 은유가 아니라 관찰 가능한 현상이다.

그러나 LLM은 다르게 사용될 수 있다. 대화 상대로, 논쟁의 파트너로, 사고를 지속시키는 장치로. 이를 위해서는 사용자가 질문자의 위치에서 벗어나 대화의 조직자, 논증의 관리자가 되어야 한다. LLM의 출력을 신뢰하는 것이 아니라 검토하고, 받아들이는 것이 아니라 반박하며, 소비하는 것이 아니라 다루어야 한다.

나는 우리가 이 방향을 선택해야 한다고 믿는다. 왜냐하면 정답은 언젠가 끝나지만, 사유는 끝나지 않기 때문이다.

참고자료

Kosmyna, N., Hauptmann, E., Yuan, Y. T., Situ, J., Liao, X.-H., Beresnitzky, A. V., Braunstein, I., & Maes, P. (2025). "Your Brain on ChatGPT: Accumulation of Cognitive Debt when Using an AI Assistant for Essay Writing Task." arXiv preprint, arXiv:2506.08872.
Kahneman, D. (2011). Thinking, Fast and Slow. Farrar, Straus and Giroux.
Ye, A., Moore, J., Novick, R., & Zhang, A. X. (2024). "Language Models as Critical Thinking Tools: A Case Study of Philosophers." arXiv preprint, arXiv:2404.04516.
Bender, E. M., Gebru, T., McMillan-Major, A., & Shmitchell, S. (2021). "On the Dangers of Stochastic Parrots: Can Language Models Be Too Big?" Proceedings of FAccT 2021, 610–623.
Lee, M. et al. (2025). Research on AI tool usage and critical thinking among knowledge workers. Microsoft & Carnegie Mellon University.
Hung, R. et al. (2025). "The Socratic Mind: An AI-powered Oral Assessment Platform." Georgia Institute of Technology.
Karousos, N., Koutouzis, E., & Verykios, V. S. (2025). "Reviving the Socratic Method with AI: An Interdisciplinary Approach to Enhancing Critical Thinking in Distance Higher Education." ResearchGate.
Frontiers in Education (2025). "Socratic Wisdom in the Age of AI: A Comparative Study of ChatGPT and Human Tutors in Enhancing Critical Thinking Skills." Frontiers in Education, 10, 1528603.
Schilling, A. et al. (2024). "Enhancing Critical Thinking in Education by means of a Socratic Chatbot." arXiv preprint, arXiv:2409.05511.
Akgun, E. & Toker, S. (2024). Research on LLM exposure and memory performance decline. (Cited in: "From Superficial Outputs to Superficial Learning," arXiv, 2509.21972.)

사고의-소멸과-인지의-완성
우리에게-사고를-들을-청중이-남아-있는가