AI 시대의 교육은 무엇을 가르쳐야 하는가

판단의 책임을 유지하는 능력이 교육 목적을 다시 정한다

AI 시대의 교육은 AI가 개입한 판단을 끝까지 책임질 수 있는 인간을 기르는 방향으로 재설계되어야 한다. 생성형 AI의 확산은 지식 접근의 비용을 낮추고, 설명·요약·초안 작성·피드백 생성의 속도를 크게 높였다. 이 변화는 학교가 오랫동안 중시해 온 기억, 반복 연습, 정답 재현의 위치를 흔든다. 교육은 정보 전달의 효율만으로 자기 목적을 설명하기 어려운 단계에 들어섰다.

이 변화는 판단 교육의 재설계를 요구한다. 교육의 핵심 과제는 AI가 매개한 정보와 판단을 다루는 인간의 능력을 더 정밀하게 설계하는 일이다. 질문을 세우는 능력, 산출물을 검토하는 판별력, 검토를 가능하게 하는 기초 지식, 결과의 귀속을 따지는 윤리적 책임, 타인과 함께 판단을 조정하는 인간적 역량이 함께 요구된다. 이 다섯 능력은 AI 시대의 교육 목적을 구성하는 하나의 체계다.

질문 역량은 답변 이전의 교육 능력이다

AI를 잘 활용하는 학생은 먼저 문제를 잘 설정하는 학생이다. 어떤 현상을 설명할지, 어떤 자료를 비교할지, 어떤 답변이 충분한지 결정하는 일은 학습의 출발점이다. AI는 입력된 과업을 바탕으로 응답을 생성하지만, 교육적으로 중요한 질문의 범위와 기준은 학습자가 마련해야 한다. 질문의 질이 낮으면 AI 산출물의 질도 낮아지고, 질문의 기준이 불분명하면 결과 검토도 흐려진다.

이 문제는 인지적 오프로딩(cognitive offloading) 연구와 연결된다. Risko와 Gilbert(2016)는 인간이 기억·계산·탐색 같은 인지 과제를 외부 도구에 맡기는 과정을 인지적 오프로딩으로 설명했다. 도구 사용은 즉각적인 수행을 높일 수 있지만, 학습자가 어떤 인지 과정을 내부에 남기는지는 별도의 문제다. Fisher, Goddu, Keil(2015)은 인터넷 검색이 정보 접근과 자기 지식을 혼동하게 만들 수 있음을 실험적으로 보였다. Dahmani와 Bohbot(2020)은 GPS 사용 경험이 많을수록 비보조 항해 상황의 공간 기억 수행이 낮게 나타나는 상관을 보고했다. 두 연구는 생성형 AI 이전의 도구 환경을 다뤘고, 외부 도구가 접근성과 내부 역량의 경계를 흐릴 수 있음을 보여준다.

AI 교육의 위험도 이 경계에서 발생한다. 학생이 답변만 맡기는 수준을 지나 질문 구성까지 습관적으로 위임하면, 무엇이 핵심 문제인지 식별하는 능력이 약해질 수 있다. Jose 등(2025)은 이 위험을 이론적·교육학적 관점에서 정리하며 AI 활용이 인지적 증폭과 의존의 두 방향으로 전개될 수 있다고 논의했다. 이 논문은 실증 보고가 아닌 의견 논문이므로, 그 가치는 현상을 확정하는 데 있지 않고 교육 설계가 다뤄야 할 위험 구조를 제시하는 데 있다. 교육은 답을 얻는 속도보다 질문을 세우는 기준을 먼저 훈련해야 한다.

판별력은 AI 산출물을 검토하는 시민적 역량이다

AI 시대의 문해력은 읽고 쓰는 능력에 검토 능력을 더한 형태로 재구성된다. 여기서 알고리즘 리터러시는 모델의 내부 수학을 완전히 해부하는 기술을 뜻하지 않는다. 산출물이 어떤 전제 위에서 만들어졌는지, 어떤 자료가 누락되었는지, 어떤 편향이 개입할 수 있는지, 그 결과를 누가 책임져야 하는지를 점검하는 시민적 능력을 뜻한다. UNESCO의 2024년 학생 역량 프레임워크가 인간 중심성, AI 윤리, AI 기술 이해, AI 시스템 설계를 함께 제시한 이유도 여기에 있다.

AI 산출물은 유창함과 신뢰성을 같은 값으로 보이게 만들 수 있다. 문장이 자연스럽고 논리 전개가 매끄러워도 출처가 부정확하거나 근거가 약할 수 있다. 이런 환경에서 학생에게 필요한 능력은 주장의 근거와 표현의 확신도를 분리하는 기술이다. Zhai 등(2024)의 체계적 문헌 검토는 AI 대화 시스템에 대한 과의존이 의사결정, 비판적 사고, 분석적 사고와 관련한 우려를 낳고 있음을 정리했다. 이 연구는 연령대별 위험을 확정하지 않고, 관련 근거가 아직 충분하지 않다는 점도 함께 지적한다. 교육은 바로 이 불확실성을 읽는 능력을 길러야 한다.

판별력 교육은 사실 확인의 습관, 비교 읽기, 출처 대조, 반례 탐색, 불확실성 표시를 포함해야 한다. 학생은 AI가 제시한 답변을 최종 지식으로 받아들이기 전에, 그 답변이 어떤 근거로 성립하는지 설명할 수 있어야 한다. 이 능력은 허위 정보 대응을 위한 방어 장치이면서, 스스로 사고하는 학습자의 최소 조건이다.

기초 지식은 AI를 검토하는 내부 기준이다

기초 지식은 AI 산출물을 해석하고 수정하기 위한 내부 기준이다. 언어 감각이 약한 학생은 문장의 빈틈을 발견하기 어렵고, 수리 감각이 약한 학생은 계산 결과의 규모 감각을 점검하기 어렵다. 역사적 맥락을 모르면 시대착오적 설명을 걸러내기 어렵고, 과학 개념이 약하면 그럴듯한 오류를 발견하기 어렵다. AI가 답변을 제공할수록, 학습자의 내부 기준은 더 중요해진다.

Grinschgl, Papenmeier, Meyerhoff(2021)는 인지적 오프로딩이 당장의 과제 수행을 높이는 동시에 이후 기억 형성을 약화시킬 수 있음을 보였다. 이 결과는 도구 사용 자체를 경계해야 한다는 결론으로 곧장 이어지지 않는다. 더 중요한 점은 외부 도움으로 해결된 과제가 학습자의 내부 표상으로 자동 전환되지 않는다는 사실이다. 교육은 이 간극을 의식적으로 다뤄야 한다. AI가 작성한 설명을 학생이 다시 요약하게 하고, 풀이의 오류 가능성을 비교하게 하고, 자신의 언어로 판단 근거를 복원하게 하는 과정이 필요하다.

기초 지식의 재정립은 암기 회귀를 뜻하지 않는다. 교육은 무엇을 기억해야 하는지, 무엇을 외부 도구와 협업할지, 무엇을 반드시 스스로 판단해야 하는지를 구분해야 한다. 이 구분이 분명할 때 AI 활용은 이해를 검증하는 과정이 된다.

책임과 윤리는 결과의 귀속을 묻는다

AI 교육은 결과의 귀속을 묻는 훈련이어야 한다. AI가 작성한 글, 추천한 판단, 분류한 학생, 제안한 평가 방식은 현실에 영향을 미친다. 그 영향이 타인의 기회와 권리를 바꿀 때, 책임은 시스템 뒤로 사라지지 않는다. UNESCO의 2021년 「인공지능 윤리에 관한 권고」는 인간의 권리와 존엄, 공정성, 투명성, 인간의 감독을 핵심 원칙으로 제시한다. 2023년 생성형 AI 교육 지침과 2024년 교사 역량 프레임워크도 인간 중심의 활용과 윤리적 판단을 반복해 강조한다.

이 글에서 윤리적 책임은 AI를 사용할 때 결과의 사회적 효과와 책임의 위치를 추적하는 능력을 뜻한다. 학생은 AI가 낸 답을 제출하는 행위, AI 추천을 근거로 타인을 평가하는 행위, 편향된 결과를 검토 없이 확산하는 행위가 모두 판단의 문제라는 점을 배워야 한다. 교육은 편리한 활용법만 가르칠 수 없다. 어떤 상황에서 AI를 사용해도 되는지, 어떤 상황에서는 사용 근거를 공개해야 하는지, 어떤 판단은 인간이 직접 설명해야 하는지를 함께 가르쳐야 한다.

이 윤리 교육은 판단 훈련이다. 학생은 실제 사례를 분석하고, 데이터 편향·저작권·개인정보·평가 공정성 같은 쟁점을 비교하며, 도구 선택이 사회적 결과를 바꾼다는 사실을 배워야 한다. AI 시대의 책임 교육은 교육과정의 중심 축이다.

인간적 역량은 판단을 공동의 세계로 옮긴다

AI 시대의 교육은 혼자 정답을 생산하는 능력과 함께, 타인과 판단을 조정하는 능력을 길러야 한다. 실제 사회의 중요한 판단은 대개 협력, 설명, 설득, 수정, 책임 분담을 포함한다. 의견이 충돌할 때 근거를 다시 검토하고, 상대의 경험을 듣고, 공동 결정을 위해 자신의 표현을 조정하는 능력은 자동 생성 결과만으로 대체되지 않는다. 교육이 이 과정을 다루지 않으면, 학생은 산출물의 품질은 높여도 판단의 사회적 질은 충분히 배우지 못한다.

UNESCO의 학생 역량 프레임워크가 책임 있는 시민성과 인간 중심성을 함께 강조하는 이유도 여기에 있다. AI와 함께 일하는 사회에서 학습자는 관계 속에서 판단하고 책임을 조정하는 행위자다. 발표, 토론, 동료 피드백, 공동 프로젝트, 이해관계자 관점 비교는 모두 인간적 역량을 훈련하는 장치가 된다. 이 역량은 AI가 개입한 판단을 사회적으로 정당화하는 능력의 일부다.

강한 반론은 AI와 결합된 수행을 교육 역량으로 본다

AI 교육을 둘러싼 강한 반론은 ‘비보조 수행’, 곧 AI나 외부 보조 없이 학습자가 스스로 문제를 해결하는 수행을 중심 기준으로 삼는 교육관 자체를 흔든다. Clark와 Chalmers(1998)의 확장된 마음(extended mind) 논변은 인간의 인지가 신체 내부에만 갇혀 있지 않고, 안정적으로 결합된 외부 도구와 함께 작동할 수 있다고 주장한다. 이 관점에서 보면 AI를 활용한 사고는 새로운 인지 조합의 형태일 수 있다. 교육은 도구와 결합해 얼마나 정교하게 사고하는지도 평가해야 한다는 주장이 가능하다.

최근 연구는 이 반론을 단순한 낙관론으로 치부하기 어렵게 만든다. Létourneau 등(2025)의 체계적 문헌 검토는 K-12 지능형 튜터링 시스템이 특정 조건에서 학습과 수행을 개선할 수 있음을 보였다. Yan, Nakajima, Sawada(2025)는 16주 질적 연구에서 대학생들이 생성형 AI 활용을 반복적으로 성찰하면서 프롬프트 설계와 메타인지 능력을 함께 발전시키는 양상을 보고했다. Haidar, Suryoputro, Safi’i(2025)는 고등학생 글쓰기 맥락에서 메타인지 프롬프트를 포함한 GenAI 활용이 글쓰기 능력과 메타인지 자각에 긍정적으로 작용할 수 있음을 제시했다. 이 연구들은 AI와 결합된 학습이 실제로 교육적 성과를 낼 수 있음을 보여준다.

이 반론은 교육의 기준을 더 정밀하게 만든다. AI와의 결합을 교육 역량으로 인정하려면, 학습자는 문제를 정의하고, 도구를 선택하고, 결과를 검토하고, 수정 이유를 설명할 수 있어야 한다. 교육은 도구 통합 능력과 판단 위임 습관을 구별하는 설계를 가져야 한다. AI와의 협업은 책임 있는 결합일 때 교육적 역량이 된다.

평가는 판단 과정을 드러내야 한다

AI 시대의 평가는 판단의 형성 과정을 측정해야 한다. 학생이 어떤 질문을 세웠는지, 어떤 AI 도구를 선택했는지, 어떤 산출물을 받아들였는지, 무엇을 수정했는지, 그 수정의 근거를 어떻게 설명하는지가 평가 대상이 되어야 한다. UNESCO의 교사 역량 프레임워크가 AI 시대의 교수법과 평가 역량을 함께 다루는 이유도 이 과정을 교육 제도의 중심 문제로 보기 때문이다.

과정 평가는 설명 가능성을 강화한다. 학생은 AI 사용 여부를 숨기지 않고, 사용이 학습에 어떤 기여를 했는지 명시할 수 있어야 한다. 교사는 산출물의 화려함보다 검토의 밀도, 반례 탐색의 성실성, 수정 과정의 합리성, 책임 있는 공개를 평가해야 한다. 프로젝트 기반 평가, 비교 분석형 과제, 구술 방어, 작성 이력 제출, 동료 검토는 이런 목표와 잘 맞는다.

이 변화는 기존 평가의 무효화를 뜻하지 않는다. 기본 개념을 확인하는 시험, 혼자 수행해야 하는 과제, 협업과 도구 활용을 포함한 과제가 서로 다른 기능을 맡아야 한다. AI 시대의 평가는 하나의 방식으로 통일될수록 취약해지고, 판단의 여러 층위를 분리할수록 강해진다.

결론: 교육은 책임 있는 판단을 기르는 제도다

AI 시대의 교육 목적은 판단의 책임을 스스로 유지하는 인간을 기르는 데 있다. 질문 역량은 학습의 방향을 정하고, 판별력은 산출물을 검토하며, 기초 지식은 검토의 기준을 제공하고, 윤리적 책임은 결과의 귀속을 붙들며, 인간적 역량은 판단을 공동의 세계 안에서 조정한다. 이 다섯 능력은 AI 활용을 교육적으로 의미 있게 만드는 조건이다.

학교는 도구 사용법과 판단 책임을 함께 가르쳐야 한다. 어떤 판단을 맡기고 어떤 판단을 직접 수행할지 분별하는 법, 도구가 낸 결과를 어떻게 검토하고 설명할지 훈련하는 법, 그 선택이 타인에게 어떤 영향을 미치는지 책임지는 법을 함께 가르쳐야 한다. 교육은 AI와 함께 살아가는 사회의 판단력을 길러내는 제도다.

참고자료

Clark, A., & Chalmers, D. (1998). The extended mind. Analysis, 58(1), 7–19.

Dahmani, L., & Bohbot, V. D. (2020). Habitual use of GPS negatively impacts spatial memory during self-guided navigation. Scientific Reports, 10, 6310.

Fisher, M., Goddu, M. K., & Keil, F. C. (2015). Searching for explanations: How the internet inflates estimates of internal knowledge. Journal of Experimental Psychology: General, 144(3), 674–687.

Grinschgl, S., Papenmeier, F., & Meyerhoff, H. S. (2021). Consequences of cognitive offloading: Boosting performance but diminishing memory. Quarterly Journal of Experimental Psychology, 74(9), 1477–1496.

Haidar, H., Suryoputro, G., & Safi’i, I. (2025). Impact of the integration of metacognitive prompts by generative artificial intelligence (GenAI) in collaborative and individual learning in improving writing skills and metacognitive awareness. International Journal of Learning, Teaching and Educational Research, 24(6), 232–250.

Jose, B., Cherian, J., Verghis, A. M., Varghise, S. M., S., M., & Joseph, S. (2025). The cognitive paradox of AI in education: Between enhancement and erosion. Frontiers in Psychology, 16, 1550621.

Létourneau, A., Deslandes Martineau, M., Charland, P., Karran, J. A., Boasen, J., & Léger, P. M. (2025). A systematic review of AI-driven intelligent tutoring systems (ITS) in K-12 education. npj Science of Learning, 10, 29.

Risko, E. F., & Gilbert, S. J. (2016). Cognitive offloading. Trends in Cognitive Sciences, 20(9), 676–688.

UNESCO. (2021). Recommendation on the Ethics of Artificial Intelligence.

UNESCO. (2023). Guidance for Generative AI in Education and Research.

UNESCO. (2024). AI Competency Framework for Students.

UNESCO. (2024). AI Competency Framework for Teachers.

Yan, W., Nakajima, T., & Sawada, R. (2025). Beyond tool use: Tracking the evolution of generative AI literacy among university students through a process-oriented investigation. Computers and Education: Artificial Intelligence, 9, 100465.

Zhai, C., Wibowo, S., & Li, L. D. (2024). The effects of over-reliance on AI dialogue systems on students’ cognitive abilities: A systematic review. Smart Learning Environments, 11, 28.

인포그래픽

작성일: 2026년 5월 13일