한 번의 경험이 세계 모델이 될 때

아이는 단어 하나에서 범주의 문을 연다

인간의 극단적 데이터 효율성은 한 번의 경험을 이미 가진 세계 모델, 선택된 증거, 검증 절차에 연결해 범주와 원인과 행동 가능성으로 확장하는 능력이다. 아이가 낯선 물건을 보고 “이건 블릭이다”라는 말을 한 번 듣는 장면은 이 능력을 작게 압축해 보여준다. 아이는 소리의 연쇄를 의미 후보로 바꾼다. 눈앞의 모양, 말하는 사람의 시선, 주변에 놓인 다른 물건들, 이름 붙이기의 사회적 관습을 함께 묶어 “블릭”이라는 말이 무엇을 가리킬 수 있는지 좁혀 간다. 그다음 비슷한 물건이 나타나면 아이는 그것을 다시 “블릭”의 후보로 올려놓는다. 한 번의 말은 다음 대상을 분류하는 작은 규칙으로 남는다.

fast mapping 연구 전통은 이 장면을 언어 학습의 중요한 단서로 다루었다. Susan Carey와 Elsa Bartlett이 논의한 fast mapping은 아이들이 한두 번의 노출만으로 새 단어에 대한 부분적 의미를 빠르게 형성하는 현상으로 이해된다. Carey의 후속 논의는 이런 빠른 연결이 완성된 의미 획득과 구분되며, 초기의 부분적 의미가 이후 경험 속에서 정렬된다는 점을 함께 강조한다. “블릭” 장면의 핵심은 아이가 제한된 단서로 의미 후보를 만들고, 그 후보를 다음 경험에서 검증 가능한 형태로 보존한다는 데 있다.

이 단어 학습 장면은 인간 학습의 첫 번째 패턴을 드러낸다. 인간은 새 데이터를 독립된 조각으로 저장하기 전에 그것이 들어갈 자리를 먼저 찾는다. 이름은 사물과 연결되고, 사물은 종류와 연결되며, 종류는 행동 가능성과 연결된다. “블릭”이라는 소리는 시각적 유사성, 사회적 지시, 언어적 관습, 범주화 기대가 만나는 자리에서 의미를 얻는다. 인간이 적은 데이터로 배우는 것처럼 보이는 이유는 작은 데이터가 들어갈 사전 구조가 이미 넓게 열려 있기 때문이다.

뜨거운 냄비는 사건을 원인으로 바꾼다

위험 학습은 인간의 적은 경험이 행동 규칙으로 확장되는 과정을 보여준다. 아이가 뜨거운 냄비에 손을 댔다가 통증을 느끼면, 그 사건은 원인 탐색의 단서가 된다. 아이는 냄비의 표면, 열기, 보호자의 경고, 손을 댄 행동, 뒤따른 통증을 하나의 의존 관계로 묶는다. 이후 비슷한 금속 냄비나 김이 나는 컵을 볼 때, 아이는 직접 접촉 전에도 손을 멈춘다. 한 번의 통증은 미래 행동을 조절하는 원인 지식으로 바뀐다.

인간은 사건의 순서에서 사건의 의존성을 추론한다. “손을 댔다”와 “아팠다”가 이어졌다는 사실은 위험 학습의 출발점이며, 아이는 그 순서를 원인 관계로 확장한다. 학습자는 두 사건 사이의 원인 관계를 가정하고, 그 관계를 비슷한 상황으로 확장한다. 발달 인지과학에서 Laura Schulz와 Alison Gopnik의 연구는 유아와 아동이 생물학적·심리적 영역에서 사건의 의존성과 독립성을 이용해 원인을 추론할 수 있음을 보여 주었다. 이런 연구는 아이가 관찰을 원인 구조로 재구성하는 학습자임을 뒷받침한다.

위험 학습 장면은 인간 학습의 두 번째 패턴을 드러낸다. 인간은 자주 본 것을 배우는 만큼, 왜 그런 일이 일어났는지를 배운다. 원인 추론은 표본 수를 줄이는 장치다. 원인이 잡히면 모든 경우를 다시 경험할 필요가 줄어든다. 뜨거운 냄비, 뜨거운 주전자, 뜨거운 다리미는 감각적으로 서로 다르지만, “열이 있는 표면에 손을 대면 통증이 생긴다”는 구조 안에서 같은 위험으로 묶인다. 인간의 데이터 효율성은 경험을 압축하는 원인 모델을 만들 때 강해진다.

새 글자는 그리는 절차가 된다

낯선 글자 하나를 보는 장면은 인간이 개념을 생성 가능한 형식으로 배운다는 점을 보여준다. 사람이 처음 보는 문자를 한 번 보고 나면, 그 문자와 비슷한 변형을 알아보고, 손으로 따라 그리며, 다른 사람이 쓴 사례도 같은 글자로 묶을 수 있다. 눈에 들어온 것은 하나의 이미지지만, 마음속에 남는 것은 선이 어떻게 시작되고 꺾이고 이어지는지에 대한 절차적 가설이다. 인간은 글자를 다시 만들어 낼 수 있는 방식으로 이해한다.

Lake, Salakhutdinov, Tenenbaum의 2015년 Science 논문은 이 능력을 설명하기 위해 probabilistic program induction이라는 모델을 제안했다. 이 연구는 사람들이 세계 여러 문자 체계의 손글씨 문자 같은 새 시각 개념을 단일 사례에서 학습하고, 분류·생성·변형·설명에 활용하는 능력을 보인다는 점에 주목했다. 논문이 제시한 모델은 개념을 그것을 생성하는 확률적 프로그램으로 표현한다. 이 접근은 인간의 원샷 개념 학습을 구성성, 인과성, learning to learn의 결합으로 설명하려는 시도다.

새 글자 학습 장면은 인간 학습의 세 번째 패턴을 드러낸다. 인간은 새 개념을 완전히 새 덩어리로 저장하기 전에 이미 아는 부분들로 쪼개고 다시 결합한다. 획, 방향, 대칭, 반복, 시작점, 끝점 같은 요소가 하나의 글자 안에서 조직된다. 그래서 한 사례는 여러 잠재 사례의 생성 규칙이 된다. 이 구성적 사고는 “날개 달린 말” 같은 표현에서도 작동한다. 처음 상상하는 대상도 떠올릴 수 있는 까닭은 말과 날개를 이미 분리 가능한 구성 요소로 알고 있기 때문이다.

여러 사례는 사전 구조와 새 관찰의 결합을 가리킨다

단어, 위험, 글자 학습은 서로 다른 영역에 속하지만 같은 방향의 결론을 만든다. 인간은 적은 관찰에서 많은 의미를 끌어내며, 그 의미는 범주·원인·구성 절차라는 형태를 가진다. “블릭” 장면에서는 범주가 생기고, 냄비 장면에서는 원인이 생기며, 새 글자 장면에서는 생성 절차가 생긴다. 이 세 장면은 인간이 데이터를 세계가 작동하는 방식에 대한 가설로 바꾸어 학습한다는 사실을 보여준다.

core knowledge 연구는 이 구조가 초기 표상 체계 위에 세워진다는 점을 설명한다. Spelke와 Kinzler는 인간 인지가 물체, 행위자, 수, 공간 같은 영역에 관한 초기 표상 체계에 부분적으로 의존한다고 보았다. 이 관점에서 영아와 아동의 학습은 이미 작동 중인 기본 기대 위에 새 관찰을 배치하는 과정이다. 물체는 계속 존재하고, 행위자는 목표를 향해 움직일 수 있으며, 수량은 대략 비교될 수 있다는 기대는 새 경험을 빨리 해석하게 만든다.

여러 사례의 공통 구조는 사전 지식과 새 관찰의 결합이다. 아이가 “강아지”를 한 번 보고 배운다고 말할 때, 그 한 번 앞에는 살아 있는 것과 움직이는 것을 구분하는 감각, 얼굴과 눈과 다리를 파악하는 지각, 사람이 대상에 이름을 붙인다는 언어 경험, 비슷한 대상을 묶는 범주화 습관이 놓여 있다. 한 번의 경험은 이 누적된 구조와 만날 때 큰 의미를 얻는다.

선택된 표본은 한 번의 경험을 과잉 정보화한다

인간의 데이터 효율성을 가장 강하게 흔드는 반론은 한 번의 경험 자체가 이미 특별히 선택된 증거라는 주장이다. 아이가 “블릭”이라는 말을 듣는 순간에는 이미 선택의 흔적이 들어 있을 수 있다. 누군가가 특정 대상을 가리키며 이름을 말했고, 주변의 다른 대상들은 비교 가능한 후보로 배치되었으며, 학습자는 말하는 사람이 자신에게 도움이 되는 증거를 제공한다고 기대한다. 이 조건에서는 한 번의 노출이 단순한 표본 하나에 비해 훨씬 많은 정보를 담는다.

Xu와 Tenenbaum의 Bayesian word learning 논의는 단어 학습자가 한두 개의 긍정 사례에서도 사전 확률과 표본 가정에 기대어 의미 범위를 추론할 수 있음을 설명한다. 학습자는 표본이 어떻게 생성되었는지에 대한 가정을 사용해 “이 단어는 이 개별 물건만을 가리키는가, 이 종류 전체를 가리키는가, 더 넓은 범주를 가리키는가”를 추론한다. 표본의 수가 적어도 표본 생성 과정에 대한 가정이 강하면 일반화는 빠르게 일어난다.

Shafto, Goodman, Frank의 2012년 논의는 사회적 학습에서 학습자가 타인의 행동과 목표를 해석해 증거의 의미를 추론한다는 점을 보여준다. 학습자는 눈앞의 사례와 그 사례를 제시한 사람의 의도와 목표를 함께 읽는다. Shafto, Goodman, Griffiths의 2014년 pedagogical sampling 논의는 교사가 선택한 예시에서 정보량이 커지는 과정을 설명한다. 교사가 선택한 예시는 학습자의 추론을 겨냥해 배열된 증거가 된다. 인간의 빠른 학습은 학습자 내부의 세계 모델, 표본 생성 과정, 타인의 교수 의도, 이후 검증 절차가 결합된 성과다.

빠른 일반화는 지능과 편향을 함께 만든다

인간의 데이터 효율성은 학습의 강점이면서 오판의 통로다. 적은 경험에서 규칙을 뽑는 능력은 위험을 피하고 새 말을 배우고 낯선 도구를 쓰게 만든다. 같은 능력은 한 번의 불쾌한 만남을 집단 전체에 대한 편견으로 확장하고, 한 번의 실패를 어떤 장소나 기술 전체에 대한 공포로 굳히며, 제한된 사례를 세계 전체의 법칙처럼 다루게 만든다. 빠른 일반화는 지능의 속도를 만들고, 그 속도는 검증되지 않은 기대를 강화할 수 있다.

이 한계는 fast mapping 논쟁에서도 확인된다. 빠른 의미 형성은 단어 학습의 시작을 설명하며, 안정된 의미 습득은 이후 검증과 정렬 과정을 요구한다. Trueswell, Medina, Hafri, Gleitman의 “propose but verify” 논의는 학습자가 하나의 가설을 제안하고 이후 경험에서 검증하는 방식으로 새 단어 의미를 좁힐 수 있음을 보여 준다. 이 모델은 빠른 학습의 힘과 위험을 함께 드러낸다. 빠른 가설은 학습을 앞당기지만, 뒤따르는 검증 과정이 약하면 초기 가설이 오류로 굳어진다.

인간의 극단적 데이터 효율성은 빠른 해석을 가능하게 하는 능력이다. 좋은 사전 구조와 풍부한 수정 기제가 결합하면 빠른 학습은 지능이 된다. 빈약한 검증, 왜곡된 사회적 전달, 편향된 사전 기대가 결합하면 빠른 학습은 편견이 된다. 인간은 적은 데이터로 많이 배우는 만큼, 적은 데이터로 잘못 배울 가능성도 가진다.

AI에게 필요한 것은 소수 예시와 사전 구조를 함께 다루는 설계다

AI 연구에서 인간의 데이터 효율성이 중요한 까닭은 인간이 새 개념을 배운 뒤 그것을 여러 기능으로 즉시 확장하기 때문이다. Lake 등의 연구가 강조한 인간 원샷 학습의 특징은 분류, 생성, 변형, 설명으로 확장된다. 사람은 새 글자를 알아보고, 다시 그리고, 변형을 상상하고, 다른 사람이 쓴 사례를 같은 범주로 묶는다. 개념은 인식의 대상인 동시에 행동과 설명의 도구가 된다.

few-shot learning은 소수 예시만으로 새 작업을 수행하게 하는 기술적 목표를 가리킨다. 이때 소수 예시는 과제 수행 또는 추론 시점에서 주어지는 예시의 수를 뜻한다. 이 구분이 중요하다. 인간의 한 번 학습이 누적된 세계 이해 위에서 작동하듯, AI의 few-shot 성능도 많은 경우 대규모 사전학습이나 누적된 표현 구조 위에서 작동한다. Brown 외의 GPT-3 논문은 few-shot 수행을 별도의 미세조정 없이 텍스트 상호작용 안에서 몇 개의 예시를 제시하는 방식으로 평가했지만, 그 능력은 이미 거대한 텍스트 말뭉치에 대한 사전학습 위에 놓여 있다. 따라서 인간과 AI를 비교할 때 핵심은 그 예시를 해석하는 사전 구조가 어떻게 형성되고 검증되는가에 있다.

meta-learning은 개별 작업의 답을 외우는 방식에서 벗어나, 새로운 작업을 빠르게 배우는 절차 자체를 학습하게 한다. world model은 관찰된 패턴 뒤에서 환경의 상태와 가능한 변화와 행동의 결과를 예측하는 내부 표현을 말한다. Ha와 Schmidhuber의 world model 논의는 에이전트가 환경의 공간적·시간적 표현을 압축적으로 학습하고, 그 표현을 행동 선택에 활용하는 방향을 보여준다. causal learning은 상관관계의 반복과 구분되는 개입·결과 구조를 파악하게 하는 접근이다. embodied AI는 언어와 이미지를 신체적 행동, 지각, 환경 상호작용에 접지시키려는 방향이다.

이 글에서 말한 세계 모델은 인간이 경험을 범주, 원인, 절차, 사회적 단서, 행동 가능성으로 연결하는 넓은 해석 구조다. AI 연구의 world model은 이 넓은 문제의 기술적 하위 형태이며, 특히 환경의 상태 변화와 행동 결과를 예측 가능한 내부 표현으로 압축하는 데 초점을 둔다. 두 용례는 같은 질문을 서로 다른 규모에서 다룬다. 인간의 세계 모델은 의미와 행동 가능성을 함께 조직하고, AI의 world model은 환경 예측과 제어를 위한 표현을 구성한다.

이 흐름들은 서로 다른 층위에서 같은 결핍을 보완한다. few-shot learning과 meta-learning은 적은 예시에서 빨리 적응하는 문제를 다룬다. world model과 causal learning은 예시가 들어갈 작동 구조를 표현하려 한다. embodied AI는 개념이 행동과 환경 속에서 시험되는 접점을 마련한다. 인간 학습에 비추어 보면 AI의 과제는 새 관찰을 범주, 원인, 생성 절차, 사회적 맥락, 행동 가능성으로 연결하는 해석 구조를 만드는 데 있다.

한 번의 경험은 여러 번 쓰일 때 세계 모델을 갱신한다

인간의 극단적 데이터 효율성은 구조화된 해석의 성과다. 한 번의 단어 노출은 범주 형성으로 확장되고, 한 번의 통증 경험은 원인 지식으로 확장되며, 한 번 본 글자는 생성 절차로 확장된다. 여기에 선택된 표본, 교수자의 의도, Bayesian 추론, 이후 검증 과정이 결합하면 작은 경험은 큰 증거가 된다.

인간은 경험을 범주, 원인, 절차, 규칙, 사회적 단서, 행동 가능성으로 조직한다. 이 능력은 인간 학습을 빠르게 만들고, 같은 속도로 편향을 만들기도 한다. 좋은 학습은 빠른 가설을 좋은 구조와 좋은 검증 절차 속에 놓는 일이다.

AI가 인간 수준의 데이터 효율성에 접근하려면 예시를 줄이는 기술과 세계를 해석하는 구조를 함께 발전시켜야 한다. 한 번의 경험이 여러 번 쓰일 수 있을 때, 학습은 세계 모델의 갱신이 된다.

참고자료

Susan Carey, “Beyond Fast Mapping,” Language Learning and Development, 2010. Carey와 Bartlett의 fast mapping 연구를 단어의 빠른 초기 의미 형성과 이후의 extended mapping 문제로 연결하는 데 사용했다. 자료 링크
John C. Trueswell, Tamara Nicol Medina, Alon Hafri, Lila R. Gleitman, “Propose but verify: Fast mapping meets cross-situational word learning,” Cognitive Psychology, 2013. 빠른 단어 가설 형성과 이후 검증 과정을 설명하는 반론·보완 논의에 사용했다. 자료 링크
Elizabeth S. Spelke, Katherine D. Kinzler, “Core Knowledge,” Developmental Science, 2007. 물체, 행위자, 수, 공간 등에 관한 초기 표상 체계를 사전 구조 논점의 근거로 사용했다. 자료 링크
Laura E. Schulz, Alison Gopnik, “Causal Learning Across Domains,” Developmental Psychology, 2004. 아이들이 생물학적·심리적 영역에서 의존성과 독립성을 이용해 원인을 추론한다는 논점에 사용했다. 자료 링크
Brenden M. Lake, Ruslan Salakhutdinov, Joshua B. Tenenbaum, “Human-level concept learning through probabilistic program induction,” Science, 2015. 인간의 원샷 시각 개념 학습, 구성성, 인과성, learning to learn, probabilistic program induction 논점에 사용했다. 자료 링크
Fei Xu, Joshua B. Tenenbaum, “Word Learning as Bayesian Inference,” Psychological Review, 2007. 한두 개의 긍정 사례에서 단어 의미를 일반화할 때 사전 확률과 표본 가정이 작동한다는 논점에 사용했다. 자료 링크
Patrick Shafto, Noah D. Goodman, Michael C. Frank, “Learning From Others: The Consequences of Psychological Reasoning for Human Learning,” Perspectives on Psychological Science, 2012. 사회적 학습에서 학습자가 타인의 행동과 목표를 이용해 증거의 의미를 추론한다는 논점에 사용했다. 자료 링크
Patrick Shafto, Noah D. Goodman, Thomas L. Griffiths, “A Rational Account of Pedagogical Reasoning: Teaching by, and Learning from, Examples,” Cognitive Psychology, 2014. 교수가 선택한 예시가 무작위 표본과 다른 정보량을 갖는다는 pedagogical sampling 논점에 사용했다. 자료 링크
Tom B. Brown et al., “Language Models are Few-Shot Learners,” Advances in Neural Information Processing Systems, 2020. AI의 few-shot 성능이 과제 수행 시점의 소수 예시와 대규모 사전학습 구조를 함께 전제한다는 구분에 사용했다. 자료 링크
David Ha, Jürgen Schmidhuber, “World Models,” arXiv, 2018. AI 연구에서 world model이 환경의 압축된 공간적·시간적 표현과 행동 선택을 연결하는 기술적 개념임을 설명하는 데 사용했다. 자료 링크