OpenAI가 LLM 시대를 열었을까: 발명, 연구 패러다임, 제품 전환의 구분
핵심 요약
OpenAI가 LLM의 핵심 아키텍처를 발명한 것은 아니다. 오늘날 대규모 언어모델의 기술적 기반이 된 Transformer는 2017년 「Attention Is All You Need」에서 Google 중심 연구진이 제시했다. 또한 Google은 이후 BERT, T5, LaMDA, PaLM 등을 통해 Transformer 기반 사전학습, 전이학습, 대화 모델, 초대형 언어모델 연구에 결정적 기여를 했다.
그럼에도 “OpenAI가 LLM 시대를 열었다”는 말은 산업사와 대중적 수용사의 관점에서는 상당히 타당하다. 이때 “LLM 시대를 열었다”는 말은 핵심 알고리즘의 최초 발명이 아니라, 대규모 생성 언어모델이 범용 작업 인터페이스이자 산업 플랫폼으로 인식되기 시작한 전환을 뜻한다. OpenAI는 GPT-1, GPT-2, GPT-3, OpenAI API, InstructGPT, ChatGPT를 거치며 “하나의 거대한 언어모델을 프롬프트로 여러 작업에 사용하는 방식”을 연구 주제에서 제품 경험으로 바꾸었다.
따라서 더 정확한 결론은 다음과 같다. Transformer라는 핵심 엔진은 Google 중심 연구진이 제시했고, LLM을 범용 생성 인터페이스·개발 플랫폼·대중적 AI 제품으로 각인시킨 가장 강한 촉발점은 OpenAI였다. “OpenAI가 LLM 시대를 열었다”는 표현은 기술 발명사로는 부정확하지만, 산업적·사회적 전환사로는 설득력 있는 진술이다.
문제의식
“OpenAI가 LLM 시대를 열었는가”라는 질문은 단순한 기업 공로 비교가 아니다. 이 질문에는 세 가지 서로 다른 기준이 섞여 있다. 첫째, 핵심 아키텍처를 누가 만들었는가. 둘째, 그 아키텍처를 어떤 연구 방향으로 밀어붙였는가. 셋째, 그 결과를 누가 제품과 플랫폼으로 만들어 사회적 인식을 바꾸었는가.
이 세 기준을 구분하지 않으면 답이 흔들린다. 기술 발명만 기준으로 보면 OpenAI가 LLM 시대를 열었다고 말하기 어렵다. Transformer는 OpenAI가 아니라 Google 중심 연구진의 성과다. 연구 패러다임을 기준으로 보면 답은 더 복합적이다. OpenAI는 GPT 계열로 생성형 사전학습 모델의 가능성을 강하게 보여주었지만, Google의 BERT와 T5도 사전학습-전이학습 패러다임을 대중화한 핵심 축이었다. 제품과 산업 전환을 기준으로 보면 OpenAI의 역할은 훨씬 커진다. GPT-3 API와 ChatGPT는 LLM을 논문 속 모델이 아니라 일상적 인터페이스와 산업 플랫폼으로 경험하게 만들었다.
이 글에서 “LLM 시대를 열었다”는 말은 핵심 아키텍처의 최초 발명이 아니라, 대규모 언어모델이 범용 작업 인터페이스이자 산업 플랫폼으로 인식되기 시작한 역사적 전환을 뜻한다. 이 기준을 놓고 보면 OpenAI는 LLM 시대의 유일한 원인은 아니지만, 가장 강력한 촉발자 중 하나였다고 평가할 수 있다.
개념의 정의
LLM, 곧 Large Language Model은 대규모 텍스트 데이터와 대규모 계산 자원을 이용해 학습한 언어모델을 뜻한다. 좁게는 다음 토큰 예측 또는 마스크된 토큰 예측 같은 자기지도학습 목표를 통해 언어 패턴을 학습한 모델을 가리키고, 넓게는 질문답변, 요약, 번역, 코드 작성, 추론 보조, 대화 같은 다양한 작업에 프롬프트나 미세조정으로 적용되는 범용 언어 기반 AI 시스템을 가리킨다.
Transformer는 LLM의 대표적 신경망 아키텍처다. 2017년 「Attention Is All You Need」는 recurrence와 convolution에 의존하지 않고 attention mechanism만으로 sequence transduction을 수행할 수 있는 구조를 제안했다. 이 논문의 직접 실험 맥락은 기계번역이었지만, 논문 자체는 Transformer를 번역 전용 장치로만 제한하지 않았다. 저자들은 attention 기반 모델이 텍스트 외의 입력·출력 양식에도 확장될 가능성을 언급했다. 따라서 “Google은 번역만 보았고 OpenAI만 범용성을 보았다”라고 단순화하면 역사적 맥락이 왜곡된다.
GPT는 Generative Pre-trained Transformer의 약자다. GPT 계열은 주로 decoder-only Transformer 구조를 사용해 이전 문맥을 보고 다음 토큰을 예측하는 방식으로 학습된다. 이 구조는 텍스트를 생성하는 데 자연스럽고, 프롬프트에 작업 설명과 예시를 넣으면 모델이 그 패턴을 이어 쓰는 방식으로 여러 작업을 수행할 수 있다. GPT-3 논문이 보여준 중요한 변화는 모델을 매번 작업별로 미세조정하지 않고도, 텍스트 입력 안에 지시와 예시를 넣어 다양한 작업을 수행할 수 있다는 점이었다.
“LLM 시대”는 이 기술이 연구실 안의 언어모델을 넘어 사회적 인프라가 되는 시기를 뜻한다. 이 시기에는 모델 성능 자체뿐 아니라 API, 챗 인터페이스, 개발자 생태계, 기업 도입, 안전성 논쟁, 오픈소스·오픈웨이트 생태계, 규제 논의가 함께 움직인다. 그러므로 LLM 시대는 단일 논문 하나로 시작된 것이 아니라, 아키텍처·스케일·데이터·제품화·사용자 경험이 결합하면서 열린 복합적 전환이다.
배경과 맥락
2010년대 중반까지 자연어처리의 중요한 흐름은 작업별 모델 설계와 지도학습이었다. 번역, 품사 태깅, 감성분석, 질문답변, 요약은 각각 다른 데이터셋과 평가 기준을 가졌고, 모델도 작업별로 조정되는 경우가 많았다. RNN, LSTM, GRU, convolution 기반 sequence model, attention을 결합한 encoder-decoder 구조가 널리 사용되었다.
Transformer는 이 흐름에서 계산 구조를 크게 바꾸었다. sequence를 순차적으로 처리하는 recurrent 구조를 중심에 놓는 대신, self-attention으로 입력의 여러 위치 사이 관계를 병렬적으로 계산했다. 이 방식은 긴 문맥 안의 토큰 관계를 더 유연하게 포착하고, 병렬 학습에 유리하며, 모델과 데이터 규모를 키우는 데 적합했다. Transformer가 곧바로 “ChatGPT 같은 범용 AI”를 의미한 것은 아니지만, 이후 대규모 언어모델이 성장할 수 있는 계산적 기반을 제공했다.
이후 연구 흐름은 크게 두 축으로 갈라져 발전했다. 하나는 BERT 계열의 encoder 중심 언어표현 모델이다. BERT는 양방향 문맥을 이용해 masked language modeling 방식으로 깊은 문맥 표현을 학습했고, 질문답변·자연어 추론·문장 분류 같은 여러 이해 과제에서 강한 성능을 보였다. 다른 하나는 GPT 계열의 autoregressive 생성 모델이다. GPT는 이전 토큰들을 바탕으로 다음 토큰을 예측하며, 이 목표가 자연스럽게 텍스트 생성과 프롬프트 기반 작업 수행으로 이어졌다.
Google과 OpenAI의 차이는 여기서 생긴다. Google은 Transformer를 발명한 조직이었고, BERT와 T5를 통해 사전학습·전이학습 패러다임을 NLP 표준으로 만드는 데 결정적 역할을 했다. OpenAI는 GPT 계열을 통해 생성형 사전학습 모델을 점점 크게 만들고, 그것을 작업별 모델이 아니라 범용 텍스트 인터페이스로 사용하는 방향을 강하게 밀었다. 이 차이는 “누가 더 먼저 생각했는가”보다 “누가 어떤 형태의 사용 경험을 사회적으로 각인시켰는가”의 문제에 가깝다.
핵심 논리
OpenAI가 LLM 시대를 열었는지를 판단하려면 “발명”과 “시대 개척”을 분리해야 한다. 발명은 특정 기술 원리나 구조를 처음 제안한 사건에 가깝다. 시대 개척은 그 기술이 사회적·산업적 표준으로 인식되도록 만든 전환에 가깝다. 증기기관을 누가 먼저 고안했는가와 산업혁명을 누가 촉발했는가가 같은 질문이 아니듯, Transformer를 누가 제안했는가와 LLM 시대를 누가 대중적으로 열었는가는 같은 질문이 아니다.
기술 발명사에서 Transformer의 공로는 Google 중심 연구진에게 돌아간다. 「Attention Is All You Need」는 Transformer라는 구조를 제시했고, 이 구조가 이후 BERT, GPT, T5, LaMDA, PaLM, Gemini, Claude, LLaMA 계열을 포함한 수많은 모델의 기반이 되었다. 그래서 “OpenAI가 LLM의 핵심 엔진을 만들었다”라고 말하면 사실관계가 맞지 않는다. 핵심 엔진을 제시한 쪽은 Google 중심 연구진이다.
연구 패러다임에서는 공로가 더 분산된다. OpenAI의 GPT-1은 generative pre-training 뒤 supervised fine-tuning을 수행하는 방식으로 여러 자연어 이해 과제에서 성능을 보였다. GPT-2는 더 큰 비지도 언어모델이 명시적 작업별 학습 없이도 일부 작업을 수행할 수 있음을 보여주었다. GPT-3는 175B parameter 규모의 autoregressive language model을 통해 few-shot, one-shot, zero-shot 프롬프트 기반 사용을 강하게 제시했다. 이 흐름은 “언어모델 자체가 범용 작업 수행기의 성격을 가질 수 있다”는 인식을 확산시켰다.
동시에 Google의 BERT와 T5도 LLM 시대의 전사에 속한다. BERT는 사전학습된 Transformer가 다양한 downstream task에 적응할 수 있음을 강하게 보여주었고, T5는 모든 텍스트 기반 언어 문제를 text-to-text format으로 통일하는 framework를 제시했다. 이들은 GPT식 생성 인터페이스와 다르지만, “하나의 큰 사전학습 모델을 여러 과제에 적용한다”는 foundation model적 사고를 강화했다. 따라서 LLM 시대는 OpenAI 혼자 연 것이 아니라, Google, OpenAI, DeepMind, Stanford, Meta, Anthropic, Hugging Face 생태계 등 여러 연구·산업 주체가 만든 흐름이다.
그럼에도 OpenAI의 역할이 특별한 이유는 제품화와 인터페이스에 있다. OpenAI는 2020년 API 발표에서 범용 “text in, text out” 인터페이스를 내세웠다. 이 표현은 중요하다. 사용자가 모델 구조를 직접 다루는 것이 아니라, 텍스트를 넣고 텍스트를 받는 방식으로 여러 작업을 수행한다는 개념이기 때문이다. GPT-3 API는 LLM을 연구 논문에서 개발자 도구로 옮겼다. 이후 InstructGPT와 RLHF는 모델이 단순히 다음 토큰을 잘 예측하는 것에서 사용자의 지시를 더 잘 따르는 방향으로 조정될 수 있음을 보여주었다.
ChatGPT는 이 흐름을 대중적 경험으로 바꾸었다. 2022년 11월 30일 공개된 ChatGPT는 대화형 인터페이스를 통해 후속 질문, 오류 인정, 잘못된 전제 지적, 부적절한 요청 거절 같은 상호작용을 전면에 내세웠다. 사용자는 더 이상 “언어모델을 호출한다”고 느끼기보다 “AI와 대화한다”고 느꼈다. 이 인터페이스 전환은 LLM을 연구자와 개발자의 도구에서 일반 사용자의 사고·글쓰기·검색·코딩 보조 도구로 확장시켰다.
따라서 OpenAI의 결정적 기여는 Transformer의 발명이 아니라 GPT 계열을 통해 Transformer 기반 생성형 사전학습 모델을 대규모 범용 인터페이스로 각인시킨 데 있다. GPT-3는 프롬프트 기반 범용성의 상징이 되었고, API는 이를 개발 플랫폼으로 바꾸었으며, InstructGPT와 RLHF는 사용자 의도 추종 문제를 전면화했고, ChatGPT는 이를 대중적 제품 경험으로 만들었다.
구체적 사례
Transformer: Google 중심 연구진이 제시한 핵심 엔진
2017년 「Attention Is All You Need」는 Transformer를 제안했다. 논문의 실험은 주로 WMT 2014 English-German, English-French 번역 과제에 집중되어 있었고, 논문의 문제의식도 당시 sequence transduction 모델의 recurrent 또는 convolutional 구조를 대체하는 데 있었다. 저자 소속은 Google Brain, Google Research가 중심이며, 일부 저자는 University of Toronto 표기도 함께 갖고 있다. 그래서 가장 엄밀한 표현은 “Google 중심 연구진이 Transformer를 제시했다”이다.
이 논문은 LLM 시대의 기술적 출발점이다. self-attention은 문장 안의 단어들이 서로 어떤 관계를 갖는지를 병렬적으로 계산하게 했고, 대규모 학습에 유리한 구조를 제공했다. 오늘날 대부분의 대표 LLM은 Transformer 계열 구조를 기반으로 한다. 그러므로 기술 원천을 묻는다면 Google의 기여를 중심에 놓아야 한다.
GPT 계열: 생성형 사전학습 모델의 범용화
OpenAI의 GPT-1은 2018년 「Improving Language Understanding by Generative Pre-Training」에서 제시되었다. 이 모델은 unlabeled text로 generative pre-training을 수행한 뒤, 특정 자연어 이해 과제에 supervised fine-tuning을 적용했다. GPT-1의 의의는 모든 작업을 처음부터 따로 설계하기보다, 먼저 큰 언어모델을 학습하고 이를 여러 작업에 적응시킨다는 방향에 있었다.
GPT-2는 2019년 「Language Models are Unsupervised Multitask Learners」에서 제시되었다. GPT-2는 1.5B parameter Transformer 언어모델이며, 명시적 작업별 학습 없이도 일부 작업에서 zero-shot 성능을 보였다. OpenAI는 같은 해 GPT-2의 잠재적 오용 가능성을 이유로 단계적 공개 전략을 취했고, 이는 언어모델이 단순한 연구 모델을 넘어 사회적 위험을 동반하는 생성 시스템으로 인식되는 계기가 되었다.
GPT-3는 2020년 「Language Models are Few-Shot Learners」에서 제시되었다. GPT-3는 175B parameter autoregressive language model이며, gradient update나 fine-tuning 없이 작업 설명과 예시를 텍스트 입력으로 제공하는 few-shot 방식으로 여러 작업을 수행했다. 이 지점에서 중요한 변화는 “모델을 작업에 맞게 고친다”에서 “작업을 프롬프트로 모델에 제시한다”로 중심이 이동했다는 점이다. 이 변화는 현대 프롬프트 기반 AI 사용법의 핵심 전환이었다.
BERT와 T5: Google의 후속 기여
OpenAI 중심 서사를 보정하려면 BERT와 T5를 반드시 포함해야 한다. BERT는 2018년 Google 연구진이 제시한 모델로, deep bidirectional representation을 사전학습한다. BERT는 양방향 문맥을 이용해 단어와 문장의 표현을 학습하고, 추가 출력층을 붙여 질문답변, 자연어 추론, 분류 등 여러 과제에 적용될 수 있음을 보여주었다. 이는 사전학습 모델이 NLP의 표준 기반이 되는 데 결정적 역할을 했다.
T5는 2019년 Google 연구진이 제시한 Text-to-Text Transfer Transformer framework이다. T5의 핵심은 모든 텍스트 기반 언어 문제를 입력 텍스트에서 출력 텍스트로 변환하는 문제로 통일하는 데 있었다. 번역, 요약, 분류, 질문답변이 모두 text-to-text 형식으로 다뤄질 수 있다는 발상은 “모든 작업을 하나의 언어 인터페이스로 처리한다”는 이후 LLM 사용 방식과 깊게 연결된다.
LaMDA와 PaLM도 Google이 단지 초기 Transformer 발명 이후 뒤처져 있었다는 단순한 서사를 약화시킨다. LaMDA는 dialog-specialized Transformer-based language model이고, PaLM은 540B parameter dense decoder-only Transformer language model이다. 특히 PaLM은 Google도 초대형 생성 언어모델과 scaling 연구를 강하게 추진했음을 보여준다. 그러므로 OpenAI와 Google의 차이는 “Google은 범용 모델을 몰랐다”가 아니라, “OpenAI가 그 가능성을 더 빠르게 대중 제품과 개발자 플랫폼의 형태로 각인시켰다”에 가깝다.
OpenAI API와 ChatGPT: 모델에서 플랫폼으로
2020년 OpenAI API 발표는 LLM 시대의 산업적 전환에서 중요한 사건이다. OpenAI는 API를 “general-purpose text in, text out interface”로 설명했다. 이는 모델을 특정 기능의 백엔드가 아니라 여러 영어 텍스트 작업에 적용 가능한 범용 인터페이스로 포지셔닝한 것이다. 개발자는 모델을 직접 학습하지 않아도, 텍스트 프롬프트를 통해 분류, 생성, 요약, 검색 보조, 코드 생성, 고객지원 자동화 같은 기능을 실험할 수 있었다.
2022년 InstructGPT는 또 다른 전환점이다. 「Training language models to follow instructions with human feedback」은 모델 크기를 키우는 것만으로 사용자 의도 추종이 보장되지 않는다고 지적했다. OpenAI 연구진은 인간이 작성한 시범 답변과 인간 선호 비교 데이터를 사용해 supervised fine-tuning과 reinforcement learning from human feedback을 적용했고, 그 결과 InstructGPT를 만들었다. 이 연구는 LLM의 실용성에서 중요한 문제가 단순한 예측 성능만이 아니라 “사용자가 원하는 방식으로 답하게 만드는 정렬”임을 보여주었다.
ChatGPT는 2022년 11월 30일 공개되었다. OpenAI는 ChatGPT를 대화형으로 상호작용하는 모델로 소개했고, 대화 형식이 후속 질문, 오류 인정, 잘못된 전제 지적, 부적절한 요청 거절을 가능하게 한다고 설명했다. ChatGPT는 LLM을 일반 대중이 직접 만지고, 시험하고, 업무에 적용하고, 교육·창작·코딩에 쓰게 만든 대중적 촉발점이었다. Reuters는 UBS 추정치를 인용해 ChatGPT가 출시 두 달 만에 월간 활성 사용자 1억 명에 도달한 것으로 추정된다고 보도했다. 이 수치는 추정치이므로 단정적 통계라기보다 당시 확산 속도를 보여주는 보도 자료로 다루는 편이 안전하다.
주요 쟁점과 반론
첫 번째 쟁점은 “Google이 Transformer를 만들었는데 왜 OpenAI가 시대를 열었다고 말하는가”이다. 이 반론은 타당한 문제 제기다. 기술 발명사를 기준으로 보면 OpenAI가 LLM 시대를 열었다는 표현은 부정확하다. Transformer는 Google 중심 연구진의 성과이고, BERT·T5·LaMDA·PaLM도 Google의 중요한 기여다. 따라서 글의 첫 문단에서 기준을 명확히 해야 한다. 이 글의 기준은 “최초 발명”이 아니라 “대규모 생성 언어모델을 범용 인터페이스와 산업 플랫폼으로 각인시킨 전환”이다.
두 번째 쟁점은 “OpenAI만이 범용 언어모델을 추구했는가”이다. 답은 그렇지 않다. Google, DeepMind, Meta, Anthropic, Stanford, Hugging Face 생태계도 LLM 시대를 구성했다. Stanford CRFM의 foundation model 보고서는 BERT, GPT-3, CLIP 같은 모델을 넓은 데이터와 scale로 학습되고 다양한 downstream task에 적응 가능한 모델로 묶어 설명했다. 이 관점에서 LLM 시대는 특정 기업 하나의 결과라기보다 foundation model 패러다임의 확산으로 이해해야 한다.
세 번째 쟁점은 “scale이 곧 지능인가”이다. GPT-3와 scaling laws 논의는 모델 크기, 데이터, 계산량이 성능과 일정한 관계를 보일 수 있음을 보여주었다. Kaplan 등의 scaling laws 연구는 cross-entropy loss가 model size, dataset size, compute와 power-law 관계를 보인다고 분석했다. 그러나 이것이 모든 실제 사용 품질, 논리 추론, 사실성, 안전성, 윤리성, 사용자 의도 추종이 자동으로 보장된다는 뜻은 아니다. 이후 DeepMind의 Chinchilla 연구는 같은 compute budget에서 모델 크기만 키우기보다 데이터 토큰 수와 모델 크기의 균형이 중요하다고 지적했다. scale은 중요하지만, scale만으로 LLM의 모든 문제가 해결되지는 않는다.
네 번째 쟁점은 “제품화가 연구 공로보다 더 중요한가”이다. 둘은 서로 다른 층위다. 연구 공로는 새로운 원리와 성능을 입증한 데 있고, 제품 공로는 그 원리를 사용자가 실제로 경험할 수 있게 만든 데 있다. OpenAI의 역할은 후자에서 특히 두드러진다. ChatGPT가 없었더라도 LLM 연구는 계속 발전했을 가능성이 크다. 그러나 ChatGPT는 사회가 LLM을 인식하는 속도와 방식, 기업의 도입 전략, 교육과 노동시장의 논쟁을 급격히 바꾸었다. 이 점에서 ChatGPT는 LLM 시대의 대중적 시작점 중 가장 강한 촉발점이었다.
오해와 한계
첫 번째 오해는 “Transformer를 Google이 만들었으므로 OpenAI의 역할은 부차적이다”라는 해석이다. 기술 발명과 사회적 전환은 다르다. Google 중심 연구진이 Transformer를 제시하지 않았다면 오늘날 LLM의 기반은 크게 달라졌을 것이다. 동시에 OpenAI가 GPT 계열, API, InstructGPT, ChatGPT를 통해 생성형 언어모델의 사용 방식을 대중화하지 않았다면 LLM 시대의 산업적 폭발은 다른 속도와 형태로 나타났을 가능성이 크다.
두 번째 오해는 “OpenAI가 LLM 시대를 열었으므로 Google은 방향을 놓쳤다”라는 해석이다. Google은 BERT와 T5로 NLP 연구의 방향을 크게 바꾸었고, LaMDA와 PaLM으로 대화형·초대형 언어모델 연구를 적극적으로 수행했다. Google의 제품 공개가 OpenAI보다 조심스러웠던 이유는 검색 광고 중심 사업 구조, 평판 리스크, 안전성 문제, 기존 서비스와의 충돌 가능성 등 복합적 요인으로 설명할 수 있다. 이 점을 “Google은 특정 NLP 작업만 보았다”로 축소하면 부정확하다.
세 번째 오해는 “GPT는 단순한 다음 단어 예측이므로 범용성이 설명되지 않는다”라는 해석이다. 다음 토큰 예측은 학습 목표로는 단순하지만, 대규모 데이터와 대규모 모델에서는 언어 안에 압축된 지식, 추론 패턴, 문체, 형식, 절차, 역할 수행 방식이 함께 학습될 수 있다. GPT-3의 few-shot learning은 이 가능성을 강하게 보여주었다. 다만 이런 범용성은 안정적 논리 추론이나 참된 이해를 자동으로 보장하지 않는다. LLM은 여전히 환각, 편향, 맥락 손실, 계산 오류, 최신 정보 부재 같은 한계를 가진다.
네 번째 오해는 “LLM 시대는 ChatGPT 하나로 시작되었다”라는 해석이다. ChatGPT는 대중적 촉발점이었지만, 그 이전에는 Transformer, BERT, GPT-1, GPT-2, GPT-3, T5, scaling laws, CLIP, Codex, LaMDA, PaLM, API 생태계, RLHF 연구가 축적되어 있었다. 이후에는 Meta LLaMA, Mistral, Hugging Face, Anthropic Claude, Google Gemini, 오픈웨이트 모델 생태계가 LLM 시대를 더 넓게 확장했다. 시대 전환은 단일 사건이 아니라 누적된 기술·제도·시장 변화의 결과다.
이 설명의 한계도 분명하다. “누가 시대를 열었는가”는 역사적 평가이므로 단일한 객관식 답이 아니다. 연구사, 산업사, 대중문화사, 플랫폼 전략, 정책 논의 중 어느 기준을 택하느냐에 따라 결론의 강조점이 달라진다. 이 글은 대중적·산업적 전환을 기준으로 OpenAI의 역할을 크게 평가하지만, 기술 원천과 연구 생태계의 관점에서는 Google과 다른 연구 주체들의 역할을 함께 놓아야 한다.
정리
OpenAI가 LLM의 핵심 아키텍처를 발명한 것은 아니다. Transformer는 Google 중심 연구진이 제시했고, Google은 BERT, T5, LaMDA, PaLM을 통해 사전학습·전이학습·대화 모델·초대형 언어모델 연구에 중대한 기여를 했다. 따라서 “OpenAI가 LLM 기술을 처음 만들었다”는 말은 사실관계에 맞지 않는다.
OpenAI가 한 일은 다른 층위에 있다. OpenAI는 GPT 계열을 통해 생성형 사전학습 Transformer를 대규모화했고, GPT-3를 통해 프롬프트 기반 few-shot 사용 방식을 강하게 각인시켰으며, API를 통해 이를 개발자 플랫폼으로 만들었다. InstructGPT와 RLHF는 사용자 지시 추종과 정렬 문제를 전면화했고, ChatGPT는 LLM을 일반 대중이 직접 사용하는 대화형 인터페이스로 바꾸었다.
따라서 최종 판단은 다음과 같다. OpenAI가 LLM의 엔진을 만든 것은 아니다. 그 엔진은 Google 중심 연구진이 제시했다. 그러나 OpenAI는 그 엔진을 대규모 생성 언어모델, 범용 텍스트 인터페이스, 개발자 API, 대화형 제품으로 결합해 LLM 시대의 산업적·사회적 전환을 강하게 촉발했다. 그래서 “OpenAI가 LLM 시대를 열었다”는 말은 기술 발명사로는 부정확하지만, 제품·플랫폼·대중 수용의 역사로는 상당히 타당하다.
참고자료
- Ashish Vaswani, Noam Shazeer, Niki Parmar 외, 「Attention Is All You Need」, NeurIPS, 2017.
- Google Research, 「Attention Is All You Need」, Research publication page, 확인일 2026-05-06.
- Alec Radford, Karthik Narasimhan, Tim Salimans, Ilya Sutskever, 「Improving Language Understanding by Generative Pre-Training」, OpenAI, 2018.
- Alec Radford, Jeffrey Wu, Rewon Child 외, 「Language Models are Unsupervised Multitask Learners」, OpenAI, 2019.
- OpenAI, 「Better Language Models and Their Implications」, OpenAI Blog, 2019-02-14.
- Tom B. Brown, Benjamin Mann, Nick Ryder 외, 「Language Models are Few-Shot Learners」, NeurIPS, 2020.
- OpenAI, 「OpenAI API」, OpenAI Blog, 2020-06-11.
- Jacob Devlin, Ming-Wei Chang, Kenton Lee, Kristina Toutanova, 「BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding」, arXiv, 2018.
- Colin Raffel, Noam Shazeer, Adam Roberts 외, 「Exploring the Limits of Transfer Learning with a Unified Text-to-Text Transformer」, Journal of Machine Learning Research, 2020.
- Romal Thoppilan, Daniel De Freitas, Jamie Hall 외, 「LaMDA: Language Models for Dialog Applications」, arXiv, 2022.
- Aakanksha Chowdhery, Sharan Narang, Jacob Devlin 외, 「PaLM: Scaling Language Modeling with Pathways」, Journal of Machine Learning Research, 2023.
- Jared Kaplan, Sam McCandlish, Tom Henighan 외, 「Scaling Laws for Neural Language Models」, arXiv, 2020.
- Jordan Hoffmann, Sebastian Borgeaud, Arthur Mensch 외, 「Training Compute-Optimal Large Language Models」, NeurIPS, 2022.
- Long Ouyang, Jeff Wu, Xu Jiang 외, 「Training Language Models to Follow Instructions with Human Feedback」, NeurIPS, 2022.
- OpenAI, 「Aligning Language Models to Follow Instructions」, OpenAI Blog, 2022-01-27.
- OpenAI, 「Introducing ChatGPT」, OpenAI Blog, 2022-11-30.
- Rishi Bommasani, Drew A. Hudson, Ehsan Adeli 외, 「On the Opportunities and Risks of Foundation Models」, Stanford Center for Research on Foundation Models, 2021.
- Reuters, 「ChatGPT Sets Record for Fastest-Growing User Base」, 2023-02-02.
- Steven Levy, 「8 Google Employees Invented Modern AI. Here’s the Inside Story」, Wired, 2024-03-20.