대규모 언어 모델의 한계: 인간 언어 능력과의 차이점
- 논문 주제: 대규모 언어 모델(LLM)이 인간 언어 능력과 유사하다고 주장하는 것에 대한 비판
- 주요 주장: LLM은 인간 언어 능력을 완벽히 모방할 수 없으며, 인간 언어의 핵심 요소인 구현, 참여, 불안정성을 갖추지 못했다.
- LLM의 한계:
- 언어 완전성 가정: LLM은 언어를 완전하고 고정된 것으로 간주하며, 데이터로 완전히 포착 가능하다고 가정한다.
- 데이터 완전성 가정: LLM은 언어를 데이터로 정량화하고 포착할 수 있다고 가정한다.
- 인간 언어의 특징:
- 구현: 언어는 신체와 환경, 경험과 밀접하게 연결되어 있다.
- 참여: 언어는 상호작용과 소통을 통해 발생하며, 맥락과 목적을 갖는다.
- 불안정성: 언어는 끊임없이 변화하고 발전하며, 불완전하고 불확실한 요소를 포함한다.
- LLM과 인간 언어의 차이점:
- 구현: LLM은 신체가 없으며, 실제 세계와 상호작용할 수 없다.
- 참여: LLM은 자발적인 행위를 수행할 수 없으며, 인간과의 상호작용에 제한적이다.
- 불안정성: LLM은 인간의 불안정성과 맥락적 이해를 반영하지 못한다.
- 알고스피크(Algospeak): LLM은 인간의 언어 활동을 정확히 반영하지 못하며, 특히 통제된 온라인 환경에서 나타나는 알고스피크와 같은 현상을 이해하지 못한다.
- 결론: LLM은 인간 언어를 완벽히 모방할 수 없으며, 인간 언어의 핵심 요소를 갖추지 못했다. LLM의 뛰어난 기술적 성과에도 불구하고, 인간 언어 능력과는 차이가 존재한다.