대규모 언어 모델은 인공지능의 한 갈래로, 자연어-처리와 기계-학습을 결합해 텍스트의 흐름을 예측하고 생성하도록 만든 모델이다.[1][2][3] 현재의 대화형 시스템, 요약 도구, 검색 보조 기능은 대부분 딥러닝과 신경망 기반 언어 모델 위에서 작동한다.[1][2][3]
이 문서는 언어 모델의 구조, 학습 방식, 활용과 한계, 그리고 사회적 영향을 함께 정리한다.[1][2][4] 모델의 성격을 이해하려면 학습-데이터, 개인정보, 기계-학습처럼 주변 주제도 함께 보는 편이 낫다.[2][3][4]
1. 개요
2. 학습과 조정
대부분의 언어 모델은 대규모 말뭉치로 사전학습을 먼저 수행하고, 이후 특정 목적에 맞게 미세 조정된다.[1][2][3] 이 과정에서 모델은 일반적인 언어 패턴을 익히고, 기계-학습의 세부 목표에 따라 질문 응답, 요약, 분류 같은 기능을 더 잘 수행하도록 조정된다.[1][2][3]
학습 데이터의 폭과 질은 결과에 직접 영향을 준다. 편향된 학습-데이터는 편향된 응답과 사실 오류를 늘릴 수 있고, 민감한 정보가 섞이면 개인정보 보호 문제를 일으킬 수 있다.[2][3][4] 그래서 데이터 선별, 품질 점검, 안전 필터링은 언어 모델 운영의 핵심 절차다.[1][2][4]
3. 활용과 한계
4. 사회적 영향
5. 평가와 운영
7. 인용 및 각주
[1] What is a large language model (LLM)? - University of Arizona Libraries, ask.library.arizona.edu(새 탭에서 열림)
[2] Research Guides: Generative AI and Large Language Models (LLMs): Generative AI, guides.nyu.edu(새 탭에서 열림)
[3] Large language models, explained with a minimum of math and jargon, www.understandingai.org(새 탭에서 열림)
[4] State media control influences large language models - Nature, www.nature.com(새 탭에서 열림)