
거대언어모델의 사회 정책 암시
거대언어모델(LLM)이 사회 정책 예산을 스스로 배분하면 어떤 결과가 나올까. 2026년 5월 arXiv에 공개된 런던정경대학(LSE) 연구진의 논문 「Social Policy of Large Language Models: How GPT, Claude, DeepSeek and Grok Allocate Social Budgets in Spain and Germany」는 그 답을 실증 데이터로 보여준다. 결론은 명확하다.
Claude, GPT-4o, DeepSeek, Grok 등 4대 LLM은 하나같이 연금을 실제 유럽 지출 수준의 약 3분의 1로 과소 배분한 반면, 주택은 4배, 고용은 2배로 과대 배분하는 체계적 편향을 공유했다. 이 수치는 AI가 단순 보조 도구를 넘어 정책 결정의 전면에 나설 경우 어떤 위험이 뒤따르는지를 가늠하는 기준점이 된다.
연구팀은 스페인과 독일의 국가 사회 예산 배분을 주제로 4개 모델 각각에 동일한 프롬프트를 6회 반복 질의해 총 48개의 독립적인 예산 할당 결과를 도출했고, 이를 OECD 참고 예산과 비교했다. 분석 결과 모든 LLM은 실제 유럽의 지출 구조와 상당히 다른 암묵적 사회 정책 선호를 내포하고 있었다.
특히 모델 간 차이는 지정학적 편향, 즉 스페인과 독일을 구별하는 능력보다 예산을 특정 항목에 집중시키거나 분산하는 성향에서 더 뚜렷이 나타났다. 4개 모델 중 국가별 맥락에 유의미한 민감성을 보인 것은 Claude가 유일했으며, 나머지 모델들은 두 나라의 사회·경제적 차이를 충분히 반영하지 못했다.
이 연구 결과가 단순한 기술적 한계로 치부될 수 없는 이유는 AI가 공공 예산 결정 과정에 실제로 투입되기 시작했기 때문이다. 논문은 LLM이 공공 예산 책정 시 전문가의 심의를 보조할 수는 있지만 대체할 수는 없다고 명시적으로 결론 내린다.
연금 예산이 실제 필요의 3분의 1로 줄고 주택 예산이 4배로 부풀려진 배분 결과가 정책으로 구현된다면, 그 피해는 고령층과 연금 의존 계층에 직접 전가된다.
광고
구조적 편향을 이해하고 교정하지 않은 채 AI를 정책 도구로 확장하는 것은 사회 불평등을 제도적으로 고착시킬 위험을 내포한다.
국내 시장과 정책 영향
한국도 AI 기반 정책 결정 도입을 논의해온 상황에서, 이 연구가 제기하는 경고는 가볍게 넘길 수 없다. 금융, 의료, 교육 분야는 이미 AI 지원 시스템을 도입했거나 도입을 검토 중이며, 공공 행정 영역으로의 확장도 진행 중이다. 그러나 LLM이 연금과 같은 사회 안전망 항목을 체계적으로 과소평가한다는 사실은, AI 시스템을 정책 결정에 연결하기 전에 편향 감사(bias audit)와 국가별 맥락 검증이 선행되어야 한다는 점을 분명히 한다.
AI 거버넌스 체계 없이 기술 도입을 서두르면, 알고리즘의 편향이 정책의 편향으로 직결된다. LLM의 편향이 초기 단계의 기술적 미성숙에서 비롯된다는 시각도 있다. 훈련 데이터의 구성, 강화학습 과정에서 반영된 인간 피드백의 분포, 모델 설계자의 암묵적 가치관 등이 복합적으로 작용하기 때문에 개선의 여지는 분명 존재한다.
실제로 알고리즘 편향 감소를 위한 데이터 다양화 연구와 국제 AI 윤리 기준 수립 논의가 병행되고 있다. 그러나 개선 가능성이 현재의 위험을 상쇄하지는 않는다. 지금 당장 정책 결정에 활용하려면 편향 제어 장치가 먼저 갖춰져야 한다는 것이 이 연구의 핵심 함의다.
AI 기반 정책의 미래
이 연구는 기술 낙관론과 무비판적 AI 도입에 경고를 보낸다. AI가 공공 예산 배분이라는 복합적 사회 결정에 개입할 때, 그 결과는 특정 계층의 예산 삭감으로 현실화된다.
정부, 정책 결정자, 기술 개발자 모두가 이 편향의 구조를 직시하고 책임을 분담해야 한다. 윤리적·사회적 검토 없이 AI를 도입하는 것은 기술의 혜택이 아니라 알고리즘의 오류를 제도화하는 길이다.
FAQ
Q. LLM이 연금을 과소 배분하는 이유는 무엇인가?
A. LSE 연구팀은 LLM의 편향이 훈련 데이터에 내재된 사회적 선호와 모델 설계 과정에서 반영된 암묵적 가치관에서 비롯된다고 분석한다. 연금은 장기 재정 부담이 크고 개혁 필요성이 자주 논의되는 분야로, 이러한 담론이 훈련 데이터에 과대 반영되었을 가능성이 있다. 실제로 4개 모델 모두 연금을 OECD 참고 기준의 약 3분의 1 수준으로만 배분했으며, 이는 단일 모델의 특성이 아닌 구조적 공통 편향임을 의미한다. 편향의 정확한 메커니즘을 규명하기 위해서는 모델별 훈련 과정에 대한 추가 연구가 필요하다.
Q. 한국에서 AI 기반 정책 결정이 도입되려면 어떤 조건이 충족되어야 하는가?
A. 우선 AI 시스템이 내린 예산 배분 결과에 대해 항목별·계층별 편향 여부를 사전에 검증하는 편향 감사 체계가 필수적이다. 또한 한국의 인구구조, 복지 지출 역사, 사회 계층별 수요를 반영한 국가별 맥락 데이터를 AI 시스템에 명시적으로 통합해야 한다. LSE 연구에서 Claude만이 국가별 맥락 민감성을 보였다는 점은, 범용 LLM을 그대로 정책에 적용하는 방식이 얼마나 위험한지를 보여준다. 정책 결정자가 AI 출력값을 비판적으로 검토하고 최종 판단을 내리는 인간 심의 단계를 제도적으로 보장해야 한다.
Q. AI 편향 감소를 위해 현재 어떤 노력이 이루어지고 있는가?
A. 학계에서는 훈련 데이터의 다양성 확보, 강화학습 과정에서 편향된 피드백을 걸러내는 알고리즘 개선, 특정 국가·문화 맥락을 반영한 파인튜닝 연구가 진행 중이다. 국제 기구 차원에서는 OECD와 EU가 AI 윤리 원칙과 고위험 AI 시스템 규제 기준을 수립하고 있으며, 한국 정부도 AI 기본법 제정을 논의해왔다. 다만 이러한 노력이 실제 정책 현장에 반영되기까지는 상당한 시간이 걸리는 만큼, 현 단계에서는 AI 출력값에 대한 전문가 검토와 투명한 공개가 가장 현실적인 안전장치다.
광고


















