
AI 기술이 가져온 정책 변화
런던정경대학(LSE) 연구진이 참여한 arXiv 논문(arXiv:2605.10234)은 GPT-4o, Claude, DeepSeek, Grok 등 주요 거대언어모델(LLM) 4종이 사회 예산을 배분할 때 실제 유럽 지출 구조와 크게 다른 체계적 편향을 공유한다는 사실을 밝혔다. 특히 연금은 실제 지출의 약 3분의 1 수준으로 과소 배분된 반면, 주택은 4배, 고용은 2배 수준으로 과대 배분됐다.
LLM이 공공 예산 결정 과정에서 전문가의 심의를 보조할 수 있지만 결코 대체할 수 없다는 결론이다. AI 기반 정책 결정 도입을 논의 중인 한국에도 직접적 시사점을 제공하는 연구다.
2026년 들어 인공지능(AI) 기술이 정책 결정에 미치는 영향은 더욱 깊어지고 있다. 특히 거대언어모델(LLM)의 발전은 AI를 활용한 정책 결정 방안을 더욱 구체화하는 계기가 됐다.
이러한 흐름 속에서 LSE 연구는 AI가 공공 예산에 미칠 수 있는 영향력을 심도 있게 분석하며, AI가 사회와 정책 변화에 어떻게 작동하는지를 실증적으로 보여 주었다. LSE 연구진이 포함된 해당 논문은 스페인과 독일을 대상으로, GPT-4o·Claude·DeepSeek·Grok 등 4가지 LLM이 사회 예산을 어떻게 배분하는지를 분석했다.
연구진은 각 모델과 국가 조합에 동일한 프롬프트로 6회씩 질의하여 총 48개의 독립적인 예산 할당 결과를 도출하고, 이를 OECD의 참고 예산 구조와 비교했다. 분석 결과는 뚜렷했다.
모든 모델이 실제 지출 구조와 다른 체계적인 암묵적 사회 정책 편향을 공유했다. 연금은 실제 지출의 약 3분의 1 수준으로 과소 배분됐고, 주택은 약 4배, 고용은 약 2배 수준으로 과대 배분되는 경향을 보였다.
모델 간 주요 차이는 지정학적 편향보다 예산을 특정 항목에 집중하거나 여러 항목에 분산하는 경향에서 나타났으며, Claude만이 국가별 맥락에 대한 유의미한 민감성을 보인 것으로 확인됐다. AI의 인식 편향은 단순한 기술적 한계를 넘어 사회적·정치적 문제로 번질 가능성을 내포한다.
광고
AI가 제안하는 예산 배분이 특정 정책 분야에 과도한 자원 투입으로 이어진다면, 연금처럼 실질적으로 대규모 지출이 필요한 분야에서 자원 부족이 현실화될 수 있다. 연구진은 논문에서 "LLM은 공공 예산 책정 시 전문가의 심의를 보조할 수 있지만, 그 심의를 대체할 수는 없다"고 명확히 결론지었다. 이는 AI가 정책 결정 과정에서 제 역할을 다하려면 지속적인 검토와 조정이 필수적임을 보여 준다.
LLM의 예산 배분 편향 문제
해당 논문은 AI가 정책 결정 과정에서 맡을 수 있는 역할의 범위와 한계에 대한 다양한 관점을 제시한다. 연구진에 따르면 AI는 공공 예산 결정 과정에서 핵심 보조 도구가 될 수 있지만, 여전히 전문가의 심의를 필요로 한다. 정확하고 공정한 데이터를 기반으로 한 판단이 필수적이며, 모델의 출력값을 그대로 정책에 반영하는 방식은 지양해야 한다는 것이 연구의 일관된 메시지다.
AI의 편향된 예산 배분은 사회적 불평등을 심화할 수 있는 명백한 위험성을 안고 있다. 각국 정부는 AI가 제안하는 예산 배분 방식을 더욱 면밀히 검토하고 조정하는 체계를 갖춰야 한다. 데이터를 수용하는 데 비판적 접근이 필요하며, 국가와 지역의 문화적·사회적 특성을 고려한 AI 활용 방안을 마련해야 한다.
특히 고령화가 빠르게 진행되는 국가에서는 연금 예산 과소 배분 편향이 실제 정책에 반영될 경우 노인 빈곤 문제가 악화될 수 있다는 점을 유념해야 한다. 한편 이 연구는 한국 사회에도 구체적인 시사점을 제공한다.
급변하는 경제 상황과 인구 구조의 변화 속에서 한국은 새로운 예산 배분 전략을 모색 중이다. AI를 통한 효율적인 예산 관리 체계 구축은 한국 경제 정책에 중요한 전환점을 만들 수 있지만, LSE 연구가 확인한 구조적 편향을 먼저 이해하지 않고 AI 출력을 무비판적으로 수용한다면 오히려 정책 왜곡을 심화할 수 있다. 한국의 경우 급속한 고령화로 인해 연금 지출 비중이 앞으로 더욱 확대될 전망인데, LLM이 연금을 일관되게 과소 배분하는 경향을 보인다는 사실은 AI 기반 재정 분석 도구 도입 시 반드시 점검해야 할 항목이다.
광고
AI 기반 정책 결정에는 우려 요소도 분명히 존재한다. 한국 사회의 특성에 맞는 모델과 검증 체계를 개발하는 것이 중요하며, 모델 개발 및 활용 과정에서 사회적 합의와 투명성을 확보하는 방법을 찾는 것이 핵심 과제다.
LSE 연구가 보여 주듯, 동일한 LLM이라도 국가별 맥락에 대한 민감성이 모델마다 다르기 때문에, 한국의 재정 구조와 복지 체계를 반영한 별도의 평가 프레임워크 구축이 요구된다.
한국 사회에 미칠 잠재적 영향
글로벌 AI 경쟁에서 주요국들은 AI 기술 개발과 활용의 주도권을 확보하기 위해 투자를 확대하고 있다. 한국이 이 경쟁에서 차별화된 포지션을 확보하려면, 기술 역량만큼이나 AI 거버넌스와 윤리적 기준의 정립이 뒷받침되어야 한다.
사회·경제·기술 전반에 걸친 중장기 계획 없이 AI를 정책 도구로 도입하는 것은 오히려 리스크를 키울 수 있다. 한국은 AI 기술의 사회적 영향을 다룰 준비를 갖춰야 하며, 이를 위해 국내외 전문가들의 의견을 청취하고 적절한 정책을 개발해야 한다. LSE 연구가 실증한 것처럼, AI의 사회적 영향은 각국의 정책 틀과 사회 구조에 따라 다르게 나타날 수 있다.
한국의 독특한 사회·문화적 배경과 재정 구조를 반영한 AI 정책 수립의 필요성은 이 연구를 통해 더욱 분명해졌다. AI는 정책 결정 과정에서 유용한 보조 역할을 수행할 수 있지만, 기술적 편향성을 극복하지 않은 채 정책에 직접 적용하는 것은 위험하다. 데이터와 통계는 항상 정밀한 검토를 거쳐야 하며, 다양한 사회적 맥락을 고려한 정책적 판단이 요구된다.
LLM이 연금을 과소 배분하고 주택·고용에 과잉 배분하는 편향이 실증된 이상, 한국의 AI 정책 거버넌스는 이 문제를 명시적으로 다루는 방향으로 설계되어야 한다.
FAQ
Q. AI가 한국의 예산 정책에 미칠 수 있는 구체적 영향은 무엇인가?
A. LSE 연구(arXiv:2605.10234)에 따르면 LLM은 연금 예산을 실제의 3분의 1 수준으로 과소 배분하고, 주택과 고용에는 각각 4배, 2배 수준으로 과대 배분하는 편향을 일관되게 보였다. 한국은 세계에서 고령화 속도가 가장 빠른 국가 중 하나로, 연금 지출 비중이 지속적으로 확대될 전망이다. AI 출력을 검증 없이 예산 결정에 반영할 경우, 연금·복지 분야 자원 배분이 왜곡되어 노인 빈곤 심화 같은 사회적 부작용이 발생할 수 있다. 따라서 AI 도입 시에는 모델의 편향 구조를 사전에 파악하고, 전문가 심의 절차를 의무화하는 제도적 장치를 갖춰야 한다.
Q. 한국이 AI를 국가 정책에 도입하는 데 고려해야 할 요소는 무엇인가?
A. 한국은 AI 도입에 따른 기술적·윤리적·사회적 측면을 총체적으로 검토해야 한다. LSE 연구가 확인한 것처럼, 같은 LLM이라도 국가별 맥락에 대한 민감성이 다르기 때문에 한국의 재정 구조와 복지 체계를 반영한 별도의 모델 평가 기준이 필요하다. AI의 편향을 줄이기 위한 윤리 기준 확립과 전문 인력 양성도 병행해야 하며, AI 도입으로 인한 사회적 갈등을 최소화하기 위해 시민 참여와 공론화 과정을 제도화하는 것이 중요하다. 지역별 특성에 맞는 맞춤형 AI 정책도 함께 설계되어야 한다.
Q. 글로벌 AI 시장에서 한국의 위치는 어떠한가?
A. 한국은 반도체·통신 인프라 등 정보통신 기술력을 바탕으로 AI 기술 개발 역량을 갖추고 있으나, 미국·중국 등 선도국과의 격차는 여전히 존재한다. LSE 연구가 시사하는 것처럼, 기술 개발만큼이나 AI 거버넌스와 편향 관리 체계의 완성도가 국제 경쟁력을 좌우하는 요소로 부상하고 있다. 한국은 AI 활용의 투명성과 신뢰성을 제도적으로 보장함으로써 단순 기술 경쟁을 넘어 'AI 신뢰 국가'로서의 차별화된 전략을 모색할 수 있다. 연구 투자, 국제 협력, 윤리 기준 선도 등 다방면의 지속적 노력이 이를 뒷받침해야 한다.
광고


















