AI 수행평가 도입과 교육부 가이드라인의 5대 원칙
가정에서 자녀가 완성한 수행평가 결과물을 보며 인공지능이 대신 작성한 것은 아닌지 우려하는 학부모가 적지 않다. 2026학년도부터는 과제 수행 시 인공지능의 활용 여부 자체보다, 이를 어디까지 사용하고 어떻게 표기했는지가 평가의 핵심 기준이 된다.
교육부는 17개 시도교육청과 함께 수행평가 시 인공지능 활용 관리 방안을 확정해 학교 현장에 적용한다. 이 지침의 핵심은 새로운 기술의 전면 금지가 아니라, 안전한 테두리 안에서 활용 범위를 명확히 설정하는 데 있다.
현장에 적용되는 5대 기본 원칙은 인공지능 활용 범위 설정, 활용 과정 표기 지도, 학생 사전 교육, 실시간 활동 중심의 평가 설계, 개인정보 보호다. 자료 탐색이나 개요 작성 등에서 인공지능의 도움을 받았다면 결과물에 구체적인 사용 내역을 밝혀야 한다.
구체적으로는 사용한 인공지능 서비스 종류, 입력한 질문 내용인 프롬프트, 직접 인용이나 요약 등 반영 방식, 실제 결과물에 반영된 부분을 명확히 기재해야 한다.
이러한 기록을 남기지 않고 제출하거나 교사의 질문에 제대로 답하지 못하면 채점에서 제외될 수 있다. 다만 학교와 교사별로 허용 범위나 기준이 다를 수 있으므로 과제를 시작하기 전 담당 교사의 사전 안내를 확인하는 과정이 필수적이다.

채움AI와 하이러닝 시범 운영이 남긴 채점 시스템의 과제
교육 현장에 서논술형 평가 비중이 늘어나면서 교사의 업무를 돕는 인공지능 채점 보조 시스템 도입도 본격화하고 있다. 서울시교육청은 인공지능 평가 지원 시스템인 채움AI를 2026년 중고등학교 120곳으로 확대하고 2027년 전 학교 도입을 목표로 삼고 있다.
이 시스템은 기계가 단독으로 점수를 매기는 방식이 아니다. 교사의 평가 설계를 바탕으로 1차 채점 결과를 제시하고 최종 판단은 교사가 내리도록 돕는 보조 도구다.
이와 별개로 경기도에서 시범 운영된 인공지능 채점 도구 하이러닝의 사례는 기술 도입의 현실적인 이면을 보여준다. 현장 연구진의 시범 운영 결과 교사 사용률은 64.6%로 높은 관심을 증명했지만, 정작 업무 부담 감소에 동의한 비율은 29.4%에 그쳤다.
특히 교사가 채점 기준표를 구체적으로 작성함과 같이 추상적으로 설정할 경우, 인공지능이 백지 답안이나 조건에 맞지 않는 글에도 분량만 보고 높은 점수를 부여하는 오류가 발견되었다.
이는 인공지능 채점의 정확성이 기술 자체의 고도화 수준보다, 평가 기준을 정량적인 수치로 꼼꼼하게 설계하는 교사의 평가 역량에 달려 있음을 시사한다.
결과물 제출에서 과정 중심으로 이동하는 평가의 방향
인공지능이 문법적으로 무난한 정답을 단시간에 생산해 내는 환경은 학교 평가의 방향성을 실시간 과정 중심으로 이동시키고 있다.
새로운 지침은 가정에서 완성해 제출하는 최종 산출물 위주의 과제 방식에서 벗어나, 수업 시간 중 전자기기를 차단하고 교사가 학생의 수행 과정을 직접 대면하여 관찰하는 평가를 권장한다.
또한 동일한 주제가 주어지더라도 학교가 위치한 지역의 특성이나 학생 개인의 고유한 경험에 기반한 성찰을 주요 평가 요소로 삼도록 유도한다. 인공지능이 방대한 데이터를 바탕으로 표준적인 답변은 쉽게 생성하지만, 학생 개인의 삶과 밀착된 경험은 지어낼 수 없기 때문이다.
따라서 결과물의 표면적인 완성도보다는 학생 스스로 주도성을 가지고 비판적 사고를 전개했는지가 중요한 평가 기준이 된다. 이러한 평가 방식의 구조적 변화 속에서도 잊지 말아야 할 것은 학교와 교사별로 허용 범위나 기준이 다를 수 있다는 사실이다.

학부모와 학생이 점검해야 할 세부 유의사항과 대응
새로운 평가 체제에서 학부모와 학생은 인공지능을 무작정 배제하기보다 현명하게 활용하고 통제하는 방법을 익혀야 한다.
새로운 과제가 주어지면 가장 먼저 교과 담당 교사에게 인공지능 활용이 허용되는 과제인지, 허용된다면 자료 검색이나 브레인스토밍 등 어느 단계까지 가능한지 구체적으로 묻고 확인해야 한다.
아이디어를 얻기 위해 보조적으로 참고하더라도, 최종 결과물에는 학생 본인이 직접 겪은 경험과 생각이 중심에 놓여야만 정상적인 평가를 받을 수 있다. 아울러 인공지능 플랫폼에 질문을 입력할 때 이름, 학번, 학교명, 주소 등 개인 식별 정보가 포함되지 않도록 가정 내 각별한 주의가 요구된다.
만약 사전에 교사가 금지 범위를 명확히 안내하지 않은 상태에서 이미 인공지능을 활용해 과제를 제출했다면, 일반적으로 소급하여 부정행위로 처리되지는 않는 것이 원칙이나 학교별 규정을 다시 한번 확인하는 것이 바람직하다.
평가를 주관하는 기준은 전적으로 교사에게 있으며 학교와 교사별로 허용 범위나 기준이 다를 수 있으므로, 학기 초와 평가 전에 제공되는 세부 지침을 최우선으로 준수하는 것이 가장 확실한 대응 방안이다.
[전문 용어 사전]
▪️프롬프트: 사용자가 거대언어모델이나 인공지능 도구에 특정한 답변이나 결과물을 생성하도록 지시하기 위해 입력하는 구체적인 질문이나 명령어를 뜻한다.
▪️채움AI: 서울시교육청이 도입하여 2026년 120개 중고교로 확대 중인 인공지능 서논술형 평가 지원 시스템으로, 최종 판단은 교사가 하되 채점 업무를 돕는 보조 도구다.
▪️하이러닝: 경기도교육청이 시범 운영한 인공지능 채점 도구 및 교육 플랫폼으로, 서울시교육청의 채움AI와는 별개로 운영되는 독자적인 시스템이다.
▪️할루시네이션: 인공지능 모델이 학습된 데이터의 한계나 오류로 인해, 잘못된 정보나 사실이 아닌 내용을 마치 논리적인 사실인 것처럼 생성해 내는 현상이다.
▪️과정 중심 평가: 단순히 과제의 최종 결과물이나 지필고사 점수만으로 성취도를 판단하지 않고, 학생이 수업 중에 과제를 수행하며 보여주는 사고 과정과 학습 태도를 실시간으로 관찰하는 평가 방식이다.


















