google.com, pub-9005101102414487, DIRECT, f08c47fec0942fa0

카카오, '인간처럼 소통하는 AI' 시대 개막 선언!

한국적 맥락 최적화된 '통합 AI' 기술력 입증

감정·호흡까지 이해하는 'AI 대화의 진화’

이미지 검색 패러다임 변화: 'Kanana-v-embedding’

이미지=캔바, kanana-o

 

 

카카오가 사람과 같이 보고, 듣고, 말하는 고도화된 멀티모달 인공지능(AI) 기술의 연구 성과를 공식 발표하며, K-AI의 새로운 지평을 열었다. 특히 한국어와 한국 문화를 깊이 있게 이해하는 데 초점을 맞춘 독자적인 AI 모델들은 글로벌 선두 모델들과의 경쟁에서 우위를 점할 잠재력을 입증했다.

 

한국적 맥락 최적화된 '통합 AI' 기술력 입증

 

카카오는 최근 테크 블로그를 통해 통합 멀티모달 언어모델 카나나-오(Kanana-o)’와 멀티모달 임베딩 모델 ‘카나나-브이-임베딩(Kanana-v-embedding)’의 개발 과정과 벤치마크 결과를 상세히 공개했다. 이는 카카오가 자체적으로 구축한 AI 모델의 기술적 성숙도와 완성도를 재차 확인하는 계기가 되었다.

 

Kanana-o는 텍스트, 음성, 이미지를 동시에 인식하고 실시간으로 응답할 수 있는 통합 멀티모달 언어모델이다. 이 모델의 가장 큰 특징은 글로벌 모델 대비 한국어 맥락 이해 능력이 압도적이라는 점이다. 지난 5월 성능 공개 이후 지속적인 고도화를 거쳐, 마치 사람처럼 자연스럽고 풍부한 표현력을 갖추게 됐다.

 

카카오 개발팀은 기존 멀티모달 모델들이 텍스트 입력에서는 강점을 보였으나, 음성 대화 시에는 답변의 깊이가 얕아지고 추론 능력이 떨어지는 한계를 명확히 인식했다. 이를 극복하고자 Kanana-o의 지시 이행 능력을 대폭 강화했다. 그 결과, 사용자의 표면적인 질문을 넘어 숨겨진 의도와 복잡다단한 요구사항까지 정교하게 파악하고 처리할 수 있게 되었다.

 

감정·호흡까지 이해하는 'AI 대화의 진화’

 

Kanana-o는 자체 구축한 대규모 데이터셋을 활용해 학습을 진행함으로써, 다양한 종류의 입출력 모달리티(텍스트, 음성, 이미지)에서도 기존 언어모델의 성능을 일관되게 유지했다. 단순한 질의응답을 넘어 요약, 감정 및 의도 해석, 오류 수정, 형식 변환, 번역 등 복합적인 과업을 성공적으로 수행하는 수준으로 성능이 향상되었다.

 

특히, 음성 분야에서의 발전이 눈에 띈다. 고품질 음성 데이터와 직접 선호 최적화(Direct Preference Optimization, DPO) 기술을 적용하여 억양, 감정, 호흡 등을 세밀하게 학습시켰다. 이를 통해 기쁨, 슬픔, 분노, 공포 등 상황별로 생생한 감정 표현은 물론, 미묘한 음색이나 어조 변화에 따른 감정까지 인식하고 표현하는 능력이 대폭 향상됐다.

 

더불어 호스트와 게스트가 대화를 나누는 '팟캐스트' 형태의 데이터셋 구축을 통해 끊김 없이 자연스럽게 이어지는 '멀티턴(Multi-turn) 대화'까지 가능해졌다. 벤치마크 평가 결과, Kanana-o는 영어 음성 성능 면에서는 GPT-4o와 유사한 수준을 보였으나, 한국어 음성 인식, 합성, 감정 인식 능력에서는 비교 모델 대비 월등히 높은 성과를 기록하며 한국어 기반 AI 대화의 새로운 표준을 제시했다.

 

이미지 검색 패러다임 변화: 'Kanana-v-embedding’

 

함께 공개된 ‘Kanana-v-embedding’은 이미지 기반 검색의 핵심 동력으로 작용하는 한국형 멀티모달 모델이다. 이 모델은 텍스트와 이미지를 동시에 이해하고 처리하여 텍스트로 이미지를 검색하거나, 특정 이미지와 관련된 정보를 탐색하고, 이미지가 포함된 문서를 찾아내는 등의 기능을 지원한다.

 

이 모델은 실질적인 서비스 적용을 염두에 두고 개발되었기에, 한국어와 한국 문화에 대한 이해도가 매우 탁월하다는 강점을 지닌다. '경복궁', '붕어빵' 같은 한국 고유명사뿐만 아니라, '하멜튼 치즈'처럼 오타가 포함된 단어까지도 문맥을 통해 정확한 이미지를 찾아낸다. 또한, '한복 입고 찍은 단체 사진'과 같은 복합적인 검색 조건도 정확히 해석하여, 조건의 일부에만 해당하는 사진을 걸러내는 높은 변별력을 갖췄다.

 

현재 Kanana-v-embedding은 카카오 내부 광고 소재의 유사도 분석 및 심사 시스템에 이미 적용되어 활용되고 있다. 카카오는 향후 적용 범위를 비디오나 음성 등 다른 모달리티로 확장하여 더욱 폭넓은 서비스에 이 기술을 적용할 계획이다.

 

카카오가 선보인 Kanana 시리즈는 한국어 기반 AI 기술의 현주소를 한 단계 끌어올렸다는 평가를 받는다. Kanana-o는 단순 정보 제공을 넘어 감정을 이해하고 의도를 파악하는 '인간적인 대화'를 구현하며, Kanana-v-embedding은 한국 문화와 맥락에 최적화된 검색 혁신을 예고한다. 이러한 기술력은 카카오 서비스 전반에 걸쳐 사용자 경험을 극적으로 개선하고, 국내외 AI 시장에서 카카오의 기술 리더십을 공고히 하는 핵심 동력이 될 것으로 기대된다.

 

김병학 카나나 성과리더는 "카카오의 자체 AI 모델 카나나는 단순한 정보 나열 수준을 넘어, 사용자의 감정을 이해하고 친숙하게 대화하는 AI가 되도록 한국적 맥락의 이해와 표현력을 높이는 데 주력했다"고 밝혔다. 카카오는 현재 온 디바이스 환경에서 동작하는 모델의 경량화 연구와 더불어, MoE(Mixture of Experts) 구조를 적용한 고성능·고효율 모델인 'Kanana-2' 개발을 준비하고 있다. 이처럼 카카오는 지속적인 기술 진화를 통해 일상 속에서 사람처럼 상호작용하는 AI 구현에 박차를 가하고 있으며, 향후 글로벌 AI 경쟁 구도에 큰 영향을 미칠 전망이다.

 

 

명인자 칼럼리스트 기자 88hagee@gmail.com
작성 2025.12.16 11:24 수정 2025.12.16 11:24

RSS피드 기사제공처 : AI지구백과저널 / 등록기자: 명인자 칼럼리스트 무단 전재 및 재배포금지

해당기사의 문의는 기사제공처에게 문의

댓글 0개 (/ 페이지)
댓글등록- 개인정보를 유출하는 글의 게시를 삼가주세요.
등록된 댓글이 없습니다.
Shorts NEWS 더보기
정부 서비스 700개 마비… 서울시는 왜 멀쩡했나
공모전 헌터들 주목! 상금 800만 원 걸린 배달특급 역대급 찬스
돌연사 원인 1위 심근병증, 이제 유전자로 미리 압니다.
전자담배는 괜찮다고요? 내일부터 10만 원 털립니다
한 번도 안 싸운 커플이 가장 위험한 이유
보는 게 아니라 직접 써본다? K의료기기 베트남 정복 시나리오
경기도가 세금 100억 넘게 태워서 꽃을 심는 진짜 이유
엉덩이 무거우면 돈 준다고? 경기도의 미친 챌린지 ㄷㄷ
병원 검사하다 방사선 더 맞는다? 기준 바뀐 이유
병원 가지 마세요, 한의사가 집으로 갑니다!” 경기도 역대급 복지 ㄷㄷ
용인특례시 보라동 행정복지센터 신축개청
파킨슨 환자 길치되면 치매 7.3배위험
DMZ 옆에 삼성이 온다고?" 경기도 접경지에 돈바람 불기 시작했다!
꽃피는 봄인데 왜 나만 우울할까?
4년 만에 45%가 사라졌다고? 경기도에서 벌어진 기적!
MZ 입맛 저격한 두바이 찹쌀떡부터 보양 끝판왕 흑염소까지
뇌는 잠들기 전 10분의 정보를 가장 중요하게 처리한다
폭락장에서 내 지갑 지키는 3단계 필살기
766억 기부한 이수영 이사장 "또" 서울대에 노벨과학상 인재육성 기부
우리 집 앞 도로, 2030년에 이렇게 바뀐다고?
베드로와 유다의 차이 한국어
가마지천 자전거
아직도 공중화장실 갈 때 구멍부터 확인하세요?
빚 때문에 인생의 끝을 고민하고 계신가요
자전거 타기와 인생은 똑 같다. 자전거와 인생 이야기 #쇼츠 #short..
자산 30억인데 밥 굶는다? 강남 노인들의 눈물겨운 흑자 도산
디알젬의 거침없는 진격: 초음파까지 접수 완료!
삼성의 역습? 엔비디아의 1,500조 파트너 낙점!
유튜브 NEWS 더보기

일론 머스크의 경고, 2030년 당신의 책상은 사라진다

부의 이동심리, 타워팰리스가 던지는 경제적 신호

그대는 소중한 사람 #유활의학 #마음챙김 #휴식

나 홀로 뇌졸중, 생존 확률 99% 높이는 실전 매뉴얼

숨결처럼 다가온 희망. 치유.명상.수면.힐링

통증이 마법처럼 사라지다./유활도/유활의학/유활파워/류카츠대학/기치유

O자 다리 한국, 칼각 일본? 앉는 습관 하나가 평생 건강을 좌우한다

겨울마다 돌아오는 ‘급성 장폭풍’… 노로바이러스, 아이들 먼저 덮쳤다

아오모리 강진, 철도·항만·도심 모두 멈췄다… 충격 확산

경기도, 숨겨진 가상자산까지 추적했다… 50억 회수한 초정밀 징수혁신으로 대통령상 수상

간병 파산 막아라... 경기도 'SOS 프로젝트' 1천 가구 숨통 틔웠다 120만 원의 기적,...

100세 시대의 진짜 재앙은 '빈곤'이 아닌 '고독', 당신의 노후는 안전합니까...

브레이크 밟았는데 차가 '쭉'... 눈길 미끄러짐, 스노우 타이어만 믿다간 '낭패...

"AI도 설렘을 알까?"... 첫눈 오는 날 GPT에게 '감성'을 물었더니

응급실 뺑뺑이 없는 경기도, '적기·적소·적시' 치료의 새 기준을 세우다

GTX·별내선·교외선이 바꾼 경기도의 하루… 이동이 빨라지자 삶이 달라졌다

행복은 뇌에서 시작된다. 신경과학이 밝혀낸 10가지 습관

행복은 뇌에서 시작된다 신경과학이 밝혀낸 10가지 습관

자신을 칭찬할 수 있는 용기, 삶을 존중하는 가장 아름다운 습관

아이젠사이언스생명연, AI 신약 개발 초격차 확보 전략적 동행