google.com, pub-9952897869402010, DIRECT, f08c47fec0942fa0

알리바바, 전모달(全模态大模型) AI 경쟁 판도 바꾸다

Qwen3.5-Omni, 음성·영상 통합 이해 성능 강화

실시간 상호작용 능력, 인간 수준 근접 평가

215개 글로벌 평가에서 SOTA 달성

알리바바(Alibaba, 阿里巴巴)가 3월 30일 차세대 전모달 인공지능 모델 ‘첸원3.5-옴니(Qwen3.5-Omni, 千问3.5-Omni)’를 공개하며 글로벌 AI 경쟁 구도에 변화를 예고했다. 해당 모델은 음성, 영상, 텍스트를 통합 이해하는 능력을 기반으로 기존 주요 모델 대비 성능 우위를 확보한 것으로 평가된다.

 

최근 글로벌 AI 시장은 텍스트 중심에서 음성·영상까지 확장된 ‘전모달’ 경쟁으로 빠르게 재편되고 있다. 이러한 흐름 속에서 알리바바가 공개한 첸원3.5-옴니는 단순한 기능 확장이 아닌 구조적 접근 방식의 변화를 제시했다는 점에서 주목된다.

 

[이미지설명]=미래형 인공지능 환경을 배경으로 음성, 영상, 텍스트 데이터를 동시에 처리하는 전모달 AI의 개념을 시각화한 이미지로, 다양한 인터페이스와 실시간 상호작용 기술이 구현된 장면. 이미지생성=ChatGPT

 

기존 다수의 멀티모달 모델이 음성을 텍스트로 변환한 뒤 처리하는 방식이었다면, 해당 모델은 혼합 어텐션 기반 MoE 구조를 통해 텍스트, 이미지, 음성, 영상 데이터를 통합적으로 학습했다. 이는 1억 시간 이상의 음영상 데이터를 활용한 엔드투엔드 학습 결과로, 장면 이해와 감정 인식, 대화 맥락 파악 능력을 동시에 확보했다는 특징이 있다.

 

성능 측면에서도 글로벌 경쟁력을 입증했다. 첸원3.5-옴니는 총 215개 외부 평가에서 최고 성능을 의미하는 SOTA를 기록했으며, 특히 음성 인식과 생성 영역에서 구글의 제미니(Gemini) 계열 모델 대비 낮은 오류율과 높은 자연스러움을 보인 것으로 나타났다. 113개 언어 및 방언 인식과 36개 언어 음성 합성 지원 역시 다국어 환경에서의 활용성을 높이는 요소로 평가된다.

 

주목할 부분은 실시간 상호작용 능력이다. 해당 모델은 사용자 발화 중 실제 명령과 단순 반응을 구분하고, 필요 시 외부 도구를 호출하는 판단 기능을 갖췄다. 이는 단순 응답 생성 단계를 넘어 ‘상황 인지 기반 AI’로 진화하고 있음을 보여준다.

 

또한 영상 기반 입력을 통한 개발 환경도 변화 가능성을 제시한다. 사용자가 카메라를 통해 아이디어를 설명하면 UI가 포함된 프로토타입 코드가 자동 생성되는 방식은 기존 텍스트 기반 개발 흐름을 단축시키는 요소로 작용할 수 있다. 이는 제품 기획자와 디자이너 중심의 개발 프로세스에도 영향을 미칠 것으로 보인다.

 

콘텐츠 산업에서의 활용 가능성도 확대되고 있다. 첸원3.5-옴니는 장시간 영상 및 음성을 분석해 장면 분할, 감정 흐름 파악, 타임라인 자동 생성 기능을 수행할 수 있다. 이에 따라 영상 편집, 콘텐츠 검수, 라이브 방송 관리 등 노동 집약적 작업의 자동화가 가능해질 것으로 예상된다.

 

상업화 전략 역시 시장 확산을 고려한 구조다. 알리바바는 해당 모델을 알리윈 바이롄(Alibaba Cloud Bailian, 阿里云百炼) 플랫폼을 통해 API 형태로 제공하며, 가격 경쟁력을 강조하고 있다. 입력 기준 토큰 비용은 글로벌 경쟁 모델 대비 10분의 1 수준으로 책정된 것으로 알려졌다.

 

현재 첸원 시리즈는 중국 기업용 AI 시장에서 약 100만 개 이상의 기업 고객을 확보한 상태다. 이는 기술 경쟁뿐 아니라 가격, 접근성, 생태계 전략이 동시에 작용한 결과로 해석된다.

 

이번 발표는 한국 AI 산업에도 시사점을 제공한다. 그동안 글로벌 시장은 오픈AI(OpenAI)와 구글 중심으로 기술 흐름이 형성돼 왔으나, 알리바바의 사례는 특정 영역에서의 집중적 기술 우위와 가격 전략이 충분한 경쟁력을 가질 수 있음을 보여준다.

 

향후 AI 시장은 단순 성능 경쟁을 넘어, 특정 산업에 최적화된 활용성과 비용 효율성을 중심으로 재편될 가능성이 높다. 첸원3.5-옴니의 등장은 이러한 변화의 방향성을 보여주는 사례로 평가된다.

 

[이 기사의 저작권은 이비즈타임즈에 있습니다]

 

윤교원 대표 / The K Media & Commerce, kyoweon@naver.com

작성 2026.04.01 12:03 수정 2026.04.01 13:53

RSS피드 기사제공처 : 이비즈타임즈 / 등록기자: 윤교원 무단 전재 및 재배포금지

해당기사의 문의는 기사제공처에게 문의

댓글 0개 (/ 페이지)
댓글등록- 개인정보를 유출하는 글의 게시를 삼가주세요.
등록된 댓글이 없습니다.
Shorts NEWS 더보기
경기도가 세금 100억 넘게 태워서 꽃을 심는 진짜 이유
엉덩이 무거우면 돈 준다고? 경기도의 미친 챌린지 ㄷㄷ
병원 검사하다 방사선 더 맞는다? 기준 바뀐 이유
병원 가지 마세요, 한의사가 집으로 갑니다!” 경기도 역대급 복지 ㄷㄷ
용인특례시 보라동 행정복지센터 신축개청
파킨슨 환자 길치되면 치매 7.3배위험
DMZ 옆에 삼성이 온다고?" 경기도 접경지에 돈바람 불기 시작했다!
꽃피는 봄인데 왜 나만 우울할까?
4년 만에 45%가 사라졌다고? 경기도에서 벌어진 기적!
MZ 입맛 저격한 두바이 찹쌀떡부터 보양 끝판왕 흑염소까지
뇌는 잠들기 전 10분의 정보를 가장 중요하게 처리한다
폭락장에서 내 지갑 지키는 3단계 필살기
766억 기부한 이수영 이사장 "또" 서울대에 노벨과학상 인재육성 기부
우리 집 앞 도로, 2030년에 이렇게 바뀐다고?
베드로와 유다의 차이 한국어
가마지천 자전거
아직도 공중화장실 갈 때 구멍부터 확인하세요?
빚 때문에 인생의 끝을 고민하고 계신가요
자전거 타기와 인생은 똑 같다. 자전거와 인생 이야기 #쇼츠 #short..
자산 30억인데 밥 굶는다? 강남 노인들의 눈물겨운 흑자 도산
디알젬의 거침없는 진격: 초음파까지 접수 완료!
삼성의 역습? 엔비디아의 1,500조 파트너 낙점!
벤츠E 300 주행후기, 음이온 2억개 공기정화, 연비향상 50%가 동시..
내 아이 입으로 들어가는 건 무조건 확인! 경기도 농업의 미친 변화
주말에 뭐해? 도서관에서 갓생 살자!
봄의 생명력으로 마음을 채우다
중동발 경제 한파 터졌다! 한일 재무수장 도쿄서 긴급 회동, 왜?
중동발 경제 쇼크, 우리는 살아남을 수 있을까요?
유튜브 NEWS 더보기

일론 머스크의 경고, 2030년 당신의 책상은 사라진다

부의 이동심리, 타워팰리스가 던지는 경제적 신호

그대는 소중한 사람 #유활의학 #마음챙김 #휴식

나 홀로 뇌졸중, 생존 확률 99% 높이는 실전 매뉴얼

숨결처럼 다가온 희망. 치유.명상.수면.힐링

통증이 마법처럼 사라지다./유활도/유활의학/유활파워/류카츠대학/기치유

O자 다리 한국, 칼각 일본? 앉는 습관 하나가 평생 건강을 좌우한다

겨울마다 돌아오는 ‘급성 장폭풍’… 노로바이러스, 아이들 먼저 덮쳤다

아오모리 강진, 철도·항만·도심 모두 멈췄다… 충격 확산

경기도, 숨겨진 가상자산까지 추적했다… 50억 회수한 초정밀 징수혁신으로 대통령상 수상

간병 파산 막아라... 경기도 'SOS 프로젝트' 1천 가구 숨통 틔웠다 120만 원의 기적,...

100세 시대의 진짜 재앙은 '빈곤'이 아닌 '고독', 당신의 노후는 안전합니까...

브레이크 밟았는데 차가 '쭉'... 눈길 미끄러짐, 스노우 타이어만 믿다간 '낭패...

"AI도 설렘을 알까?"... 첫눈 오는 날 GPT에게 '감성'을 물었더니

응급실 뺑뺑이 없는 경기도, '적기·적소·적시' 치료의 새 기준을 세우다

GTX·별내선·교외선이 바꾼 경기도의 하루… 이동이 빨라지자 삶이 달라졌다

행복은 뇌에서 시작된다. 신경과학이 밝혀낸 10가지 습관

행복은 뇌에서 시작된다 신경과학이 밝혀낸 10가지 습관

자신을 칭찬할 수 있는 용기, 삶을 존중하는 가장 아름다운 습관

아이젠사이언스생명연, AI 신약 개발 초격차 확보 전략적 동행