기사 메일전송

카카오, 국내 최고 성능 경량 멀티모달·국내 최초 MoE 모델 동시 오픈소스 공개

  • 최인미 기자
  • 등록 2025-07-24 16:29:36
기사수정
  • 카카오톡 운영 경험 기반 `독자 AI 파운데이션 모델 프로젝트` 박차
  • 이미지 이해 능률 탁월한 `Kanana-1.5-v-3b`…GPT-4o와 견줄 성능 과시
  • 비용 효율 혁신 `MoE 모델` 국내 첫 공개…AI 개발 트렌드 선도

카카오가 자체 개발한 AI 기술력을 다시 한번 입증하며 국내 AI 생태계에 새로운 활력을 불어넣고 있다. 지난 5월 언어모델 4종 공개에 이어 약 두 달 만에 국내 공개 모델 중 최고 성능을 자랑하는 경량 멀티모달 언어모델과 국내 최초로 MoE(Mixture of Experts) 모델을 오픈소스로 공개했다고 24일 밝혔다.

 

카카오(대표이사 정신아)는 24일 허깅페이스를 통해 이미지 정보 이해 및 지시 이행 능력을 갖춘 경량 멀티모달 언어모델 `Kanana-1.5-v-3b`와 MoE 언어모델 `Kanana-1.5-15.7b-a3b`를 공개했다.

카카오(대표이사 정신아)는 오늘 허깅페이스를 통해 이미지 정보 이해 및 지시 이행 능력을 갖춘 경량 멀티모달 언어모델 `Kanana-1.5-v-3b`와 MoE 언어모델 `Kanana-1.5-15.7b-a3b`를 공개했다. 이는 카카오가 독자적인 모델 설계 기반의 기술 경쟁력을 지속적으로 강화하고 있음을 보여주는 대목이다.

 

정부가 추진하는 `독자 AI 파운데이션 모델 프로젝트`에 참여하고 있는 카카오는 이러한 자체 모델 개발 역량과 카카오톡 등 대규모 서비스 운영 경험을 바탕으로 전 국민의 AI 접근성을 높이고 국가 AI 경쟁력 강화에 기여하겠다는 방침이다.

 

이미지와 텍스트를 동시에 처리하는 경량 멀티모달 언어모델 `Kanana-1.5-v-3b`는 지난 5월 공개된 Kanana 1.5 모델을 기반으로 한다. 이 모델은 개발의 처음부터 마지막 단계까지 카카오의 자체 기술로 구축하는 `프롬 스크래치(From Scratch)` 방식으로 개발되었다.

 

`Kanana-1.5-v-3b`는 이용자의 질문 의도를 정확히 이해하는 높은 지시 이행 성능과 뛰어난 한국어·영어 이미지 이해 능력을 자랑한다.

 

경량 모델임에도 이미지로 표현된 한국어와 영어 문서 이해 능력은 글로벌 멀티모달 언어모델인 GPT-4o와 견줄 만한 수준이며, 한국어 벤치마크에서는 유사 사이즈의 국내외 공개 모델 중 최고 점수를 기록했다.

 

카카오는 인간 선호 반영 학습(Human Preference Alignment Training)과 지식 증류(Knowledge Distillation) 기술을 통해 이 모델의 성능을 극대화했다고 설명했다.

 

이를 통해 `Kanana-1.5-v-3b`는 이미지 및 글자 인식, 동화 및 시 창작, 국내 문화유산 및 관광지 인식, 도표 이해, 수학 문제풀이 등 다양한 분야에서 유연하게 활용될 수 있다.

 

이와 함께 카카오는 국내 최초로 MoE(Mixture of Experts) 구조의 언어모델 `Kanana-1.5-15.7b-a3b`를 오픈소스로 공개했다. MoE 모델은 입력 데이터 처리 시 모든 파라미터가 연산에 참여하는 기존 `밀집(Dense)` 모델과 달리, 특정 작업에 최적화된 일부 전문가 모델만 활성화되어 컴퓨팅 자원 활용 효율성과 비용 절감에 강점을 가진다.

 

이러한 장점으로 MoE는 글로벌 AI 모델 개발의 새로운 트렌드로 자리 잡고 있다. `Kanana-1.5-15.7b-a3b`는 전체 15.7B 파라미터 중 추론 시 약 3B 파라미터만 활성화되며, `업사이클링(Upcycling)` 방식을 적용해 효율적으로 개발되었다.

 

활성화되는 파라미터가 3B에 불과함에도 성능은 `Kanana-1.5-8B`와 동등하거나 그 이상을 기록해, 고성능 AI 인프라를 저비용으로 구축하고자 하는 기업이나 연구 개발자들에게 큰 도움이 될 것으로 기대된다.

 

카카오는 이번 오픈소스 공개를 통해 AI 모델 생태계에 새로운 기준을 제시하고, 더 많은 연구자와 개발자가 효율적이고 강력한 AI 기술을 자유롭게 활용할 수 있는 기반을 마련해 나갈 계획이다.

 

김병학 카나나 성과리더는 "이번 오픈소스 공개는 비용 효율성과 성능이라는 유의미한 기술 개발의 성과를 거둔 것으로, 단순한 모델 아키텍처의 진보를 넘어 서비스 적용과 기술 자립이라는 두 가지 측면의 목표에 부합하는 결과물"이라고 밝혔다.

 

카카오는 자체 기술 기반의 모델을 지속적으로 고도화하고, 글로벌 플래그십 수준의 초거대 모델 개발에 도전하며 국내 AI 생태계의 자립성과 기술 경쟁력 강화에 기여할 방침이다.

 

0
포토뉴스더보기
이전 기사 보기 다음 기사 보기
많이 본 뉴스더보기
  1. 이재용 '부당합병·회계부정' 무죄 확정…4년 10개월 재판 끝났다 이재용 삼성전자 회장이 삼성물산과 제일모직의 부당합병 및 삼성바이오로직스 회계부정 혐의로 재판에 넘겨진 지 4년 10개월 만에 무죄를 확정받았다.대법원 3부(주심 오석준 대법관)는 17일 자본시장법상 부정거래행위·시세조종, 업무상 배임 등 혐의로 기소된 이 회장에 대해 1·2심과 같은 무죄 판결을 내리고 검찰의 상고를 기...
  2. 온라인 플랫폼이 불러온 자영업 양극화…“성장잠재력 있는 곳에 금융 집중해야” 온라인 플랫폼의 확산이 자영업자의 양극화를 심화시키고 있다는 분석 속에, 정부의 자영업 금융지원이 성장잠재력이 큰 업체에 집중돼야 한다는 제언이 나왔다.정희완 한국은행 지역경제조사팀 과장은 17일 광주 김대중컨벤션센터에서 열린 ‘2025 BOK 지역경제 심포지엄’에서 “온라인 플랫폼 성장은 자영업 경영성과의 격차를 .
  3. 김민석 총리 "제2의 IMF급 경제위기, 범국가적 에너지 모아야" 김민석 국무총리가 16일 경주에서 열린 제48회 대한상의 하계포럼 개회식에서 현재 경제상황을 `제2의 IMF`에 비유하며 구조적·복합적 위기 극복을 위한 범국가적 에너지 결집을 강조했다.김민석 국무총리는 16일 오후 경주 라한셀렉트 호텔에서 개최된 제48회 대한상의 하계포럼 개회식에서 기조강연을 통해 현재 경제 상황에 대한 강한 ...
  4. KB부동산, LH청약전용관 서비스 선보여 KB국민은행(은행장 이환주)은 부동산 종합 플랫폼 ‘KB부동산’에서 공공 청약 정보를 통합 제공하는 ‘LH청약전용관’ 서비스를 출시했다. 이번 서비스는 지난해 12월 KB국민은행과 한국토지주택공사(LH) 간 업무협약(MOU)을 기반으로 민간 플랫폼 중에서는 최초로 LH분양주택의 청약 관련 정보를 제공하는 서비스다. ‘LH청약전용관’은 청약 ...
  5. 올해 2분기 부패·공익신고자 44명에 6억5천만 원 보상금 지급 국민권익위원회(위원장 유철환)는 올해 2분기 동안 부패 및 공익침해행위를 신고한 44명에게 총 6억 5천만 원 규모의 보상금을 지급했다고 17일 밝혔다. 이들의 신고를 통해 공공기관이 회복 결정한 수입은 약 65억 원에 달한다.분야별로는 ▴연구개발 1억 9천만 원(28.4%) ▴의료 1억 7천만 원(26.2%) ▴산업 1억 4천만 원(21.7%) 등 세 분야가 전체 보.
  6. 배우 박보검, 2025 한국 관광 명예홍보대사 위촉…‘출구 없는 매력’ 알린다 ‘출구 없는 매력의 한국 관광’을 알릴 새로운 얼굴로 배우 박보검이 나선다. 문화체육관광부와 한국관광공사는 오는 7월 29일 ‘2025 한국 관광 명예홍보대사’로 박보검을 공식 위촉하고, 글로벌 홍보 캠페인 ‘네버 엔딩 코리아(Never Ending Korea)’를 본격적으로 시작한다.문체부는 24일, 한국 관광 홍보 유튜브 채널 ‘I...
  7. 美 25% 상호관세 D-7… 정부, 막판 총력전 속 '윈-윈' 해법 찾나 도널드 트럼프 미국 대통령이 한국에 25% 상호관세를 부과하겠다고 통보한 시한이 일주일 앞으로 다가오면서, 한국 정부는 8월 1일 전 협상 타결을 목표로 막판 총력을 기울이고 있다. 트럼프 행정부도 한국과의 협상 상황을 "생산적"이라고 평가하며 계속 협상하겠다는 의지를 보여, 양국이 조만간 합의점에 근접할 수 있다는 관측이 조심스.
모바일 버전 바로가기