LLM

알리바바 큐원(Qwen) 2.5: 새로운 오픈소스 LLM

돌돌55 2024. 12. 15. 16:26

큐원(Qwen) 2.5는 알리바바 클라우드가 개발한 최신 대규모 언어 모델로, 다양한 기능과 성능 향상을 통해 인공지능 분야에서 주목받고 있습니다. 이번 글에서는 큐원 2.5의 새로운 기능과 개선 사항, 활용 사례 및 응용 분야, 그리고 모델의 한계와 향후 발전 방향에 대해 자세히 살펴보겠습니다.

 

큐원 2 및 2.5와의 차이점

다국어 지원 강화: 큐원 2.5는 영어, 중국어, 한국어, 일본어 등 주요 언어를 포함한 29개 이상의 언어를 지원하며, 이를 통해 다양한 언어 환경에서의 활용도가 높아졌습니다.
코딩 및 수학 성능 향상: 큐원 2.5는 코딩 및 수학 분야에서의 성능을 강화하였으며, 별도의 모델을 제작하여 특정 도메인에 더 강한 모델을 출시하였습니다.

 

큐원 2.5의 모델 출시 현황

모델 크기 및 성능: 큐원 2.5는 0.5B, 1.5B, 3B, 7B, 14B, 32B, 72B 등 다양한 크기의 모델을 제공하며, 이를 통해 다양한 하드웨어 환경에서 활용이 가능합니다. 특히, 큐원 2.5-72B 모델은 MMLU 등 여러 벤치마크에서 Llama 3-70B 모델을 상회하는 성능을 보였습니다.

 

앞으로도 알리바바의 큐원 시리즈는 AI 언어 모델의 발전과 함께 다양한 산업 분야에서의 활용 가능성을 넓혀갈 것으로 기대됩니다. 이를 통해 AI 기술의 혁신이 더욱 가속화될 것입니다.