LLM 7

좋은 LLM 찾기 - 벤치마크 기준으로

벤치마크는 편하지만, 그대로 받아들이기는 어렵다.LLM은 전례 없는 속도로 발전하며 인공지능 분야의 혁신을 주도하고 있다. ChatGPT, Gemini, Llama, 딥시크 등 LLM 개발 경쟁은 날로 치열해지고 있다. 이러한 경쟁 환경 속에서 새로운 모델과 업데이트 버전이 끊임없이 출시되고 있다. 사용자들은 가장 좋은 LLM을 찾기위해 노력하고 있고, 개발사들은 자사 모델의 우수성을 입증하고 싶어한다.이처럼 치열한 경쟁 속에서 LLM의 성능을 객관적으로 측정하고 비교하는 기준의 중요성은 더욱 커지고 있다. 현재 LLM의 능력을 정량화하고 비교하는 사실상의 표준은 바로 '벤치마크(benchmark)'다. 벤치마크는 모델의 추론, 코딩, 언어 이해, 수학 문제 해결 등 다양한 능력을 평가하기 위한 표준화된..

LLM 2025.04.23

LMStudio로 오픈소스 LLM 시작하기

들어가며ChatGPT, Gemini 등 상용 서비스로 이용하기 좋은 LLM(대규모 언어 모델)도 있지만, 오픈소스로 제공되는 LLM은 바로 활용하기가 어려운 경우가 많습니다. 그러나 오픈소스 LLM은 자유도가 높아 사용자의 필요에 맞게 맞춤형으로 활용할 수 있다는 장점이 있습니다. 최근에는 이런 오픈소스 LLM을 더욱 쉽게 활용할 수 있도록 돕는 도구들이 다수 출시되었으며, 오늘은 그중 하나인 LMStudio를 소개하려고 합니다.LMstudio의 장점간편성처음 시작하기 매우 간편하다. https://lmstudio.ai/ ChatGPT, Gemini 등 상용 서비스로 이용하기 좋은 LLM(대규모 언어 모델)도 있지만, 오픈소스로 제공되는 LLM은 바로 활용하기가 어려운 경우가 많습니다. 그러나 오픈소스 ..

LLM 2025.01.12

알리바바 큐원(Qwen) 2.5: 새로운 오픈소스 LLM

큐원(Qwen) 2.5는 알리바바 클라우드가 개발한 최신 대규모 언어 모델로, 다양한 기능과 성능 향상을 통해 인공지능 분야에서 주목받고 있습니다. 이번 글에서는 큐원 2.5의 새로운 기능과 개선 사항, 활용 사례 및 응용 분야, 그리고 모델의 한계와 향후 발전 방향에 대해 자세히 살펴보겠습니다. 큐원 2 및 2.5와의 차이점다국어 지원 강화: 큐원 2.5는 영어, 중국어, 한국어, 일본어 등 주요 언어를 포함한 29개 이상의 언어를 지원하며, 이를 통해 다양한 언어 환경에서의 활용도가 높아졌습니다.코딩 및 수학 성능 향상: 큐원 2.5는 코딩 및 수학 분야에서의 성능을 강화하였으며, 별도의 모델을 제작하여 특정 도메인에 더 강한 모델을 출시하였습니다. 큐원 2.5의 모델 출시 현황모델 크기 및 성능: ..

LLM 2024.12.15

라마 3.3 출시: 3.1, 3.2와의 차이점과 새로운 가능성

인공지능 언어 모델의 발전은 현대 기술 혁신의 핵심 동력 중 하나로 자리매김하고 있습니다. 그중에서도 메타(Meta)의 라마(Llama) 시리즈는 오픈 소스 커뮤니티와 연구자들에게 큰 주목을 받아왔습니다. 최근 발표된 라마 3.3은 이전 버전들과 비교하여 성능과 효율성 면에서 획기적인 개선을 이루어냈습니다. 이번 글에서는 라마 3.3의 출시일과 함께, 라마 3.1 및 3.2와의 주요 차이점, 그리고 새롭게 출시된 모델의 크기와 성능에 대해 자세히 살펴보겠습니다. 1. Llama 3.1 및 3.2와의 차이점모델 구조 개선: Llama 3.3은 이전 버전인 Llama 3.1 및 3.2와 비교하여 성능과 효율성 면에서 상당한 발전을 이루었습니다. Llama 3.1은 기존 Transformer 아키텍처를 사용하..

LLM 2024.12.15

ChatGPT o1: 새로운 AI 모델의 등장과 그 의미

지난달 OpenAI에서 새로운 AI 모델인 ChatGPT o1이 출시되었습니다. 이 모델은 이전 버전들과는 다른 독특한 기능과 성능을 갖추고 있어 많은 주목을 받고 있습니다. 특히 눈에 띄는 점은, ChatGPT o1이 추론 과정을 보여준다는 점입니다. 질문을 듣고 대답을 출력하기까지의 과정을 상세히 설명해주기 때문에, 사용자가 답변이 어떻게 도출되었는지 쉽게 이해할 수 있습니다. 이러한 기능은 이전 모델들과 차별화되는 중요한 요소로 자리 잡고 있습니다.ChatGPT o1의 적용 사례제가 직접 사용해본 결과, 특히 대학교 교재의 연습문제에 답이 없는 경우에 ChatGPT o1이 큰 도움이 될 것이라고 생각합니다. 연습문제는 정해진 답이 없을 때가 많아, 논리적 추론이 요구되는데, 이 모델은 이러한 문제 ..

LLM 2024.10.14

LLama 3.2의 출시: 가정용 PC에서도 가능해진 LLM

LLama 3.2가 새롭게 출시되었습니다. 이번 버전에서 가장 인상 깊었던 점은 모델의 크기가 작아졌다는 것입니다. LLama 3.1에서는 가장 작은 모델이 8B였지만, 이번 LLama 3.2에서는 1B, 3B 모델까지 출시되었습니다. 이로 인해 상대적으로 작은 GPU를 보유한 사용자들도 부담 없이 LLM(대규모 언어 모델)을 활용할 수 있게 되었습니다. 작은 모델의 등장과 그 의미1B, 3B 모델의 출시는 특히 고사양 GPU가 없는 사용자들에게 희소식입니다. 8B 이상의 대형 모델을 실행하기에는 고성능 GPU와 많은 메모리가 필요했지만, 이번에는 3GB 정도의 메모리만으로도 충분히 사용할 수 있게 되었습니다. LLama 3.1의 8B 모델과 비교하면 성능 면에서는 다소 떨어지지만, 중요한 것은 이제 훨..

LLM 2024.09.30

EXAONE 사용 후기

LG AI 연구원에서 만든 EXAONE이 공개되었다고해서 한번 사용해보았다.  예제 코드가 잘 되어있으니 바로 쓸 수 있었다.  참고 사항- 개인 계정의 토큰으로 로그인이 필요했다. 실행 결과 (서버컴으로 할때는 되었는데, 예시를 보여줄려고 집컴으로 했더니 안된다..ㅠ)내가 서버컴으로 했을때의 경험을 이야기하면,1. 말을 잘 생성한다는 느낌을 받았다. 2. 같은 질문을 입력하면 똑같은 대답이 나온다.- chatgpt같은 다른 LLM 모델과 다른 이질적인 느낌이 들었다. - 질문에 마침표 몇개만 추가해도 비슷하지만 다른 결과가 나옴-(추가) 아마도 LLM 캐시로 인해서 같은 답이 나오는 것 같음3. 할루시네이션을 막기위해 노력한 것은 보임- 특정 잘못된 질문을 해봐도 사실과 거짓을 잘 분류해서 알려줌- 그..

LLM 2024.08.13