LLM 11

좋은 LLM 찾기 - 벤치마크 기준으로

벤치마크는 편하지만, 그대로 받아들이기는 어렵다.LLM은 전례 없는 속도로 발전하며 인공지능 분야의 혁신을 주도하고 있다. ChatGPT, Gemini, Llama, 딥시크 등 LLM 개발 경쟁은 날로 치열해지고 있다. 이러한 경쟁 환경 속에서 새로운 모델과 업데이트 버전이 끊임없이 출시되고 있다. 사용자들은 가장 좋은 LLM을 찾기위해 노력하고 있고, 개발사들은 자사 모델의 우수성을 입증하고 싶어한다.이처럼 치열한 경쟁 속에서 LLM의 성능을 객관적으로 측정하고 비교하는 기준의 중요성은 더욱 커지고 있다. 현재 LLM의 능력을 정량화하고 비교하는 사실상의 표준은 바로 '벤치마크(benchmark)'다. 벤치마크는 모델의 추론, 코딩, 언어 이해, 수학 문제 해결 등 다양한 능력을 평가하기 위한 표준화된..

LLM 2025.04.23

ChatGPT-4o의 이미지 생성 기능, 무엇이 달라졌고, 무엇이 문제인가?

새로운 모델 GPT-4o의 도입 (DALL·E 3에서 업그레이드)OpenAI는 2025년 3월 말 ChatGPT의 이미지 생성 엔진을 대폭 개선하며, 기존에 사용되던 DALL·E 3 모델을 GPT-4o로 교체했습니다. GPT-4o는 원래 GPT-4 기반의 멀티모달(multimodal) 모델로, 텍스트뿐만 아니라 이미지를 직접 생성 및 편집할 수 있도록 훈련되었습니다. 이번 업그레이드를 통해 ChatGPT는 내장 모델로 이미지를 만들어내므로, DALL·E 3를 별도로 호출하던 이전보다 일관되고 자연스러운 이미지 생성 경험을 제공하게 되었습니다. 다만 GPT-4o 모델은 DALL·E 3보다 생성 속도가 약간 느리지만, 그만큼 더 정확하고 세밀한 이미지를 생성하는 것이 특징입니다. 또한 GPT-4o는 기존 이..

LLM 2025.04.01

ChatGPT 심층 리서치(Deep Research) 사용 후기: 빠른 자료 조사와 신뢰도 높은 정보 얻기

ChatGPT Deep Research 사용 후기 최근 ChatGPT Pro를 구독하며 새로 추가된 Deep Research 기능을 직접 사용해보았습니다. 예상보다 훨씬 유용한 기능이어서, 일종의 ‘개인 연구 비서’를 두는 듯한 인상을 받았는데요. 본 포스트에서는 해당 기능을 사용해본 과정과 소감을 간단히 정리해 공유하고자 합니다. 특징 : 빠른 자료 수집과 명확한 출처 표기새로운 주제를 조사할 때, 보통은 구글 검색을 여러 번 반복해야 합니다. 그러나 Deep Research를 활용하면 ChatGPT가 방대한 자료를 한 번에 모아 요약해주므로 정보 수집 시간이 크게 단축됩니다. 직접 검색해 정리하는 데 몇 시간이 걸렸을 작업을 단 몇 분 만에 개요 수준으로 파악할 수 있었죠. 또한 가장 인상적이었..

LLM 2025.02.23

ChatGPT 모델 o1, o3, 4o 비교 분석

들어가며ChatGPT가 하나의 모델이 아닌 여러 가지 특성을 지닌 모델 제품군으로 확장됨에 따라, 사용자는 목적에 맞게 최적의 모델을 선택하거나 조합하는 것이 중요해졌습니다. 모델들의 특징과 성능을 비교 분석하였고, 창의적 활용 환경에서의 유의점도 살펴보았습니다. GPT-4o 및 4o Mini멀티모달 대응, 빠른 응답, 저렴한 비용이 장점이며, 창의적 표현력도 좋아 일반용도 및 크리에이티브 작업에 적합합니다. 4o Mini는 대량 처리 업무에 효율적이지만 복잡한 추론이나 고품질 창작에는 한계가 있습니다.o1 (Mini/Pro 포함)심층 논리 추론과 고난도 문제 해결에 특화되어 있습니다. CoT 기반 강화학습으로 추론 정확도는 뛰어나나, 응답 지연과 비용 부담이 크고 창의적 용도에는 부적합합니다. Pro ..

LLM 2025.02.17

ChatGPT Pro 1일차 사용후기

안녕하세요! 오늘은 제가 챗지피티 프로를 처음 사용해본 후기를 공유해드리려고 합니다. ‘프로’라는 단어에서 알 수 있듯, 일반 버전보다 한 단계 업그레이드된 기능들이 제공되어서 상당히 흥미롭고 유용하게 느껴졌어요. 혹시 사용을 고민하시는 분들을 위해, 제가 첫날 사용하면서 느낀 점과 함께 챗지피티 프로에 포함된 것들, 그리고 그중 핵심 기능인 o1 Pro 모델과 Deep Research가 무엇인지 정리해보았습니다.주요 기능Deep Research(심층 리서치) 기능프로 버전에서는 더욱 전문적인 자료조사가 가능하도록, 대화형 서치 및 분석 기능을 한층 강화한 Deep Research 모드가 지원됩니다.일반 대화 모드와 달리, ‘Deep Research’ 모드를 활성화하면, 질문에 대한 보다 폭넓고 심층적인..

LLM 2025.02.13

LMStudio로 오픈소스 LLM 시작하기

들어가며ChatGPT, Gemini 등 상용 서비스로 이용하기 좋은 LLM(대규모 언어 모델)도 있지만, 오픈소스로 제공되는 LLM은 바로 활용하기가 어려운 경우가 많습니다. 그러나 오픈소스 LLM은 자유도가 높아 사용자의 필요에 맞게 맞춤형으로 활용할 수 있다는 장점이 있습니다. 최근에는 이런 오픈소스 LLM을 더욱 쉽게 활용할 수 있도록 돕는 도구들이 다수 출시되었으며, 오늘은 그중 하나인 LMStudio를 소개하려고 합니다.LMstudio의 장점간편성처음 시작하기 매우 간편하다. https://lmstudio.ai/ ChatGPT, Gemini 등 상용 서비스로 이용하기 좋은 LLM(대규모 언어 모델)도 있지만, 오픈소스로 제공되는 LLM은 바로 활용하기가 어려운 경우가 많습니다. 그러나 오픈소스 ..

LLM 2025.01.12

알리바바 큐원(Qwen) 2.5: 새로운 오픈소스 LLM

큐원(Qwen) 2.5는 알리바바 클라우드가 개발한 최신 대규모 언어 모델로, 다양한 기능과 성능 향상을 통해 인공지능 분야에서 주목받고 있습니다. 이번 글에서는 큐원 2.5의 새로운 기능과 개선 사항, 활용 사례 및 응용 분야, 그리고 모델의 한계와 향후 발전 방향에 대해 자세히 살펴보겠습니다. 큐원 2 및 2.5와의 차이점다국어 지원 강화: 큐원 2.5는 영어, 중국어, 한국어, 일본어 등 주요 언어를 포함한 29개 이상의 언어를 지원하며, 이를 통해 다양한 언어 환경에서의 활용도가 높아졌습니다.코딩 및 수학 성능 향상: 큐원 2.5는 코딩 및 수학 분야에서의 성능을 강화하였으며, 별도의 모델을 제작하여 특정 도메인에 더 강한 모델을 출시하였습니다. 큐원 2.5의 모델 출시 현황모델 크기 및 성능: ..

LLM 2024.12.15

라마 3.3 출시: 3.1, 3.2와의 차이점과 새로운 가능성

인공지능 언어 모델의 발전은 현대 기술 혁신의 핵심 동력 중 하나로 자리매김하고 있습니다. 그중에서도 메타(Meta)의 라마(Llama) 시리즈는 오픈 소스 커뮤니티와 연구자들에게 큰 주목을 받아왔습니다. 최근 발표된 라마 3.3은 이전 버전들과 비교하여 성능과 효율성 면에서 획기적인 개선을 이루어냈습니다. 이번 글에서는 라마 3.3의 출시일과 함께, 라마 3.1 및 3.2와의 주요 차이점, 그리고 새롭게 출시된 모델의 크기와 성능에 대해 자세히 살펴보겠습니다. 1. Llama 3.1 및 3.2와의 차이점모델 구조 개선: Llama 3.3은 이전 버전인 Llama 3.1 및 3.2와 비교하여 성능과 효율성 면에서 상당한 발전을 이루었습니다. Llama 3.1은 기존 Transformer 아키텍처를 사용하..

LLM 2024.12.15

ChatGPT o1: 새로운 AI 모델의 등장과 그 의미

지난달 OpenAI에서 새로운 AI 모델인 ChatGPT o1이 출시되었습니다. 이 모델은 이전 버전들과는 다른 독특한 기능과 성능을 갖추고 있어 많은 주목을 받고 있습니다. 특히 눈에 띄는 점은, ChatGPT o1이 추론 과정을 보여준다는 점입니다. 질문을 듣고 대답을 출력하기까지의 과정을 상세히 설명해주기 때문에, 사용자가 답변이 어떻게 도출되었는지 쉽게 이해할 수 있습니다. 이러한 기능은 이전 모델들과 차별화되는 중요한 요소로 자리 잡고 있습니다.ChatGPT o1의 적용 사례제가 직접 사용해본 결과, 특히 대학교 교재의 연습문제에 답이 없는 경우에 ChatGPT o1이 큰 도움이 될 것이라고 생각합니다. 연습문제는 정해진 답이 없을 때가 많아, 논리적 추론이 요구되는데, 이 모델은 이러한 문제 ..

LLM 2024.10.14

LLama 3.2의 출시: 가정용 PC에서도 가능해진 LLM

LLama 3.2가 새롭게 출시되었습니다. 이번 버전에서 가장 인상 깊었던 점은 모델의 크기가 작아졌다는 것입니다. LLama 3.1에서는 가장 작은 모델이 8B였지만, 이번 LLama 3.2에서는 1B, 3B 모델까지 출시되었습니다. 이로 인해 상대적으로 작은 GPU를 보유한 사용자들도 부담 없이 LLM(대규모 언어 모델)을 활용할 수 있게 되었습니다. 작은 모델의 등장과 그 의미1B, 3B 모델의 출시는 특히 고사양 GPU가 없는 사용자들에게 희소식입니다. 8B 이상의 대형 모델을 실행하기에는 고성능 GPU와 많은 메모리가 필요했지만, 이번에는 3GB 정도의 메모리만으로도 충분히 사용할 수 있게 되었습니다. LLama 3.1의 8B 모델과 비교하면 성능 면에서는 다소 떨어지지만, 중요한 것은 이제 훨..

LLM 2024.09.30