전체 글 171

1.1 지우개를 잘 잃어버리는 이유

1. 문제 정의초중고등학교를 다니면서 유독 지우개를 자주 잃어버렸던 기억이 있다. 대학생이 되고 나서는 볼펜을 많이 사용하면서 지우개의 사용 빈도가 줄어들었지만, 과거에는 지우개를 다 쓰거나 너무 작아져서 정리한 적은 거의 없었다. 대신 어쩌다 지우개를 잃어버리면 금방 새 지우개를 사거나, 샤프 뒤에 있는 작은 지우개로 하루이틀을 버티곤 했다.왜 지우개는 다른 학용품보다 더 자주 잃어버리게 되는지, 실제로 그런 경향이 있는지 분석해보고자 한다.2. 목표지우개가 다른 학용품(볼펜, 샤프 등)보다 잃어버릴 가능성이 높은지 비교하고, 그 원인을 파악한다.3. 가설지우개는 가끔씩만 사용되기 때문에 책상 위에 올려져 있다가 무심코 떨어뜨리는 경우가 많다. 이후, 떨어뜨린 사실을 모른 채 시간이 흐르고, 필요할 때..

데이터 분석 2024.12.29

데이터로 세상 알아보기

들어가며데이터 분석과 연구는 우리가 세상을 이해하고 문제를 해결하는 데 중요한 도구입니다. 논리적 접근과 실증 데이터를 통해 가설을 검증함으로써, 일상에서 관찰되는 현상이나 문제를 더욱 깊이 탐구할 수 있습니다.이번 글에서는 특정 주제를 데이터와 실험을 바탕으로 분석하는 과정을 다루며, 이를 통해 실질적인 인사이트를 도출하고자 합니다.분석의 전개는 주제별로 약간의 차이가 있을 수 있지만, 기본적인 흐름은 다음과 같습니다.진행 순서1. 문제 정의연구 또는 분석을 통해 해결하려는 문제 설명문제의 중요성과 배경 설명2. 목표 및 가설분석의 주요 목표와 이를 기반으로 설정한 가설 정리3. 데이터 수집데이터 수집의 방식과 도구4. 분석 방법론데이터를 처리하고 분석하기 위한 구체적인 방법(실험, 데이터 수집, 분석..

데이터 분석 2024.12.28

알리바바 큐원(Qwen) 2.5: 새로운 오픈소스 LLM

큐원(Qwen) 2.5는 알리바바 클라우드가 개발한 최신 대규모 언어 모델로, 다양한 기능과 성능 향상을 통해 인공지능 분야에서 주목받고 있습니다. 이번 글에서는 큐원 2.5의 새로운 기능과 개선 사항, 활용 사례 및 응용 분야, 그리고 모델의 한계와 향후 발전 방향에 대해 자세히 살펴보겠습니다. 큐원 2 및 2.5와의 차이점다국어 지원 강화: 큐원 2.5는 영어, 중국어, 한국어, 일본어 등 주요 언어를 포함한 29개 이상의 언어를 지원하며, 이를 통해 다양한 언어 환경에서의 활용도가 높아졌습니다.코딩 및 수학 성능 향상: 큐원 2.5는 코딩 및 수학 분야에서의 성능을 강화하였으며, 별도의 모델을 제작하여 특정 도메인에 더 강한 모델을 출시하였습니다. 큐원 2.5의 모델 출시 현황모델 크기 및 성능: ..

LLM 2024.12.15

라마 3.3 출시: 3.1, 3.2와의 차이점과 새로운 가능성

인공지능 언어 모델의 발전은 현대 기술 혁신의 핵심 동력 중 하나로 자리매김하고 있습니다. 그중에서도 메타(Meta)의 라마(Llama) 시리즈는 오픈 소스 커뮤니티와 연구자들에게 큰 주목을 받아왔습니다. 최근 발표된 라마 3.3은 이전 버전들과 비교하여 성능과 효율성 면에서 획기적인 개선을 이루어냈습니다. 이번 글에서는 라마 3.3의 출시일과 함께, 라마 3.1 및 3.2와의 주요 차이점, 그리고 새롭게 출시된 모델의 크기와 성능에 대해 자세히 살펴보겠습니다. 1. Llama 3.1 및 3.2와의 차이점모델 구조 개선: Llama 3.3은 이전 버전인 Llama 3.1 및 3.2와 비교하여 성능과 효율성 면에서 상당한 발전을 이루었습니다. Llama 3.1은 기존 Transformer 아키텍처를 사용하..

LLM 2024.12.15

ChatGPT o1: 새로운 AI 모델의 등장과 그 의미

지난달 OpenAI에서 새로운 AI 모델인 ChatGPT o1이 출시되었습니다. 이 모델은 이전 버전들과는 다른 독특한 기능과 성능을 갖추고 있어 많은 주목을 받고 있습니다. 특히 눈에 띄는 점은, ChatGPT o1이 추론 과정을 보여준다는 점입니다. 질문을 듣고 대답을 출력하기까지의 과정을 상세히 설명해주기 때문에, 사용자가 답변이 어떻게 도출되었는지 쉽게 이해할 수 있습니다. 이러한 기능은 이전 모델들과 차별화되는 중요한 요소로 자리 잡고 있습니다.ChatGPT o1의 적용 사례제가 직접 사용해본 결과, 특히 대학교 교재의 연습문제에 답이 없는 경우에 ChatGPT o1이 큰 도움이 될 것이라고 생각합니다. 연습문제는 정해진 답이 없을 때가 많아, 논리적 추론이 요구되는데, 이 모델은 이러한 문제 ..

LLM 2024.10.14

Python, R을 모두 쓰는 데이터 분석가에게 좋은 Positron 사용 후기

파이썬과 R을 번갈아 가면서 사용하는 사용자들에게는 어떤 IDE(통합 개발 환경)를 사용하는지가 늘 고민입니다. 두 언어를 모두 다룰 수 있는 강력한 IDE는 작업 효율성을 높일 수 있기 때문입니다. 저 역시 이 고민을 겪었습니다. 처음에는 R 전용 IDE인 RStudio로 시작했지만, 이후에는 Visual Studio Code(VSCode)로 전환하여 주로 사용하게 되었습니다. VSCode는 파이썬과 R 모두를 지원하며, 확장성도 뛰어나 다양한 기능을 한 곳에서 처리할 수 있다는 장점이 있습니다. 하지만 여러 기능을 동시에 다루려다 보면 설정과 플러그인 관리가 복잡할 수 있다는 점에서 아쉬움을 느끼기도 했습니다. Positron IDE 사용 후기최근에 Positron이라는 새로운 IDE를 사용해보게 되..

코딩/파이썬 2024.10.03

LLama 3.2의 출시: 가정용 PC에서도 가능해진 LLM

LLama 3.2가 새롭게 출시되었습니다. 이번 버전에서 가장 인상 깊었던 점은 모델의 크기가 작아졌다는 것입니다. LLama 3.1에서는 가장 작은 모델이 8B였지만, 이번 LLama 3.2에서는 1B, 3B 모델까지 출시되었습니다. 이로 인해 상대적으로 작은 GPU를 보유한 사용자들도 부담 없이 LLM(대규모 언어 모델)을 활용할 수 있게 되었습니다. 작은 모델의 등장과 그 의미1B, 3B 모델의 출시는 특히 고사양 GPU가 없는 사용자들에게 희소식입니다. 8B 이상의 대형 모델을 실행하기에는 고성능 GPU와 많은 메모리가 필요했지만, 이번에는 3GB 정도의 메모리만으로도 충분히 사용할 수 있게 되었습니다. LLama 3.1의 8B 모델과 비교하면 성능 면에서는 다소 떨어지지만, 중요한 것은 이제 훨..

LLM 2024.09.30

EXAONE 사용 후기

LG AI 연구원에서 만든 EXAONE이 공개되었다고해서 한번 사용해보았다.  예제 코드가 잘 되어있으니 바로 쓸 수 있었다.  참고 사항- 개인 계정의 토큰으로 로그인이 필요했다. 실행 결과 (서버컴으로 할때는 되었는데, 예시를 보여줄려고 집컴으로 했더니 안된다..ㅠ)내가 서버컴으로 했을때의 경험을 이야기하면,1. 말을 잘 생성한다는 느낌을 받았다. 2. 같은 질문을 입력하면 똑같은 대답이 나온다.- chatgpt같은 다른 LLM 모델과 다른 이질적인 느낌이 들었다. - 질문에 마침표 몇개만 추가해도 비슷하지만 다른 결과가 나옴-(추가) 아마도 LLM 캐시로 인해서 같은 답이 나오는 것 같음3. 할루시네이션을 막기위해 노력한 것은 보임- 특정 잘못된 질문을 해봐도 사실과 거짓을 잘 분류해서 알려줌- 그..

LLM 2024.08.13

ADP 28회 실기 후기

ADP 실기 시험을 지난 일요일에 보고왔다. 구체적인 문제가 어떤지보다는 시험을 보고 느낀점을 적어보겠다. 우선 머신러닝은 구체적으로 나온다고 느꼈다. 구현해야하는 모델 방법들을 알려주고, 이를 구현해야한다. 또한 학습 모델을 만들기 전과 후에 필요한 과정들을 서술형으로 작성해야해서 다양한 모델링을 하거나, 이론적으로 꽤 깊게 알고있어야 문항을 착실하게 작성할 수 있을거같다. 통계 문제에서는 생존분석이 나왔으며, 다른 문제는 기출과 비슷했던 문제도 있어서 머신러닝 문제에 비해서는 난이도가 낮게 느껴졌다. 데이터 분석이라는게 많은 경험을 갖고 하면 할수록 배울게 많다는 것을 이번 시험을 보면서 느꼈다.

자격증 2023.03.14

[ADP실기 기출 풀이] 23회 객실사용여부

문제는 멋쟁이천재사자님의 내용을 참고하였습니다. https://it-freelancer.tistory.com/21 [ADP 실기 study log] ADP 23회 객실사용여부 (풀이중) 1. 문제 온,습도,조도,CO2농도에 따른 객실의 사용유무 판별 종속변수 Occupancy, 0: 비어있음 , 1: 사용중 데이터 경로 : /kaggle/input/adp-kr-p1/problem1.csv 1 - (1) 데이터 EDA 수행 후, 분석가 입장에서 의미있 it-freelancer.tistory.com 문제 온,습도,조도,CO2농도에 따른 객실의 사용유무 판별 종속변수 Occupancy, 0: 비어있음 , 1: 사용중 1 - (1) 데이터 EDA 수행 후, 분석가 입장에서 의미있는 탐색 1 - (2) 결측치를 ..

자격증 2023.03.05