SK증권 한동희. 2025년 1월 31일.
[출처 : pixabay]
중국의 딥시크(DeepSeek)는 R1 추론 모델 출시를 통해 저비용, 고성능 AI 모델의 발전 방향을 제시했다고 판단한다. R1 모델은 DeepSkke-V3를 기반으로 하며, 지도 학습 없이 자체 강화학습에 의한 CoT(Chain of Thought)를 통해 자체적인 추론 능력 강화를 강화한 R1-Zero의 문제점을 Cold start data를 통해 개선한 모델이다. R1의 전체 파라미터 수는 671B개이나, MoE(Mixure of Expert)를 통한 실제 활성화 파라미터 수는 37B개에 불과하다. Artificial Analysis에 따르면 DeepSeek-R1은 경쟁 모델 대비 질 측면에서는 최상위권, 토큰 당 가격 측면에서는 중위권 수준이라는 점에서 높은 가성비 모델이라고 평가할 수 있다. 알고리즘을 통한 AI 성능 제고는 AI 사이클의 지속 명분을 강화시키는 요소가 될 것으로 전망된다.
알고리즘 발전을 통한 AI 성능 제고에도 높은 컴퓨팅 파워와 강력한 거대 기반 모델의 필요성은 지속될 것으로 전망된다. DeepSeek-R1의 Cold start에 활용된 data set은 프론티어급 모델에서 비롯됐으며, 이는 DeepSeek-R1 논문에서 언급된 대로 작은 모델은 높은 컴퓨팅 파워를 기반으로 한 거대 강화모델을 요구하며, 더 경제적, 효과적 Intelligence 역시 강력한 기반 모델과 Large-scale의 강화 학습에 기반하므로 하드웨어에 대한 시장의 우려는 다소 과장됐다고 판단된다.
[관심종목]
05930: 삼성전자, 000660: SK하이닉스, 036200: 유니셈, 036810: 에프에스티, 079370: 제우스, 144960: 뉴파워프라즈마, 240810: 원익IPS, 036930: 주성엔지니어링, 039440: 에스티아이, 311320: 지오엘리먼트
<저작권자 ©I.H.S 버핏연구소(buffettlab.co.kr) 무단전재 및 재배포 금지>