메타, 새로운 Llama 4 AI 모델 공개! GPT-4와 Gemini를 능가하는 성능 주장

이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받습니다.

728x90
반응형

메타, 새로운 Llama 4 AI 모델 공개! GPT-4와 Gemini를 능가하는 성능 주장

메타 Llama 4 AI 모델 시각화. 세 개의 다른 크기의 라마 캐릭터(Scout, Maverick, Behemoth)가 첨단 기술적 배경 앞에 서 있음.
메타 Llama 4 AI 모델 시각화. 세 개의 다른 크기의 라마 캐릭터(Scout, Maverick, Behemoth)가 첨단 기술적 배경 앞에 서 있음.

안녕하세요, Do you? 블로그입니다. 메타(Meta)가 새로운 인공지능 모델인 'Llama 4' 시리즈를 공개했습니다. 이번에 발표된 시리즈는 Scout, Maverick, Behemoth 세 가지 모델로 구성되어 있으며, 현재 Scout와 Maverick 두 모델이 먼저 출시되었습니다. 메타는 이번 모델들이 오픈AI의 GPT-4o, 구글의 Gemini 2.0 등 경쟁 모델들보다 '광범위한 벤치마크에서 우수한 성능'을 보인다고 주장하고 있는데요. 무엇이 달라졌고 어떤 특징이 있는지 자세히 살펴보겠습니다.

Llama 4 모델 라인업: Scout, Maverick, Behemoth

메타가 발표한 Llama 4 시리즈는 세 가지 모델로 구성되어 있으며, 크기와 성능에 따라 각각 다른 이름이 붙었습니다. 현재 Scout와 Maverick 두 모델이 공개되었고, Behemoth는 아직 개발 중입니다.

Llama 4 Scout - 경량화된 모델

Scout는 Llama 4 시리즈 중 가장 가벼운 모델입니다. 메타에 따르면 Scout는 총 17억(17B) 개의 활성 파라미터를 가지고 있으며, 16개의 '전문가' 모듈로 구성되어 있습니다. 이 모델의 가장 큰 특징은 단일 NVIDIA H100 GPU에 맞출 수 있을 정도로 최적화되어 있다는 점입니다.

Llama 4 Scout 주요 스펙

• 17B 활성 파라미터
• 16개 전문가 모듈
• 1천만(10M) 토큰 컨텍스트 윈도우
• 단일 NVIDIA H100 GPU에 최적화
• 멀티모달 기능 지원

Scout는 10백만 토큰의 컨텍스트 윈도우(AI 모델의 작업 메모리)를 갖추고 있어, 한 번에 처리할 수 있는 정보량이 상당히 큽니다. 메타는 이 모델이 구글의 Gemma 3과 Gemini 2.0 Flash-Lite, 그리고 오픈소스 모델인 Mistral 3.1보다 "다양한 벤치마크에서 우수한 성능"을 보인다고 주장하고 있습니다.

Llama 4 Maverick - 고성능 모델

Maverick는 Scout보다 훨씬 강력한 모델로, 17B 활성 파라미터를 가지고 있지만 전문가 모듈이 128개로 늘어났습니다. 메타는 이 모델이 OpenAI의 GPT-4o와 구글의 Gemini 2.0 Flash에 견줄 만한 성능을 갖추고 있다고 설명합니다.

특히 코딩과 추론 작업에서 Maverick는 DeepSeek-V3와 비슷한 성능을 보이면서도 "절반 이하의 활성 파라미터"만 사용한다고 메타는 주장합니다. 이는 효율성 면에서 상당한 향상을 의미합니다.

최신 스마트폰에서 WhatsApp과 Instagram의 메타 AI 인터페이스 사용 모습.
최신 스마트폰에서 WhatsApp과 Instagram의 메타 AI 인터페이스 사용 모습.

Llama 4 Behemoth - 개발 중인 최고급 모델

Behemoth는 현재 개발 중인 Llama 4 시리즈의 최상위 모델입니다. 메타 CEO 마크 저커버그에 따르면 이 모델은 "세계에서 가장 높은 성능을 가진 기반 모델"이 될 것이라고 합니다.

Llama 4 Behemoth 예상 스펙

  • 2880억(288B) 활성 파라미터: Scout와 Maverick보다 훨씬 큰 규모
  • 2조(2T) 총 파라미터: 엄청난 지식과 능력 보유 가능
  • 16개 전문가 모듈: 복잡한 작업 처리 능력
  • FP8 및 32K GPU 사용: 훈련 과정에서 GPU당 390 TFLOPS 달성
  • STEM 분야 특화: GPT-4.5, Claude Sonnet 3.7 등 경쟁 모델보다 STEM 벤치마크에서 우수한 성능 예상

메타에 따르면 Behemoth 모델은 여전히 훈련 중이며, 공개 일정은 아직 발표되지 않았습니다. 하지만 이 모델은 특히 STEM(과학, 기술, 공학, 수학) 분야에서 뛰어난 능력을 보일 것으로 예상됩니다.

'전문가 혼합(MoE)' 아키텍처의 의미와 장점

Llama 4 시리즈에서 가장 주목할 만한 기술적 변화는 '전문가 혼합(Mixture of Experts, MoE)' 아키텍처의 도입입니다. 이는 Llama 시리즈에서 처음으로 적용된 방식이며, 메타의 AI 접근 방식에 있어 중요한 전환점을 나타냅니다.

MoE란 무엇인가?

전문가 혼합(MoE)은 기계 학습 접근 방식의 일종으로, 하나의 큰 작업을 여러 개의 작은 작업으로 나누고 각각을 특정 문제 해결에 특화된 신경망 하위 시스템(전문가)에 할당하는 방식입니다. 쉽게 말해, 다양한 분야의 전문가들이 모여 각자 자신의 전문 분야를 담당하는 것과 비슷합니다.

MoE 작동 방식 예시

AI에게 '태양계에 대한 시를 작성해줘'라는 요청을 했다고 가정해봅시다.

1. 라우팅 시스템이 이 작업을 분석합니다.
2. 천문학 지식이 필요하므로 과학 전문가 모듈을 활성화합니다.
3. 시 형식의 창작물이 필요하므로 창작 전문가 모듈을 활성화합니다.
4. 다른 전문가 모듈(예: 코딩, 역사 등)은 이 작업에 필요하지 않으므로 비활성화됩니다.
5. 활성화된 전문가 모듈들의 작업이 결합되어 최종 결과물이 만들어집니다.

MoE 아키텍처는 이미 DeepSeek-V3, Mistral.ai의 Mixtral 8x7B 등 여러 최신 AI 모델에서 사용되고 있습니다. OpenAI도 이 접근 방식을 사용하고 있는지 공식적으로 확인하거나 부인하지 않았지만, 향후 계획에 포함되어 있다고 언급한 바 있습니다.

MoE의 장점

장점 설명
자원 효율성 필요한 전문가 모듈만 활성화하여 계산 자원 절약
더 나은 성능 각 분야에 특화된 전문가 모듈로 인해 더 정확한 결과물 생성
확장성 더 적은 자원으로 더 큰 모델 효과를 낼 수 있음
다양한 작업 처리 여러 전문 분야를 조합하여 복잡한 작업도 효과적으로 처리

메타에 따르면 Llama 4 모델은 "MetaP"라고 불리는 새로운 훈련 기술을 적용했습니다. 이 기술은 "각 레이어별 학습률과 초기화 스케일과 같은 중요한 모델 하이퍼파라미터를 안정적으로 설정할 수 있게 해준다"고 합니다. 이러한 기술적 개선은 Llama 4가 200개 언어를 지원하고, 그중 100개 이상의 언어에 대해 10억 개 이상의 토큰으로 사전 훈련할 수 있게 했습니다.

경쟁 모델과의 성능 비교

메타는 Llama 4 모델이 다양한 벤치마크에서 경쟁 모델들을 능가하는 성능을 보인다고 주장하고 있습니다. 주요 경쟁 모델과의 비교 내용을 살펴보겠습니다.

Llama 4 Scout의 성능

Scout 모델은 단일 H100 GPU에 맞는 경량 모델임에도 불구하고 다음과 같은 경쟁 모델들보다 우수한 성능을 보인다고 메타는 주장합니다:

  • 구글의 Gemma 3 - 경량 오픈소스 모델
  • 구글의 Gemini 2.0 Flash-Lite - 빠른 응답 속도에 초점을 맞춘 모델
  • Mistral 3.1 - 프랑스 AI 스타트업 Mistral.ai의 오픈소스 모델

특히 10백만 토큰의 컨텍스트 윈도우를 갖춘 Scout는 긴 문서 처리와 복잡한 작업에서 유리할 것으로 보입니다.

Llama 4 Maverick의 성능

더 강력한 Maverick 모델은 다음 모델들과 비교되고 있습니다:

Maverick vs 주요 경쟁 모델

  • OpenAI의 GPT-4o: 오픈AI의 최신 멀티모달 모델
  • 구글의 Gemini 2.0 Flash: 구글의 빠른 응답 모델
  • DeepSeek-V3: 코딩과 추론 작업에서 강점을 보이는 모델

메타는 Maverick가 DeepSeek-V3와 비슷한 성능을 보이면서도 "절반 이하의 활성 파라미터"만 사용한다고 주장합니다. 이는 모델의 효율성 측면에서 상당한 진전을 의미합니다.

Llama 4 Behemoth의 예상 성능

아직 개발 중인 Behemoth는 다음 모델들을 능가할 것으로 메타는 예상하고 있습니다:

  • OpenAI의 GPT-4.5 - OpenAI의 최신 고성능 모델
  • Anthropic의 Claude Sonnet 3.7 - Anthropic의 최신 대형 언어 모델
  • 구글의 Gemini 2.0 Pro - 구글의 전문가용 AI 모델

특히 Behemoth는 MATH-500, GPQA Diamond와 같은 STEM 분야 벤치마크에서 우수한 성능을 보일 것으로 예상됩니다. 이는 과학 및 수학 분야에서 Llama 4 Behemoth가 특별한 강점을 가질 수 있음을 시사합니다.

"Llama 4 Behemoth는 세계에서 가장 높은 성능을 가진 기반 모델이 될 것입니다." - 마크 저커버그, 메타 CEO

사용 방법 및 접근성

메타는 Llama 4 모델들을 다양한 방법으로 사용할 수 있도록 제공하고 있습니다. 일반 사용자와 개발자 모두 각자의 필요에 맞게 이 모델들에 접근할 수 있습니다.

메타 앱에서의 접근

현재 Llama 4의 Scout와 Maverick 모델은 메타의 여러 앱에서 'Meta AI' 비서로 사용할 수 있습니다:

Llama 4를 사용할 수 있는 메타 앱

Meta.ai - 웹 브라우저에서 직접 접근
WhatsApp - 메시징 앱 내에서 Meta AI와 대화
Messenger - 메신저 앱 내에서 사용 가능
Instagram Direct - 인스타그램 다이렉트 메시지에서 접근

이렇게 메타 앱을 통해 Llama 4 모델에 접근하면 별도의 설치나 설정 없이 간편하게 AI 기능을 활용할 수 있습니다. 하지만 현재 Meta AI는 ChatGPT나 Gemini와 달리 이미지 업로드 기능이 지원되지 않는 등 일부 제한이 있습니다.

아직 공개되지 않은 Llama 4 Behemoth 모델의 예상 성능을 보여주는 그래프.
아직 공개되지 않은 Llama 4 Behemoth 모델의 예상 성능을 보여주는 그래프.

개발자를 위한 접근 방법

개발자들은 Llama 4 모델을 직접 다운로드하여 자신의 프로젝트에 활용할 수 있습니다. 메타는 "오픈소스에 대한 약속"에 따라 다음과 같은 방법으로 모델에 접근할 수 있도록 제공하고 있습니다:

접근 방법 설명
llama.com 메타의 공식 Llama 웹사이트에서 직접 다운로드
Hugging Face AI 모델 공유 플랫폼에서 다운로드 가능
LlamaCon 컨퍼런스 4월 29일 개최 예정, 추가 정보 공개 예상

그러나 Llama 4의 '오픈소스' 정책에는 일부 제한이 있습니다. Open Source Initiative에 따르면, Llama 라이선스는 월간 활성 사용자 7억 명 이상인 상업적 기관이 모델을 사용하려면 메타의 허가를 받아야 한다는 조항이 포함되어 있어, 엄밀한 의미에서의 '오픈소스'가 아니라는 지적이 있습니다.

정치적 편향성 조정과 저작권 분쟁

Llama 4 모델에는 기술적 발전뿐만 아니라 몇 가지 논란이 되는 조정 사항도 포함되어 있습니다. 특히 정치적 편향성을 조정하는 시도와 모델 학습에 사용된 데이터에 관한 저작권 문제가 주목받고 있습니다.

정치적 편향성 조정

메타는 Llama 4 출시 발표에서 흥미로운 내용을 언급했습니다. "모든 주요 LLM이 편향 문제를 가지고 있다는 것은 잘 알려진 사실—특히, 역사적으로 정치적, 사회적 논쟁 주제에 관해서는 좌파적인 경향이 있었다"고 설명하며, 이러한 편향이 "인터넷에서 사용 가능한 훈련 데이터의 유형" 때문이라고 분석했습니다.

메타가 Llama 4에서 시도한 편향성 조정

  • 응답성 개선: "질문에 답변하고, 판단 없이 다양한 관점에 응답할 수 있도록" 개선
  • 특정 관점 편향 감소: "일부 관점을 다른 관점보다 선호하지 않도록" 조정
  • 응답 거부 균형화: "어떤 프롬프트에 응답을 거부할지에 대해 크게 더 균형 잡힌" 방식 채택
  • Grok 수준의 정치적 응답률: "논쟁이 되는 정치적 또는 사회적 주제에 대해 Grok과 비슷한 수준(Llama 3.3의 절반)으로 강한 정치적 성향으로 응답"

메타는 이런 조정이 필요한 이유에 대해 명확히 설명하지 않았지만, 최근 AI 모델들이 정치적으로 진보적인 응답을 내놓는다는 비판이 있었던 것과 연관이 있어 보입니다. 메타는 앞으로도 이 비율을 "더 낮추기 위해 노력"하겠다고 밝혔습니다.

"이는 AI 개발에 있어 흥미로운 변화입니다. 메타는 정치적 중립성을 강조하고 있지만, 이런 조정이 어떻게 이루어지는지, 그리고 '균형'의 기준이 무엇인지에 대한 투명성이 중요할 것입니다." - AI 윤리 전문가

저작권 문제와 훈련 데이터 논란

메타는 Llama 4 모델의 훈련 과정에 대해 "사전 훈련 과정은 30조 개 이상의 토큰으로 구성된 데이터 혼합물을 사용했으며, 이는 Llama 3 사전 훈련 혼합물의 두 배 이상이고 다양한 텍스트, 이미지, 비디오 데이터셋을 포함한다"고 설명했습니다.

그러나 메타의 발표는 모델 훈련에 사용된 구체적인 데이터 출처에 대한 정보를 포함하지 않았습니다. 이는 중요한 문제인데, 현재 메타는 저작권이 있는 콘텐츠를 무단으로 사용해 모델을 훈련했다는 혐의로 법적 분쟁 중입니다.

메타의 저작권 논란

최근 법원 문서에 따르면, 메타 CEO 마크 저커버그가 LibGen 데이터셋을 포함한 '셰도우 라이브러리(비공식 도서 라이브러리)'를 Llama LLM 훈련에 사용하도록 승인했다는 주장이 제기되었습니다. 이에 따라 The Atlantic은 LibGen에 포함된 제목들의 검색 가능한 데이터베이스를 발표하여, 많은 저자들이 자신의 작품이 허가 없이 메타의 AI 훈련에 사용되었는지 확인할 수 있게 했습니다.

또한 최근 한 판사는 메타가 Llama 훈련 데이터에서 저작권 정보를 삭제했다는 주장에 대한 소송을 방어해야 한다고 판결했습니다. 이러한 법적 문제들은 Llama 4를 포함한 메타의 AI 모델 개발에 잠재적인 영향을 미칠 수 있습니다.

현재 한계점과 향후 전망

메타의 Llama 4 모델은 인상적인 성능과 혁신적인 아키텍처를 갖추고 있지만, 현재 몇 가지 한계점도 존재합니다. 이러한 한계점과 향후 전망에 대해 살펴보겠습니다.

현재 Meta AI의 한계점

Llama 4를 이용하는 Meta AI는 ChatGPT나 Gemini와 비교했을 때 몇 가지 기능적 제한이 있습니다:

한계점 설명
이미지 업로드 불가 meta.ai 또는 메타 앱에서 직접 이미지를 업로드할 수 없음
제한된 이미지 처리 URL을 통한 이미지 분석만 가능, 직접 업로드 불가
AI 검색 기능 부재 ChatGPT, Gemini 등이 제공하는 실시간 웹 검색 기능 없음
심층 추론 제한 복잡한 추론 능력에서 상대적으로 제한적
이미지 생성 기능 최신 ChatGPT 업데이트에 비해 제한적인 이미지 생성 기능

이러한 한계에도 불구하고, 메타는 Llama 4의 오픈소스 특성을 강조하며, 이것이 다양한 개발자들이 모델을 사용하고 발전시킬 수 있는 기회를 제공한다고 주장합니다. 실제로 Llama 3가 출시된 이후, 다양한 독립 개발자들이 이를 기반으로 한 사용자 정의 모델과 애플리케이션을 개발한 사례가 있습니다.

향후 전망 및 발전 방향

메타는 오는 4월 29일 'LlamaCon' 컨퍼런스를 개최할 예정이며, 이 자리에서 AI 모델과 제품에 대한 향후 계획을 논의할 것으로 예상됩니다. 특히 다음과 같은 발전이 예상됩니다:

Llama 4의 예상 발전 방향

  • Behemoth 모델 출시: 현재 훈련 중인 2조 파라미터 모델의 완성 및 릴리스
  • 멀티모달 기능 강화: 이미지 업로드 및 처리 기능 개선
  • AI 검색 기능 추가: 실시간 정보 접근 능력 향상
  • 개발자 도구 확장: 더 많은 맞춤형 애플리케이션 개발 지원
  • 안전성 및 편향성 개선: GOAT(Generative Offensive Agent Testing) 시스템의 지속적 개선

메타는 AI 모델의 안전성을 확보하기 위해 'GOAT(Generative Offensive Agent Testing)'라는 시스템을 개발했습니다. 이 시스템은 "중간 수준의 적대적 행위자의 멀티턴 상호작용을 시뮬레이션하여 테스트 범위를 늘리고 취약점을 더 빠르게 발견하는 데 도움을 준다"고 메타는 설명합니다. 이러한 안전 시스템의 지속적인 개선은 향후 Llama 모델의 중요한 발전 방향이 될 것입니다.

"전문가 혼합 아키텍처와 다양한 언어 지원을 통해 Llama 4는 메타의 AI 전략에서 중요한 진전을 나타냅니다. 앞으로 Behemoth 모델의 출시와 함께 메타가 AI 경쟁에서 어떤 위치를 차지할지 주목할 필요가 있습니다." - AI 산업 분석가

자주 묻는 질문

Llama 4의 '전문가 혼합(MoE)' 기술이 정확히 무엇인가요?

전문가 혼합(Mixture of Experts, MoE)은 AI 모델을 여러 개의 '전문가' 모듈로 나누는 기술입니다. 각 전문가는 특정 유형의 작업을 처리하도록 특화되어 있어, 주어진 문제에 따라 가장 적합한 전문가들만 활성화됩니다. 이렇게 하면 모든 파라미터를 항상 사용하지 않아도 되므로 계산 효율성이 높아지고, 더 적은 자원으로도 더 큰 모델과 비슷한 성능을 얻을 수 있습니다.

Llama 4 모델을 직접 다운로드하여 사용할 수 있나요?

네, Llama 4 Scout와 Maverick 모델은 현재 개발자들이 직접 다운로드하여 사용할 수 있습니다. llama.com이나 Hugging Face 플랫폼에서 다운로드할 수 있으며, 메타의 오픈소스 정책에 따라 대부분의 사용자가 자유롭게 활용할 수 있습니다. 단, 월간 활성 사용자 7억 명 이상의 대형 기업이 사용할 경우 메타의 허가가 필요합니다.

Llama 4 Behemoth는 언제 출시될 예정인가요?

메타는 아직 Llama 4 Behemoth의 정확한 출시 일정을 발표하지 않았습니다. 현재 이 모델은 여전히 훈련 중이라고 밝혔으며, 4월 29일에 개최될 예정인 LlamaCon 컨퍼런스에서 추가 정보가 공개될 가능성이 있습니다. Behemoth는 288B 활성 파라미터와 2조 총 파라미터를 가진 대규모 모델로, 특히 STEM 분야에서 뛰어난 성능을 보일 것으로 예상됩니다.

메타는 왜 Llama 4에서 정치적 편향성을 조정했다고 주장하나요?

메타는 기존 AI 모델들이 정치적, 사회적 논쟁 주제에서 좌파적 경향을 보이는 것이 "인터넷에서 사용 가능한 훈련 데이터의 유형" 때문이라고 분석했습니다. Llama 4에서는 더 "균형 잡힌" 접근 방식을 목표로 했으며, "판단 없이 다양한 관점에 응답"하고 "일부 관점을 다른 관점보다 선호하지 않도록" 조정했다고 밝혔습니다. 이러한 조정은 AI 모델이 특정 정치적 성향을 갖는다는 비판에 대응하기 위한 것으로 보입니다.

Llama 4 모델의 컨텍스트 윈도우는 얼마나 되나요?

Llama 4 Scout와 Maverick 모델은 모두 10백만(10M) 토큰의 컨텍스트 윈도우를 가지고 있습니다. 이는 AI 모델이 한 번에 처리할 수 있는 텍스트의 양을 의미하며, 상당히 큰 규모입니다. 이러한 긴 컨텍스트 윈도우 덕분에 Llama 4 모델은 긴 문서나 복잡한 대화를 처리하는 데 더 효과적입니다.

메타의 AI 모델 훈련과 관련된 저작권 논란은 무엇인가요?

메타는 현재 Llama 모델 훈련에 사용된 콘텐츠와 관련하여 저작권 분쟁에 휘말려 있습니다. 법원 문서에 따르면, 메타 CEO 마크 저커버그가 LibGen 데이터셋과 같은 '셰도우 라이브러리'를 AI 훈련에 사용하도록 승인했다는 주장이 제기되었습니다. 많은 저자들이 자신의 작품이 허가 없이 AI 훈련에 사용되었다고 주장하고 있으며, 한 판사는 최근 메타가 훈련 데이터에서 저작권 정보를 삭제했다는 주장에 대한 소송을 방어해야 한다고 판결했습니다.

지금까지 메타의 새로운 Llama 4 AI 모델에 대해 자세히 알아보았습니다. 전문가 혼합(MoE) 아키텍처를 도입한 Scout와 Maverick 모델은 이전 세대보다 더 적은 자원으로 뛰어난 성능을 제공하며, 향후 출시될 Behemoth 모델은 STEM 분야에서 특히 강력한 성능을 보일 것으로 기대됩니다. 메타의 이러한 혁신은 AI 산업에 새로운 바람을 불어넣고 있지만, 정치적 편향성 조정과 저작권 논란 등 몇 가지 도전과제도 남아있습니다. 또한 현재 Meta AI는 이미지 업로드나 AI 검색 기능 등 일부 경쟁 모델들이 제공하는 기능이 제한되어 있습니다. 그럼에도 불구하고, 메타의 오픈소스 접근 방식은 개발자들에게 큰 기회를 제공하며, 4월 29일 LlamaCon 컨퍼런스에서 공개될 추가 정보가 기대됩니다.

여러분은 메타의 새로운 Llama 4 모델에 대해 어떻게 생각하시나요? GPT-4나 Gemini와 같은 경쟁 모델과 비교했을 때 어떤 점이 기대되시나요? 혹시 이미 Meta AI를 사용해보셨다면, 경험과 느낌을 댓글로 공유해 주시면 좋겠습니다. 앞으로도 AI 기술의 최신 발전 동향과 유용한 정보를 계속해서 전해드리도록 하겠습니다. 이 글이 여러분께 도움이 되었기를 바랍니다.

관련 태그

메타, Llama 4, AI 모델, 전문가 혼합, MoE, Scout, Maverick, Behemoth, GPT-4, Gemini, 오픈소스 AI, 컨텍스트 윈도우, 저작권 분쟁, Meta AI, LlamaCon

728x90
반응형