생성 데이터 인텔리전스

이 초경량 AI 모델은 휴대폰에 적합하며 ChatGPT를 이길 수 있습니다 – Decrypt

시간

오늘 마이크로 소프트 주장 "가장 유능하고 비용 효율적인 소규모 언어 모델(SLM)"을 출시했다고 밝혔습니다. 파이-3—세 번째 반복 소규모 언어 모델의 Phi 계열 (SLM) - 비슷한 크기의 모델과 몇 가지 더 큰 모델보다 성능이 뛰어납니다.

SLM(Small Language Model)은 특정 언어 관련 작업을 수행하는 데 매우 효율적으로 설계된 AI 모델 유형입니다. 광범위한 일반 작업에 적합한 LLM(대형 언어 모델)과 달리 SLM은 더 작은 데이터 세트를 기반으로 구축되어 특정 사용 사례에 더 효율적이고 비용 효율적입니다.

Phi-3는 다양한 버전으로 제공되며, 가장 작은 버전은 3조 3.8천억 개의 토큰으로 훈련된 3.3억 개의 매개변수 모델인 Phi-3 Mini입니다. 비교적 작은 크기에도 불구하고 Llama-XNUMX의 코퍼스 무게는 15 조 데이터 토큰 - Phi-3 Mini는 여전히 128K의 컨텍스트 토큰을 처리할 수 있습니다. 이는 GPT-4와 비슷하며 토큰 용량 측면에서 Llama-3 및 Mistral Large를 능가합니다.

즉, Meta.ai의 Llama-3 및 Mistral Large와 같은 거대 AI는 긴 채팅 후에 붕괴되거나 이 경량 모델이 어려움을 겪기 훨씬 전에 메시지를 표시할 수 있습니다.

Phi-3 Mini의 가장 중요한 장점 중 하나는 일반적인 스마트폰에 장착하고 실행할 수 있다는 것입니다. Microsoft는 iPhone 14에서 이 모델을 테스트했으며 문제 없이 실행되어 초당 14개의 토큰을 생성했습니다. Phi-3 Mini를 실행하려면 1.8GB의 VRAM만 필요하므로 보다 집중적인 요구 사항을 가진 사용자를 위한 가볍고 효율적인 대안이 됩니다.

Phi-3 Mini는 고급 코더나 광범위한 요구 사항을 가진 사람들에게는 적합하지 않을 수 있지만 특정 요구 사항이 있는 사용자에게는 효과적인 대안이 될 수 있습니다. 예를 들어, 챗봇이 필요한 스타트업이나 데이터 분석을 위해 LLM을 활용하는 사람들은 데이터 정리, 정보 추출, 수학 추론 수행, 에이전트 구축과 같은 작업에 Phi-3 Mini를 사용할 수 있습니다. 모델에 인터넷 액세스가 제공되면 실시간 정보로 부족한 기능을 보완하여 매우 강력해질 수 있습니다.

Phi-3 Mini는 가능한 가장 유용한 정보로 데이터 세트를 관리하는 데 중점을 둔 Microsoft의 노력 덕분에 높은 테스트 점수를 얻었습니다. 실제로 더 넓은 Phi 제품군은 사실적 지식이 필요한 작업에는 적합하지 않지만 높은 추론 기술로 인해 주요 경쟁사보다 우위에 있습니다. Phi-3 Medium(14억 매개변수 모델)은 GPT-3.5(ChatGPT 무료 버전을 지원하는 LLM)와 같은 강력한 LLM을 지속적으로 능가하며 Mini 버전은 대부분의 합성 벤치마크에서 Mixtral-8x7B와 같은 강력한 모델을 능가합니다.

그러나 Phi-3은 이전 제품인 Phi-2와 같은 오픈 소스가 아니라는 점은 주목할 가치가 있습니다. 대신, 그것은 오픈 모델, 이는 액세스 가능하고 사용이 가능하지만 Phi-2와 동일한 오픈 소스 라이센스가 없으므로 더 광범위하게 사용하고 상업적인 응용 프로그램을 사용할 수 있습니다.

앞으로 몇 주 안에 Microsoft는 Phi-3 Small(3억 매개변수) 및 앞서 언급한 Phi-7 Medium을 포함하여 Phi-3 제품군에서 더 많은 모델을 출시할 것이라고 밝혔습니다.

Microsoft는 Azure AI Studio, Hugging Face 및 Ollama에서 Phi-3 Mini를 사용할 수 있도록 만들었습니다. 이 모델은 Windows DirectML 지원은 물론 다양한 GPU, CPU 및 모바일 하드웨어 전반에 걸친 크로스 플랫폼 지원을 통해 ONNX Runtime에 맞게 지침이 조정되고 최적화되었습니다.

암호화 뉴스를 최신 상태로 유지하고 받은 편지함에서 매일 업데이트를 받으십시오.

spot_img

최신 인텔리전스

spot_img

우리와 함께 채팅

안녕하세요! 어떻게 도와 드릴까요?