जनरेटिव डेटा इंटेलिजेंस

यह अल्ट्रा लाइट एआई मॉडल आपके फोन पर फिट बैठता है और चैटजीपीटी - डिक्रिप्ट को मात दे सकता है

दिनांक:

माइक्रोसॉफ्ट आज ने दावा किया इसने "उपलब्ध सबसे सक्षम और लागत प्रभावी लघु भाषा मॉडल (एसएलएम)" जारी किया है फ़ि-3-इसकी तीसरी पुनरावृत्ति छोटे भाषा मॉडलों का फी परिवार (एसएलएम)-तुलनात्मक आकार के मॉडल और कुछ बड़े मॉडल से बेहतर प्रदर्शन करता है।

एक लघु भाषा मॉडल (एसएलएम) एक प्रकार का एआई मॉडल है जिसे विशिष्ट भाषा-संबंधी कार्यों को करने में बेहद कुशल बनाने के लिए डिज़ाइन किया गया है। बड़े भाषा मॉडल (एलएलएम) के विपरीत, जो सामान्य कार्यों की एक विस्तृत श्रृंखला के लिए उपयुक्त हैं, एसएलएम को विशिष्ट उपयोग के मामलों के लिए अधिक कुशल और लागत प्रभावी बनाने के लिए छोटे डेटासेट पर बनाया जाता है।

Microsoft ने बताया कि Phi-3 विभिन्न संस्करणों में आता है, जिसमें सबसे छोटा Phi-3 Mini है, जो 3.8 ट्रिलियन टोकन पर प्रशिक्षित 3.3 बिलियन पैरामीटर मॉडल है। इसके तुलनात्मक रूप से छोटे आकार के बावजूद-लामा-3 के कोष का वजन अधिक है 15 खरब डेटा के टोकन—Phi-3 Mini अभी भी संदर्भ के 128K टोकन को संभालने में सक्षम है। यह इसे GPT-4 के तुलनीय बनाता है और टोकन क्षमता के मामले में लामा-3 और मिस्ट्रल लार्ज को मात देता है।

दूसरे शब्दों में, मेटा.एआई और मिस्ट्रल लार्ज पर लामा-3 जैसे एआई दिग्गज लंबी बातचीत के बाद ढह सकते हैं या इस हल्के मॉडल के संघर्ष शुरू होने से पहले ही संकेत दे सकते हैं।

फी-3 मिनी का सबसे महत्वपूर्ण लाभ इसकी सामान्य स्मार्टफोन पर फिट होने और चलने की क्षमता है। Microsoft ने iPhone 14 पर मॉडल का परीक्षण किया, और यह बिना किसी समस्या के चला, प्रति सेकंड 14 टोकन उत्पन्न करता है। Phi-3 Mini को चलाने के लिए केवल 1.8GB VRAM की आवश्यकता होती है, जो इसे अधिक केंद्रित आवश्यकताओं वाले उपयोगकर्ताओं के लिए एक हल्का और कुशल विकल्प बनाता है।

हालाँकि Phi-3 Mini हाई-एंड कोडर्स या व्यापक आवश्यकताओं वाले लोगों के लिए उपयुक्त नहीं हो सकता है, लेकिन यह विशिष्ट आवश्यकताओं वाले उपयोगकर्ताओं के लिए एक प्रभावी विकल्प हो सकता है। उदाहरण के लिए, जिन स्टार्टअप्स को चैटबॉट की आवश्यकता होती है या जो लोग डेटा विश्लेषण के लिए एलएलएम का लाभ उठाते हैं, वे डेटा संगठन, जानकारी निकालने, गणित तर्क करने और एजेंटों के निर्माण जैसे कार्यों के लिए फी-3 मिनी का उपयोग कर सकते हैं। यदि मॉडल को इंटरनेट एक्सेस दिया जाता है, तो यह वास्तविक समय की जानकारी के साथ क्षमताओं की कमी की भरपाई करते हुए, काफी शक्तिशाली बन सकता है।

Microsoft द्वारा अपने डेटासेट को सबसे उपयोगी जानकारी के साथ क्यूरेट करने पर ध्यान केंद्रित करने के कारण Phi-3 Mini ने उच्च परीक्षण स्कोर प्राप्त किया है। व्यापक फी परिवार, वास्तव में, उन कार्यों के लिए अच्छा नहीं है जिनके लिए तथ्यात्मक ज्ञान की आवश्यकता होती है, लेकिन उच्च तर्क कौशल उन्हें प्रमुख प्रतिस्पर्धियों से ऊपर रखता है। Phi-3 मीडियम (एक 14-बिलियन पैरामीटर मॉडल) लगातार GPT-3.5 जैसे शक्तिशाली LLM को मात देता है - यह LLM ChatGPT के मुफ्त संस्करण को शक्ति प्रदान करता है - और मिनी संस्करण अधिकांश सिंथेटिक बेंचमार्क में मिक्सट्रल-8x7B जैसे शक्तिशाली मॉडल को मात देता है।

हालाँकि, यह ध्यान देने योग्य है कि Phi-3 अपने पूर्ववर्ती Phi-2 की तरह खुला स्रोत नहीं है। इसके बजाय, यह एक है खुला मॉडल, जिसका अर्थ है कि यह पहुंच योग्य है और उपयोग के लिए उपलब्ध है, लेकिन इसमें Phi-2 के समान ओपन सोर्स लाइसेंसिंग नहीं है, जो व्यापक उपयोग और वाणिज्यिक अनुप्रयोगों की अनुमति देता है।

आने वाले हफ्तों में, माइक्रोसॉफ्ट ने कहा कि वह Phi-3 परिवार में और अधिक मॉडल जारी करेगा, जिसमें Phi-3 Small (7 बिलियन पैरामीटर) और उपरोक्त Phi-3 मीडियम शामिल हैं।

माइक्रोसॉफ्ट ने Phi-3 Mini को Azure AI Studio, Hugging Face और Ollama पर उपलब्ध कराया है। मॉडल को विंडोज़ डायरेक्टएमएल के समर्थन के साथ-साथ विभिन्न जीपीयू, सीपीयू और यहां तक ​​कि मोबाइल हार्डवेयर में क्रॉस-प्लेटफ़ॉर्म समर्थन के साथ ओएनएनएक्स रनटाइम के लिए अनुदेश-ट्यून और अनुकूलित किया गया है।

क्रिप्टो समाचारों के शीर्ष पर रहें, अपने इनबॉक्स में दैनिक अपडेट प्राप्त करें।

स्पॉट_आईएमजी

नवीनतम खुफिया

स्पॉट_आईएमजी

हमारे साथ चैट करें

नमस्ते! मैं आपकी कैसे मदद कर सकता हूँ?