Meta เปิดตัว Llama-3—เรานำโมเดล AI โอเพ่นซอร์สยอดนิยมตัวใหม่มาทดสอบ - ถอดรหัส

Meta ได้เปิดตัว Llama 3 ซึ่งเป็นโมเดลภาษาขนาดใหญ่โอเพ่นซอร์สที่ทันสมัยที่สุดที่มีอยู่ในปัจจุบัน มันสร้างขึ้นบนรากฐานที่วางไว้โดย Llama 2 รุ่นก่อน และเป็นเรื่องที่น่าประหลาดใจเมื่อพิจารณาจากข่าวลือที่ชี้ให้เห็นว่า การเปิดตัวจะเกิดขึ้นในเดือนหน้า.

ด้วยรากฐานของโอเพ่นซอร์ส Llama-2 จึงเป็นเครื่องมือในการพัฒนาโมเดลที่ทรงพลังอื่นๆ ไปพร้อมๆ กัน เช่น มิกซ์ทรัล, อัลปาก้า, วิคูน่า และ WizardLM ปัจจุบัน Llama-3 สัญญาว่าจะพัฒนาความสามารถเหล่านี้ให้ดียิ่งขึ้นไปอีก โดยนำเสนอฟังก์ชันการทำงานที่เทียบได้กับ AI รุ่นเรือธง GPT-4 ในปัจจุบันของ OpenAI

Meta ยกย่องการเปิดตัววันพฤหัสบดี ในฐานะ “โมเดลภาษาขนาดใหญ่โอเพ่นซอร์สที่ล้ำสมัยรุ่นต่อไปของเรา” Llama 3 เป็นยักษ์ใหญ่ด้านเทคโนโลยีที่มีความมั่นใจอย่างยิ่งในความสามารถของตน เมตาเอไอซึ่งในทางกลับกันก็เพิ่มเข้ามาเกือบทั้งหมดของบริษัท แอพยอดนิยมอย่างหนาแน่น: อินสตาแกรม, เฟสบุ๊ค และ WhatsApp มีให้บริการในบางประเทศ แต่ผู้ใช้ในภูมิภาคอื่นสามารถเข้าถึงได้ผ่าน VPN

อินเทอร์เฟซ Chatbot ของ Meta AI เทียบได้กับ ChatGPT Plus และใช้งานได้ฟรี

“เรากำลังอัปเกรด Meta AI ด้วยโมเดล AI Llama 3 ที่ล้ำสมัยใหม่ของเรา ซึ่งเราเป็นแบบโอเพ่นซอร์ส” Mark Zuckerberg กล่าวว่า ในโพสต์บน Facebook “ด้วยโมเดลใหม่นี้ เราเชื่อว่าตอนนี้ Meta AI กลายเป็นผู้ช่วย AI ที่ชาญฉลาดที่สุดที่คุณสามารถใช้งานได้อย่างอิสระ”

ถอดรหัส สามารถทดสอบ AI ใหม่และพบว่ามีความสามารถเท่ากับ ChatGPT-Plus โดยไม่ต้องสมัครสมาชิกแบบชำระเงิน โดยสามารถสร้างรูปภาพและภาพเคลื่อนไหว สร้างโค้ด และให้การตอบสนองที่เกี่ยวข้องตามบริบทที่สอดคล้องกัน แชทบอตใหม่ยังสามารถเข้าถึงอินเทอร์เน็ตได้ แต่ก็ยังไม่ตรงกับความสามารถของโซลูชันพิเศษเช่น Perplexity

บางทีข้อเสียเพียงอย่างเดียวก็คือหน้าต่างบริบทปัจจุบันของ Llama-3 ถูกจำกัดไว้ที่โทเค็น 8K — ประมาณ 6,000 คำ

Meta ได้เปิดตัวโมเดล Llama-70 มูลค่า 3 พันล้านพารามิเตอร์ แต่การใช้โมเดลดังกล่าวจะต้องใช้พลังงานในการประมวลผลจำนวนมาก ซึ่งอาจเป็น GPU ทั้งหมด ตามเกณฑ์มาตรฐานสังเคราะห์ รุ่นนี้เอาชนะ Gemini 1.5 Pro และ Claude 3 Sonnet

นอกจากนี้ยังมีโมเดลพารามิเตอร์ 8 พันล้าน ซึ่งสามารถเรียกใช้ภายในเครื่องบน GPU ระดับผู้บริโภค อันนี้เอาชนะ Gemma และ Mistral 7B ของ Google ในเกณฑ์มาตรฐานสังเคราะห์ต่างๆ โมเดลดังกล่าวยังไม่มีการระบุไว้ใน LLM Arena ดังนั้นจึงยังไม่มีคะแนน ELO แบบอัตนัยที่จะรายงาน

ทั้งสองรุ่นสามารถรันในอินสแตนซ์คลาวด์ได้ด้วยต้นทุนที่ต่ำกว่า

“เราทุ่มเทให้กับการพัฒนา Llama 3 ด้วยความรับผิดชอบ และเรากำลังนำเสนอทรัพยากรต่างๆ เพื่อช่วยให้ผู้อื่นใช้งานได้อย่างมีความรับผิดชอบเช่นกัน” Meta กล่าว ซึ่งรวมถึงการเปิดตัวเครื่องมือที่เชื่อถือได้และความปลอดภัยใหม่ เช่น Llama Guard 2, Code Shield และ CyberSec Eval 2

ในอีกไม่กี่เดือนข้างหน้า Meta กล่าวว่ามีแผนจะเปิดตัวความสามารถใหม่ หน้าต่างบริบทที่ยาวขึ้น ขนาดโมเดลเพิ่มเติม และประสิทธิภาพที่ได้รับการปรับปรุง นอกจากนี้ จะมีการแชร์รายงานการวิจัย Llama 3 ด้วย

“Meta AI ซึ่งสร้างขึ้นด้วยเทคโนโลยี Llama 3 ปัจจุบันเป็นหนึ่งในผู้ช่วย AI ชั้นนำของโลกที่สามารถเพิ่มความฉลาดและลดภาระของคุณ ช่วยให้คุณเรียนรู้ ทำสิ่งต่าง ๆ ให้สำเร็จ สร้างเนื้อหา และเชื่อมต่อเพื่อรับประโยชน์สูงสุดจากทุกช่วงเวลา "เมต้ากล่าว

Meta เสริมว่ากำลังฝึกอบรมโมเดลพารามิเตอร์ขนาดใหญ่ 400 พันล้าน ซึ่งคาดว่าจะเปิดตัวในปลายปีนี้ โมเดลนี้ ซึ่งน่าจะเทียบได้กับ Claude Opus หรือ GPT-4.5 เวอร์ชันล่าสุด อาจเป็นโมเดลโอเพ่นซอร์สที่ทรงพลังที่สุดในปัจจุบัน หากประวัติศาสตร์ซ้ำรอย ประวัติศาสตร์ก็จะทำหน้าที่เป็นฐานสำหรับโมเดลที่ได้รับการปรับแต่งอย่างดีรุ่นใหม่ ซึ่งจะเอาชนะ Llama-3 ในด้านคุณภาพโดยรวม และจะช่วยเพิ่มการแข่งขันกับโมเดลที่มาจากแหล่งใกล้เคียงชั้นนำ

ขี่ลามะ

ถอดรหัส ทดสอบ Llama-3 ภายใน Meta AI เพื่อดูว่ามันดีเท่ากับที่ Zuck พูดหรือไม่ กล่าวโดยสรุป Llama-3 ได้นำเสนอคุณลักษณะและความสามารถที่โดดเด่นหลายประการ และควรเป็นโมเดลพื้นฐานที่ยอดเยี่ยมที่ชุมชนโอเพ่นซอร์สสามารถทำซ้ำได้

การกลั่นกรองเนื้อหา

Llama-3 แสดงให้เห็นถึงความมุ่งมั่นอย่างแรงกล้าในการกลั่นกรองเนื้อหา ปฏิเสธที่จะสร้างเนื้อหาเกี่ยวกับเชื้อชาติที่เป็นอันตรายอย่างต่อเนื่อง แม้ว่าจะต้องเผชิญกับเทคนิคการแหกคุกทั่วไปก็ตาม

ตัวอย่างเช่น เมื่อนางแบบถูกถามถึงคำแนะนำในการล่อลวงผู้หญิง แบบจำลองก็ให้คำตอบทั่วไปแต่มีประโยชน์ อย่างไรก็ตาม เมื่อถูกถามถึงวิธีการเกลี้ยกล่อมภรรยาของเพื่อนสนิท นางแบบก็ปฏิเสธที่จะให้คำตอบอย่างแข็งขัน

รูปภาพและภาพเคลื่อนไหว

เช่นเดียวกับ ChatGPT-Plus Meta AI พร้อม Llama-3 สามารถสร้างภาพได้ อย่างไรก็ตาม ความสามารถนี้ก้าวไปอีกขั้นด้วยการนำเสนอตัวเลือกในการทำให้พวกมันเคลื่อนไหว ซึ่งเป็นฟีเจอร์ที่ไม่มีใน ChatGPT หรือ Gemini

รูปภาพที่สร้างโดย Meta AI พร้อม Llama-3 นั้นมีความสมจริงมากกว่าภาพที่ผลิตโดย Dalle-3 แต่คุณภาพของรูปภาพที่สร้างโดย ImageFX ของ Google ที่กำลังจะมาถึงนั้นไม่เพียงพอ

ความสามารถในการเข้ารหัส

Llama-3 ได้รับการพิสูจน์แล้วว่ามีความเชี่ยวชาญในการเขียนโค้ดสูง เมื่อนำเสนอด้วยแนวคิดเกมที่ไม่เหมือนใครและอธิบายได้ไม่ดี โมเดลก็สามารถสร้างโค้ด Python ที่จำเป็นได้ในสองครั้ง ส่งผลให้เกิดเกมที่ใช้งานได้ ช็อตแรกทำให้เรามีแนวคิดคร่าวๆ เกี่ยวกับวิธีการสร้างเกม แต่มันสร้างโค้ดที่ใช้งานได้หลังจากที่เราชี้แจงว่าเราต้องการมันใน Python

เกมดังกล่าวใช้งานได้แต่พลาดรายละเอียดเล็กๆ น้อยๆ บางอย่าง เช่น การรีสตาร์ทหลังจากที่ผู้เล่นชนะ สิ่งเดียวกันนี้เกิดขึ้นกับแชทบอทอื่น ๆ

เราพบว่า Claude 3 Sonnet เป็นเครื่องมือที่ดีที่สุดสำหรับงานนี้ ตามมาด้วย Llama 3 GPT-4 ตกไปอยู่อันดับสาม อย่างไรก็ตาม ผู้ใช้แต่ละคนอาจได้รับผลลัพธ์ที่แตกต่างกัน

ที่นี่คือ pastebin ด้วยซอร์สโค้ดที่สร้างโดย Llama3, Claude และ ChatGPT สำหรับผู้ที่สนใจทดสอบ

ความเป็นกลางทางการเมือง

แบบจำลองนี้มีจุดมุ่งหมายเพื่อความเป็นกลางทางการเมือง โดยเห็นได้จากการตอบคำถามเกี่ยวกับลัทธิทุนนิยมและลัทธิคอมมิวนิสต์ การตอบสนองมีโครงสร้างคล้ายคลึงกัน โดยให้การแนะนำ ข้อดี และข้อเสียสำหรับแต่ละระบบ

รูปแบบของความเป็นกลางนี้ยังพบเห็นได้ในการตอบคำถามเช่น “ผู้ชายคืออะไร” และ “ผู้หญิงคืออะไร”

ถึงกระนั้น การตอบสนองของมันก็เป็นแบบสนับสนุนทุนนิยมเล็กน้อยและเอนเอียงไปทางซ้ายเล็กน้อย ซึ่งไม่น่าแปลกใจเนื่องจากเป็นการตอบสนองมากที่สุด แนวโน้มทางการเมืองร่วมกัน ท่ามกลางโมเดลภาษาขนาดใหญ่

เหตุผลเชิงตรรกะ

Llama-3 ได้แสดงให้เห็นถึงความสามารถในการให้เหตุผลเชิงตรรกะที่ทรงพลัง เมื่อทดสอบด้วยคำถาม LSAT ที่ซับซ้อนซึ่งมักสร้างความสับสนให้กับผู้ใช้ โมเดลดังกล่าวไม่เพียงแต่ให้คำตอบที่ถูกต้อง แต่ยังให้คำอธิบายที่ชัดเจนและสมเหตุสมผลอีกด้วย

ข้อ จำกัด ที่รวดเร็ว

แม้จะมีจุดแข็งมากมาย แต่ Llama-3 ก็ต่อสู้กับการแจ้งเตือนที่ยาวนาน เมื่อได้รับข้อความแจ้งที่มีความยาวประมาณหนึ่งหน้าครึ่งของบริบท ซึ่งสามารถนำเข้าได้โดยโมเดลอย่าง GPT-4, Claude หรือ Mistral โมเดลดังกล่าวก็ส่งคืนข้อความแสดงข้อผิดพลาด

ความเข้าใจภาษา

แบบจำลองนี้แสดงให้เห็นถึงความเข้าใจที่ดีในภาษาต่างๆ เมื่อถูกขอให้แปลสโลแกนภาษาสเปน สโลแกนดังกล่าวไม่เพียงแต่ให้การแปลที่ถูกต้องเท่านั้น แต่ยังเสนอบริบทเพื่อให้เข้าใจสโลแกนนั้นได้ดียิ่งขึ้นอีกด้วย

สรุป

ในฐานะอินเทอร์เฟซแชทบอท Meta AI (ซึ่งขับเคลื่อนโดย Llama3) สามารถแข่งขันกับ ChatGPT Plus และเป็นตัวเลือกที่ยอดเยี่ยมโดยรวม

ในระดับเทคนิคมากขึ้น LLama3 ในฐานะ LLM ดีพอที่จะแข่งขันกับ GPT-4 ในสถานการณ์ต่างๆ โดยสูญเสียเพียงความสามารถด้านบริบทของโทเค็นและการดึงข้อมูล Augmented Generations เท่านั้น (โดยพื้นฐานแล้วจะดึงข้อมูลจากชุดข้อมูลเฉพาะที่ผู้ใช้ให้มา) สิ่งนี้อาจสำคัญสำหรับผู้ใช้ที่เชี่ยวชาญด้านเทคโนโลยี แต่อาจไม่ใช่เรื่องใหญ่สำหรับคนทั่วไปในชีวิตประจำวัน

หากคุณใช้ ChatGPT เพื่อสร้างภาพด้วย Dall-E เป็นหลัก คุณอาจต้องพิจารณายกเลิกการสมัครสมาชิกของคุณ เนื่องจากความสามารถในการสร้างภาพและภาพเคลื่อนไหวของ Llama-3 นั้นเทียบเคียงได้ อย่างไรก็ตาม หากคุณต้องการการสนับสนุนสำหรับการแจ้งที่ยาว Llama-3 อาจไม่ใช่ตัวเลือกที่ดีที่สุดสำหรับคุณ และคุณอาจต้องการพิจารณาใช้ ChatGPT-Plus ต่อไป

ผู้ใช้เป็นครั้งคราวอาจพบว่า Llama-3 ตรงตามความต้องการโดยไม่ต้องสมัครสมาชิกแบบชำระเงิน

สำหรับงานที่ต้องศึกษาข้อมูลทางอินเทอร์เน็ตอย่างหนัก ChatGPT Plus หรือ Perplexity อาจเหมาะสมกว่า

สุดท้ายนี้ หากคุณมุ่งเน้นไปที่การเขียนโค้ด Llama-3 อาจเป็นทางเลือกที่ดี แม้ว่าจะมีเครื่องมือพิเศษอื่นๆ ให้เลือกก็ตาม ความจริงที่ว่า Llama-3 ฟรีถือเป็นข้อได้เปรียบที่สำคัญ

แก้ไขโดย ไรอัน โอซาว่า.

ติดตามข่าวสาร crypto รับการอัปเดตทุกวันในกล่องจดหมายของคุณ

เนื้อหาที่ขับเคลื่อนด้วย SEO และการเผยแพร่ประชาสัมพันธ์ รับการขยายวันนี้
PlatoData.Network Vertical Generative Ai เพิ่มพลังให้กับตัวเอง เข้าถึงได้ที่นี่.
เพลโตไอสตรีม. Web3 อัจฉริยะ ขยายความรู้ เข้าถึงได้ที่นี่.
เพลโตESG. คาร์บอน, คลีนเทค, พลังงาน, สิ่งแวดล้อม แสงอาทิตย์, การจัดการของเสีย. เข้าถึงได้ที่นี่.
เพลโตสุขภาพ เทคโนโลยีชีวภาพและข่าวกรองการทดลองทางคลินิก เข้าถึงได้ที่นี่.
ที่มา: https://decrypt.co/227263/meta-llama-3-open-source-ai-llm-review

ความฉลาดทางข้อมูลเชิงกำเนิด

Meta เปิดตัว Llama-3—เรานำโมเดล AI โอเพ่นซอร์สยอดนิยมตัวใหม่มาทดสอบ – ถอดรหัส

ขี่ลามะ

สรุป

ติดตามข่าวสาร crypto รับการอัปเดตทุกวันในกล่องจดหมายของคุณ

Ethereum กลับมาแล้วเหรอ? บันทึกผู้ใช้ใหม่ 267,000 ราย จุดประกายการเก็งกำไร

Metabirkin NFT เดินทางไปยังพิพิธภัณฑ์สตอกโฮล์ม – CryptoInfoNet

ข่าวกรองล่าสุด

การวิเคราะห์เงินสด Bitcoin: BCH เผชิญกับงานที่ยากลำบากที่ $462 | ข่าว Bitcoin สด

ราคา Ethereum อาจพุ่งขึ้นได้หากสามารถเรียกคืน 100 SMA ได้

Trezor ยุติฟีเจอร์ coinjoin ที่ปรับปรุงความเป็นส่วนตัว ในขณะที่ Wasabi Wallet ก้าวถอยหลัง

เหตุใด AI จึงไม่ช่วยเหลือเกม Web 3.0 ที่ไม่สามารถเล่นได้ – The Daily Hodl

รูปแบบ Bitcoin Mimics 2016: นักวิเคราะห์ชี้ว่าราคาอาจลดลงชั่วคราว pen_spark

แชทกับเรา