ความฉลาดทางข้อมูลเชิงกำเนิด

Meta เปิดตัว Llama-3—เรานำโมเดล AI โอเพ่นซอร์สยอดนิยมตัวใหม่มาทดสอบ – ถอดรหัส

วันที่:

Meta ได้เปิดตัว Llama 3 ซึ่งเป็นโมเดลภาษาขนาดใหญ่โอเพ่นซอร์สที่ทันสมัยที่สุดที่มีอยู่ในปัจจุบัน มันสร้างขึ้นบนรากฐานที่วางไว้โดย Llama 2 รุ่นก่อน และเป็นเรื่องที่น่าประหลาดใจเมื่อพิจารณาจากข่าวลือที่ชี้ให้เห็นว่า การเปิดตัวจะเกิดขึ้นในเดือนหน้า.

ด้วยรากฐานของโอเพ่นซอร์ส Llama-2 จึงเป็นเครื่องมือในการพัฒนาโมเดลที่ทรงพลังอื่นๆ ไปพร้อมๆ กัน เช่น มิกซ์ทรัล, อัลปาก้า, วิคูน่า และ WizardLM ปัจจุบัน Llama-3 สัญญาว่าจะพัฒนาความสามารถเหล่านี้ให้ดียิ่งขึ้นไปอีก โดยนำเสนอฟังก์ชันการทำงานที่เทียบได้กับ AI รุ่นเรือธง GPT-4 ในปัจจุบันของ OpenAI

Meta ยกย่องการเปิดตัววันพฤหัสบดี ในฐานะ “โมเดลภาษาขนาดใหญ่โอเพ่นซอร์สที่ล้ำสมัยรุ่นต่อไปของเรา” Llama 3 เป็นยักษ์ใหญ่ด้านเทคโนโลยีที่มีความมั่นใจอย่างยิ่งในความสามารถของตน เมตาเอไอซึ่งในทางกลับกันก็เพิ่มเข้ามาเกือบทั้งหมดของบริษัท แอพยอดนิยมอย่างหนาแน่น: อินสตาแกรม, เฟสบุ๊ค และ WhatsApp มีให้บริการในบางประเทศ แต่ผู้ใช้ในภูมิภาคอื่นสามารถเข้าถึงได้ผ่าน VPN

อินเทอร์เฟซ Chatbot ของ Meta AI เทียบได้กับ ChatGPT Plus และใช้งานได้ฟรี

“เรากำลังอัปเกรด Meta AI ด้วยโมเดล AI Llama 3 ที่ล้ำสมัยใหม่ของเรา ซึ่งเราเป็นแบบโอเพ่นซอร์ส” Mark Zuckerberg กล่าวว่า ในโพสต์บน Facebook “ด้วยโมเดลใหม่นี้ เราเชื่อว่าตอนนี้ Meta AI กลายเป็นผู้ช่วย AI ที่ชาญฉลาดที่สุดที่คุณสามารถใช้งานได้อย่างอิสระ”

ถอดรหัส สามารถทดสอบ AI ใหม่และพบว่ามีความสามารถเท่ากับ ChatGPT-Plus โดยไม่ต้องสมัครสมาชิกแบบชำระเงิน โดยสามารถสร้างรูปภาพและภาพเคลื่อนไหว สร้างโค้ด และให้การตอบสนองที่เกี่ยวข้องตามบริบทที่สอดคล้องกัน แชทบอตใหม่ยังสามารถเข้าถึงอินเทอร์เน็ตได้ แต่ก็ยังไม่ตรงกับความสามารถของโซลูชันพิเศษเช่น Perplexity

บางทีข้อเสียเพียงอย่างเดียวก็คือหน้าต่างบริบทปัจจุบันของ Llama-3 ถูกจำกัดไว้ที่โทเค็น 8K — ประมาณ 6,000 คำ

Meta ได้เปิดตัวโมเดล Llama-70 มูลค่า 3 พันล้านพารามิเตอร์ แต่การใช้โมเดลดังกล่าวจะต้องใช้พลังงานในการประมวลผลจำนวนมาก ซึ่งอาจเป็น GPU ทั้งหมด ตามเกณฑ์มาตรฐานสังเคราะห์ รุ่นนี้เอาชนะ Gemini 1.5 Pro และ Claude 3 Sonnet

นอกจากนี้ยังมีโมเดลพารามิเตอร์ 8 พันล้าน ซึ่งสามารถเรียกใช้ภายในเครื่องบน GPU ระดับผู้บริโภค อันนี้เอาชนะ Gemma และ Mistral 7B ของ Google ในเกณฑ์มาตรฐานสังเคราะห์ต่างๆ โมเดลดังกล่าวยังไม่มีการระบุไว้ใน LLM Arena ดังนั้นจึงยังไม่มีคะแนน ELO แบบอัตนัยที่จะรายงาน

Llama 3 กับ AI LLM อื่นๆ
ภาพ: Meta

ทั้งสองรุ่นสามารถรันในอินสแตนซ์คลาวด์ได้ด้วยต้นทุนที่ต่ำกว่า

“เราทุ่มเทให้กับการพัฒนา Llama 3 ด้วยความรับผิดชอบ และเรากำลังนำเสนอทรัพยากรต่างๆ เพื่อช่วยให้ผู้อื่นใช้งานได้อย่างมีความรับผิดชอบเช่นกัน” Meta กล่าว ซึ่งรวมถึงการเปิดตัวเครื่องมือที่เชื่อถือได้และความปลอดภัยใหม่ เช่น Llama Guard 2, Code Shield และ CyberSec Eval 2

ในอีกไม่กี่เดือนข้างหน้า Meta กล่าวว่ามีแผนจะเปิดตัวความสามารถใหม่ หน้าต่างบริบทที่ยาวขึ้น ขนาดโมเดลเพิ่มเติม และประสิทธิภาพที่ได้รับการปรับปรุง นอกจากนี้ จะมีการแชร์รายงานการวิจัย Llama 3 ด้วย

“Meta AI ซึ่งสร้างขึ้นด้วยเทคโนโลยี Llama 3 ปัจจุบันเป็นหนึ่งในผู้ช่วย AI ชั้นนำของโลกที่สามารถเพิ่มความฉลาดและลดภาระของคุณ ช่วยให้คุณเรียนรู้ ทำสิ่งต่าง ๆ ให้สำเร็จ สร้างเนื้อหา และเชื่อมต่อเพื่อรับประโยชน์สูงสุดจากทุกช่วงเวลา "เมต้ากล่าว

Meta เสริมว่ากำลังฝึกอบรมโมเดลพารามิเตอร์ขนาดใหญ่ 400 พันล้าน ซึ่งคาดว่าจะเปิดตัวในปลายปีนี้ โมเดลนี้ ซึ่งน่าจะเทียบได้กับ Claude Opus หรือ GPT-4.5 เวอร์ชันล่าสุด อาจเป็นโมเดลโอเพ่นซอร์สที่ทรงพลังที่สุดในปัจจุบัน หากประวัติศาสตร์ซ้ำรอย ประวัติศาสตร์ก็จะทำหน้าที่เป็นฐานสำหรับโมเดลที่ได้รับการปรับแต่งอย่างดีรุ่นใหม่ ซึ่งจะเอาชนะ Llama-3 ในด้านคุณภาพโดยรวม และจะช่วยเพิ่มการแข่งขันกับโมเดลที่มาจากแหล่งใกล้เคียงชั้นนำ

ขี่ลามะ

ถอดรหัส ทดสอบ Llama-3 ภายใน Meta AI เพื่อดูว่ามันดีเท่ากับที่ Zuck พูดหรือไม่ กล่าวโดยสรุป Llama-3 ได้นำเสนอคุณลักษณะและความสามารถที่โดดเด่นหลายประการ และควรเป็นโมเดลพื้นฐานที่ยอดเยี่ยมที่ชุมชนโอเพ่นซอร์สสามารถทำซ้ำได้

การกลั่นกรองเนื้อหา

Llama-3 แสดงให้เห็นถึงความมุ่งมั่นอย่างแรงกล้าในการกลั่นกรองเนื้อหา ปฏิเสธที่จะสร้างเนื้อหาเกี่ยวกับเชื้อชาติที่เป็นอันตรายอย่างต่อเนื่อง แม้ว่าจะต้องเผชิญกับเทคนิคการแหกคุกทั่วไปก็ตาม

ตัวอย่างเช่น เมื่อนางแบบถูกถามถึงคำแนะนำในการล่อลวงผู้หญิง แบบจำลองก็ให้คำตอบทั่วไปแต่มีประโยชน์ อย่างไรก็ตาม เมื่อถูกถามถึงวิธีการเกลี้ยกล่อมภรรยาของเพื่อนสนิท นางแบบก็ปฏิเสธที่จะให้คำตอบอย่างแข็งขัน

รูปภาพและภาพเคลื่อนไหว

เช่นเดียวกับ ChatGPT-Plus Meta AI พร้อม Llama-3 สามารถสร้างภาพได้ อย่างไรก็ตาม ความสามารถนี้ก้าวไปอีกขั้นด้วยการนำเสนอตัวเลือกในการทำให้พวกมันเคลื่อนไหว ซึ่งเป็นฟีเจอร์ที่ไม่มีใน ChatGPT หรือ Gemini

รูปภาพที่สร้างโดย Meta AI พร้อม Llama-3 นั้นมีความสมจริงมากกว่าภาพที่ผลิตโดย Dalle-3 แต่คุณภาพของรูปภาพที่สร้างโดย ImageFX ของ Google ที่กำลังจะมาถึงนั้นไม่เพียงพอ

ความสามารถในการเข้ารหัส

Llama-3 ได้รับการพิสูจน์แล้วว่ามีความเชี่ยวชาญในการเขียนโค้ดสูง เมื่อนำเสนอด้วยแนวคิดเกมที่ไม่เหมือนใครและอธิบายได้ไม่ดี โมเดลก็สามารถสร้างโค้ด Python ที่จำเป็นได้ในสองครั้ง ส่งผลให้เกิดเกมที่ใช้งานได้ ช็อตแรกทำให้เรามีแนวคิดคร่าวๆ เกี่ยวกับวิธีการสร้างเกม แต่มันสร้างโค้ดที่ใช้งานได้หลังจากที่เราชี้แจงว่าเราต้องการมันใน Python

เกมดังกล่าวใช้งานได้แต่พลาดรายละเอียดเล็กๆ น้อยๆ บางอย่าง เช่น การรีสตาร์ทหลังจากที่ผู้เล่นชนะ สิ่งเดียวกันนี้เกิดขึ้นกับแชทบอทอื่น ๆ

เราพบว่า Claude 3 Sonnet เป็นเครื่องมือที่ดีที่สุดสำหรับงานนี้ ตามมาด้วย Llama 3 GPT-4 ตกไปอยู่อันดับสาม อย่างไรก็ตาม ผู้ใช้แต่ละคนอาจได้รับผลลัพธ์ที่แตกต่างกัน

ที่นี่คือ pastebin ด้วยซอร์สโค้ดที่สร้างโดย Llama3, Claude และ ChatGPT สำหรับผู้ที่สนใจทดสอบ

ความเป็นกลางทางการเมือง

แบบจำลองนี้มีจุดมุ่งหมายเพื่อความเป็นกลางทางการเมือง โดยเห็นได้จากการตอบคำถามเกี่ยวกับลัทธิทุนนิยมและลัทธิคอมมิวนิสต์ การตอบสนองมีโครงสร้างคล้ายคลึงกัน โดยให้การแนะนำ ข้อดี และข้อเสียสำหรับแต่ละระบบ

รูปแบบของความเป็นกลางนี้ยังพบเห็นได้ในการตอบคำถามเช่น “ผู้ชายคืออะไร” และ “ผู้หญิงคืออะไร”

ถึงกระนั้น การตอบสนองของมันก็เป็นแบบสนับสนุนทุนนิยมเล็กน้อยและเอนเอียงไปทางซ้ายเล็กน้อย ซึ่งไม่น่าแปลกใจเนื่องจากเป็นการตอบสนองมากที่สุด แนวโน้มทางการเมืองร่วมกัน ท่ามกลางโมเดลภาษาขนาดใหญ่

เหตุผลเชิงตรรกะ

Llama-3 ได้แสดงให้เห็นถึงความสามารถในการให้เหตุผลเชิงตรรกะที่ทรงพลัง เมื่อทดสอบด้วยคำถาม LSAT ที่ซับซ้อนซึ่งมักสร้างความสับสนให้กับผู้ใช้ โมเดลดังกล่าวไม่เพียงแต่ให้คำตอบที่ถูกต้อง แต่ยังให้คำอธิบายที่ชัดเจนและสมเหตุสมผลอีกด้วย

ข้อ จำกัด ที่รวดเร็ว

แม้จะมีจุดแข็งมากมาย แต่ Llama-3 ก็ต่อสู้กับการแจ้งเตือนที่ยาวนาน เมื่อได้รับข้อความแจ้งที่มีความยาวประมาณหนึ่งหน้าครึ่งของบริบท ซึ่งสามารถนำเข้าได้โดยโมเดลอย่าง GPT-4, Claude หรือ Mistral โมเดลดังกล่าวก็ส่งคืนข้อความแสดงข้อผิดพลาด

ความเข้าใจภาษา

แบบจำลองนี้แสดงให้เห็นถึงความเข้าใจที่ดีในภาษาต่างๆ เมื่อถูกขอให้แปลสโลแกนภาษาสเปน สโลแกนดังกล่าวไม่เพียงแต่ให้การแปลที่ถูกต้องเท่านั้น แต่ยังเสนอบริบทเพื่อให้เข้าใจสโลแกนนั้นได้ดียิ่งขึ้นอีกด้วย

สรุป

ในฐานะอินเทอร์เฟซแชทบอท Meta AI (ซึ่งขับเคลื่อนโดย Llama3) สามารถแข่งขันกับ ChatGPT Plus และเป็นตัวเลือกที่ยอดเยี่ยมโดยรวม

ในระดับเทคนิคมากขึ้น LLama3 ในฐานะ LLM ดีพอที่จะแข่งขันกับ GPT-4 ในสถานการณ์ต่างๆ โดยสูญเสียเพียงความสามารถด้านบริบทของโทเค็นและการดึงข้อมูล Augmented Generations เท่านั้น (โดยพื้นฐานแล้วจะดึงข้อมูลจากชุดข้อมูลเฉพาะที่ผู้ใช้ให้มา) สิ่งนี้อาจสำคัญสำหรับผู้ใช้ที่เชี่ยวชาญด้านเทคโนโลยี แต่อาจไม่ใช่เรื่องใหญ่สำหรับคนทั่วไปในชีวิตประจำวัน

หากคุณใช้ ChatGPT เพื่อสร้างภาพด้วย Dall-E เป็นหลัก คุณอาจต้องพิจารณายกเลิกการสมัครสมาชิกของคุณ เนื่องจากความสามารถในการสร้างภาพและภาพเคลื่อนไหวของ Llama-3 นั้นเทียบเคียงได้ อย่างไรก็ตาม หากคุณต้องการการสนับสนุนสำหรับการแจ้งที่ยาว Llama-3 อาจไม่ใช่ตัวเลือกที่ดีที่สุดสำหรับคุณ และคุณอาจต้องการพิจารณาใช้ ChatGPT-Plus ต่อไป

ผู้ใช้เป็นครั้งคราวอาจพบว่า Llama-3 ตรงตามความต้องการโดยไม่ต้องสมัครสมาชิกแบบชำระเงิน

สำหรับงานที่ต้องศึกษาข้อมูลทางอินเทอร์เน็ตอย่างหนัก ChatGPT Plus หรือ Perplexity อาจเหมาะสมกว่า

สุดท้ายนี้ หากคุณมุ่งเน้นไปที่การเขียนโค้ด Llama-3 อาจเป็นทางเลือกที่ดี แม้ว่าจะมีเครื่องมือพิเศษอื่นๆ ให้เลือกก็ตาม ความจริงที่ว่า Llama-3 ฟรีถือเป็นข้อได้เปรียบที่สำคัญ

แก้ไขโดย ไรอัน โอซาว่า.

ติดตามข่าวสาร crypto รับการอัปเดตทุกวันในกล่องจดหมายของคุณ

จุด_img

ข่าวกรองล่าสุด

จุด_img

แชทกับเรา

สวัสดี! ฉันจะช่วยคุณได้อย่างไร?