ความฉลาดทางข้อมูลเชิงกำเนิด

Anthropic เปิดตัว Claude 3 และบอกว่ามันดีกว่าคู่แข่ง

วันที่:

Anthropic สตาร์ทอัพด้าน AI ได้เปิดตัว Claude 3 ซึ่งเป็นการทำซ้ำล่าสุดของโมเดลภาษาขนาดใหญ่ ซึ่งอ้างว่ามีประสิทธิภาพมากกว่า GPT-4 ของ OpenAI

ประกาศเมื่อวันจันทร์ Claude 3 มีสามขนาดแตกต่างกัน: บทประพันธ์ โคลง และไฮกุ [รูปแบบ PDF ที่ไม่เหมาะสม] Opus เป็นโปรแกรมที่ทรงพลังที่สุดในสามตัวเลือกนี้ และพร้อมให้นักพัฒนาและผู้ใช้ใช้งานได้ผ่านการสมัครสมาชิก API ของ Anthropic และ Claude Pro นักพัฒนายังสามารถเข้าถึง Sonnet ผ่านทาง API และปัจจุบันขับเคลื่อนแชทบอตบนเว็บฟรีของ Anthropic Haiku รุ่นที่เล็กที่สุดยังไม่มีวางจำหน่ายในขณะนี้

ในการทดสอบเกณฑ์มาตรฐานทางวิชาการ – การประเมินความสามารถของ LLM ในการรักษาความรู้ทั่วไป, แก้ปัญหาคณิตศาสตร์, สร้างโค้ด และแสดงทักษะการใช้เหตุผล – Opus ทำคะแนนได้สูงกว่า GPT-4 ของ OpenAI และ Gemini Ultra ของ Google, รายงาน Anthropic นักพัฒนาไปได้ไกลถึงขั้นโอ้อวดว่า Opus “แสดงให้เห็นถึงระดับความเข้าใจและความคล่องแคล่วในระดับที่ใกล้เคียงกับมนุษย์ในงานที่ซับซ้อน ซึ่งนำไปสู่ขอบเขตของสติปัญญาทั่วไป”

ในขณะเดียวกัน Sonnet และ Haiku ก็มีประสิทธิภาพมากกว่ารุ่น GPT-3.5 ก่อนหน้าของ OpenAI แต่มีความสามารถน้อยกว่ารุ่น Gemini Ultra และ Pro ของ Google

Anthropic อธิบายว่าหน้าต่างบริบท – จำนวนอินพุตที่สามารถประมวลผลได้ในคราวเดียว – จะเป็นโทเค็น 200 ในตอนแรก แต่สามารถสูงถึงหนึ่งล้านโทเค็น

Opus มีราคาสูง และได้รับการออกแบบมาสำหรับผู้ใช้ที่ต้องการใช้ AI สำหรับงานที่ต้องการความเข้าใจและสร้างข้อมูลในระดับสูงสุด เช่น การวิจัยทางวิทยาศาสตร์ หรือการวิเคราะห์รายงานที่ยาวและซับซ้อน มีค่าใช้จ่าย 15 ดอลลาร์ในการประมวลผลพรอมต์อินพุตที่ขยายเป็นล้านโทเค็น และ 75 ดอลลาร์เพื่อสร้างโทเค็นหนึ่งล้านสำหรับเอาท์พุต จากการเปรียบเทียบ OpenAI จะเรียกเก็บเงินระหว่าง 10 ถึง 30 ดอลลาร์สำหรับการประมวลผลและสร้างโทเค็นหนึ่งล้านโทเค็นในรุ่น GPT-4 Turbo

Sonnet มุ่งเป้าไปที่ผู้ใช้ระดับองค์กรทั่วไปที่ต้องการโมเดลที่มีความสามารถแต่รวดเร็ว ซึ่งสามารถทำสิ่งต่างๆ เช่น ค้นหาและดึงข้อมูล เขียนสำเนาทางการตลาด หรือสร้างโค้ดได้ ได้รับการปรับให้เหมาะสมสำหรับการปรับใช้ขนาดใหญ่และมีค่าใช้จ่าย 3 และ 15 ดอลลาร์เพื่อจัดการโทเค็นหนึ่งล้านที่อินพุตและเอาต์พุตตามลำดับ Haiku จะมีราคาถูกกว่าอีก โดยมีราคา 0.25 ดอลลาร์ และ 1.25 ดอลลาร์ในการประมวลผลและสร้างโทเค็นหนึ่งล้านโทเค็น ควรเป็นประโยชน์สำหรับสิ่งต่างๆ เช่น การกลั่นกรองเนื้อหา การแปลภาษา หรือการบริการลูกค้า

Amazon ประกาศว่าจะมีการโฮสต์โมเดล Claude 3 ของ Anthropic บนแพลตฟอร์มคลาวด์ Bedrock และมีการแสดงตัวอย่างแบบส่วนตัวบน Vertex AI Model Garden ของ Google Cloud ขณะนี้มีเพียง Sonnet เท่านั้น

Claude 3 ยังมีความระมัดระวังน้อยกว่ารุ่นก่อนอีกด้วย Claude 2.1 มักจะปฏิเสธที่จะปฏิบัติตามคำแนะนำที่ไม่จำเป็นต้องเป็นอันตราย เช่น การร้องขอให้เขียนเรื่องราวสมมติ ประกาศของผู้พัฒนา ผู้ใช้ที่มั่นใจ: “เราได้ก้าวหน้าไปอย่างมากในด้านนี้: Opus, Sonnet และ Haiku มีโอกาสน้อยที่จะปฏิเสธที่จะตอบข้อความแจ้งที่กั้นรั้วของระบบมากกว่ารุ่นก่อนๆ อย่างมีนัยสำคัญ”

อย่างไรก็ตาม ปัญหาใหญ่ที่สุดที่คุกคาม LLM คือแนวโน้มที่จะสร้างข้อมูลที่ไม่ถูกต้อง ข้อผิดพลาดที่เรียกว่าอาการประสาทหลอน หมายความว่าเป็นการยากที่จะเชื่อถือผลลัพธ์ของ AI และทำให้คอมพิวเตอร์มีอิสระในการทำงานมากขึ้น Anthropic สัญญาว่า Opus นำเสนอ "การปรับปรุงสองเท่า" เมื่อเทียบกับ Claude 2.1 และจะแนะนำคุณลักษณะที่จะอ้างอิงแหล่งที่มาในผลลัพธ์ที่สร้างโดยรุ่นล่าสุดเพื่อให้ผู้ใช้ตรวจสอบ

“เราไม่เชื่อว่าความอัจฉริยะของโมเดลนั้นใกล้ขีดจำกัด และเราวางแผนที่จะเผยแพร่การอัปเดตบ่อยครั้งสำหรับตระกูลโมเดล Claude 3 ในอีกไม่กี่เดือนข้างหน้า นอกจากนี้เรายังรู้สึกตื่นเต้นที่จะเปิดตัวชุดฟีเจอร์ต่างๆ เพื่อเพิ่มขีดความสามารถของโมเดลของเรา โดยเฉพาะสำหรับการใช้งานระดับองค์กรและการปรับใช้ขนาดใหญ่” การประกาศสรุป

สิ่งที่น่าสนใจคือ Anthropic เลือกที่จะไม่ทำให้ Claude 3 เป็นระบบหลายรูปแบบ แม้ว่าจะสามารถประมวลผลภาพได้ แต่ก็ไม่สามารถสร้างได้และไม่สามารถจัดการกับอินพุตเสียงหรือวิดีโอได้ ไม่เหมือน ChatGPT หรือ Gemini ®

จุด_img

ข่าวกรองล่าสุด

จุด_img