تخيل تسخير قوة نماذج اللغة المتقدمة لفهم استفسارات عملائك والرد عليها. أمازون بيدروك، وهي خدمة مُدارة بالكامل توفر الوصول إلى مثل هذه النماذج، مما يجعل ذلك ممكنًا. يؤدي الضبط الدقيق لنماذج اللغات الكبيرة (LLMs) على البيانات الخاصة بالمجال إلى زيادة المهام مثل الإجابة على أسئلة المنتج أو إنشاء محتوى ذي صلة.
في هذا المنشور، نعرض كيف تقوم أمازون بيدروك و قماش أمازون سيج ميكر، مجموعة الذكاء الاصطناعي بدون تعليمات برمجية، تسمح لمستخدمي الأعمال الذين ليس لديهم خبرة فنية عميقة بضبط ونشر LLMs. يمكنك تحويل تفاعل العملاء باستخدام مجموعات البيانات مثل الأسئلة والأجوبة الخاصة بالمنتج ببضع نقرات فقط باستخدام Amazon Bedrock و أمازون سيج ميكر جومب ستارت .
حل نظرة عامة
يوضح الرسم البياني التالي هذه العمارة.
في الأقسام التالية، نوضح لك كيفية ضبط النموذج من خلال إعداد مجموعة البيانات الخاصة بك، وإنشاء نموذج جديد، واستيراد مجموعة البيانات، وتحديد نموذج أساسي. نوضح أيضًا كيفية تحليل النموذج واختباره، ثم نشر النموذج عبر Amazon Bedrock.
المتطلبات الأساسية المسبقة
يحتاج المستخدمون لأول مرة إلى حساب AWS و إدارة الهوية والوصول AWS (IAM) مع SageMaker وAmazon Bedrock و خدمة تخزين أمازون البسيطة (أمازون S3) الوصول.
لمتابعة هذا المنشور، أكمل الخطوات الأساسية لإنشاء مجال وتمكين الوصول إلى نماذج Amazon Bedrock:
- قم بإنشاء مجال SageMaker.
- في صفحة تفاصيل المجال، قم بعرض ملفات تعريف المستخدمين.
- اختار إطلاق من خلال ملفك الشخصي، ثم اختر لوحة جدارية (لوحة كانفس).
- تأكد من أن دور SageMaker IAM الخاص بك وأدوار المجال لها الأذونات اللازمة و علاقات الثقة.
- في وحدة تحكم Amazon Bedrock، اختر الوصول إلى النموذج في جزء التنقل.
- اختار إدارة الوصول إلى النموذج.
- أختار أمازون لتمكين نموذج Amazon Titan.
قم بإعداد مجموعة البيانات الخاصة بك
أكمل الخطوات التالية لإعداد مجموعة البيانات الخاصة بك:
- قم بتنزيل ما يلي مجموعة بيانات CSV لأزواج الأسئلة والأجوبة.
- تأكد من أن مجموعة البيانات الخاصة بك خالية من مشكلات التنسيق.
- انسخ البيانات إلى ورقة جديدة واحذف النسخة الأصلية.
إنشاء نموذج جديد
يسمح SageMaker Canvas بالضبط الدقيق المتزامن لنماذج متعددة، مما يتيح لك مقارنة واختيار الأفضل من لوحة المتصدرين بعد الضبط الدقيق. ومع ذلك، يركز هذا المنشور على Amazon Titan Text G1-Express LLM. أكمل الخطوات التالية لإنشاء النموذج الخاص بك:
- في لوحة SageMaker، اختر نماذجي في جزء التنقل.
- اختار النموذج الجديد.
- في حالة نموذج اسم، أدخل اسمًا (على سبيل المثال ،
MyModel
). - في حالة نوع المشكلةتحديد نموذج الأساس الدقيق.
- اختار إنشاء.
الخطوة التالية هي استيراد مجموعة البيانات الخاصة بك إلى SageMaker Canvas:
- قم بإنشاء مجموعة بيانات باسم QA-Pairs.
- قم بتحميل ملف CSV المجهز أو حدده من مجموعة S3.
- اختر مجموعة البيانات، ثم اختر حدد مجموعة البيانات.
حدد نموذج الأساس
بعد تحميل مجموعة البيانات الخاصة بك، حدد نموذجًا أساسيًا وقم بضبطه باستخدام مجموعة البيانات الخاصة بك. أكمل الخطوات التالية:
- على ضبط دقيق علامة التبويب في حدد النماذج الأساسية القائمة¸ حدد تيتان اكسبرس.
- في حالة حدد عمود الإدخال، اختر سؤال.
- في حالة حدد عمود الإخراج، اختر إجابة.
- اختار ضبط دقيق.
انتظر من 2 إلى 5 ساعات حتى ينتهي SageMaker من ضبط نماذجك.
حلل النموذج
عند اكتمال الضبط الدقيق، يمكنك عرض الإحصائيات الخاصة بطرازك الجديد، بما في ذلك:
- خسارة التدريب – عقوبة كل خطأ في التنبؤ بالكلمة التالية أثناء التدريب. تشير القيم المنخفضة إلى أداء أفضل.
- حيرة التدريب - مقياس مفاجأة العارضة عند مواجهتها للنص أثناء التدريب. تشير الحيرة المنخفضة إلى ثقة أعلى في النموذج.
- فقدان التحقق من الصحة والحيرة التحقق من الصحة - تشبه مقاييس التدريب، ولكن يتم قياسها أثناء مرحلة التحقق.
للحصول على تقرير تفصيلي عن أداء نموذجك المخصص عبر أبعاد مختلفة، مثل درجة السمية والدقة، اختر إنشاء تقرير التقييم. ثم حدد تحميل التقرير.
يقدم Canvas دفتر ملاحظات Python Jupyter يعرض تفاصيل مهمة الضبط الدقيق لديك، ويخفف من المخاوف بشأن تقييد البائع المرتبط بالأدوات التي لا تحتوي على تعليمات برمجية، ويتيح مشاركة التفاصيل مع فرق علوم البيانات لمزيد من التحقق من الصحة والنشر.
إذا قمت بتحديد نماذج أساسية متعددة لإنشاء نماذج مخصصة من مجموعة البيانات الخاصة بك، فاطلع على المتصدرين النموذجية لمقارنتها بأبعاد مثل الخسارة والحيرة.
اختبار النماذج
لديك الآن إمكانية الوصول إلى النماذج المخصصة التي يمكن اختبارها في SageMaker Canvas. أكمل الخطوات التالية لاختبار النماذج:
- اختار اختبار في النماذج الجاهزة للاستخدام وانتظر من 15 إلى 30 دقيقة حتى يتم نشر نقطة نهاية الاختبار.
ستبقى نقطة نهاية الاختبار هذه لمدة ساعتين فقط لتجنب التكاليف غير المقصودة.
عند اكتمال النشر، ستتم إعادة توجيهك إلى ساحة لعب SageMaker Canvas، مع تحديد النموذج الخاص بك مسبقًا.
- اختار المقارنات وحدد نموذج الأساس المستخدم لنموذجك المخصص.
- أدخل عبارة مباشرة من مجموعة بيانات التدريب الخاصة بك، للتأكد من أن النموذج المخصص على الأقل يؤدي أداءً أفضل في مثل هذا السؤال.
في هذا المثال ندخل السؤال “Who developed the lie-detecting algorithm Fraudoscope?”
استجاب النموذج المضبوط بشكل صحيح:
“The lie-detecting algorithm Fraudoscope was developed by Tselina Data Lab.”
استجابت Amazon Titan بشكل غير صحيح وإسهاب. ومع ذلك، يُحسب للنموذج أنه أنتج مخاوف أخلاقية مهمة وقيودًا على تقنيات التعرف على الوجه بشكل عام:
دعونا نطرح سؤالاً حول شريحة NVIDIA التي تعمل بالطاقة الأمازون الحوسبة المرنة السحابية (Amazon EC2) مثيلات P4d: “How much memory in an A100?”
مرة أخرى، النموذج المخصص لا يحصل على الإجابة الصحيحة فحسب، بل يجيب أيضًا بالإيجاز الذي تريده من روبوت الأسئلة والأجوبة:
“An A100 GPU provides up to 40 GB of high-speed HBM2 memory.”
إجابة Amazon Titan غير صحيحة:
انشر النموذج عبر Amazon Bedrock
بالنسبة للاستخدام الإنتاجي، خاصة إذا كنت تفكر في توفير الوصول إلى العشرات أو حتى الآلاف من الموظفين عن طريق تضمين النموذج في أحد التطبيقات، يمكنك نشر النماذج كنقاط نهاية لواجهة برمجة التطبيقات (API). أكمل الخطوات التالية لنشر النموذج الخاص بك:
- في وحدة تحكم Amazon Bedrock، اختر نماذج الأساس في جزء التنقل ، ثم اختر نماذج مخصصة.
- حدد موقع النموذج الذي يحتوي على البادئة Canvas - مع استخدام Amazon Titan كمصدر.
بدلا من ذلك ، يمكنك استخدام واجهة سطر الأوامر AWS (AWS CLI): aws bedrock list-custom-models
- قم بتدوين ملف
modelArn
، والذي ستستخدمه في الخطوة التالية، وmodelName
أو احفظها مباشرة كمتغيرات:
لبدء استخدام النموذج الخاص بك، يجب عليك توفير الإنتاجية.
- في وحدة تحكم Amazon Bedrock، اختر شراء الإنتاجية المتوفرة.
- قم بتسميتها، قم بتعيين وحدة نموذجية واحدة، بدون مدة التزام.
- قم بتأكيد الشراء.
وبدلاً من ذلك، يمكنك استخدام AWS CLI:
أو، إذا قمت بحفظ القيم كمتغيرات في الخطوة السابقة، استخدم الكود التالي:
وبعد حوالي خمس دقائق، تتغير حالة النموذج من خلق إلى في الخدمة.
إذا كنت تستخدم AWS CLI، فيمكنك رؤية الحالة عبر aws bedrock list-provisioned-model-throughputs
.
استخدم النموذج
يمكنك الوصول إلى LLM المضبوط من خلال وحدة تحكم Amazon Bedrock أو API أو CLI أو SDK.
في مجلة ساحة الدردشة، واختر فئة النماذج التي تم ضبطها بدقة، وحدد نموذج Canvas البادئ، والإنتاجية المتوفرة.
قم بإثراء برنامجك الحالي كخدمة (SaaS)، أو منصات البرامج، أو بوابات الويب، أو تطبيقات الهاتف المحمول باستخدام LLM المضبوط بدقة باستخدام واجهة برمجة التطبيقات (API) أو مجموعات تطوير البرامج (SDK). تتيح لك هذه إرسال المطالبات إلى نقطة نهاية Amazon Bedrock باستخدام لغة البرمجة المفضلة لديك.
توضح الاستجابة قدرة النموذج المخصصة للإجابة على هذه الأنواع من الأسئلة:
“The lie-detecting algorithm Fraudoscope was developed by Tselina Data Lab.”
يؤدي هذا إلى تحسين الاستجابة من Amazon Titan قبل الضبط الدقيق:
“Marston Morse developed the lie-detecting algorithm Fraudoscope.”
للحصول على مثال كامل لاستدعاء النماذج على Amazon Bedrock، راجع ما يلي مستودع جيثب. يوفر هذا المستودع قاعدة تعليمات برمجية جاهزة للاستخدام تتيح لك تجربة العديد من دورات LLM ونشر بنية chatbot متعددة الاستخدامات داخل حساب AWS الخاص بك. لديك الآن المهارات اللازمة لاستخدام هذا مع النموذج المخصص الخاص بك.
مستودع آخر قد يثير خيالك هو عينات الأمازون بيدروك، والتي يمكن أن تساعدك على البدء في عدد من حالات الاستخدام الأخرى.
وفي الختام
في هذا المنشور، أوضحنا لك كيفية ضبط LLM لتناسب احتياجات عملك بشكل أفضل، ونشر نموذجك المخصص كنقطة نهاية لواجهة برمجة تطبيقات Amazon Bedrock، واستخدام نقطة النهاية هذه في رمز التطبيق. أدى هذا إلى فتح قوة نموذج اللغة المخصصة لمجموعة واسعة من الأشخاص داخل عملك.
على الرغم من أننا استخدمنا أمثلة تعتمد على مجموعة بيانات نموذجية، فقد عرض هذا المنشور قدرات هذه الأدوات والتطبيقات المحتملة في سيناريوهات العالم الحقيقي. تعتبر العملية واضحة وقابلة للتطبيق على مجموعات البيانات المختلفة، مثل الأسئلة الشائعة الخاصة بمؤسستك، بشرط أن تكون بتنسيق CSV.
خذ ما تعلمته وابدأ في تبادل الأفكار حول طرق استخدام نماذج الذكاء الاصطناعي المخصصة في مؤسستك. لمزيد من الإلهام، انظر التغلب على تحديات مركز الاتصال الشائعة باستخدام الذكاء الاصطناعي التوليدي وAmazon SageMaker Canvas و AWS re:Invent 2023 – إمكانات LLM جديدة في Amazon SageMaker Canvas، مع Bain & Company (AIM363).
حول المؤلف
يان ستونمان هو مهندس حلول في AWS يركز على التعلم الآلي وتطوير التطبيقات بدون خادم. بفضل خلفيته في هندسة البرمجيات ومزيج من الفنون والتعليم التكنولوجي من Juilliard وColumbia، يقدم Yann نهجًا إبداعيًا لمواجهة تحديات الذكاء الاصطناعي. يشارك خبرته بنشاط من خلال قناته على YouTube ومنشورات المدونة والعروض التقديمية.
دافيد جاليتيلي مهندس حلول متخصص للذكاء الاصطناعي / تعلم الآلة في منطقة أوروبا والشرق الأوسط وإفريقيا. يقيم في بروكسل ويعمل بشكل وثيق مع العملاء في جميع أنحاء البنلوكس. لقد كان مطورًا منذ صغره ، حيث بدأ البرمجة في سن السابعة. بدأ تعلم AI / ML في سنواته الجامعية الأخيرة ، وقد وقع في حبها منذ ذلك الحين.
- محتوى مدعوم من تحسين محركات البحث وتوزيع العلاقات العامة. تضخيم اليوم.
- PlatoData.Network Vertical Generative Ai. تمكين نفسك. الوصول هنا.
- أفلاطونايستريم. ذكاء Web3. تضخيم المعرفة. الوصول هنا.
- أفلاطون كربون، كلينتك ، الطاقة، بيئة، شمسي، إدارة المخلفات. الوصول هنا.
- أفلاطون هيلث. التكنولوجيا الحيوية وذكاء التجارب السريرية. الوصول هنا.
- المصدر https://aws.amazon.com/blogs/machine-learning/fine-tune-and-deploy-language-models-with-amazon-sagemaker-canvas-and-amazon-bedrock/