Bayangkan memanfaatkan kekuatan model bahasa tingkat lanjut untuk memahami dan menanggapi pertanyaan pelanggan Anda. Batuan Dasar Amazon, layanan terkelola sepenuhnya yang menyediakan akses ke model tersebut, memungkinkan hal ini. Menyempurnakan model bahasa besar (LLM) pada data khusus domain akan meningkatkan tugas seperti menjawab pertanyaan produk atau menghasilkan konten yang relevan.
Dalam postingan ini, kami menunjukkan bagaimana Amazon Bedrock dan Kanvas Amazon SageMaker, rangkaian AI tanpa kode, memungkinkan pengguna bisnis tanpa keahlian teknis mendalam untuk menyempurnakan dan menerapkan LLM. Anda dapat mengubah interaksi pelanggan menggunakan kumpulan data seperti Tanya Jawab produk hanya dengan beberapa klik menggunakan Amazon Bedrock dan Mulai Lompatan Amazon SageMaker model.
Ikhtisar solusi
Diagram berikut menggambarkan arsitektur ini.
Di bagian berikut, kami menunjukkan kepada Anda cara menyempurnakan model dengan menyiapkan kumpulan data, membuat model baru, mengimpor kumpulan data, dan memilih model dasar. Kami juga mendemonstrasikan cara menganalisis dan menguji model, lalu menerapkan model melalui Amazon Bedrock.
Prasyarat
Pengguna pertama kali memerlukan akun AWS dan Identitas AWS dan Manajemen Akses (IAM) peran dengan SageMaker, Amazon Bedrock, dan Layanan Penyimpanan Sederhana Amazon (Amazon S3) akses.
Untuk mengikuti postingan ini, selesaikan langkah-langkah prasyarat untuk membuat domain dan mengaktifkan akses ke model Amazon Bedrock:
- Buat domain SageMaker.
- Di halaman detail domain, lihat profil pengguna.
- Pilih Launch berdasarkan profil Anda, dan pilih Kanvas.
- Konfirmasikan bahwa peran IAM dan peran domain SageMaker Anda memiliki izin yang diperlukan dan hubungan kepercayaan.
- Di konsol Amazon Bedrock, pilih Akses model di panel navigasi.
- Pilih Kelola akses model.
- Pilih Amazon untuk mengaktifkan model Amazon Titan.
Siapkan kumpulan data Anda
Selesaikan langkah-langkah berikut untuk mempersiapkan dataset Anda:
- Download yang berikut ini Kumpulan data CSV dari pasangan tanya jawab.
- Konfirmasikan bahwa kumpulan data Anda bebas dari masalah pemformatan.
- Salin data ke lembar baru dan hapus yang asli.
Buat model baru
SageMaker Canvas memungkinkan penyesuaian beberapa model secara bersamaan, memungkinkan Anda membandingkan dan memilih yang terbaik dari papan peringkat setelah melakukan penyesuaian. Namun, postingan ini berfokus pada Amazon Titan Text G1-Express LLM. Selesaikan langkah-langkah berikut untuk membuat model Anda:
- Di kanvas SageMaker, pilih Model saya di panel navigasi.
- Pilih Model baru.
- Untuk Nama model, masukkan nama (misalnya,
MyModel
). - Untuk Jenis masalahPilih Menyempurnakan model pondasi.
- Pilih membuat.
Langkah selanjutnya adalah mengimpor kumpulan data Anda ke SageMaker Canvas:
- Buat kumpulan data bernama QA-Pairs.
- Unggah file CSV yang telah disiapkan atau pilih dari bucket S3.
- Pilih kumpulan data, lalu pilih Pilih set data.
Pilih model pondasi
Setelah Anda mengunggah kumpulan data, pilih model dasar dan sesuaikan dengan kumpulan data Anda. Selesaikan langkah-langkah berikut:
- pada Melodi indah tab, pada Pilih model dasar menuยธ pilih Titan Ekspres.
- Untuk Pilih kolom masukan, pilih pertanyaan.
- Untuk Pilih kolom keluaran, pilih menjawab.
- Pilih Melodi indah.
Tunggu 2โ5 jam hingga SageMaker menyelesaikan penyempurnaan model Anda.
Analisis modelnya
Saat penyesuaian selesai, Anda dapat melihat statistik tentang model baru Anda, termasuk:
- Kerugian pelatihan โ Hukuman untuk setiap kesalahan dalam prediksi kata berikutnya selama pelatihan. Nilai yang lebih rendah menunjukkan kinerja yang lebih baik.
- Kebingungan pelatihan โ Ukuran keterkejutan model saat menemukan teks selama pelatihan. Kebingungan yang lebih rendah menunjukkan kepercayaan model yang lebih tinggi.
- Kehilangan validasi dan kebingungan validasi โ Mirip dengan metrik pelatihan, tetapi diukur selama tahap validasi.
Untuk mendapatkan laporan mendetail tentang performa model kustom Anda di berbagai dimensi, seperti toksisitas dan akurasi, pilih Menghasilkan laporan evaluasi. Kemudian pilih Unduh laporan.
Canvas menawarkan notebook Python Jupyter yang merinci pekerjaan penyesuaian Anda, mengurangi kekhawatiran tentang penguncian vendor yang terkait dengan alat tanpa kode dan memungkinkan berbagi detail dengan tim ilmu data untuk validasi dan penerapan lebih lanjut.
Jika Anda memilih beberapa model pondasi untuk membuat model kustom dari kumpulan data Anda, lihat Papan peringkat model untuk membandingkannya pada dimensi seperti kehilangan dan kebingungan.
Uji modelnya
Anda sekarang memiliki akses ke model khusus yang dapat diuji di SageMaker Canvas. Selesaikan langkah-langkah berikut untuk menguji model:
- Pilih Uji Model Siap Pakai dan tunggu 15โ30 menit hingga titik akhir pengujian Anda diterapkan.
Titik akhir pengujian ini hanya akan bertahan selama 2 jam untuk menghindari biaya yang tidak diinginkan.
Saat penerapan selesai, Anda akan diarahkan ke taman bermain SageMaker Canvas, dengan model Anda telah dipilih sebelumnya.
- Pilih Bandingkan dan pilih model fondasi yang digunakan untuk model kustom Anda.
- Masukkan frasa langsung dari kumpulan data pelatihan Anda, untuk memastikan model kustom setidaknya berfungsi lebih baik dalam menjawab pertanyaan seperti itu.
Untuk contoh ini, kita memasukkan pertanyaan, โWho developed the lie-detecting algorithm Fraudoscope?โ
Model yang telah disesuaikan merespons dengan benar:
โThe lie-detecting algorithm Fraudoscope was developed by Tselina Data Lab.โ
Amazon Titan merespons dengan salah dan bertele-tele. Namun, model ini menimbulkan kekhawatiran etika yang penting dan keterbatasan teknologi pengenalan wajah secara umum:
Mari kita ajukan pertanyaan tentang chip NVIDIA, yang mendukungnya Cloud komputasi elastis Amazon (Amazon EC2) Instans P4d: โHow much memory in an A100?โ
Sekali lagi, model kustom tidak hanya memberikan jawaban yang lebih benar, namun juga menjawab dengan singkat yang Anda inginkan dari bot tanya jawab:
โAn A100 GPU provides up to 40 GB of high-speed HBM2 memory.โ
Jawaban Amazon Titan salah:
Terapkan model melalui Amazon Bedrock
Untuk penggunaan produksi, terutama jika Anda mempertimbangkan untuk memberikan akses ke puluhan atau bahkan ribuan karyawan dengan menyematkan model ke dalam aplikasi, Anda dapat menerapkan model tersebut sebagai titik akhir API. Selesaikan langkah-langkah berikut untuk menyebarkan model Anda:
- Di konsol Amazon Bedrock, pilih Model pondasi di panel navigasi, lalu pilih Model khusus.
- Temukan model dengan awalan Canvas- dengan Amazon Titan sebagai sumbernya.
Atau, Anda dapat menggunakan Antarmuka Baris Perintah AWS (AWS CLI): aws bedrock list-custom-models
- Perhatikan
modelArn
, yang akan Anda gunakan pada langkah berikutnya, danmodelName
, atau simpan langsung sebagai variabel:
Untuk mulai menggunakan model Anda, Anda harus menyediakan throughput.
- Di konsol Amazon Bedrock, pilih Beli Throughput yang Disediakan.
- Sebut saja, tetapkan 1 unit model, tanpa jangka waktu komitmen.
- Konfirmasi pembelian.
Alternatifnya, Anda dapat menggunakan AWS CLI:
Atau, jika Anda menyimpan nilai sebagai variabel pada langkah sebelumnya, gunakan kode berikut:
Setelah sekitar lima menit, status model berubah dari membuat untuk Dalam pelayanan.
Jika Anda menggunakan AWS CLI, Anda dapat melihat statusnya melalui aws bedrock list-provisioned-model-throughputs
.
Gunakan modelnya
Anda dapat mengakses LLM yang telah disesuaikan melalui konsol Amazon Bedrock, API, CLI, atau SDK.
Dalam majalah Taman Bermain Obrolan, pilih kategori model yang disempurnakan, pilih model dengan awalan Canvas, dan throughput yang disediakan.
Perkaya perangkat lunak sebagai layanan (SaaS), platform perangkat lunak, portal web, atau aplikasi seluler Anda yang sudah ada dengan LLM yang telah Anda sesuaikan menggunakan API atau SDK. Ini memungkinkan Anda mengirimkan perintah ke titik akhir Amazon Bedrock menggunakan bahasa pemrograman pilihan Anda.
Responsnya menunjukkan kemampuan model yang disesuaikan untuk menjawab jenis pertanyaan berikut:
โThe lie-detecting algorithm Fraudoscope was developed by Tselina Data Lab.โ
Hal ini meningkatkan respons dari Amazon Titan sebelum melakukan penyesuaian:
โMarston Morse developed the lie-detecting algorithm Fraudoscope.โ
Untuk contoh lengkap pemanggilan model di Amazon Bedrock, lihat yang berikut ini Repositori GitHub. Repositori ini menyediakan basis kode siap pakai yang memungkinkan Anda bereksperimen dengan berbagai LLM dan menerapkan arsitektur chatbot serbaguna dalam akun AWS Anda. Anda sekarang memiliki keterampilan untuk menggunakan ini dengan model kustom Anda.
Repositori lain yang mungkin memicu imajinasi Anda adalah Sampel Batuan Dasar Amazon, yang dapat membantu Anda memulai sejumlah kasus penggunaan lainnya.
Kesimpulan
Dalam postingan ini, kami menunjukkan kepada Anda cara menyempurnakan LLM agar lebih sesuai dengan kebutuhan bisnis Anda, menerapkan model kustom Anda sebagai titik akhir API Amazon Bedrock, dan menggunakan titik akhir tersebut dalam kode aplikasi. Hal ini membuka kekuatan model bahasa khusus untuk lebih banyak orang dalam bisnis Anda.
Meskipun kami menggunakan contoh berdasarkan sampel kumpulan data, postingan ini menunjukkan kemampuan alat tersebut dan potensi penerapannya dalam skenario dunia nyata. Prosesnya mudah dan dapat diterapkan pada berbagai kumpulan data, seperti FAQ organisasi Anda, asalkan dalam format CSV.
Ambil apa yang Anda pelajari dan mulailah bertukar pikiran tentang cara menggunakan model AI khusus di organisasi Anda. Untuk inspirasi lebih lanjut, lihat Mengatasi tantangan umum pusat kontak dengan AI generatif dan Amazon SageMaker Canvas dan AWS re:Invent 2023 โ Kemampuan LLM baru di Amazon SageMaker Canvas, dengan Bain & Company (AIM363).
Tentang Penulis
Yann Stoneman adalah Arsitek Solusi di AWS yang berfokus pada pembelajaran mesin dan pengembangan aplikasi tanpa server. Dengan latar belakang rekayasa perangkat lunak dan perpaduan pendidikan seni dan teknologi dari Juilliard dan Columbia, Yann menghadirkan pendekatan kreatif terhadap tantangan AI. Dia aktif berbagi keahliannya melalui saluran YouTube, postingan blog, dan presentasi.
Davide Gallitelli adalah Arsitek Solusi Spesialis untuk AI/ML di wilayah EMEA. Dia berbasis di Brussel dan bekerja sama dengan pelanggan di seluruh Benelux. Dia telah menjadi pengembang sejak sangat muda, mulai membuat kode pada usia 7 tahun. Dia mulai belajar AI/ML di tahun-tahun terakhirnya di universitas, dan telah jatuh cinta padanya sejak saat itu.
- Konten Bertenaga SEO & Distribusi PR. Dapatkan Amplifikasi Hari Ini.
- PlatoData.Jaringan Vertikal Generatif Ai. Berdayakan Diri Anda. Akses Di Sini.
- PlatoAiStream. Intelijen Web3. Pengetahuan Diperkuat. Akses Di Sini.
- PlatoESG. Karbon, teknologi bersih, energi, Lingkungan Hidup, Tenaga surya, Penanganan limbah. Akses Di Sini.
- PlatoHealth. Kecerdasan Uji Coba Biotek dan Klinis. Akses Di Sini.
- Sumber: https://aws.amazon.com/blogs/machine-learning/fine-tune-and-deploy-language-models-with-amazon-sagemaker-canvas-and-amazon-bedrock/