Building Scalable, Secure, And Reliable RAG Applications Using Knowledge Bases For Amazon Bedrock | Amazon Web Services

Генеративний штучний інтелект (AI) набув значного розмаху завдяки організаціям, які активно вивчають його потенційні застосування. У міру успішного переходу перевірки концепції на виробництво організації все більше потребують масштабованих корпоративних рішень. Однак, щоб розблокувати довгостроковий успіх і життєздатність цих рішень на основі штучного інтелекту, вкрай важливо узгодити їх із усталеними архітектурними принципами.

AWS Well-Architected Framework надає найкращі практики та рекомендації щодо проектування та експлуатації надійних, безпечних, ефективних і економічно ефективних систем у хмарі. Узгодження генеративних програм штучного інтелекту з цією структурою є важливим з кількох причин, включаючи забезпечення масштабованості, підтримку безпеки та конфіденційності, досягнення надійності, оптимізацію витрат і оптимізацію операцій. Прийняття цих принципів має вирішальне значення для організацій, які прагнуть використовувати силу генеративного ШІ та стимулювати інновації.

У цьому дописі розглядаються нові функції корпоративного рівня для Бази знань Amazon Bedrock і як вони відповідають AWS Well-Architected Framework. За допомогою баз знань для Amazon Bedrock ви можете швидко створювати програми за допомогою Retrieval Augmented Generation (RAG) для таких випадків використання, як відповіді на запитання, контекстні чат-боти та персоналізований пошук.

Ось деякі функції, які ми розглянемо:

Підтримка AWS CloudFormation
Політики приватної мережі для Amazon OpenSearch Serverless
Кілька сегментів S3 як джерела даних
Підтримка квот на обслуговування
Гібридний пошук, фільтри метаданих, спеціальні підказки для RetreiveAndGenerate API та максимальну кількість запитів.

Принципи дизайну AWS Well-Architected

Програми на основі RAG, створені за допомогою баз знань для Amazon Bedrock, можуть отримати значну користь від дотримання Добре побудований фреймворк AWS. Цей фреймворк має шість основних принципів, які допомагають організаціям переконатися, що їхні програми безпечні, високопродуктивні, стійкі, ефективні, економічно ефективні та стійкі:

Оперативне досконалість – Добре розроблені принципи оптимізують операції, автоматизують процеси та забезпечують постійний моніторинг і покращення продуктивності генеративної програми AI.
Безпека – Впровадження надійного контролю доступу, шифрування та моніторингу допомагає захистити конфіденційні дані, які використовуються в базі знань вашої організації, і запобігти зловживанням генеративним ШІ.
Надійність – Розробкою стійких і стійких до збоїв систем керуються принципи добре архітектури, що забезпечує постійне надання користувачам цінностей.
Оптимізація продуктивності – Вибір відповідних ресурсів, впровадження стратегій кешування та проактивний моніторинг показників продуктивності гарантують, що додатки надають швидкі та точні відповіді, що забезпечує оптимальну продуктивність і покращений досвід роботи з користувачем.
Оптимізація витрат – Добре розроблені рекомендації допомагають оптимізувати використання ресурсів, використовувати економні послуги та контролювати витрати, що забезпечує довгострокову життєздатність генеративних проектів ШІ.
Sustainability – Добре розроблені принципи сприяють ефективному використанню ресурсів і мінімізації вуглецевих слідів, усуваючи вплив на навколишнє середовище зростаючого генеративного використання ШІ.

Дотримуючись Well-Architected Framework, організації можуть ефективно створювати RAG-додатки корпоративного рівня та керувати ними за допомогою баз знань для Amazon Bedrock. Тепер давайте детальніше зануримося в нові функції, запущені в базах знань для Amazon Bedrock.

Підтримка AWS CloudFormation

Організаціям, які розробляють програми RAG, важливо забезпечити ефективну та ефективну роботу та узгоджену інфраструктуру в різних середовищах. Цього можна досягти шляхом впровадження таких практик, як автоматизація процесів розгортання. Щоб досягти цього, бази знань для Amazon Bedrock тепер пропонують підтримку для AWS CloudFormation.

З AWS CloudFormation і Набір хмарних розробок AWS (AWS CDK), тепер ви можете створювати, оновлювати та видаляти бази знань і пов’язані джерела даних. Застосування AWS CloudFormation і AWS CDK для керування базами знань і пов’язаними джерелами даних не тільки спрощує процес розгортання, але й сприяє дотриманню принципів добре архітектури. Виконуючи операції (програми, інфраструктуру) у вигляді коду, ви можете забезпечити узгоджене та надійне розгортання в кількох облікових записах AWS і регіонах AWS, а також підтримувати версії конфігурацій інфраструктури, які можна перевіряти.

Нижче наведено зразок Скрипт CloudFormation у форматі JSON для створення та оновлення бази знань в Amazon Bedrock:

{
    "Type" : "AWS::Bedrock::KnowledgeBase", 
    "Properties" : {
        "Name": String,
        "RoleArn": String,
        "Description": String,
        "KnowledgeBaseConfiguration": {
  		"Type" : String,
  		"VectorKnowledgeBaseConfiguration" : VectorKnowledgeBaseConfiguration
},
        "StorageConfiguration": StorageConfiguration,            
    } 
}

Type визначає базу знань як ресурс у шаблоні верхнього рівня. Як мінімум необхідно вказати такі властивості:

ІМ'Я – Вкажіть назву для бази знань.
РольАрн – Укажіть назву ресурсу Amazon (ARN) для Управління ідентифікацією та доступом AWS (IAM) роль із дозволами на виклик операцій API у базі знань. Для отримання додаткової інформації див Створіть роль служби для баз знань для Amazon Bedrock.
Конфігурація бази знань – Укажіть конфігурацію вбудовування бази знань. Необхідні такі підвластивості:
- тип – Вкажіть значення VECTOR.
- VectorKnowledgeBaseConfiguration – Містить подробиці про модель, яка використовується для створення векторних вставок для бази знань.
Конфігурація сховища – Укажіть інформацію про сховище векторів, у якому знаходиться джерело даних зберігати. Необхідні такі підвластивості:
- тип – Укажіть службу векторного сховища, яку ви використовуєте.
- Вам також потрібно буде вибрати одне з векторних сховищ, які підтримуються базами знань, наприклад OpenSearchServerless, Pinecone або Amazon PostgreSQL, і надати конфігурацію для вибраного векторного сховища.

Докладніше про всі поля та надання конфігурації різних векторних сховищ, які підтримуються базами знань для Amazon Bedrock, див. AWS::Bedrock::KnowledgeBase.

На момент написання цієї статті векторні сховища Redis Enterprise Cloud не підтримуються в AWS CloudFormation. Щоб отримати останню інформацію, зверніться до документації вище.

Після створення бази знань вам потрібно створити джерело даних із Служба простого зберігання Amazon (Amazon S3), що містить файли для вашої бази знань. Це викликає CreateDataSource та DeleteDataSource API.

Нижче наведено зразок Скрипт CloudFormation у форматі JSON:

{
    "Type" : "AWS::Bedrock::DataSource", 
    "Properties" : {
        "KnowledgeBaseId": String,
        "Name": String,
        "RoleArn": String,
        "Description": String,
        "DataSourceConfiguration": {
  		"S3Configuration" : S3DataSourceConfiguration,
  		"Type" : String
},
ServerSideEncryptionConfiguration":ServerSideEncryptionConfiguration,           
"VectorIngestionConfiguration": VectorIngestionConfiguration
    } 
}

Type визначає джерело даних як ресурс у шаблоні верхнього рівня. Як мінімум необхідно вказати такі властивості:

ІМ'Я – Вкажіть назву для джерела даних.
KnowledgeBaseId – Укажіть ідентифікатор бази знань, до якої належить джерело даних.
DataSourceConfiguration – Укажіть інформацію про сегмент S3, що містить джерело даних. Необхідні такі підвластивості:
- тип – Вкажіть значення S3.
- Конфігурація S3 – Містить подробиці про конфігурацію об’єкта S3, що містить джерело даних.
VectorIngestionConfiguration – містить відомості про те, як завантажувати документи в джерело даних. Ви повинні надати "Chunking Configuration”, де ви можете визначити свою стратегію фрагментації.
ServerSideEncryptionConfiguration – Містить конфігурацію для шифрування на стороні сервера, де ви можете вказати назву ресурсу Amazon (ARN) ключа AWS KMS, який використовується для шифрування ресурсу.

Щоб отримати додаткові відомості про налаштування джерел даних в Amazon Bedrock, див Налаштуйте джерело даних для своєї бази знань.

Примітка. Ви не можете змінити конфігурацію поділу на фрагменти після створення джерела даних.

Шаблон CloudFormation дозволяє визначати ресурси бази знань і керувати ними за допомогою інфраструктури як коду (IaC). Автоматизуючи налаштування та керування базою знань, ви можете забезпечити узгоджену інфраструктуру в різних середовищах. Цей підхід узгоджується з принципом операційної досконалості, який наголошує на виконанні операцій у вигляді коду. Розглядаючи все робоче навантаження як код, ви можете автоматизувати процеси, створювати узгоджені реакції на події та, зрештою, зменшити людські помилки.

Політики приватної мережі для Amazon OpenSearch Serverless

Для компаній, які розробляють програми RAG, важливо, щоб дані залишалися в безпеці, а мережевий трафік не спрямовувався в загальнодоступний Інтернет. Для підтримки цього Бази знань для Amazon Bedrock тепер підтримують політики приватної мережі для Amazon OpenSearch Serverless.

Бази знань для Amazon Bedrock надають можливість використовувати OpenSearch Serverless як векторне сховище. Тепер ви можете отримати доступ до безсерверних колекцій OpenSearch, які мають політику приватної мережі, що додатково підвищує рівень безпеки для вашої програми RAG. Щоб досягти цього, вам потрібно створити колекцію OpenSearch Serverless і налаштувати її для доступу до приватної мережі. Спочатку створіть векторний індекс у колекції для зберігання вставок. Потім під час створення колекції встановіть Налаштування доступу до мережі до приватний і вкажіть кінцеву точку VPC для доступу. Важливо, що тепер ви можете надати приватний мережевий доступ до OpenSearch Serverless колекції спеціально для Amazon Bedrock. Для цього виберіть Приватний доступ до служби AWS і вкажіть bedrock.amazonaws.com як послуга.

Ця конфігурація приватної мережі гарантує, що ваші вбудовування надійно зберігаються та доступні лише Amazon Bedrock, підвищуючи загальну безпеку та конфіденційність ваших баз знань. Це тісно пов’язане з Стовп безпеки контролю трафіку на всіх рівнях, оскільки весь мережевий трафік зберігається в магістралі AWS із цими налаштуваннями.

Наразі ми досліджували автоматизацію створення, видалення й оновлення ресурсів бази знань, а також покращену безпеку за допомогою політик приватної мережі для OpenSearch Serverless для безпечного зберігання векторних вбудованих файлів. Тепер давайте розберемося, як створювати більш надійні, комплексні й оптимізовані за витратами програми RAG.

Кілька сегментів S3 як джерела даних

Бази знань для Amazon Bedrock тепер підтримують додавання кількох сегментів S3 як джерел даних в одній базі знань, включаючи доступ між обліковими записами. Це вдосконалення підвищує всебічність і точність бази знань, дозволяючи користувачам легко збирати та використовувати інформацію з різних джерел.

Ось ключові особливості:

Кілька відер S3 – Бази знань для Amazon Bedrock тепер можуть включати дані з кількох сегментів S3, дозволяючи користувачам легко комбінувати та використовувати інформацію з різних джерел. Ця функція сприяє різноманітності даних і гарантує, що відповідна інформація є легкодоступною для додатків на основі RAG.
Доступ до даних між обліковими записами – Бази знань для Amazon Bedrock підтримують налаштування сегментів S3 як джерел даних для різних облікових записів. Ви можете надати необхідні облікові дані для доступу до цих джерел даних, розширюючи діапазон інформації, яку можна включити в їхні бази знань.
Ефективне управління даними – Під час налаштування джерела даних у базі знань ви можете вказати, чи слід зберігати чи видаляти дані, що належать до цього джерела даних, якщо джерело даних буде видалено. Ця функція гарантує, що ваша база знань залишається актуальною та не містить застарілих або нерелевантних даних, зберігаючи цілісність і точність процесу RAG.

Завдяки підтримці кількох сегментів S3 як джерел даних усувається необхідність створення кількох баз знань або надлишкових копій даних, що оптимізує витрати та сприяє хмарному фінансовому управлінню. Крім того, можливості доступу між обліковими записами дають змогу розробляти стійкі архітектури, які відповідають принципу надійності AWS Well-Architected Framework, забезпечуючи високу доступність і відмовостійкість.

Інші нещодавно анонсовані функції для баз знань

Щоб ще більше підвищити надійність вашої програми RAG, бази знань для Amazon Bedrock тепер розширюють підтримку для Квоти послуг. Ця функція забезпечує єдине вікно для перегляду застосованих значень квот і використання AWS. Наприклад, тепер у вас є швидкий доступ до такої інформації, як дозволена кількість `RetrieveAndGenerate API запитів в секунду.

Ця функція дає змогу ефективно керувати квотами ресурсів, запобігати надмірному забезпеченню та обмежувати частоту запитів API, щоб захистити служби від потенційних зловживань.

Ви також можете підвищити продуктивність своєї програми, використовуючи нещодавно оголошені функції, такі як гібридний пошук, фільтрація на основі метаданих, користувацькі підказки для API RetreiveAndGenerate та максимальну кількість запитів. Ці функції разом покращують точність, релевантність і узгодженість згенерованих відповідей і узгоджуються зі стовпом продуктивності AWS Well-Architected Framework.

Бази знань для Amazon Bedrock узгоджуються зі стійким принципом AWS Well-Architected Framework завдяки використанню керованих сервісів і оптимізації використання ресурсів. Будучи повністю керованою послугою, бази знань для Amazon Bedrock усувають тягар надання, керування та масштабування основної інфраструктури, тим самим зменшуючи вплив на навколишнє середовище, пов’язаний з експлуатацією та обслуговуванням цих ресурсів.

Крім того, дотримуючись принципів AWS Well-Architected, організації можуть проектувати та експлуатувати свої додатки RAG в екологічно чистий спосіб. Такі практики, як автоматизація розгортань через AWS CloudFormation, впровадження політик приватної мережі для безпечного доступу до даних і використання ефективних служб, таких як OpenSearch Serverless, сприяють мінімізації впливу цих навантажень на навколишнє середовище.

Загалом, Knowledge Bases для Amazon Bedrock у поєднанні з AWS Well-Architected Framework дає змогу організаціям створювати масштабовані, безпечні та надійні додатки RAG, водночас віддаючи пріоритет екологічній стійкості за рахунок ефективного використання ресурсів і впровадження керованих послуг.

Висновок

Нові функції корпоративного рівня, такі як підтримка AWS CloudFormation, політики приватної мережі, можливість використовувати кілька сегментів S3 як джерела даних і підтримка квот на обслуговування, спрощують створення масштабованих, безпечних і надійних додатків RAG за допомогою баз знань. для Amazon Bedrock. Використання керованих сервісів AWS і дотримання найкращих практик Well-Architected дозволяє організаціям зосередитися на розробці інноваційних генеративних рішень штучного інтелекту, одночасно забезпечуючи досконалість операцій, надійну безпеку та ефективне використання ресурсів. Коли ви створюєте додатки на AWS, узгодження додатків RAG із добре архітектурною інфраструктурою AWS забезпечує надійну основу для створення рішень корпоративного рівня, які підвищують цінність бізнесу, дотримуючись галузевих стандартів.

Щоб отримати додаткові ресурси, зверніться до наступного:

Про авторів

Мані Хануджа є технічним керівником – Generative AI Specialists, автором книги Applied Machine Learning and High Performance Computing on AWS, а також членом ради директорів фонду «Жінки у сфері виробничої освіти». Вона керує проектами машинного навчання в різних областях, таких як комп’ютерне бачення, обробка природної мови та генеративний штучний інтелект. Вона виступає на внутрішніх і зовнішніх конференціях, таких як AWS re:Invent, Women in Manufacturing West, вебінарах YouTube і GHC 23. У вільний час вона любить довго бігати вздовж пляжу.

Нітін Євсевій є старшим архітектором корпоративних рішень в AWS, має досвід розробки програмного забезпечення, корпоративної архітектури та штучного інтелекту/ML. Він глибоко захоплений дослідженням можливостей генеративного ШІ. Він співпрацює з клієнтами, щоб допомогти їм створювати добре архітектурні додатки на платформі AWS, і присвячує себе вирішенню технологічних проблем і допомозі в їхній хмарній подорожі.

Паллаві Наргунд є головним архітектором рішень в AWS. Виконуючи роль постачальника хмарних технологій, вона працює з клієнтами, щоб зрозуміти їхні цілі та проблеми, а також дає чіткі вказівки щодо досягнення їх мети за допомогою пропозицій AWS. Вона захоплюється жінками в технологіях і є одним із основних членів групи Women in AI/ML в Amazon. Вона виступає на внутрішніх і зовнішніх конференціях, таких як AWS re:Invent, AWS Summits і вебінарах. Поза роботою вона захоплюється волонтерством, садівництвом, їздою на велосипеді та пішим туризмом.

Розповсюдження контенту та PR на основі SEO. Отримайте посилення сьогодні.
PlatoData.Network Vertical Generative Ai. Додайте собі сили. Доступ тут.
PlatoAiStream. Web3 Intelligence. Розширення знань. Доступ тут.
ПлатонЕСГ. вуглець, CleanTech, Енергія, Навколишнє середовище, Сонячна, Поводження з відходами. Доступ тут.
PlatoHealth. Розвідка про біотехнології та клінічні випробування. Доступ тут.
джерело: https://aws.amazon.com/blogs/machine-learning/building-scalable-secure-and-reliable-rag-applications-using-knowledge-bases-for-amazon-bedrock/

Generative Data Intelligence

Створення масштабованих, безпечних і надійних додатків RAG за допомогою баз знань для Amazon Bedrock | Веб-сервіси Amazon

Принципи дизайну AWS Well-Architected

Підтримка AWS CloudFormation

Політики приватної мережі для Amazon OpenSearch Serverless

Кілька сегментів S3 як джерела даних

Інші нещодавно анонсовані функції для баз знань

Висновок

Про авторів

PEPE готовий до великого стрибка: Ціна підвищиться на 80%?

Біткойн перевищив 64,000 78 доларів після того, як GBTC Grayscale перервав 63-денну смугу відтоку з XNUMX мільйонами доларів нових грошей

Остання розвідка

Конфлікт щодо авторських прав Moonbirds викриває недоліки в одержимості Crypto IP – розшифруйте

WienerAI досягає важливої віхи, оскільки власники поспішають зробити ставку на свій WAI

Травень 2024: нестримний імпульс криптовалюти Bitgert Coin | Живі новини Bitcoin

Ціна монети BEFE: планування курсу до прогнозованого пампування | Живі новини Bitcoin

Binance представляє OM Locked Staking із річною відсотковою ставкою до 19.9%.

Майнери біткойнів збільшують активність продажів, оскільки зростання попиту на BTC сповільнюється: CryptoQuant

Зв'яжіться з нами!