Amazon Kendra、LangChain、大規模言語モデルを使用して、エンタープライズデータ上で高精度の生成 AI アプリケーションを迅速に構築する

Generative AI (GenAI) と大規模言語モデル (LLM)。アマゾンの岩盤およびアマゾンタイタン開発者や企業が、自然言語の処理と理解に関連する従来の複雑な課題を解決できる方法を変革しています。 LLM が提供する利点には、カスタマーサービスアプリケーション向けのより有能で魅力的な会話型 AI エクスペリエンスを作成する機能や、より直感的で正確な応答によって従業員の生産性を向上させる機能が含まれます。

ただし、これらのユースケースでは、会話型エクスペリエンスを実装する GenAI アプリケーションが XNUMX つの重要な基準を満たすことが重要です。それは、企業データへの応答を制限し、それによってモデルの幻覚 (誤ったステートメント) を軽減し、エンドユーザーのコンテンツアクセスに応じて応答をフィルター処理することです。パーミッション。

GenAI アプリケーションの応答を企業データのみに制限するには、Retrieval Augmented Generation (RAG) と呼ばれる手法を使用する必要があります。 RAG アプローチを使用するアプリケーションは、エンタープライズナレッジベースまたはコンテンツからユーザーの要求に最も関連する情報を取得し、それをプロンプトとしてのユーザーの要求と共にコンテキストとしてバンドルし、LLM に送信して GenAI 応答を取得します。 LLM には、入力プロンプトの最大単語数に関する制限があるため、企業内の数千または数百万のドキュメントから適切なパッセージを選択することは、LLM の精度に直接影響します。

効果的な RAG の設計において、コンテンツ検索は、LLM がエンタープライズコンテンツから最も関連性が高く簡潔なコンテキストを確実に受け取り、正確な応答を生成するための重要なステップです。これは、非常に正確な機械学習 (ML) を活用したインテリジェント検索 in アマゾンケンドラ重要な役割を果たします。 Amazon Kendra は、ドキュメントとパッセージの最先端のランキングのために、すぐに使えるセマンティック検索機能を提供する完全マネージド型のサービスです。 Amazon Kendra の高精度検索を使用して、最も関連性の高いコンテンツとドキュメントを調達し、RAG ペイロードの品質を最大化し、従来の検索ソリューションやキーワードベースの検索ソリューションを使用するよりも優れた LLM 応答を得ることができます。 Amazon Kendra は、14 のドメインで事前にトレーニングされ、ML の専門知識を必要としない使いやすい深層学習検索モデルを提供するため、単語の埋め込み、ドキュメントのチャンキング、および通常必要とされるその他の低レベルの複雑さに対処する必要はありません。 RAG 実装用。 Amazon Kendra には、次のような一般的なデータソースへの事前構築済みコネクタも付属しています。 Amazon シンプルストレージサービス (Amazon S3)、SharePoint、Confluence、および Web サイトに対応し、HTML、Word、PowerPoint、PDF、Excel、純粋なテキストファイルなどの一般的なドキュメント形式をサポートします。エンドユーザーのアクセス許可で許可されているドキュメントのみに基づいて応答をフィルタリングするために、Amazon Kendra はアクセスコントロールリスト (ACL) をサポートするコネクタを提供します。 Amazon Kendra も提供しています AWS IDおよびアクセス管理（IAM）および AWS IAM アイデンティティセンター Okta や Azure AD などの顧客 ID プロバイダーと同期するユーザーグループ情報のための (AWS Single Sign-On の後継) 統合。

この投稿では、Amazon Kendra の機能を LLM と組み合わせて RAG ワークフローを実装し、エンタープライズコンテンツに対する会話体験を提供する最先端の GenAI アプリケーションを作成する方法を示します。後アマゾンの岩盤 Amazon Bedrock を使用して同様の GenAI アプリケーションを実装する方法を示すフォローアップの投稿を公開する予定です。

ソリューションの概要

次の図は、RAG アプローチを使用した GenAI アプリケーションのアーキテクチャを示しています。

Amazon Kendra インデックスを使用して、wiki ページ、MS SharePoint サイト、Atlassian Confluence、Amazon S3 などのドキュメントリポジトリなどのデータソースから企業の非構造化データを取り込みます。ユーザーが GenAI アプリを操作するときの流れは次のとおりです。

ユーザーが GenAI アプリにリクエストを送信します。
アプリは、ユーザーのリクエストに基づいて Amazon Kendra インデックスに検索クエリを発行します。
インデックスは、取り込まれたエンタープライズデータからの関連ドキュメントの抜粋を含む検索結果を返します。
アプリは、LLM プロンプトのコンテキストとしてインデックスから取得したデータと共に、ユーザーリクエストを送信します。
LLM は、取得したデータに基づいて、ユーザーの要求に対して簡潔な応答を返します。
LLM からの応答がユーザーに返されます。

このアーキテクチャを使用すると、ユースケースに最適な LLM を選択できます。 LLM オプションには、パートナーである Hugging Face、AI21 Labs、Cohere など、アマゾンセージメーカーエンドポイント、および次のような企業によるモデル人間原理および OpenAI アマゾンの岩盤、選択できるようになりますアマゾンタイタン、Amazon 独自の LLM、または AI21 Labs や Anthropic などのパートナー LLM と API を安全に使用でき、データが AWS エコシステムを離れる必要はありません。 Amazon Bedrock が提供するその他の利点には、サーバーレスアーキテクチャ、サポートされている LLM を呼び出す単一の API、および開発者のワークフローを合理化するマネージドサービスが含まれます。

最良の結果を得るには、GenAI アプリは、ユーザーの要求と使用されている特定の LLM に基づいてプロンプトを設計する必要があります。会話型 AI アプリでは、チャットの履歴とコンテキストも管理する必要があります。 GenAI アプリの開発者は、次のようなオープンソースフレームワークを使用できます。ラングチェーン選択した LLM と統合するためのモジュール、およびチャット履歴管理やプロンプトエンジニアリングなどのアクティビティ用のオーケストレーションツールを提供します。私たちは提供しました KendraIndexRetriever を実装するクラス LangChain レトリーバーアプリケーションは、次のような他の LangChain インターフェースと組み合わせて使用できます。チェーン Amazon Kendra インデックスからデータを取得します。また、いくつかのサンプルアプリケーションも提供しています。 GitHubレポ. この投稿のステップバイステップガイドを使用して、このソリューションを AWS アカウントにデプロイできます。

前提条件

このチュートリアルでは、Linux、Mac、または Linux 用 Windows サブシステムに Python 3.9 以降がインストールされた bash ターミナルと、AWS アカウントが必要です。また、 AWS クラウド9 インスタンスまたはアマゾンエラスティックコンピューティングクラウド（Amazon EC2）インスタンス。

RAG ワークフローを実装する

RAG ワークフローを構成するには、次の手順を実行します。

提供されているものを使用してください AWS CloudFormation template 新しい Amazon Kendra インデックスを作成します。

このテンプレートには、Amazon Kendra の AWS オンラインドキュメントを含むサンプルデータが含まれています。 Amazon Lex, アマゾンセージメーカー. または、Amazon Kendra インデックスがあり、独自のデータセットにインデックスを作成している場合は、それを使用できます。スタックの起動には約 30 分かかり、同期とインデックス内のデータの取り込みには約 15 分かかります。そのため、スタックを起動してから約 45 分待ちます。スタックのインデックス ID と AWS リージョンに注意してください出力タブには何も表示されないことに注意してください。

GenAI エクスペリエンスを向上させるために、 Amazon Kendra サービスのクォータの増加最大の DocumentExcerpt これにより、Amazon Kendra はより大きなドキュメントの抜粋を提供して、LLM のセマンティックコンテキストを改善します。
インストール Python 用 AWS SDK 選択したコマンドラインインターフェイスで。
を使用して構築されたサンプル Web アプリを使用する場合ストリームライト、最初にストリームリットをインストール. サンプルアプリケーションのコマンドラインバージョンのみを実行する場合、この手順はオプションです。
LangChain をインストールする.
このチュートリアルで使用されるサンプルアプリケーションでは、Flan-T5-XL、Flan-T5-XXL、Anthropic Claud-V1、および OpenAI-text-davinci-003 から XNUMX つ以上の LLM にアクセスできる必要があります。
1. Flan-T5-XL または Flan-T5-XXL を使用する場合は、以下を使用して推論のためにそれらをエンドポイントにデプロイします。 Amazon SageMaker Studio ジャンプスタート.
2. Anthropic Claud-V1 または OpenAI-da-vinci-003 を使用する場合は、対象の LLM の API キーを次から取得します。 https://www.anthropic.com/ および https://openai.com/それぞれ。
の指示に従ってください GitHubレポインストールする KendraIndexRetriever インターフェイスとサンプルアプリケーション。
サンプルアプリケーションを実行する前に、Flan-T5-XL または Flan-T5-XXL のデプロイメントの優先 LLM または SageMaker エンドポイントの Amazon Kendra インデックスの詳細と API キーを使用して環境変数を設定する必要があります。以下は、環境変数を設定するサンプルスクリプトです。
```
export AWS_REGION="<YOUR-AWS-REGION>"
export KENDRA_INDEX_ID="<YOUR-KENDRA-INDEX-ID>"
export FLAN_XL_ENDPOINT="<YOUR-SAGEMAKER-ENDPOINT-FOR-FLAN-T-XL>"
export FLAN_XXL_ENDPOINT="<YOUR-SAGEMAKER-ENDPOINT-FOR-FLAN-T-XXL>"
export OPENAI_API_KEY="<YOUR-OPEN-AI-API-KEY>"
export ANTHROPIC_API_KEY="<YOUR-ANTHROPIC-API-KEY>"
```
コマンドラインウィンドウで、 samples GitHub リポジトリをクローンした場所のサブディレクトリ。次のように、コマンドラインからコマンドラインアプリを実行できます。 python <sample-file-name.py>. ディレクトリを次のように変更することで、streamlit Web アプリを実行できます。 samples そして実行中 streamlit run app.py <anthropic|flanxl|flanxxl|openai>.
サンプルファイルを開く kendra_retriever_flan_xxl.py お好みのエディターで。

ステートメントを観察する result = run_chain(chain, "What's SageMaker?"). これは、LLM として Flan-T-XXL を使用し、レトリーバーとして Amazon Kendra を使用するチェーンを介して実行されるユーザークエリ (「What's SageMaker?」) です。このファイルを実行すると、次のような出力を確認できます。チェーンはユーザークエリを Amazon Kendra インデックスに送信し、上位 XNUMX つの結果の抜粋を取得して、クエリと共にプロンプトのコンテキストとして送信し、LLM は簡潔な回答で応答しました。また、ソース (回答の生成に使用されたドキュメントへの URL) も提供しています。

それでは、Web アプリを実行してみましょう app.py as streamlit run app.py flanxxl. この特定の実行では、LLM として Flan-T-XXL モデルを使用しています。

Web インターフェイスを備えたブラウザウィンドウが開きます。この場合は「What is Amazon Lex?」というクエリを入力できます。次のスクリーンショットに示すように、アプリケーションは応答で応答し、 ソース セクションでは、抜粋が Amazon Kendra インデックスから取得され、クエリとともにコンテキストとしてプロンプトで LLM に送信されたドキュメントへの URL を提供します。

さあ、走りましょう app.py を使用して会話体験を感じてください。 streamlit run app.py anthropic. ここで使用される基礎となる LLM は Anthropic Claud-V1 です。

次のビデオでわかるように、LLM は、Amazon Kendra インデックスから取得したドキュメントに基づいてユーザーのクエリに対する詳細な回答を提供し、回答の生成に使用されたソースドキュメントへの URL で回答をサポートします。後続のクエリでは、Amazon Kendra について明示的に言及していないことに注意してください。しかし ConversationalRetrievalChain (LangChain フレームワークの一部であり、この LangChain アプリケーションで使用される、レトリーバーインスタンスから取得された会話型アプリケーションベースの情報を開発するための簡単なメカニズムを提供するチェーンの一種) は、チャット履歴とコンテキストを管理して、適切な応答を取得します。

また、次のスクリーンショットでは、Amazon Kendra がクエリに対する抽出的な回答を見つけ、上位のドキュメントを抜粋で絞り込みます。次に、LLM は、取得した抜粋に基づいて、より簡潔な回答を生成できます。

以下のセクションでは、Amazon Kendra で Generative AI を使用する XNUMX つのユースケースについて説明します。

ユースケース 1: 金融サービス企業向けのジェネレーティブ AI

金融機関は、財務報告書、法律文書、ホワイトペーパーなど、さまざまなデータリポジトリにわたってデータを作成および保存します。厳格な政府の規制と監視を順守する必要があります。つまり、従業員は関連性があり、正確で信頼できる情報を迅速に見つける必要があります。さらに、さまざまなデータソースにわたって洞察を検索して集約するのは面倒で、エラーが発生しやすくなります。 Generative AI on AWS を使用すると、ユーザーはさまざまなデータソースやタイプから回答をすばやく生成し、エンタープライズ規模で正確な回答を合成できます。

Amazon Kendra と AI21 Lab の Jurassic-2 Jumbo Instruct LLM を使用するソリューションを選択しました。 Amazon Kendra を使用すると、Amazon S3、ウェブサイト、ServiceNow などの複数のデータソースから簡単にデータを取り込むことができます。次に、Amazon Kendra は AI21 Lab の Jurassic-2 Jumbo Instruct LLM を使用して、データの要約、レポート生成などの企業データに関する推論アクティビティを実行します。 Amazon Kendra は、LLM を強化して正確で検証可能な情報をエンドユーザーに提供し、LLM の幻覚の問題を減らします。提案されたソリューションを使用すると、金融アナリストは正確なデータを使用してより迅速に意思決定を行い、詳細で包括的なポートフォリオを迅速に構築できます。近い将来、このソリューションをオープンソースプロジェクトとして利用できるようにする予定です。

例

Kendra Chatbot ソリューションを使用すると、財務アナリストと監査人は企業データ (財務レポートと契約書) を操作して、監査関連の質問に対する信頼できる回答を見つけることができます。 Kendra ChatBot は、ソースリンクとともに回答を提供し、より長い回答を要約する機能を備えています。次のスクリーンショットは、Kendra ChatBot との会話の例を示しています。

アーキテクチャの概要

次の図は、ソリューションのアーキテクチャを示しています。

ワークフローには次の手順が含まれます。

財務文書と契約書は Amazon S3 に保存され、S3 データソースコネクタを使用して Amazon Kendra インデックスに取り込まれます。
LLM は SageMaker エンドポイントでホストされます。
Amazon Lex チャットボットを使用して、 Amazon Lex ウェブ UI.
このソリューションでは、 AWSラムダ LangChain で機能して、Amazon Kendra、Amazon Lex、および LLM の間でオーケストレーションを行います。
ユーザーが Amazon Lex チャットボットに財務文書からの回答を求めると、Amazon Lex は LangChain オーケストレーターを呼び出して要求を実行します。
クエリに基づいて、LangChain オーケストレーターは関連する財務記録と段落を Amazon Kendra から引き出します。
LangChain オーケストレーターは、必要なアクティビティを実行するために、これらの関連レコードをクエリおよび関連するプロンプトと共に LLM に提供します。
LLM は、LangChain オーケストレーターからの要求を処理し、結果を返します。
LangChain オーケストレーターは LLM から結果を取得し、Amazon Lex チャットボットを介してエンドユーザーに送信します。

ユースケース 2: ヘルスケア研究者と臨床医向けのジェネレーティブ AI

臨床医や研究者は、研究の一環として、医学雑誌や政府の健康に関する Web サイトから何千もの記事を分析することがよくあります。さらに重要なことは、調査結果を検証して実証するために使用できる信頼できるデータソースを求めていることです。このプロセスには、何時間もの集中的な調査、分析、およびデータ合成が必要であり、価値と革新までの時間が長くなります。 Generative AI on AWS を使用すると、信頼できるデータソースに接続し、自然言語クエリを実行して、これらの信頼できるデータソース全体から数秒で洞察を生成できます。また、応答の生成に使用されたソースを確認し、その正確性を検証することもできます。

Amazon Kendra と Hugging Face の Flan-T5-XXL を使用したソリューションを選択しました。まず、Amazon Kendra を使用して、コーパス全体で意味的に関連するドキュメントからテキストスニペットを識別します。次に、Flan-T5-XXL などの LLM の機能を使用して、Amazon Kendra からのテキストスニペットをコンテキストとして使用し、簡潔な自然言語の回答を取得します。このアプローチでは、Amazon Kendra インデックスは、RAG メカニズムのパッセージリトリーバーコンポーネントとして機能します。最後に、Amazon Lex を使用してフロントエンドを強化し、エンドユーザーにシームレスでレスポンシブなエクスペリエンスを提供します。近い将来、このソリューションをオープンソースプロジェクトとして利用できるようにする予定です。

例

次のスクリーンショットは、次の Web サイトで利用可能なテンプレートを使用してソリューション用に構築された Web UI からのものです。 GitHubの. ピンクのテキストは Amazon Kendra LLM システムからの応答で、青のテキストはユーザーの質問です。

アーキテクチャの概要

このソリューションのアーキテクチャとソリューションワークフローは、ユースケース 1 と似ています。

クリーンアップ

コストを節約するには、チュートリアルの一部としてデプロイしたすべてのリソースを削除します。 CloudFormation スタックを起動した場合は、AWS CloudFormation コンソールから削除できます。同様に、SageMaker コンソールを介して作成した SageMaker エンドポイントを削除できます。

まとめ

大規模な言語モデルを利用したジェネレーティブ AI は、人々が情報から洞察を取得して適用する方法を変えています。ただし、エンタープライズユースケースでは、検索拡張生成アプローチを使用して、答えをドメイン内に保持し、幻覚を軽減するために、エンタープライズコンテンツに基づいて洞察を生成する必要があります。 RAG アプローチでは、LLM によって生成される洞察の質は、取得された情報の基になるセマンティック関連性に依存するため、Amazon Kendra などのソリューションを使用して高精度のセマンティック検索結果を提供する必要性がますます高まっています。ボックス。データソースコネクタの包括的なエコシステム、一般的なファイル形式のサポート、およびセキュリティにより、Amazon Kendra を検索メカニズムとして使用するエンタープライズユースケース向けのジェネレーティブ AI ソリューションの使用をすぐに開始できます。

AWS で Generative AI を使用する方法の詳細については、次を参照してください。 AWS でジェネレーティブ AI を使用して構築するための新しいツールを発表. このブログで説明されている方法を使用して、エンタープライズ GenAI アプリの RAG の概念実証 (POC) の実験と構築を開始できます。前述したように、一度アマゾンの岩盤が利用可能になったら、Amazon Bedrock を使用して RAG を構築する方法を示すフォローアップブログを公開します。

著者について

アビナブ・ジャワデカール は、AWSのAI/ML言語サービスチームでAmazonKendraに焦点を当てたプリンシパルソリューションアーキテクトです。 Abhinavは、AWSのお客様やパートナーと協力して、AWSでインテリジェントな検索ソリューションを構築できるよう支援します。

ジャンピエールドーデル Amazon Kendra のプリンシパルプロダクトマネージャーであり、主要な戦略的製品機能とロードマップの優先順位付けを主導しています。彼は、7 年前に Amazon に入社する前は Autonomy、HP、および検索スタートアップで主導的な役割を果たし、Enterprise Search と ML/AI の豊富な経験をチームにもたらしました。

ミシル・シャー AWS の ML/AI スペシャリストです。現在、AWS で機械学習ソリューションを構築することにより、公共部門の顧客が市民の生活を改善するのを支援しています。

フィラズ・アクマル AWS の Amazon Kendra のシニアプロダクトマネージャーです。彼はカスタマーアドボケイトであり、Kendra on AWS を使用した検索および生成 AI のユースケースをお客様が理解できるように支援しています。仕事以外では、フィラズは PNW の山で過ごすことや、娘の視点を通して世界を体験することを楽しんでいます。

アビシェーク・マリゲハリ・シヴァリンガイア AWS のシニア AI サービスソリューションアーキテクトであり、Amazon Kendra に重点を置いています。 Amazon Kendra、Generative AI、NLP を使用したアプリケーションの構築に情熱を注いでいます。彼は、顧客と企業に価値を生み出すためのデータと AI ソリューションの構築に約 10 年の経験があります。彼は、彼のキャリアとプロの旅についての質問に答えるために、楽しみのために (個人的な) チャットボットを作成しました。仕事以外では、家族や友人の肖像画を作ることを楽しんでおり、作品を作ることも大好きです。

SEO を活用したコンテンツと PR 配信。今日増幅されます。
プラトアイストリーム。 Web3 データインテリジェンス。知識増幅。こちらからアクセスしてください。
未来を鋳造する w エイドリエン・アシュリー。こちらからアクセスしてください。
情報源： https://aws.amazon.com/blogs/machine-learning/quickly-build-high-accuracy-generative-ai-applications-on-enterprise-data-using-amazon-kendra-langchain-and-large-language-models/

生成的データインテリジェンス

Amazon Kendra、LangChain、および大規模な言語モデルを使用して、エンタープライズデータ上に高精度のジェネレーティブ AI アプリケーションを迅速に構築します

ソリューションの概要

前提条件

RAG ワークフローを実装する

ユースケース 1: 金融サービス企業向けのジェネレーティブ AI

例

アーキテクチャの概要

ユースケース 2: ヘルスケア研究者と臨床医向けのジェネレーティブ AI

例

アーキテクチャの概要

クリーンアップ

まとめ

著者について

Bitcoin’s Tipping Point: Analysts Debate $66K Breakout Amid Global Financial Uncertainties and Regulatory Challenges

Bitcoin at the Crossroads: Analysts Predict Breakout Above $66K Amidst Institutional Interest and Economic Uncertainty

最新のインテリジェンス

Bitcoin at the Brink: Expert Insights and Global Crypto Dynamics as BTC Eyes $66K Breakout

Exploring the Future of Finance: Bitcoin’s Quest for $66K and the Impact of Ransomware Sanctions, Meme Stock Trading, and Smart Money Investments

ビットコインは瀬戸際にある：制度上の関心と経済的不確実性により、BTCは66万XNUMX千ドルを超えるだろうか？

仮想通貨のジェットコースターを乗り切る: 記録破りのロビンフッドの収益とランサムウェアの取り締まり強化の中で、ビットコインは66,000ドルを超えて急騰する可能性があるか?

金融の未来を探る: 66 万 XNUMX ドルを狙うビットコイン、ランサムウェアの取り締まり、ミームストック効果

ビットコインの価格高騰：ロビンフッドの収益ブームと仮想通貨の激動のさなか、66万XNUMX千ドルの天井を打ち破ることができるのか？

生成的データ インテリジェンス

Amazon Kendra、LangChain、および大規模な言語モデルを使用して、エンタープライズ データ上に高精度のジェネレーティブ AI アプリケーションを迅速に構築します

ソリューションの概要

前提条件

RAG ワークフローを実装する

ユースケース 1: 金融サービス企業向けのジェネレーティブ AI

例

アーキテクチャの概要

ユースケース 2: ヘルスケア研究者と臨床医向けのジェネレーティブ AI

例

アーキテクチャの概要

クリーンアップ

まとめ

著者について

最新のインテリジェンス

生成的データインテリジェンス

Amazon Kendra、LangChain、および大規模な言語モデルを使用して、エンタープライズデータ上に高精度のジェネレーティブ AI アプリケーションを迅速に構築します