دستیار جلسه زنده با آمازون رونویسی، آمازون بستر، و پایگاه های دانش برای آمازون بستر

دیدن تغییر دهید برای آخرین ویژگی ها و اصلاحات

شما احتمالاً با چالش یادداشت برداری در طول جلسه در حالی که سعی می کنید به مکالمه توجه کنید، تجربه کرده اید. شما احتمالاً نیاز به بررسی سریع مطالب گفته شده یا جستجوی اطلاعات برای پاسخ به سؤالی را که به تازگی در تماس پرسیده شده است، تجربه کرده اید. یا شاید یکی از اعضای تیم دارید که همیشه دیر به جلسات می‌پیوندد و از شما انتظار دارد که خلاصه‌ای سریع از طریق چت برای آنها ارسال کنید تا به آنها رسیدگی کند.

سپس مواقعی پیش می‌آید که دیگران به زبانی صحبت می‌کنند که زبان اصلی شما نیست، و شما دوست دارید ترجمه‌ای زنده از آنچه مردم می‌گویند داشته باشید تا مطمئن شوید که به درستی متوجه شده‌اید.

و پس از پایان تماس، معمولاً می‌خواهید خلاصه‌ای را برای سوابق خود بگیرید یا برای شرکت‌کنندگان ارسال کنید، با فهرستی از تمام موارد اقدام، مالکان و تاریخ‌های سررسید.

همه اینها، و بیشتر، اکنون با جدیدترین راه حل نمونه ما، Live Meeting Assistant (LMA) امکان پذیر است.

دمو زیر را بررسی کنید تا ببینید چگونه کار می کند.

در این پست نحوه استفاده از LMA را به شما نشان می دهیم آمازون رونوشت, بستر آمازونو پایگاه های دانش برای آمازون بستر.

بررسی اجمالی راه حل

راه حل نمونه LMA صدای بلندگو و فراداده را از برنامه جلسه مبتنی بر مرورگر شما (تا زمان نگارش این مقاله، Zoom و Chime پشتیبانی می‌شوند)، یا صدا را فقط از هر برنامه جلسه مبتنی بر مرورگر، تلفن نرم‌افزار یا منبع صوتی دیگر ضبط می‌کند. از Amazon Transcript برای گفتار به متن، پایگاه های دانش برای Amazon Bedrock برای پرسش های متنی در برابر اسناد و منابع دانش شرکت شما، و مدل های Amazon Bedrock برای بینش ها و خلاصه های رونویسی قابل تنظیم استفاده می کند.

هر آنچه شما نیاز دارید به عنوان منبع باز در ما ارائه شده است GitHub repo. استقرار در حساب AWS شما ساده است. وقتی کارتان تمام شد، متعجب خواهید شد که چگونه بدون آن موفق شده اید!

موارد زیر برخی از کارهایی است که LMA می تواند انجام دهد:

رونویسی زنده با ذکر منبع سخنران – LMA توسط مدل‌های Amazon Transcribe ASR برای گفتار به متن با تأخیر کم و با دقت بالا پشتیبانی می‌شود. در صورت نیاز می‌توانید با استفاده از واژگان سفارشی و ویژگی‌های مدل زبان سفارشی در Amazon Transcript، نام‌های تجاری و اصطلاحات خاص دامنه را به آن آموزش دهید.
ترجمه زنده - از ترجمه آمازون برای نمایش اختیاری هر بخش از مکالمه ترجمه شده به زبان دلخواه شما، از مجموعه ای از 75 زبان، استفاده می کند.
دستیار جلسه آگاه از زمینه - از پایگاه های دانش برای Amazon Bedrock برای ارائه پاسخ از منابع مورد اعتماد شما، با استفاده از رونوشت زنده به عنوان زمینه برای بررسی واقعیت و سؤالات بعدی استفاده می کند. برای فعال کردن دستیار، فقط بگویید «Okay, Assistant»، آن را انتخاب کنید از دستیار بپرسید! را فشار دهید، یا سوال خود را در UI وارد کنید.
خلاصه های درخواستی جلسه - با کلیک روی یک دکمه روی رابط کاربری، می توانید خلاصه ای را ایجاد کنید، که برای زمانی مفید است که شخصی دیر به آن ملحق می شود و باید درگیر شود. خلاصه ها از رونوشت توسط Amazon Bedrock تولید می شوند. LMA همچنین گزینه هایی را برای شناسایی موضوع جلسه جاری و برای ایجاد لیستی از موارد اقدام با صاحبان و تاریخ های سررسید ارائه می دهد. شما همچنین می توانید درخواست های سفارشی و گزینه های مربوطه خود را ایجاد کنید.
خلاصه و بینش خودکار - هنگامی که جلسه به پایان رسید، LMA به طور خودکار مجموعه ای از مدل های زبان بزرگ (LLM) را در Amazon Bedrock اجرا می کند تا متن جلسه را خلاصه کرده و بینش ها را استخراج کند. شما می توانید این دستورات را نیز سفارشی کنید.
ضبط جلسه - صدا (اختیاری) برای شما ذخیره می شود، بنابراین می توانید بعداً بخش های مهم جلسه را دوباره پخش کنید.
فهرست موجودی جلسات - LMA تمام جلسات شما را در یک لیست قابل جستجو پیگیری می کند.
افزونه مرورگر، فراداده‌های صوتی و جلسه را از برنامه‌های محبوب جلسه ضبط می‌کند – افزونه مرورگر، فراداده جلسه - عنوان جلسه و نام سخنرانان فعال - و صدا را از شما (میکروفون شما) و دیگران (از برگه مرورگر جلسه) می گیرد. از زمان نگارش این مقاله، LMA از Chrome برای افزونه مرورگر و Zoom و Chime برای برنامه‌های جلسه (به زودی با Teams و WebEx) پشتیبانی می‌کند. برنامه‌های جلسات مستقل با LMA کار نمی‌کنند — در عوض، جلسات خود را در مرورگر راه‌اندازی کنید.

شما مسئول رعایت محدودیت های قانونی، شرکتی و اخلاقی هستید که برای ضبط جلسات و تماس ها اعمال می شود. اگر غیر از این ممنوع است، از این راه حل برای پخش جریانی، ضبط یا رونویسی تماس ها استفاده نکنید.

پیش نیازها

شما باید یک حساب AWS و یک هویت AWS و مدیریت دسترسی (IAM) نقش و کاربر با مجوز برای ایجاد و مدیریت منابع و اجزای لازم برای این برنامه. اگر حساب AWS ندارید، ببینید چگونه می توانم یک حساب جدید خدمات وب آمازون ایجاد و فعال کنم؟

شما همچنین به یک پایگاه دانش موجود در Amazon Bedrock نیاز دارید. اگر هنوز یکی را تنظیم نکرده اید، ببینید یک پایگاه دانش ایجاد کنید. پایگاه دانش خود را با محتوا پر کنید تا دستیار جلسه آگاه LMA را تقویت کند.

در نهایت، LMA از Amazon Bedrock LLM برای ویژگی‌های خلاصه‌سازی جلسات خود استفاده می‌کند. قبل از ادامه، اگر قبلاً این کار را نکرده اید، باید درخواست دسترسی به مدل های زیر بستر آمازون:

Titan Embeddings G1 – متن
آنتروپیک: همه مدل های کلود

راه حل را با استفاده از AWS CloudFormation مستقر کنید

ما از قبل ساخته شده است AWS CloudFormation قالب هایی که هر آنچه را که نیاز دارید در حساب AWS شما مستقر می کند.

اگر توسعه‌دهنده هستید و می‌خواهید راه‌حل را از روی کد بسازید، استقرار یا منتشر کنید، به آن مراجعه کنید توسعه دهنده README.

مراحل زیر را برای راه اندازی پشته CloudFormation کامل کنید:

وارد شوید کنسول مدیریت AWS.
را انتخاب کنید Stack را راه اندازی کنید برای منطقه AWS مورد نظر شما، کنسول AWS CloudFormation را باز کرده و یک پشته جدید ایجاد کنید.

منطقه	Stack را راه اندازی کنید
شرق ایالات متحده (N. Virginia)
غرب ایالات متحده (اورگان)

برای نام پشته، از مقدار پیش فرض LMA استفاده کنید.
برای آدرس ایمیل ادمین، از یک آدرس ایمیل معتبر استفاده کنید—گذرواژه موقت شما در حین استقرار به این آدرس ایمیل می شود.
برای دامنه ایمیل حساب مجاز، از قسمت نام دامنه آدرس ایمیل شرکتی خود استفاده کنید تا به کاربرانی که آدرس ایمیل در همان دامنه دارند اجازه دهید حساب های رابط کاربری جدید خود را ایجاد کنند، یا برای جلوگیری از ایجاد مستقیم حساب های کاربران، آن را خالی بگذارید. می توانید چندین دامنه را به عنوان یک لیست جدا شده با کاما وارد کنید.
برای MeetingAssistService، انتخاب کنید BEDROCK_KNOWLEDGE_BASE (تنها گزینه موجود تا این لحظه).
برای شناسه پایگاه دانشی Meeting Assist (موجود)، شناسه پایگاه دانش موجود خود را وارد کنید (به عنوان مثال، JSXXXXX3D8). می توانید آن را از کنسول بستر آمازون کپی کنید.
برای تمام پارامترهای دیگر، از مقادیر پیش فرض استفاده کنید.

اگر می خواهید بعداً تنظیمات را سفارشی کنید، برای مثال تنظیمات خود را اضافه کنید AWS لامبدا توابع، استفاده از واژگان سفارشی و مدل های زبان برای بهبود دقت، فعال کردن ویرایش اطلاعات شخصی قابل شناسایی (PII) و موارد دیگر، می توانید پشته را برای این پارامترها به روز کنید.

چک باکس های تایید را انتخاب کنید، سپس انتخاب کنید پشته ایجاد کنید.

پشته اصلی CloudFormation از پشته های تو در تو برای ایجاد منابع زیر در حساب AWS شما استفاده می کند:

سرویس ذخیره سازی ساده آمازون سطل های (Amazon S3) برای نگهداری مصنوعات ساخت و ضبط تماس ها
An AWS Fargate وظیفه با یک Application Load Balancer ارائه کد در حال اجرا سرور WebSocket برای مصرف جریان های صوتی استریو و رله کردن به Amazon Transcript، انتشار بخش های رونویسی در آمازون کینزیس جریان دادهو ضبط تماس های استریو را ایجاد و ذخیره کنید
یک جریان داده Kinesis برای انتقال رویدادهای فراخوانی و بخش‌های رونویسی به تابع پردازش غنی‌سازی
منابع LMA، از جمله QnABot در راه حل AWS پشته، که با سرویس جستجوی باز آمازون و آمازون بستر
La AWS AppSync API، که یک نقطه پایانی GraphQL برای پشتیبانی از پرس و جوها و به روز رسانی های بلادرنگ ارائه می دهد
اجزای وب سایت، از جمله سطل S3، آمازون CloudFront توزیع، و Cognito آمازون استخر کاربر
یک برنامه افزونه مرورگر از پیش پیکربندی شده قابل دانلود برای مرورگرهای کروم
سایر منابع حمایتی، از جمله نقش‌ها و سیاست‌های IAM (با استفاده از بهترین شیوه‌های حداقل امتیاز)، ابر خصوصی مجازی آمازون منابع (Amazon VPC)، پل رویداد آمازون قوانین رویداد، و CloudWatch آمازون گروه های ورود به سیستم

استقرار پشته ها حدود 35 تا 40 دقیقه طول می کشد. وضعیت پشته اصلی نشان می دهد CREATE_COMPLETE وقتی همه چیز مستقر است

کلمه ی عبور خود را تنظیم کنید

پس از استقرار پشته، رابط کاربری وب LMA را باز کنید و رمز عبور خود را با انجام مراحل زیر تنظیم کنید:

ایمیلی را که دریافت کرده‌اید، در آدرس ایمیلی که ارائه کرده‌اید، با موضوع «به دستیار جلسه زنده خوش آمدید!» باز کنید.
مرورگر وب خود را به URL نشان داده شده در ایمیل باز کنید. شما به صفحه ورود هدایت می شوید.
ایمیل حاوی یک رمز عبور موقت تولید شده است که برای ورود به سیستم و ایجاد رمز عبور خود استفاده می کنید. نام کاربری شما آدرس ایمیل شماست.
یک رمز عبور جدید تنظیم کنید.

رمز عبور جدید شما باید حداقل هشت نویسه داشته باشد و دارای حروف بزرگ و کوچک و اعداد و کاراکترهای خاص باشد.

برای تأیید آدرس ایمیل خود دستورالعمل ها را دنبال کنید یا انتخاب کنید پرش تا بعدا انجامش بده

شما اکنون به LMA وارد شده اید.

شما همچنین ایمیل مشابهی با موضوع «کد تأیید ثبت نام QnABot» دریافت کردید. این ایمیل حاوی یک رمز عبور موقت تولید شده است که از آن برای ورود به سیستم و ایجاد رمز عبور خود در طراح QnABot استفاده می کنید. شما فقط در صورتی از طراح QnABot استفاده می کنید که بخواهید گزینه ها و درخواست های LMA را سفارشی کنید. نام کاربری شما برای QnABot Admin است. اکنون می‌توانید رمز عبور دائمی مدیریت QnABot خود را تنظیم کنید، یا اگر بخواهید بعداً چیزها را سفارشی کنید، این ایمیل را ایمن نگه دارید.

افزونه مرورگر کروم را دانلود و نصب کنید

برای بهترین تجربه پخش جریانی جلسه، افزونه مرورگر LMA (در حال حاضر برای Chrome موجود است) را نصب کنید:

را انتخاب کنید برنامه افزودنی کروم را دانلود کنید برای دانلود فایل زیپ پسوند مرورگر (lma-chrome-extension.zip).
را انتخاب کنید (راست کلیک کنید) و فایل .zip را گسترش دهید (lma-chrome-extension.zip) برای ایجاد یک پوشه محلی به نام lma-chrome-extension.
کروم را باز کنید و لینک را وارد کنید chrome://extensions در نوار آدرس.
فعال حالت توسعهدهنده.
را انتخاب کنید بارگیری بدون بسته بندی، به مسیر lma-chrome-extension پوشه (که از دانلود خارج کردید) و انتخاب کنید انتخاب کنید. این برنامه افزودنی شما را بارگیری می کند.
افزونه LMA جدید را برای دسترسی آسان به نوار ابزار مرورگر پین کنید—شما اغلب از آن برای پخش جریانی جلسات خود استفاده خواهید کرد!

شروع به استفاده از LMA کنید

LMA دو گزینه پخش را ارائه می دهد:

افزونه مرورگر کروم - از این برای پخش فراداده های صوتی و بلندگو از برنامه مرورگر جلسه خود استفاده کنید. در حال حاضر با Zoom و Chime کار می‌کند، اما امیدواریم برنامه‌های جلسه بیشتری اضافه کنیم.
تب LMA Stream Audio - از این برای پخش صدا از میکروفون خود و هر برنامه جلسه مبتنی بر مرورگر Chrome، تلفن نرم افزاری یا برنامه صوتی استفاده کنید.

نحوه استفاده از هر دو گزینه را در بخش های زیر به شما نشان می دهیم.

از افزونه مرورگر کروم برای پخش جریانی تماس زوم استفاده کنید

برای استفاده از افزونه مرورگر مراحل زیر را کامل کنید:

افزونه LMA را باز کنید و با اعتبار LMA خود وارد شوید.
به یک جلسه Zoom در مرورگر وب خود بپیوندید یا شروع کنید (از مشتری زوم جداگانه استفاده نکنید).

اگر قبلاً صفحه جلسه Zoom را بارگذاری کرده اید، آن را دوباره بارگیری کنید.

برنامه افزودنی LMA به طور خودکار تشخیص می دهد که Zoom در تب مرورگر در حال اجرا است و نام شما و نام جلسه را پر می کند.

در هنگام تماس به دیگران بگویید که در شرف شروع ضبط تماس با استفاده از LMA هستید و از آنها اجازه بگیرید. در صورت مخالفت شرکت کنندگان ادامه ندهید.
را انتخاب کنید شروع به گوش دادن کنید.
سلب مسئولیت را بخوانید و بپذیرید و انتخاب کنید اجازه دادن برای اشتراک گذاری برگه مرورگر

پسوند LMA به طور خودکار بلندگوی فعال را در تماس شناسایی و نمایش می دهد. اگر در جلسه تنها هستید، برخی از دوستان را دعوت کنید تا به آن بپیوندند و مشاهده کنید که اسامی که برای ملحق شدن به تماس استفاده کرده اند، هنگام صحبت در برنامه افزودنی نمایش داده می شود و به کلمات آنها در رونوشت LMA نسبت داده می شود.

را انتخاب کنید در LMA باز کنید برای مشاهده متن زنده خود در یک برگه جدید.
زبان رونوشت دلخواه خود را انتخاب کنید و با استفاده از عبارت «OK Assistant!» با دستیار جلسه تعامل داشته باشید. یا ربات کمک جلسه پنجره

La از دستیار بپرسید دکمه از سرویس دستیار جلسه (پایگاه دانش آمازون بستر) می خواهد تا بر اساس رونوشت تعاملات اخیر در جلسه، پاسخ خوبی را پیشنهاد دهد. مسافت پیموده شده شما ممکن است متفاوت باشد، پس آزمایش کنید!

وقتی کارتان تمام شد، انتخاب کنید پخش جریانی را متوقف کنید برای پایان دادن به جلسه در LMA.

در عرض چند ثانیه، خلاصه‌های خودکار پایان جلسه ظاهر می‌شوند و ضبط صدا در دسترس می‌شود. پس از پایان تماس می توانید به استفاده از ربات ادامه دهید.

از تب LMA UI Stream Audio برای پخش جریانی از میکروفون خود و هر برنامه صوتی مبتنی بر مرورگر استفاده کنید

افزونه مرورگر راحت‌ترین راه برای پخش جریانی فراداده و صدا از برنامه‌های وب جلسه پشتیبانی‌شده است. با این حال، می‌توانید از LMA برای پخش صدا از هر تلفن نرم‌افزار مبتنی بر مرورگر، برنامه جلسه یا سایر منابع صوتی که در مرورگر کروم شما پخش می‌شود، استفاده کنید. پخش جریانی صدا برگه ای که در رابط کاربری LMA تعبیه شده است.

هر منبع صوتی را در برگه مرورگر باز کنید.

به عنوان مثال، این می تواند یک تلفن نرم افزاری باشد (مانند صدای گوگل)، یک برنامه جلسه دیگر، یا برای اهداف نمایشی، می توانید به سادگی یک صدای ضبط شده محلی یا یک ویدیوی YouTube را در مرورگر خود پخش کنید تا از شرکت کننده دیگری در جلسه تقلید کنید. اگر فقط می خواهید آن را امتحان کنید، موارد زیر را باز کنید ویدیو یوتیوب در یک برگه جدید

در رابط کاربری برنامه LMA، را انتخاب کنید پخش جریانی صدا (بدون پسوند) برای باز کردن تب Stream Audio.
برای شناسه جلسه، شناسه جلسه را وارد کنید.
برای نام، یک نام برای خود وارد کنید (برای صدا از میکروفون شما اعمال می شود).
برای نام(های) شرکت کننده، نام شرکت کنندگان را وارد کنید (در منبع صوتی ورودی اعمال می شود).
را انتخاب کنید شروع به جریان دادن.
برگه مرورگری را که قبلا باز کردید انتخاب کنید و انتخاب کنید اجازه دادن برای به اشتراک گذاشتن
مجدداً برگه رابط کاربری LMA را انتخاب کنید تا شناسه جلسه جدید خود را که در فهرست قرار گرفته است را مشاهده کنید و جلسه را به عنوان نشان دهید در حال پیش رفت.
برای باز کردن صفحه جزئیات، شناسه جلسه را انتخاب کنید و رونوشت صدای ورودی را که به نام شرکت‌کنندگانی که وارد کرده‌اید نسبت داده می‌شود، تماشا کنید. اگر صحبت کنید، رونویسی صدای خود را خواهید دید.

استفاده از پخش جریانی صدا قابلیت پخش جریانی از هر برنامه تلفن نرم افزاری، برنامه جلسه، یا هر صدای پخش جریانی دیگری که در مرورگر پخش می شود، به همراه صدای ضبط شده از میکروفون انتخابی شما. همیشه قبل از ضبط آنها با استفاده از LMA یا هر برنامه ضبط دیگری، از دیگران اجازه بگیرید.

مروری بر جریان پردازش

LMA چگونه جلسه شما را رونویسی و تجزیه و تحلیل کرد؟ بیایید ببینیم چگونه کار می کند. نمودار زیر اجزای اصلی معماری و نحوه تطبیق آنها با یکدیگر را در سطح بالایی نشان می دهد.

کاربر LMA در مرورگر خود به جلسه می‌پیوندد، افزونه مرورگر LMA را فعال می‌کند و با استفاده از اعتبار LMA خود احراز هویت می‌کند. اگر برنامه جلسه (به عنوان مثال، Zoom.us) توسط برنامه افزودنی LMA پشتیبانی می شود، نام کاربر، نام جلسه و نام سخنران فعال به طور خودکار توسط برنامه افزودنی شناسایی می شود. اگر برنامه جلسه توسط برنامه افزودنی پشتیبانی نمی‌شود، کاربر LMA می‌تواند به صورت دستی نام خود و موضوع جلسه را وارد کند—نام سخنرانان فعال شناسایی نخواهد شد.

پس از دریافت مجوز از سایر شرکت‌کنندگان، کاربر LMA شروع گوش دادن را در صفحه افزودنی LMA انتخاب می‌کند. یک اتصال WebSocket ایمن به URL از پیش پیکربندی شده پشته LMA WebSocket برقرار می شود و رمز تأیید اعتبار کاربر تأیید می شود. برنامه افزودنی مرورگر LMA یک پیام START حاوی فراداده های جلسه (نام، موضوع و غیره) به WebSocket ارسال می کند و پخش صدای دو کاناله را از میکروفون کاربر و کانال صوتی ورودی حاوی صدای سایر شرکت کنندگان جلسه شروع می کند. برنامه افزودنی برنامه جلسه را نظارت می کند تا تغییرات بلندگوی فعال را در طول مکالمه تشخیص دهد و آن ابرداده را به WebSocket ارسال می کند و LMA را قادر می سازد تا قسمت های گفتار را با نام گوینده برچسب گذاری کند.

سرور WebSocket در حال اجرا در Fargate قطعات صوتی دو کاناله بلادرنگ را از جریان WebSocket دریافتی مصرف می کند. صدا در Amazon Transcript پخش می شود و نتایج رونویسی در زمان واقعی برای Kinesis Data Streams نوشته می شود.

هر جلسه پردازش جلسه تا زمانی اجرا می‌شود که کاربر Stop Listening را در صفحه افزودنی LMA انتخاب کند یا جلسه را پایان دهد و برگه را ببندد. در پایان تماس، این تابع یک فایل ضبط استریو در آمازون S3 ایجاد می‌کند (اگر ضبط در هنگام استقرار پشته فعال بود).

یک تابع Lambda به نام Call Event Processor که توسط Kinesis Data Streams تغذیه می‌شود، پردازش می‌کند و به‌صورت اختیاری ابرداده‌های جلسه و بخش‌های رونویسی را غنی می‌کند. پردازشگر رویداد تماس با خدمات کمک جلسه ادغام می شود. LMA توسط آمازون لکس، پایگاه های دانش برای Amazon Bedrock و Amazon Bedrock LLM با استفاده از منبع باز QnABot در راه حل AWS برای پاسخ‌های مبتنی بر پرسش‌های متداول و به‌عنوان هماهنگ‌کننده برای مسیریابی درخواست به سرویس هوش مصنوعی مناسب. هنگام پایان تماس، پردازشگر رویداد فراخوانی تابع لامبدا خلاصه‌سازی رونوشت را فراخوانی می‌کند تا خلاصه‌ای از تماس را از رونوشت کامل ایجاد کند.

عملکرد پردازشگر رویداد تماس با AWS AppSync برای تداوم تغییرات (جهش) در رابط کاربری آمازون DynamoDB و به‌روزرسانی‌های بلادرنگ را به مشتریان وب وارد شده کاربر LMA ارسال کنید (به راحتی با انتخاب گزینه Open in LMA در افزونه مرورگر باز می‌شود).

دارایی های رابط کاربری وب LMA در Amazon S3 میزبانی می شوند و از طریق CloudFront ارائه می شوند. احراز هویت توسط Amazon Cognito ارائه شده است.

هنگامی که کاربر احراز هویت شد، برنامه وب یک اتصال امن GraphQL به API AWS AppSync برقرار می‌کند و برای دریافت رویدادهای بی‌درنگ مانند تماس‌های جدید و تغییرات وضعیت تماس برای صفحه فهرست جلسات، و بخش‌های رونویسی جدید یا به‌روز شده و محاسبه شده مشترک می‌شود. تجزیه و تحلیل برای صفحه جزئیات جلسه. هنگامی که ترجمه فعال است، برنامه وب همچنین به طور ایمن با آمازون ترنسلیت تعامل می کند تا رونویسی جلسه را به زبان انتخابی ترجمه کند.

کل جریان پردازش، از گفتار دریافت‌شده تا به‌روزرسانی‌های صفحه وب زنده، مبتنی بر رویداد است، و تأخیر انتها به انتها کوتاه است - معمولاً فقط چند ثانیه.

نظارت و عیب یابی

AWS CloudFormation خرابی‌ها و علل استقرار را در پشته‌های مربوطه گزارش می‌کند رویدادها برگه دیدن عیب یابی CloudFormation برای کمک به مشکلات رایج استقرار مراقب خرابی های استقرار ناشی از خطاهای بیش از حد مجاز باشید. پشته های LMA منابعی را ایجاد می کنند که مشمول سهمیه های پیش فرض حساب و خدمات منطقه هستند، مانند آدرس های IP الاستیک و دروازه های NAT. هنگام عیب‌یابی خرابی‌های پشته CloudFormation، همیشه به پشته‌های تودرتوی ناموفق پیمایش کنید تا اولین خرابی منبع تودرتو گزارش‌شده را بیابید - این تقریباً همیشه علت اصلی است.

Amazon Transcript دارای محدودیت پیش‌فرض 25 جریان رونویسی همزمان است که LMA را به 25 جلسه همزمان در یک حساب یا منطقه AWS محدود می‌کند. اگر کاربران زیادی دارید و باید تعداد بیشتری از جلسات همزمان را در حساب خود مدیریت کنید، برای رونویسی پخش جریانی، تعداد جریان‌های همزمان HTTP/2 را درخواست کنید.

LMA با استفاده از CloudWatch، نظارت بر زمان اجرا و گزارش‌ها را برای هر مؤلفه فراهم می‌کند:

پردازش WebSocket و رونویسی وظیفه Fargate - روی سرویس کانتینر الاستیک آمازون کنسول (Amazon ECS)، به قسمت خوشه صفحه و باز کردن LMA-WEBSOCKETSTACK-xxxx-TranscribingCluster تابع. انتخاب وظایف را برگه و صفحه کار را باز کنید. انتخاب کنید سیاههها و مشاهده در CloudWatch برای بازرسی سیاهههای وظیفه رونویس WebSocket.
فراخوانی عملکرد لامبدا پردازشگر رویداد – در کنسول Lambda، را باز کنید LMA-AISTACK-CallEventProcessor تابع. انتخاب مانیتور برای مشاهده معیارهای عملکرد، را انتخاب کنید. انتخاب کنید مشاهده گزارش‌ها در CloudWatch برای بررسی گزارش های عملکرد
AWS AppSync API – در کنسول AWS AppSync، آن را باز کنید CallAnalytics-LMA API. انتخاب کنید نظارت در صفحه پیمایش برای مشاهده معیارهای API. انتخاب کنید مشاهده گزارش‌ها در CloudWatch برای بررسی گزارش های API AWS AppSync.

برای QnABot در AWS برای Meeting Assist، به بخش مراجعه کنید کمک جلسه README، و راهنمای پیاده سازی راه حل QnABot برای اطلاعات بیشتر.

ارزیابی هزینه

LMA یک سرور WebSocket با استفاده از Fargate (2vCPU) و منابع شبکه VPC با هزینه حدود 0.10 دلار در ساعت (تقریباً 72 دلار در ماه) ارائه می دهد. برای جزئیات بیشتر، نگاه کنید قیمت گذاری AWS Fargate.

LMA با استفاده از QnABot و Knowledge Bases برای Amazon Bedrock فعال می شود. شما پایگاه دانش خود را ایجاد می کنید که از آن برای LMA و موارد استفاده بالقوه دیگر استفاده می کنید. برای جزئیات بیشتر، نگاه کنید قیمت گذاری سنگ بستر آمازون. خدمات اضافی AWS مورد استفاده توسط راه حل QnABot حدود 0.77 دلار در ساعت هزینه دارد. برای جزئیات بیشتر، به لیست مراجعه کنید QnABot در هزینه های راه حل AWS.

هزینه های راه حل باقی مانده بر اساس استفاده است.

هزینه‌های استفاده برای یک تماس 0.17 دقیقه‌ای به 5 دلار می‌رسد، اگرچه این می‌تواند بر اساس گزینه‌های انتخاب شده (مانند ترجمه)، تعداد خلاصه‌های LLM و کل استفاده متفاوت باشد، زیرا استفاده بر واجد شرایط بودن ردیف رایگان و قیمت‌گذاری سطح حجم برای بسیاری از خدمات تأثیر می‌گذارد. . برای اطلاعات بیشتر در مورد خدماتی که هزینه استفاده را به همراه دارند، به موارد زیر مراجعه کنید:

برای بررسی هزینه های LMA برای خودتان، استفاده کنید AWS Cost Explorer یا انتخاب کنید جزئیات لایحه در داشبورد صورت‌حساب AWS برای مشاهده هزینه‌های ماهانه خود بر اساس خدمات.

استقرار خود را سفارشی کنید

هنگام ایجاد یا به‌روزرسانی پشته خود برای سفارشی کردن استقرار LCA از پارامترهای الگوی CloudFormation زیر استفاده کنید:

برای استفاده از سطل S3 خود برای ضبط جلسات، استفاده کنید نام سطل ضبط صدا تماس بگیرید و پیشوند فایل صوتی.
برای ویرایش PII از رونویسی، تنظیم کنید ویرایش محتوا را برای رونوشت‌ها فعال کنید درست است، و تنظیم کنید انواع موجودیت ویرایش PII رونویسی به عنوان مورد نیاز. برای اطلاعات بیشتر ببین ویرایش یا شناسایی PII در یک جریان بیدرنگ.
برای بهبود دقت رونویسی برای کلمات اختصاری و اصطلاحات تخصصی فنی و دامنه، تنظیم کنید رونویسی نام واژگان سفارشی به نام واژگان سفارشی که قبلاً در آمازون رونویسی یا تنظیم کرده اید رونویسی نام مدل زبان سفارشی به نام یک مدل زبان سفارشی که قبلا ایجاد شده است. برای اطلاعات بیشتر ببین بهبود دقت رونویسی.
برای رونویسی جلسات به زبان پشتیبانی شده به غیر از انگلیسی ایالات متحده، مقدار مورد نظر را انتخاب کنید زبان برای رونویسی.
برای سفارشی کردن پردازش رونوشت، به صورت اختیاری تنظیم کنید تابع قلاب لامبدا ARN برای پردازش قطعه رونوشت سفارشی به ARN تابع Lambda خودتان. برای اطلاعات بیشتر ببین استفاده از تابع Lambda برای ارائه منطق سفارشی برای پردازش رونوشت به صورت اختیاری.
برای سفارشی کردن قابلیت های کمک جلسه بر اساس راه حل QnABot در AWS، آمازون لکس، آمازون بستر و پایگاه های دانش برای ادغام آمازون بستر، به بخش زیر مراجعه کنید. کمک جلسه README.
برای سفارشی‌سازی خلاصه‌نویسی رونوشت با پیکربندی LMA برای فراخوانی تابع Lambda خود، ببینید گزینه LAMBDA خلاصه رونوشت.
برای سفارشی کردن خلاصه‌سازی رونوشت با اصلاح اعلان‌های پیش‌فرض یا افزودن موارد جدید، ببینید خلاصه رونوشت.
برای تغییر دوره نگهداری، تنظیم کنید رکورد انقضا در چند روز به مقدار مورد نظر تمام داده های تماس پس از این مدت برای همیشه از حافظه LMA DynamoDB حذف می شود. تغییرات در این تنظیم فقط برای تماس های جدید دریافت شده پس از به روز رسانی اعمال می شود.

LMA یک پروژه متن باز است. می‌توانید مخزن LMA GitHub را فورک کنید، کد را بهبود ببخشید، و درخواست‌های کششی را برای ما ارسال کنید تا بتوانیم پیشرفت‌های شما را ترکیب کرده و به اشتراک بگذاریم!

یک پشته LMA موجود را به روز کنید

می توانید پشته LMA موجود خود را به آخرین نسخه به روز کنید. برای جزئیات بیشتر، نگاه کنید یک پشته موجود را به روز کنید.

پاک کردن

تبریک می گویم! شما تمام مراحل راه اندازی نمونه راه حل تجزیه و تحلیل تماس زنده خود را با استفاده از خدمات AWS انجام داده اید.

وقتی آزمایش این نمونه راه حل را تمام کردید، منابع خود را با استفاده از کنسول AWS CloudFormation پاکسازی کنید تا پشته های LMA را که مستقر کرده اید حذف کنید. این باعث حذف منابعی می شود که با استقرار راه حل ایجاد شده اند. سطل های ضبط S3، جدول DynamoDB و گروه های گزارش CloudWatch پس از حذف پشته حفظ می شوند تا از حذف داده های شما جلوگیری شود.

تجزیه و تحلیل تماس زنده: راه حل همراه

راه حل همراه ما، تجزیه و تحلیل تماس زنده و کمک عامل (LCA)، رونویسی و تجزیه و تحلیل در زمان واقعی را برای مراکز تماس (تماس های تلفنی) به جای جلسات ارائه می دهد. شباهت های زیادی وجود دارد - در واقع، LMA با استفاده از معماری و بسیاری از اجزای مشتق شده از LCA ساخته شده است.

نتیجه

راه حل نمونه Live Meeting Assistant یک رویکرد منعطف، غنی از ویژگی ها و قابل تنظیم برای ارائه کمک به جلسات زنده برای بهبود بهره وری شما در طول و بعد از جلسات ارائه می دهد. از خدمات آمازون AI/ML مانند Amazon Transcript، Amazon Lex، Knowledge Bases for Amazon Bedrock و Amazon Bedrock LLMs برای رونویسی و استخراج اطلاعات بی‌درنگ از صدای جلسه شما استفاده می‌کند.

نمونه برنامه LMA به عنوان منبع باز ارائه شده است—از آن به عنوان نقطه شروعی برای راه حل خود استفاده کنید و با کمک کردن به رفع مشکلات و ویژگی ها از طریق درخواست های کشش GitHub به ما کمک کنید تا آن را بهتر کنیم. مرور به مخزن LMA GitHub برای کاوش کد، را انتخاب کنید تماشا کردن برای اطلاع از نسخه های جدید، و بررسی کنید README برای آخرین به روز رسانی اسناد.

برای کمک تخصصی، خدمات حرفه ای AWS و دیگر شرکای AWS اینجا هستند تا کمک کنند.

ما از اینکه ازت خبر داشته باشیم خوشحال میشویم. نظر خود را در بخش نظرات با ما در میان بگذارید یا از تالار گفتمان مشکلات موجود در آن استفاده کنید مخزن LMA GitHub.

درباره نویسندگان

باب استرهان یک معمار اصلی راه حل در تیم خدمات هوش مصنوعی زبان AWS است.

کریس لات یک معمار راه حل اصلی در تیم خدمات زبان AWS AI است. او 20 سال تجربه توسعه نرم افزار سازمانی دارد. کریس در ساکرامنتو، کالیفرنیا زندگی می کند و از باغبانی، هوافضا و سفر در سراسر جهان لذت می برد.

بابو سرینیواسان یک Sr. Specialist SA – خدمات هوش مصنوعی زبان در سازمان تخصصی جهانی در AWS، با بیش از 24 سال تجربه در فناوری اطلاعات و 6 سال گذشته متمرکز بر AWS Cloud. او مشتاق هوش مصنوعی/ML است. در خارج از محل کار، او از نجاری لذت می برد و دوستان و خانواده (گاهی اوقات غریبه ها) را با استفاده از جادوی کارت دست سرگرم می کند.

کیشور داموداران یک معمار ارشد راه حل در AWS است.

عکس جیلیان آرمسترانگ جیلیان آرمسترانگ معمار Builder Solutions است. او از اینکه چگونه ابر فرصت‌هایی را برای افراد بیشتری برای استفاده از فناوری برای حل مشکلات باز می‌کند هیجان‌زده است، و به‌ویژه از این که چگونه فناوری‌های شناختی، مانند هوش مصنوعی محاوره‌ای، به ما اجازه می‌دهند تا با رایانه‌ها به روش‌های انسانی‌تری تعامل داشته باشیم، هیجان‌زده است.

محتوای مبتنی بر SEO و توزیع روابط عمومی. امروز تقویت شوید.
PlatoData.Network Vertical Generative Ai. به خودت قدرت بده دسترسی به اینجا.
PlatoAiStream. هوش وب 3 دانش تقویت شده دسترسی به اینجا.
PlatoESG. کربن ، CleanTech، انرژی، محیط، خورشیدی، مدیریت پسماند دسترسی به اینجا.
PlatoHealth. هوش بیوتکنولوژی و آزمایشات بالینی. دسترسی به اینجا.
منبع: https://aws.amazon.com/blogs/machine-learning/live-meeting-assistant-with-amazon-transcribe-amazon-bedrock-and-knowledge-bases-for-amazon-bedrock/

هوش داده های تولیدی

دستیار جلسه زنده با آمازون رونویسی، آمازون بستر، و پایگاه های دانش برای آمازون بستر | خدمات وب آمازون

بررسی اجمالی راه حل

پیش نیازها

راه حل را با استفاده از AWS CloudFormation مستقر کنید

کلمه ی عبور خود را تنظیم کنید

افزونه مرورگر کروم را دانلود و نصب کنید

شروع به استفاده از LMA کنید

از افزونه مرورگر کروم برای پخش جریانی تماس زوم استفاده کنید

از تب LMA UI Stream Audio برای پخش جریانی از میکروفون خود و هر برنامه صوتی مبتنی بر مرورگر استفاده کنید

مروری بر جریان پردازش

نظارت و عیب یابی

ارزیابی هزینه

استقرار خود را سفارشی کنید

یک پشته LMA موجود را به روز کنید

پاک کردن

تجزیه و تحلیل تماس زنده: راه حل همراه

نتیجه

درباره نویسندگان

Binance’s Strategic Expansion: Securing Dubai License and Reviving Operations in India Amidst a Surge in Meme Stock Trading and Rapid Crypto Developments

Binance Expands MENA Presence with Dubai License and Indian Market Return, as Robinhood Sees Meme Stock Revenue Surge and Crypto Investment Heats Up

جدیدترین اطلاعات

Binance Expands Global Reach with Dubai License and Indian Market Return Amidst Crypto Surge and Trading Innovations

بایننس با مجوز دبی و بازگشت به هند، دسترسی جهانی را افزایش می‌دهد، در حالی که رابینهود برای ثبت درآمد از موج میم استفاده می‌کند.

گسترش استراتژیک بایننس: تضمین مجوز دبی و احیای بازار هند در میان تحول جهانی رمزنگاری

بایننس دسترسی جهانی را با مجوز دبی و بازگشت هند در میان افزایش درآمد رابینهود و روند سرمایه گذاری رمزنگاری افزایش می دهد: گزارشی جامع

بایننس با مجوز دبی و بازدهی بازار هند، دسترسی جهانی را افزایش می‌دهد، زیرا Robinhood Eyes در میان افزایش کریپتو، درآمد خود را ثبت می‌کند.

بازگشت استراتژیک بایننس به هند: استفاده از مجوز دبی در میان تحولات نظارتی