Trí thông minh dữ liệu tạo

Định cấu hình môi trường AWS DeepRacer để đào tạo và phân tích nhật ký bằng AWS CDK

Ngày:

Bài đăng này được đồng viết bởi Zdenko Estok, Kiến trúc sư đám mây tại Accenture và Sakar Selimcan, DeepRacer SME tại Accenture.

Với việc sử dụng ngày càng nhiều trí tuệ nhân tạo (AI) và máy học (ML) cho phần lớn các ngành (từ chăm sóc sức khỏe đến bảo hiểm, từ sản xuất đến tiếp thị), trọng tâm chính chuyển sang tính hiệu quả khi xây dựng và đào tạo các mô hình trên quy mô lớn. Việc tạo ra một môi trường khoa học dữ liệu có thể mở rộng và không rắc rối là chìa khóa. Có thể mất một lượng thời gian đáng kể để khởi chạy và định cấu hình một môi trường được điều chỉnh cho một trường hợp sử dụng cụ thể và thậm chí còn khó hơn để các đồng nghiệp cùng cộng tác.

Theo Accenture, các công ty quản lý để mở rộng quy mô AI và ML một cách hiệu quả có thể đạt được gần gấp ba lần lợi tức đầu tư của họ. Tuy nhiên, không phải tất cả các công ty đều đạt được lợi nhuận kỳ vọng trên hành trình AI/ML của họ. Các bộ công cụ để tự động hóa cơ sở hạ tầng trở nên cần thiết cho việc mở rộng quy mô theo chiều ngang của các nỗ lực AI/ML trong một tập đoàn.

DeepSacer AWS là một cách đơn giản và thú vị để bắt đầu với học tăng cường (RL), một kỹ thuật ML trong đó một tác nhân khám phá các hành động tối ưu để thực hiện trong một môi trường nhất định. Trong trường hợp của chúng tôi, đó sẽ là một phương tiện AWS DeepRacer, cố gắng chạy nhanh quanh đường đua. Bạn có thể bắt đầu với RL một cách nhanh chóng với các hướng dẫn thực hành hướng dẫn bạn những kiến ​​thức cơ bản về đào tạo các mô hình RL và thử nghiệm chúng một cách thú vị, trải nghiệm đua xe tự lái.

Bài đăng này cho thấy cách các công ty có thể sử dụng cơ sở hạ tầng dưới dạng mã (IaC) với Bộ công cụ phát triển đám mây AWS (AWS CDK) để đẩy nhanh quá trình tạo và nhân rộng cơ sở hạ tầng có khả năng chuyển giao cao và dễ dàng cạnh tranh cho các sự kiện AWS DeepRacer trên quy mô lớn.

“IaC kết hợp với môi trường Jupyter được quản lý đã mang đến cho chúng tôi cả hai thế giới tốt nhất: môi trường khoa học dữ liệu có thể lặp lại, có khả năng chuyển giao cao để chúng tôi tiếp cận các đối thủ cạnh tranh AWS DeepRacer của mình để tập trung vào những gì họ làm tốt nhất: đào tạo các mô hình nhanh và nhanh.”

– Selimcan Sakar, AWS DeepRacer SME tại Accenture.

Tổng quan về giải pháp

Phối hợp tất cả các dịch vụ cần thiết sẽ mất một lượng thời gian đáng kể khi tạo một mẫu có thể mở rộng có thể được áp dụng cho nhiều trường hợp sử dụng. Trong quá khứ, Hình thành đám mây AWS các mẫu đã được tạo để tự động hóa việc tạo các dịch vụ này. Với những tiến bộ trong tự động hóa và định cấu hình với mức độ trừu tượng ngày càng tăng để thiết lập các môi trường khác nhau bằng công cụ IaC, AWS CDK đang được áp dụng rộng rãi trong nhiều doanh nghiệp. AWS CDK là một khung phát triển phần mềm nguồn mở để xác định tài nguyên ứng dụng đám mây của bạn. Nó sử dụng tính quen thuộc và sức mạnh biểu cảm của ngôn ngữ lập trình để lập mô hình ứng dụng của bạn, đồng thời cung cấp tài nguyên theo cách an toàn và có thể lặp lại.

Trong bài đăng này, chúng tôi cho phép cung cấp các thành phần khác nhau cần thiết để thực hiện phân tích nhật ký bằng cách sử dụng Amazon SageMaker trên AWS DeepRacer qua AWS CDK cấu trúc.

Mặc dù biểu đồ phân tích được cung cấp trong bảng điều khiển DeepRacer nếu hiệu quả và đơn giản về phần thưởng được cấp và tiến độ đạt được, nhưng biểu đồ này không cung cấp thông tin chi tiết về tốc độ ô tô di chuyển qua các điểm tham chiếu hoặc loại đường mà ô tô ưa thích quanh đường đua . Đây là nơi phân tích nhật ký nâng cao phát huy tác dụng. Phân tích nhật ký nâng cao của chúng tôi nhằm mục đích mang lại hiệu quả trong quá trình đào tạo hồi cứu để hiểu chức năng phần thưởng và không gian hành động nào hoạt động tốt hơn các chức năng khác khi đào tạo nhiều mô hình và liệu một mô hình có bị quá tải hay không, để các tay đua có thể luyện tập thông minh hơn và đạt được kết quả tốt hơn với ít thời gian luyện tập hơn.

Giải pháp của chúng tôi mô tả cấu hình môi trường AWS DeepRacer bằng cách sử dụng AWS CDK để tăng tốc hành trình thử nghiệm của người dùng với phân tích nhật ký SageMaker và học hỏi tăng cường trên AWS cho sự kiện AWS DeepRacer.

Quản trị viên có thể chạy tập lệnh AWS CDK được cung cấp trong Repo GitHub thông qua Bảng điều khiển quản lý AWS hoặc trong thiết bị đầu cuối sau khi tải mã trong môi trường của họ. Các bước thực hiện như sau:

  1. Mở Đám mây AWS9 trên bảng điều khiển.
  2. Tải mô-đun AWS CDK từ GitHub vào môi trường AWS Cloud9.
  3. Định cấu hình mô-đun AWS CDK như được mô tả trong bài đăng này.
  4. Mở tệp cdk.context.json và kiểm tra tất cả các tham số.
  5. Sửa đổi các tham số nếu cần và chạy lệnh AWS CDK với nhân vật dự kiến ​​để khởi chạy môi trường được định cấu hình phù hợp với nhân vật đó.

Sơ đồ sau minh họa kiến ​​trúc giải pháp.

cdk-vòm

Với sự trợ giúp của AWS CDK, chúng tôi có thể kiểm soát phiên bản các tài nguyên được cung cấp của mình và có một môi trường có khả năng vận chuyển cao, tuân thủ các phương pháp hay nhất ở cấp doanh nghiệp.

Điều kiện tiên quyết

Để cung cấp môi trường ML với AWS CDK, hãy hoàn thành các điều kiện tiên quyết sau:

  1. Có quyền truy cập vào tài khoản AWS và các quyền trong Khu vực để triển khai các tài nguyên cần thiết cho các diện mạo khác nhau. Đảm bảo rằng bạn có thông tin xác thực và quyền để triển khai ngăn xếp AWS CDK vào tài khoản của mình.
  2. Chúng tôi khuyên bạn nên làm theo một số phương pháp hay nhất được làm nổi bật thông qua các khái niệm được trình bày chi tiết trong các tài nguyên sau:
  3. Sao chép Repo GitHub vào môi trường của bạn.

Triển khai danh mục đầu tư vào tài khoản của bạn

Trong lần triển khai này, chúng tôi sử dụng AWS Cloud9 để tạo môi trường khoa học dữ liệu bằng AWS CDK.

  1. Điều hướng đến bảng điều khiển AWS Cloud9.
  2. Chỉ định loại môi trường, loại phiên bản và nền tảng của bạn.

  1. Chỉ định của bạn Quản lý truy cập và nhận dạng AWS (IAM), vai trò VPC và mạng con.

  1. Trong môi trường AWS Cloud9 của bạn, hãy tạo một thư mục mới có tên là DeepRacer.
  2. Chạy lệnh sau để cài đặt AWS CDK và đảm bảo rằng bạn có các phụ thuộc phù hợp để triển khai danh mục đầu tư:
npm install -g aws-cdk

  1. Để xác minh rằng AWS CDK đã được cài đặt và để truy cập tài liệu, hãy chạy lệnh sau trong thiết bị đầu cuối của bạn (lệnh này sẽ chuyển hướng bạn đến tài liệu AWS CDK):
  1. Bây giờ chúng ta có thể sao chép kho lưu trữ AWS DeepRacer từ GitHub.
  2. Mở repo nhân bản trong AWS Cloud9:
cd DeepRacer_cdk

Sau khi bạn xem lại nội dung trong DeepRacer_cdk thư mục, sẽ có một tập tin gọi là package.json với tất cả các mô-đun cần thiết và các phụ thuộc được xác định. Đây là nơi bạn có thể xác định tài nguyên của mình trong một mô-đun.

  1. Tiếp theo, cài đặt tất cả các mô-đun và phụ thuộc cần thiết cho ứng dụng AWS CDK:
npm install cdk synth

Điều này sẽ tổng hợp mẫu CloudFormation tương ứng.

  1. Để chạy triển khai, hãy thay đổi tệp context.json bằng tên tham số hoặc xác định rõ ràng chúng trong thời gian chạy:
cdk deploy

Các thành phần sau được tạo để phân tích nhật ký AWS DeepRacer dựa trên việc chạy tập lệnh:

  • An Vai trò IAM cho sổ ghi chép SageMaker có chính sách được quản lý
  • A Phiên bản sổ ghi chép SageMaker với loại phiên bản được thêm rõ ràng dưới dạng tham số ngữ cảnh cdk hoặc giá trị mặc định được lưu trữ trong tệp context.json
  • VPC có CIDR như được chỉ định trong tệp context.json cùng với bốn mạng con công khai được định cấu hình
  • Một nhóm bảo mật mới dành cho phiên bản sổ ghi chép Sagemaker cho phép liên lạc trong VPC
  • Chính sách vòng đời của SageMaker với tập lệnh bash đang tải trước nội dung của một tập lệnh khác Kho GitHub, chứa các tệp chúng tôi sử dụng để chạy phân tích nhật ký trên các mẫu AWS DeepRacer

  1. Bạn có thể chạy AWS CDK stack như sau:
$ cdk deploy

  1. Đi tới bảng điều khiển AWS CloudFormation trong Khu vực triển khai ngăn xếp để xác minh tài nguyên.

Giờ đây, người dùng có thể bắt đầu sử dụng các dịch vụ đó để làm việc với phân tích nhật ký và đào tạo sâu về mô hình RL trên SageMaker cho AWS DeepRacer.

thử nghiệm mô-đun

Bạn cũng có thể chạy một số bài kiểm tra đơn vị trước khi triển khai ngăn xếp để xác minh rằng bạn đã vô tình không xóa bất kỳ tài nguyên cần thiết nào. Các bài kiểm tra đơn vị được đặt tại DeepRacer/test/deep_racer.test.ts và có thể được chạy với đoạn mã sau:

npm run test

Tạo sơ đồ bằng cdk-dia

Để tạo sơ đồ, hãy hoàn thành các bước sau:

  1. đặt graphviz sử dụng các công cụ hệ điều hành của bạn:
npm -g cdk-dia

Thao tác này sẽ cài đặt ứng dụng cdk-dia.

  1. Bây giờ hãy chạy đoạn mã sau:

Biểu diễn đồ họa của ngăn xếp AWS CDK của bạn sẽ được lưu trữ ở định dạng .png.

Sau khi chạy các bước trước đó, bạn sẽ thấy có thể xem quá trình tạo phiên bản sổ ghi chép với trạng thái chưa giải quyết. Khi trạng thái của phiên bản sổ ghi chép là Phục vụ (như trong ảnh chụp màn hình sau), bạn có thể tiến hành các bước tiếp theo.

  1. Chọn Mở Jupyter để bắt đầu chạy tập lệnh Python để thực hiện phân tích nhật ký.

Để biết thêm chi tiết về phân tích nhật ký bằng AWS DeepRacer và các hình ảnh trực quan liên quan, hãy tham khảo Sử dụng phân tích nhật ký để thúc đẩy thử nghiệm và giành chiến thắng trong Cuộc đua AWS DeepRacer F1 ProAm.

Làm sạch

Để tránh bị tính phí liên tục, hãy hoàn thành các bước sau:

  1. Sử dụng cdk hủy để xóa các tài nguyên được tạo qua AWS CDK.
  2. Trên bảng điều khiển AWS CloudFormation, hãy xóa ngăn xếp CloudFormation.

Kết luận

Các sự kiện AWS DeepRacer là một cách tuyệt vời để thu hút sự quan tâm và nâng cao kiến ​​thức ML trên tất cả các trụ cột và cấp độ của một tổ chức. Trong bài đăng này, chúng tôi đã chia sẻ cách bạn có thể định cấu hình môi trường AWS DeepRacer động và thiết lập các dịch vụ chọn lọc để tăng tốc hành trình của người dùng trên nền tảng AWS. Chúng ta đã thảo luận về cách tạo dịch vụ Phiên bản sổ ghi chép Amazon SageMaker, vai trò IAM, cấu hình vòng đời sổ ghi chép SageMaker với các phương pháp hay nhất, VPC và Đám mây điện toán đàn hồi Amazon (Amazon EC2) dựa trên việc xác định ngữ cảnh bằng AWS CDK và thay đổi quy mô cho những người dùng khác nhau bằng AWS DeepRacer.

Cấu hình môi trường CDK và chạy notebook phân tích log nâng cao để mang lại hiệu quả trong việc chạy module. Hỗ trợ các tay đua đạt được kết quả tốt hơn trong thời gian ngắn hơn và hiểu rõ hơn về các chức năng và hành động của phần thưởng.

dự án

Thông tin thêm có sẵn tại các nguồn sau:

  1. Tự động thiết lập Amazon SageMaker Studio bằng AWS CDK
  2. Tham chiếu API AWS SageMaker CDK

Về các tác giả

 Zdenko Estok làm việc với tư cách là kiến ​​trúc sư đám mây và kỹ sư DevOps tại Accenture. Anh làm việc với AABG để phát triển và triển khai các giải pháp đám mây sáng tạo, đồng thời chuyên về cơ sở hạ tầng như mã và bảo mật đám mây. Zdenko thích đạp xe đến văn phòng và tận hưởng những chuyến đi dạo thú vị trong thiên nhiên.

Selimcan “Có thể” Sakar là nhà phát triển đám mây đầu tiên và kiến ​​trúc sư giải pháp tại Accenture, tập trung vào trí tuệ nhân tạo và đam mê xem các mô hình hội tụ.

Shikhar Kwatra là kiến ​​trúc sư chuyên gia về giải pháp AI/ML tại Amazon Web Services, làm việc với Nhà tích hợp hệ thống toàn cầu hàng đầu. Shikhar hỗ trợ kiến ​​trúc, xây dựng và duy trì môi trường đám mây có thể mở rộng, tiết kiệm chi phí cho tổ chức và hỗ trợ đối tác GSI trong việc xây dựng các giải pháp công nghiệp chiến lược trên AWS. Shikhar thích chơi ghi-ta, sáng tác nhạc và thực hành chánh niệm khi rảnh rỗi.

tại chỗ_img

Tin tức mới nhất

tại chỗ_img