هوش داده های تولیدی

بهبود تعدیل محتوا با تجزیه و تحلیل انبوه شناسایی آمازون و تعدیل سفارشی | خدمات وب آمازون

تاریخ:

شناسایی آمازون اضافه کردن تجزیه و تحلیل تصویر و ویدئو به برنامه های خود را آسان می کند. این مبتنی بر همان فناوری یادگیری عمیق اثبات شده، بسیار مقیاس پذیر و توسعه یافته توسط دانشمندان بینایی کامپیوتر آمازون برای تجزیه و تحلیل روزانه میلیاردها تصویر و ویدیو است. برای استفاده از آن نیازی به تخصص یادگیری ماشین (ML) نیست و ما به طور مداوم ویژگی‌های بینایی کامپیوتری جدیدی را به این سرویس اضافه می‌کنیم. آمازون Rekognition شامل یک API ساده و با کاربری آسان است که می تواند به سرعت هر تصویر یا فایل ویدیویی ذخیره شده در آن را تجزیه و تحلیل کند. سرویس ذخیره سازی ساده آمازون (Amazon S3).

مشتریان در صنایعی مانند فناوری تبلیغات و بازاریابی، بازی‌ها، رسانه‌ها، و خرده‌فروشی و تجارت الکترونیک به تصاویر آپلود شده توسط کاربران نهایی خود (محتوای تولید شده توسط کاربر یا UGC) به عنوان یک مؤلفه مهم برای ایجاد تعامل در پلتفرم خود متکی هستند. آنها استفاده می کنند تعدیل محتوای شناسایی آمازون برای شناسایی محتوای نامناسب، ناخواسته و توهین‌آمیز به منظور محافظت از اعتبار برند خود و تقویت جوامع ایمن کاربران.

در این پست به موارد زیر می پردازیم:

  • Content Moderation مدل نسخه 7.0 و قابلیت ها
  • چگونه تجزیه و تحلیل انبوه شناسایی آمازون برای تعدیل محتوا کار می کند؟
  • چگونه می توان پیش بینی اعتدال محتوا را با تجزیه و تحلیل انبوه و تعدیل سفارشی بهبود بخشید

مدل تعدیل محتوا نسخه 7.0 و قابلیت ها

Amazon Rekognition Content Moderation نسخه 7.0 26 برچسب تعدیل جدید اضافه می کند و طبقه بندی برچسب های تعدیل را از دسته برچسب های دو لایه به سه لایه گسترش می دهد. این برچسب‌های جدید و طبقه‌بندی گسترده مشتریان را قادر می‌سازد تا مفاهیم دقیق محتوایی را که می‌خواهند تعدیل کنند، شناسایی کنند. علاوه بر این، مدل به روز شده قابلیت جدیدی را برای شناسایی دو نوع محتوای جدید، محتوای متحرک و مصور معرفی می کند. این به مشتریان اجازه می دهد تا قوانین دقیقی را برای گنجاندن یا حذف چنین انواع محتوایی از گردش کار تعدیل خود ایجاد کنند. با این به روز رسانی های جدید، مشتریان می توانند محتوا را مطابق با خط مشی محتوای خود با دقت بالاتر تعدیل کنند.

بیایید به یک مثال تشخیص برچسب اعتدال برای تصویر زیر نگاه کنیم.

جدول زیر برچسب‌های تعدیل، نوع محتوا و امتیازات اطمینان بازگشت‌شده در پاسخ API را نشان می‌دهد.

برچسب های اعتدال سطح طبقه بندی نمرات اعتماد به نفس
خشونت L1 ٪۱۰۰
خشونت گرافیکی L2 ٪۱۰۰
انفجارها و انفجارها L3 ٪۱۰۰
انواع محتوا نمرات اعتماد به نفس
مصور ٪۱۰۰

برای به دست آوردن طبقه بندی کامل برای Content Moderation نسخه 7.0، به ما مراجعه کنید راهنمای توسعه دهنده.

تجزیه و تحلیل انبوه برای تعدیل محتوا

Amazon Rekognition Content Moderation علاوه بر تعدیل در زمان واقعی، تعدیل تصویر دسته‌ای را با استفاده از تجزیه و تحلیل انبوه شناسایی آمازون. این به شما امکان می‌دهد تا مجموعه‌های تصویری بزرگ را به صورت ناهمزمان تجزیه و تحلیل کنید تا محتوای نامناسب را شناسایی کنید و بینش‌هایی در مورد دسته‌های تعدیل اختصاص داده شده به تصاویر به دست آورید. همچنین نیاز به ساخت راه حل تعدیل تصویر دسته ای برای مشتریان را از بین می برد.

می‌توانید از طریق کنسول آمازون Rekognition یا با تماس مستقیم با APIها با استفاده از AWS CLI و AWS SDK به ویژگی تجزیه و تحلیل انبوه دسترسی پیدا کنید. در کنسول آمازون Rekognition می توانید تصاویری را که می خواهید آنالیز کنید بارگذاری کنید و با چند کلیک به نتیجه برسید. پس از تکمیل کار تجزیه و تحلیل انبوه، می‌توانید پیش‌بینی‌های برچسب تعدیل را شناسایی و مشاهده کنید، مانند برهنگی صریح، غیر صریح برهنگی اعضای صمیمی و بوسیدن، خشونت، مواد مخدر و تنباکو، و موارد دیگر. همچنین برای هر دسته برچسب یک امتیاز اطمینان دریافت می کنید.

در کنسول آمازون Rekognition یک کار تجزیه و تحلیل انبوه ایجاد کنید

مراحل زیر را تکمیل کنید تا تجزیه و تحلیل انبوه شناسایی آمازون را امتحان کنید:

  1. در کنسول آمازون Rekognition، را انتخاب کنید تحلیل انبوه در صفحه ناوبری
  2. را انتخاب کنید تجزیه و تحلیل انبوه را شروع کنید.
  3. نام شغلی را وارد کنید و تصاویر را برای تجزیه و تحلیل مشخص کنید، یا با وارد کردن یک مکان سطل S3 یا با آپلود تصاویر از رایانه خود.
  4. به صورت اختیاری، می توانید یک را انتخاب کنید آداپتور برای تجزیه و تحلیل تصاویر با استفاده از آداپتور سفارشی که با استفاده از Custom Moderation آموزش داده اید.
  5. را انتخاب کنید تجزیه و تحلیل را شروع کنید برای اجرای کار

پس از تکمیل فرآیند، می توانید نتایج را در کنسول شناسایی آمازون مشاهده کنید. همچنین، یک کپی JSON از نتایج تجزیه و تحلیل در محل خروجی آمازون S3 ذخیره خواهد شد.

درخواست API تجزیه و تحلیل انبوه آمازون

در این بخش، ما شما را از طریق ایجاد یک کار تجزیه و تحلیل انبوه برای تعدیل تصویر با استفاده از رابط های برنامه نویسی راهنمایی می کنیم. اگر فایل‌های تصویری شما قبلاً در سطل S3 نیستند، آنها را آپلود کنید تا از دسترسی آمازون Rekognition مطمئن شوید. مشابه ایجاد یک کار تجزیه و تحلیل انبوه در کنسول شناسایی آمازون، هنگام فراخوانی StartMediaAnalysisJob API، شما باید پارامترهای زیر را ارائه دهید:

  • OperationsConfig – اینها گزینه های پیکربندی برای کار تحلیل رسانه ای هستند که باید ایجاد شوند:
    • MinConfidence - حداقل سطح اطمینان با محدوده معتبر 0-100 برای برچسب های تعدیل برای بازگشت. آمازون Rekognition هیچ برچسبی را با سطح اطمینان کمتر از این مقدار مشخص شده بر نمی گرداند.
  • ورودی - این شامل موارد زیر است:
    • S3Object – اطلاعات شی S3 برای فایل مانیفست ورودی، از جمله سطل و نام فایل. فایل ورودی شامل خطوط JSON برای هر تصویر ذخیره شده در سطل S3 است. مثلا: {"source-ref": "s3://MY-INPUT-BUCKET/1.jpg"}
  • OutputConfig - این شامل موارد زیر است:
    • S3Bucket – نام سطل S3 برای فایل های خروجی.
    • S3KeyPrefix – پیشوند کلید برای فایل های خروجی.

کد زیر را ببینید:

import boto3
import os
import datetime
import time
import json
import uuid

region = boto3.session.Session().region_name
s3=boto3.client('s3')
rekognition_client=boto3.client('rekognition', region_name=region)

min_confidence = 50
input_bucket = "MY-INPUT-BUCKET"

input_file = "input_file.jsonl"
output_bucket = "MY-OUTPUT-BUCKET"
key_prefix = "moderation-results"
job_name = "bulk-analysis-demo"

job_start_response = rekognition_client.start_media_analysis_job(
    OperationsConfig={"DetectModerationLabels": {"MinConfidence": min_confidence}},
    JobName = job_name,
    Input={"S3Object": {"Bucket": input_bucket, "Name": input_file}},
    OutputConfig={"S3Bucket": output_bucket, "S3KeyPrefix": key_prefix},
)

job_id = job_start_response["JobId"]
max_tries = 60
while max_tries > 0:
    max_tries -= 1
    job = rekognition_client.get_media_analysis_job(JobId=job_id)
    job_status = job["Status"]
    if job_status in ["SUCCEEDED", "FAILED"]:
        print(f"Job {job_name} is {job_status}.")
        if job_status == "SUCCEEDED":
            print(
                f"Bulk Analysis output file copied to:n"
                f"tBucket: {job['Results']['S3Object']['Bucket']}n"
                f"tObject: {job['Results']['S3Object']['Name']}."
            )
        break
    else:
        print(f"Waiting for {job_name}. Current status is {job_status}.")
    time.sleep(10)

می توانید همان تحلیل رسانه را با استفاده از دستور AWS CLI زیر فراخوانی کنید:

aws rekognition start-media-analysis-job 
--operations-config "DetectModerationLabels={MinConfidence='50'}" 
--input "S3Object={Bucket=input_bucket,Name=input_file.jsonl}" 
--output-config "S3Bucket=output_bucket,S3KeyPrefix=moderation-results"

نتایج API تجزیه و تحلیل انبوه آمازون

برای دریافت لیست کارهای آنالیز انبوه می توانید استفاده کنید ListMediaAnalysisJobs. پاسخ شامل تمام جزئیات مربوط به فایل های ورودی و خروجی کار تجزیه و تحلیل و وضعیت کار است:

# get the latest 10 media analysis jobs
moderation_job_list = rekognition_client.list_media_analysis_jobs(MaxResults=10, NextToken="")
for job_result in moderation_job_list["MediaAnalysisJobs"]:
 print(f'JobId: {job_result["JobId"]} ,Status: {job_result["Status"]},n
Summary: {job_result["ManifestSummary"]["S3Object"]["Name"]}, n
Result: {job_result["Results"]["S3Object"]["Name"]}n')

شما همچنین می توانید فراخوانی کنید list-media-analysis-jobs دستور از طریق AWS CLI:

aws rekognition list-media-analysis-jobs --max-results 10

Amazon Rekognition Bulk Analysis دو فایل خروجی را در سطل خروجی تولید می کند. فایل اول است manifest-summary.json، که شامل آمار کار تجزیه و تحلیل انبوه و لیستی از خطاها است:

{
    "version": "1.0",
    "statistics": {
      "total-json-lines": 2,
      "valid-json-lines": 2,
      "invalid-json-lines": 0
    },
    "errors": []
 }

فایل دوم است results.json، که شامل یک خط JSON برای هر تصویر تجزیه و تحلیل شده در قالب زیر است. هر نتیجه شامل دسته سطح بالا (L1) یک برچسب شناسایی شده و دسته سطح دوم برچسب (L2)، با امتیاز اطمینان بین 1 تا 100. برخی از برچسب‌های طبقه‌بندی سطح 2 ممکن است دارای برچسب‌های طبقه‌بندی سطح 3 (L3) باشند. این اجازه می دهد تا یک طبقه بندی سلسله مراتبی از محتوا.

{
  "source-ref": "s3://MY-INPUT-BUCKET/1.jpg",
    "detect-moderation-labels": {
    "ModerationLabels": [
      {
        "ParentName": "Products",
        "TaxonomyLevel": 3,
        "Confidence": 91.9385,
        "Name": "Pills"
      },
      {
        "ParentName": "Drugs & Tobacco",
        "TaxonomyLevel": 2,
        "Confidence": 91.9385,
        "Name": "Products"
      },
      {
        "ParentName": "",
        "TaxonomyLevel": 1,
        "Confidence": 91.9385,
        "Name": "Drugs & Tobacco"
      }
    ],
    "ModerationModelVersion": "7.0",
    "ContentTypes": [
      
    ]
  }
}

بهبود پیش‌بینی مدل تعدیل محتوا با استفاده از تحلیل انبوه و تعدیل سفارشی

می توانید دقت مدل پایه تعدیل محتوا را با تعدیل سفارشی ویژگی. با تعدیل سفارشی، می توانید یک را آموزش دهید آداپتور تعدیل سفارشی با آپلود تصاویر خود و حاشیه نویسی این تصاویر. آداپتورها اجزای مدولار هستند که می توانند قابلیت های مدل یادگیری عمیق آمازون Rekognition را گسترش داده و افزایش دهند. برای اینکه به راحتی تصاویر خود را حاشیه نویسی کنید، می توانید به سادگی پیش بینی های کار تجزیه و تحلیل انبوه خود را برای آموزش یک آداپتور سفارشی تأیید کنید. برای تایید نتایج پیش بینی، مراحل زیر را دنبال کنید:

  1. در کنسول آمازون Rekognition، را انتخاب کنید تحلیل انبوه در صفحه ناوبری
  2. کار تحلیل انبوه را انتخاب کنید، سپس انتخاب کنید پیش بینی ها را تأیید کنید.

بر پیش بینی را تأیید کنید در صفحه، می توانید تمام تصاویر ارزیابی شده در این کار و برچسب های پیش بینی شده را مشاهده کنید.

  1. برچسب هر تصویر را به عنوان موجود انتخاب کنید (علامت تیک) برای تأیید یک مثبت واقعی. یا علامت گذاری به عنوان غیر حضوری (نشان X) برای باطل کردن هر برچسب اختصاص داده شده (یعنی، پیش بینی برچسب یک مثبت کاذب است).
  2. اگر برچسب مناسب به تصویر اختصاص داده نشده است (یعنی False Negative)، همچنین می توانید برچسب های صحیح را به تصویر انتخاب و اختصاص دهید.

بر اساس تأیید شما، موارد مثبت کاذب و منفی کاذب در آمار تأیید به روز می شوند. می‌توانید از این تأییدیه‌ها برای آموزش یک آداپتور نظارت سفارشی استفاده کنید، که به شما امکان می‌دهد دقت پیش‌بینی‌های تعدیل محتوا را افزایش دهید.

  1. به عنوان پیش نیاز، آموزش یک آداپتور تعدیل سفارشی از شما می‌خواهد که حداقل 20 مثبت کاذب یا 50 منفی کاذب را برای هر برچسب تعدیل که می‌خواهید بهبود دهید، تأیید کنید. پس از تأیید 20 مثبت کاذب یا 50 منفی کاذب، می توانید انتخاب کنید یک آداپتور آموزش دهید.

شما می توانید آداپتورهای تعدیل سفارشی بعداً با انتخاب آداپتور سفارشی و در حین ایجاد یک کار تجزیه و تحلیل انبوه جدید یا از طریق API با ارسال شناسه آداپتور منحصر به فرد آداپتور سفارشی، تصاویر خود را تجزیه و تحلیل کنید.

خلاصه

در این پست، مروری بر Content Moderation نسخه 7.0، تجزیه و تحلیل انبوه برای تعدیل محتوا، و نحوه بهبود پیش بینی های Content Moderation با استفاده از تجزیه و تحلیل انبوه و مدیریت سفارشی ارائه کردیم. برای امتحان برچسب‌های تعدیل جدید و تجزیه و تحلیل انبوه، به حساب AWS خود وارد شوید و کنسول شناسایی آمازون را بررسی کنید. تعدیل تصویر و تحلیل انبوه.


درباره نویسندگان

مهدی حقی یک معمار ارشد راه حل در تیم AWS WWCS، متخصص در AI و ML در AWS است. او با مشتریان سازمانی کار می کند و به آنها کمک می کند تا به مهاجرت، مدرن سازی و بهینه سازی حجم کاری خود برای ابر AWS کمک کنند. او در اوقات فراغت از پخت غذاهای ایرانی و قلع و قمع الکترونیک لذت می برد.

شیپرا کانوریا مدیر محصول اصلی در AWS است. او مشتاق کمک به مشتریان برای حل پیچیده ترین مشکلاتشان با قدرت یادگیری ماشینی و هوش مصنوعی است. قبل از پیوستن به AWS، شیپرا بیش از 4 سال را در آمازون الکسا گذراند، جایی که بسیاری از ویژگی‌های مرتبط با بهره‌وری را در دستیار صوتی الکسا راه‌اندازی کرد.

ماریا هاندوکو مدیر محصول ارشد در AWS است. او بر کمک به مشتریان برای حل چالش های تجاری خود از طریق یادگیری ماشینی و بینایی کامپیوتر تمرکز دارد. او در اوقات فراغت خود از پیاده روی، گوش دادن به پادکست ها و کاوش در غذاهای مختلف لذت می برد.

نقطه_img

جدیدترین اطلاعات

نقطه_img