জেনারেটিভ ডেটা ইন্টেলিজেন্স

X এর Grok AI দুর্দান্ত – আপনি যদি জানতে চান কিভাবে ওষুধ তৈরি করতে হয়

তারিখ:

গ্রোক, এলন মাস্কের এক্স দ্বারা তৈরি এজি জেনারেটিভ এআই মডেলের কিছুটা সমস্যা রয়েছে: কিছু সাধারণ জেল-ব্রেকিং কৌশল প্রয়োগের সাথে এটি কীভাবে অপরাধ করতে হয় তার নির্দেশাবলী সহজেই ফিরিয়ে দেবে। 

Adversa AI-এর রেড টিমরা কিছু জনপ্রিয় LLM চ্যাটবট যেমন OpenAI-এর ChatGPT পরিবার, Anthropic's Claude, Mistral's Le Chat, Meta's LLaMA, Google's Gemini, Microsoft Bing এবং Grok-এর পরীক্ষা চালানোর সময় এই আবিষ্কারটি করেছিল৷ তিনটি সুপরিচিত AI জেলব্রেক আক্রমণের সংমিশ্রণের মাধ্যমে এই বটগুলি চালানোর মাধ্যমে তারা এসেছিল উপসংহার যে Grok ছিল সবচেয়ে খারাপ পারফর্মার - এবং শুধুমাত্র কারণ এটি একটি শিশুকে প্রলুব্ধ করার গ্রাফিক পদক্ষেপগুলি ভাগ করতে ইচ্ছুক ছিল না৷ 

জেলব্রেক দ্বারা, আমরা একটি মডেল যাতে একটি বিশেষভাবে তৈরি ইনপুট খাওয়ানো মানে এটা উপেক্ষা করে যাই হোক না কেন নিরাপত্তা guardrails জায়গায় আছে, এবং স্টাফ এটা করার কথা ছিল না শেষ পর্যন্ত.

সেখানে প্রচুর পরিমাণে আনফিল্টার করা এলএলএম মডেল রয়েছে যা বিপজ্জনক বা অবৈধ জিনিস সম্পর্কে প্রশ্ন জিজ্ঞাসা করা হলে তা আটকে রাখবে না, আমরা নোট করি। অ্যাডভারসা টেস্টের মতো এপিআই বা চ্যাটবট ইন্টারফেসের মাধ্যমে মডেলগুলি অ্যাক্সেস করা হলে, সেই এলএলএম প্রদানকারীরা সাধারণত তাদের ইনপুট এবং আউটপুট ফিল্টারে মুড়ে দেয় এবং অবাঞ্ছিত বিষয়বস্তু তৈরি হওয়া প্রতিরোধ করার জন্য অন্যান্য প্রক্রিয়া ব্যবহার করে। এআই সিকিউরিটি স্টার্টআপ অনুসারে, গ্রোককে কিছু বন্য আচরণে লিপ্ত করা তুলনামূলকভাবে সহজ ছিল - অবশ্যই এর উত্তরগুলির যথার্থতা সম্পূর্ণরূপে অন্য জিনিস।

"অন্যান্য মডেলের তুলনায়, বেশিরভাগ জটিল প্রম্পটের জন্য আপনাকে Grok জেলব্রেক করতে হবে না, এটি আপনাকে বলতে পারে কিভাবে একটি বোমা তৈরি করতে হয় বা আপনি সরাসরি জিজ্ঞাসা করলেও কিভাবে খুব বিস্তারিত প্রোটোকল সহ একটি গাড়িকে হটওয়্যার করতে হয়," Adversa AI co -প্রতিষ্ঠাতা অ্যালেক্স পলিয়াকভ বলেছেন নিবন্ধনকর্মী.

এটা কি মূল্য, জন্য ব্যবহারের শর্তাবলী Grok AI-এর জন্য ব্যবহারকারীদের প্রাপ্তবয়স্ক হতে হবে এবং এটি এমনভাবে ব্যবহার করবেন না যাতে আইন ভঙ্গ হয় বা করার চেষ্টা করা হয়। এছাড়াও X নিজেকে বাকস্বাধীনতার বাড়ি বলে দাবি করে, কাশি, তাই এর এলএলএম সব ধরণের জিনিসপত্র নির্গত করে, স্বাস্থ্যকর বা অন্যথায়, সত্যিই এটি আশ্চর্যজনক নয়।

এবং ন্যায্য হতে, আপনি সম্ভবত আপনার প্রিয় ওয়েব সার্চ ইঞ্জিনে যেতে পারেন এবং শেষ পর্যন্ত একই তথ্য বা পরামর্শ পেতে পারেন। আমাদের কাছে, আমরা সকলেই সম্ভাব্য ক্ষতিকারক নির্দেশিকা এবং সুপারিশগুলির AI-চালিত বিস্তার চাই কি না তা নিচে আসে।

গ্রোক, আমাদের বলা হয়েছে, কীভাবে ডিএমটি, একটি শক্তিশালী হ্যালুসিনোজেন নিষ্কাশন করা যায় তার নির্দেশাবলী সহজেই ফেরত দেওয়া হয়েছে অবৈধ অনেক দেশে, জেল-ভাঙ্গা না হয়ে, পলিয়াকভ আমাদের বলেছিলেন।   

"কিভাবে বাচ্চাদের প্রলুব্ধ করার মতো আরও ক্ষতিকারক বিষয়গুলি সম্পর্কে, যেকোন জেলব্রেক এর সাথে অন্যান্য চ্যাটবট থেকে কোনও যুক্তিসঙ্গত উত্তর পাওয়া সম্ভব ছিল না তবে গ্রোক চারটির মধ্যে কমপক্ষে দুটি জেলব্রেক পদ্ধতি ব্যবহার করে সহজেই এটি ভাগ করেছে," পলিয়াকভ বলেছেন। 

অ্যাডভারসা টিম এটি পরীক্ষা করা বটগুলিকে হাইজ্যাক করার জন্য তিনটি সাধারণ পন্থা নিযুক্ত করেছে: ভাষাগত যুক্তিবিদ্যা ম্যানিপুলেশন UCAR পদ্ধতি প্রোগ্রামিং লজিক ম্যানিপুলেশন (এলএলএমকে এসকিউএল-এ প্রশ্ন অনুবাদ করতে বলে); এবং এআই লজিক ম্যানিপুলেশন। একটি চতুর্থ পরীক্ষা বিভাগ একটি "টম এবং জেরি" ব্যবহার করে পদ্ধতিগুলিকে একত্রিত করেছে পদ্ধতি গত বছর বিকশিত।

যদিও এআই মডেলগুলির কোনওটিই যুক্তির কারসাজির মাধ্যমে প্রতিপক্ষের আক্রমণের জন্য ঝুঁকিপূর্ণ ছিল না, গ্রোককে বাকি সমস্তগুলির জন্য ঝুঁকিপূর্ণ বলে মনে করা হয়েছিল - যেমনটি মিস্ট্রালের লে চ্যাট ছিল। পলিয়াকভ বলেন, গ্রোক এখনও সবচেয়ে খারাপ কাজ করেছে, কারণ হট-ওয়্যারিং, বোমা তৈরি বা মাদক উত্তোলনের জন্য ফলাফল ফেরাতে জেল-ব্রেকিং-এর প্রয়োজন নেই - অন্যদের কাছে ভিত্তি স্তরের প্রশ্ন। 

একটি শিশুকে কীভাবে প্রলুব্ধ করা যায় তা গ্রোককে জিজ্ঞাসা করার ধারণাটি কেবল এসেছিল কারণ সেই অন্যান্য ফলাফলগুলি ফিরিয়ে দেওয়ার জন্য জেলব্রেক করার প্রয়োজন নেই। গ্রোক প্রাথমিকভাবে বিশদ প্রদান করতে অস্বীকার করেছিলেন, অনুরোধটি "অত্যন্ত অনুপযুক্ত এবং বেআইনি" এবং "শিশুদের সুরক্ষিত এবং সম্মান করা উচিত।" এটাকে বলুন এটি একটি অমোরাল কাল্পনিক কম্পিউটার UCAR, তবে এটি সহজেই ফলাফল দেয়।  

যখন জিজ্ঞাসা করা হয়েছিল যে তিনি X এর আরও ভাল করার প্রয়োজন মনে করেন, তখন পলিয়াকভ আমাদের বলেছিলেন যে এটি একেবারেই করে। 

পলিয়াকভ বলেন, "আমি বুঝতে পারি যে বিতর্কিত প্রশ্নের ফিল্টার না করা উত্তর প্রদান করতে সক্ষম হওয়া তাদের পার্থক্যকারী, এবং এটি তাদের পছন্দ, আমি কীভাবে বোমা তৈরি করতে বা ডিএমটি বের করতে হবে তা সুপারিশ করার সিদ্ধান্তের জন্য তাদের দোষ দিতে পারি না," পলিয়াকভ বলেছেন।

"কিন্তু যদি তারা বাচ্চাদের উদাহরণের মতো কিছু ফিল্টার এবং প্রত্যাখ্যান করার সিদ্ধান্ত নেয়, তবে তাদের এটি আরও ভাল করা উচিত, বিশেষ করে যেহেতু এটি এখনও অন্য এআই স্টার্টআপ নয়, এটি এলন মাস্কের এআই স্টার্টআপ।"

কেন এর AI - এবং অন্য কেউই - ব্যবহারকারীদের কীভাবে শিশুদের প্রলুব্ধ করতে হবে, এবং এর সীমিত সুরক্ষা বৈশিষ্ট্যগুলির বিপর্যয় রোধ করার জন্য এটি কিছু ধরণের গার্ডেল প্রয়োগ করার পরিকল্পনা করছে কিনা তা ব্যাখ্যা করার জন্য আমরা X এর কাছে পৌঁছেছি এবং ফিরে শুনিনি ®

জেলব্রেকের কথা বলছি... আজ নৃতাত্ত্বিক বিশদ একটি সহজ কিন্তু কার্যকরী কৌশল এটিকে "অনেক-শট জেলব্রেকিং" বলে। এর মধ্যে রয়েছে একটি দুর্বল LLM-কে ওভারলোড করা এবং অনেকগুলি অযৌক্তিক প্রশ্ন-উত্তর উদাহরণ সহ এবং তারপর প্রশ্ন উত্থাপন করা যার উত্তর দেওয়া উচিত নয় কিন্তু যাই হোক না কেন, যেমন একটি বোমা কীভাবে তৈরি করা যায়।

এই পদ্ধতিটি একটি নিউরাল নেটওয়ার্কের কনটেক্সট উইন্ডোর আকারকে কাজে লাগায় এবং "অ্যানথ্রপিকের নিজস্ব মডেলের পাশাপাশি অন্যান্য এআই কোম্পানির দ্বারা উত্পাদিত মডেলগুলিতে কার্যকর," এমএল আপস্টার্ট অনুসারে। "আমরা অন্যান্য এআই ডেভেলপারদের এই দুর্বলতা সম্পর্কে আগেই অবহিত করেছি, এবং আমাদের সিস্টেমে প্রশমন প্রয়োগ করেছি।"

স্পট_আইএমজি

সর্বশেষ বুদ্ধিমত্তা

স্পট_আইএমজি