জেনারেটিভ ডেটা ইন্টেলিজেন্স

বিজ্ঞানীরা ChatGPT-এর 99 শতাংশ শনাক্তকরণের দাবি করেছেন

তারিখ:

শিক্ষাবিদরা দৃশ্যত ChatGPT দ্বারা উত্পন্ন বৈজ্ঞানিক কাগজপত্র সনাক্ত করতে একটি মেশিন লার্নিং অ্যালগরিদম প্রশিক্ষণ দিয়েছেন এবং দাবি করেছেন যে সফ্টওয়্যারটির 99 শতাংশের বেশি নির্ভুলতা রয়েছে৷

জেনারেটিভ এআই মডেলগুলি অল্প সময়ের মধ্যে মানুষের লেখার নকল করার ক্ষেত্রে নাটকীয়ভাবে উন্নতি করেছে, যা মানুষের পক্ষে টেক্সট একটি মেশিন বা মানুষের দ্বারা উত্পাদিত হয়েছে তা বলা কঠিন করে তুলেছে। শিক্ষক এবং প্রভাষকরা উদ্বেগ প্রকাশ করেছেন যে সরঞ্জামগুলি ব্যবহার করে শিক্ষার্থীরা চুরি করছে, বা দৃশ্যত ছেঁচড়ামি মেশিন জেনারেটেড কোড ব্যবহার করে।

AI-উত্পন্ন পাঠ্য সনাক্ত করার জন্য ডিজাইন করা সফ্টওয়্যার, তবে, প্রায়শই অবিশ্বস্ত. বিশেষজ্ঞরা কাজের মূল্যায়নের জন্য এই সরঞ্জামগুলি ব্যবহার করার বিরুদ্ধে সতর্ক করেছেন।

কানসাস বিশ্ববিদ্যালয়ের নেতৃত্বে গবেষকদের একটি দল ভেবেছিল যে AI-উত্পাদিত বিজ্ঞান লেখা সনাক্ত করার একটি উপায় বিকাশ করা কার্যকর হবে - বিশেষত গবেষণাপত্রের শৈলীতে লেখা যা সাধারণত একাডেমিক জার্নালগুলি দ্বারা গৃহীত এবং প্রকাশিত হয়।

"এই মুহূর্তে, এআই লেখার সাথে কিছু চমকপ্রদ সমস্যা রয়েছে," বলেছেন হেদার ডেসায়ার, একটি কাগজের প্রথম লেখক প্রকাশিত জার্নালে সেল রিপোর্ট ভৌত বিজ্ঞান, এবং কানসাস বিশ্ববিদ্যালয়ের একজন রসায়ন অধ্যাপক, একটি বিবৃতিতে। "সবচেয়ে বড় সমস্যা হল যে এটি অনেক উত্স থেকে পাঠ্য একত্রিত করে এবং কোন প্রকার নির্ভুলতা যাচাই করা হয় না - এটি অনেকটা দুই সত্য এবং একটি মিথ্যা খেলার মতো।"

Desaire এবং তার সহকর্মীরা বিজ্ঞানীদের দ্বারা এবং ChatGPT দ্বারা লিখিত কাগজপত্র শ্রেণীবদ্ধ করার জন্য একটি অ্যালগরিদম প্রশিক্ষণ এবং পরীক্ষা করার জন্য ডেটাসেটগুলি সংকলন করেছেন৷ তারা 64টি "দৃষ্টিকোণ" নিবন্ধ নির্বাচন করেছে - বিজ্ঞান জার্নালে প্রকাশিত নিবন্ধের একটি নির্দিষ্ট শৈলী - যা জীববিজ্ঞান থেকে পদার্থবিদ্যা পর্যন্ত বিভিন্ন বিষয়ের প্রতিনিধিত্ব করে এবং 128টি জাল নিবন্ধ তৈরি করার জন্য একই গবেষণার বর্ণনা দিয়ে ChatGPT-কে অনুচ্ছেদ তৈরি করতে অনুরোধ করেছিল। মোট 1,276টি অনুচ্ছেদ AI দ্বারা উত্পাদিত হয়েছিল এবং ক্লাসিফায়ারকে প্রশিক্ষণ দিতে ব্যবহৃত হয়েছিল।

এরপরে, দলটি আরও দুটি ডেটাসেট সংকলন করেছে, প্রতিটিতে 30টি বাস্তব দৃষ্টিকোণ নিবন্ধ এবং 60টি ChatGPT-লিখিত কাগজ রয়েছে, অ্যালগরিদম পরীক্ষা করার জন্য মোট 1,210টি অনুচ্ছেদ রয়েছে।

প্রাথমিক পরীক্ষায় জানা গেছে যে শ্রেণিবিন্যাসকারী মানুষের থেকে প্রকৃত বিজ্ঞানের লেখা এবং এআই-উত্পন্ন কাগজপত্রের মধ্যে 100 শতাংশ সময় নির্ধারণ করতে সক্ষম হয়েছিল। স্বতন্ত্র অনুচ্ছেদ স্তরে নির্ভুলতা, তবে, সামান্য কমেছে - 92 শতাংশে, এটি দাবি করা হয়েছে। 

তারা বিশ্বাস করে যে তাদের ক্লাসিফায়ার কার্যকর, কারণ এটি মানুষের এবং এআই লেখার মধ্যে শৈলীগত পার্থক্যের একটি পরিসরের মধ্যে রয়েছে। বিজ্ঞানীদের একটি সমৃদ্ধ শব্দভাণ্ডার থাকার সম্ভাবনা বেশি এবং তারা মেশিনের চেয়ে বেশি বৈচিত্র্যময় শব্দ সম্বলিত দীর্ঘ অনুচ্ছেদ লেখেন। তারা প্রশ্ন চিহ্ন, বন্ধনী, সেমিকোলনের মতো বিরাম চিহ্নগুলিও ChatGPT-এর চেয়ে বেশি ব্যবহার করে, উদ্ধৃতির জন্য ব্যবহৃত বক্তৃতা চিহ্নগুলি ছাড়া। 

ChatGPTও কম সুনির্দিষ্ট, এবং মানুষের তুলনায় পরিসংখ্যান বা অন্যান্য বিজ্ঞানীর নাম সম্পর্কে নির্দিষ্ট তথ্য প্রদান করে না। বাস্তব বিজ্ঞানের কাগজপত্রগুলি আরও দ্ব্যর্থহীন ভাষা ব্যবহার করে - যেমন "তবে", "কিন্তু", "যদিও" পাশাপাশি "এই" এবং "কারণ"।

ফলাফল, তবে, লবণ একটি দানা সঙ্গে গ্রহণ করা উচিত. এটি স্পষ্ট নয় যে অ্যালগরিদমটি এমন অধ্যয়নের বিরুদ্ধে কতটা শক্তিশালী যেগুলি বেশিরভাগই ChatGPT দ্বারা লেখা সত্ত্বেও মানুষের দ্বারা হালকাভাবে সম্পাদনা করা হয়েছে, বা অন্যান্য বৈজ্ঞানিক জার্নাল থেকে আসল কাগজপত্রের বিরুদ্ধে৷

"যেহেতু এই কাজের মূল লক্ষ্য ছিল একটি প্রুফ-অফ-ধারণা অধ্যয়ন, তাই কাজের সুযোগ সীমিত ছিল, এবং এই পদ্ধতির প্রযোজ্যতার পরিমাণ নির্ধারণের জন্য ফলো-আপ অধ্যয়ন প্রয়োজন," গবেষকরা তাদের গবেষণাপত্রে লিখেছেন। "উদাহরণস্বরূপ, পরীক্ষার সেটের আকার (180 নথি, ∼ 1,200 অনুচ্ছেদ) ছোট, এবং একটি বৃহত্তর পরীক্ষার সেট এই শ্রেণীর উদাহরণ লেখার পদ্ধতির নির্ভুলতা আরও স্পষ্টভাবে সংজ্ঞায়িত করবে।"

নিবন্ধনকর্মী মন্তব্যের জন্য Desaire জিজ্ঞাসা করেছে. ®

স্পট_আইএমজি

সর্বশেষ বুদ্ধিমত্তা

স্পট_আইএমজি