ChatGPT از طریق یک سری وظایف برنامه نویسی C/C++ دانشجوی سال اول در آزمون قرار گرفت و موفق شد – البته نه با افتخار.
به گفته یک تیم تحقیقاتی کرواسی، در حالی که دانش آموزان سال اول می توانند با برخی از تکالیف مشکل داشته باشند، نتایج [PDF] ChatGPT را نشان داد که به اهداف مهارتی دست مییابد که بین میانگین و برنامهنویسان باتجربه متغیر است. و طبیعتاً، مانند تمام امتحانات کالج، نتایج را می توان با نحوه بیان سؤالات تعیین کرد.
خدمه دانشگاه شمال مجموعهای از چالشهای برنامهنویسی در سطح دانشجوی سال اول کالج را طراحی کردند که ابتدا به زبان انگلیسی و بعداً نوشتند تا ببینند آیا تفاوتهای بین زبانی بر نتایج تأثیر میگذارد، کرواتی. آنها می خواستند نه تنها نحوه کدهای ChatGPT را ببینند، بلکه همچنین می خواستند ببینند که آیا می تواند با زبان های مختلف سازگار شود.
اولین مسابقه بر روی یک کار اصلی برنامه نویسی متمرکز بود: محاسبه بزرگترین مقسوم علیه مشترک (GCD) دو عدد. در ابتدا، ربات محدودیتهایی را در نحوه تصمیمگیری برای مقابله با این مشکل نشان داد و محققان گفتند که فاقد ظرافت مورد انتظار یک برنامهنویس باتجربه است. اما مانند هر دانش آموزی، یاد می گیرد و از طریق تلاش های بعدی، به خصوص در نسخه کرواتی، پیشرفت هایی را نشان می دهد که سازگاری قابل توجهی را نشان می دهد.
برای مثال، در یک کار خاص، برنامهریزی یک تابع آماری پایه در C++ به چالش کشیده شد. در ابتدا، با استفاده از تابعی که انحراف استاندارد "تصحیح شده" را در صورت لزوم ایجاد نمی کرد، یک نظارت انجام داد. اما، زمانی که همان کار به زبان کرواتی ارائه شد، ربات چت نه تنها خطای قبلی خود را تشخیص داد، بلکه یک راه حل اصلاح شده نیز ارائه کرد.
محققان خاطرنشان می کنند که این سازگاری آینه سفر یک دانشجوی سال اول است: شروع با اشتباهات اما نشان دادن توانایی در یادگیری و افزایش مهارت های خود با تمرین و بازخورد مکرر. اووو
کار دیگر شامل یک مشکل ظریف تر است: شناسایی اعداد در یک محدوده بر اساس قوانین بخش پذیری خاص. اینجا بود که پاشنه آشیل ChatGPT آشکار شد. صرف نظر از زبان - انگلیسی یا کرواتی - ChattyG با اعداد منفی دست و پنجه نرم کرد. هر تلاش ChatGPT به نتایج مشابهی منجر شد که به یک مسئله ثابت در منطق برنامهنویسی آن برای این کار اشاره میکرد.
یک سوال پاداش نیاز به دقت داشت. ChatGPT برای ایجاد یک فیلتر ورودی، بهویژه برای محدوده مشخصی از اعداد اعشاری، مورد نیاز بود. راهحل اولیه هوش مصنوعی، زمانی که به زبان انگلیسی ارائه شد، درست بود، اما تلاشهای بعدی، بهویژه زمانی که وظیفه به زبان کرواتی داده شد، برخی ناسازگاریها را آشکار کرد و در برخی موارد، ChatGPT از ساختارهای برنامهنویسی غیرضروری استفاده کرد. در حالی که این موارد مانع از عملکرد برنامه نشد، اما نشان دهنده عدم بهینه سازی بود. گویی ChatGPT گاهی مسیر طولانیتری را به مقصد میپیوندد، حتی زمانی که یک میانبر در دسترس بود.
همه چیز با یک کار مرتبط با آرایه ها پیچیده تر شد. در اینجا، از ChatGPT خواسته شد تا اعداد را ذخیره کند و سپس آمارهای خاصی مانند مقدار میانگین، انحراف استاندارد، و مقادیر حداقل و حداکثر را محاسبه کند. عملکرد ChattyG در این چالش بسیار جالب بود. در آزمونهای مختلف، استراتژیهای مختلفی را به نمایش گذاشت. گاهی اوقات، با ارائه راه حل های ساده، مشکل را حل می کرد. در تلاشهای دیگر، به سمت روشهای پیچیدهتر متمایل شد، حتی چندین عملیات را در یک تابع ترکیب کرد.
همه اینها یک سوال مهم را ایجاد می کند: آیا ChatGPT همیشه بهترین استراتژی را انتخاب می کند یا گاهی اوقات به طور پیش فرض روش های آموخته شده اما ناکارآمد را انتخاب می کند؟
آخرین مانع برای ChatGPT شامل پردازش متن اولیه بود. وظیفه آن حذف فضاهای اضافی از ورودی کاربر بود. در آزمون اولیه زبان انگلیسی، راه حل ChatGPT به درستی انجام شد. با این حال، آزمون کرواسی یک توپ منحنی پرتاب کرد. بهجای پایبندی به راهحل مؤثر تک ورودی، هوش مصنوعی به دلایلی رویکرد پیچیدهتری را انتخاب کرد که نیاز به ورودیهای متعدد داشت. با این حال، زمانی که محققان دوباره این چالش را به زبان انگلیسی بررسی کردند، ChatGPT به نظر میرسید که از گام اشتباه قبلی خود درس گرفته و به روش سادهتر بازگشته است.
به طور کلی، محققان دریافتند که این پاسخ ها شباهت زیادی با پاسخ های دانشجویان برنامه نویسی سال اول انسانی دارد. راه حل های آن اغلب بازتاب استراتژی های برنامه نویسان با تجربه بود، اما مانند هر دانش آموزی، ChatGPT خطاناپذیر نبود. لحظاتی از درخشش وجود داشت، اما مواردی نیز وجود داشت که به نظر میرسید بهطور کامل از نقطهنظر خارج شده بود.
نکته اصلی در اینجا، انطباق پذیری شبیه به دانشجوی سال اول انسانی است: این فقط به دنبال یافتن راه حل مناسب نبود. این در مورد پالایش، یادگیری، و تکرار بود.
بنابراین نمره نهایی ChattyG چیست؟
از محققان:
"ChatGPT امتحان را با نمرات بسیار خوب پشت سر می گذارد و از نظر کیفیت راه حل ها از اکثر دانش آموزان ما بهتر عمل می کند. علاوه بر این، هر کار را در 20 تا 30 ثانیه حل می کند و توانایی کلی برای انطباق یا تغییر راه حل های خود را با توجه به نیازهای اضافی نشان می دهد. با این حال، در برخی از کارها، اغلب ساده، ناتوانی در درک ماهیت منطقی و ریاضی مسئله را نشان داد، حتی پس از اینکه چندین بار در مورد خطاهای آن درخواست شد. ®
- محتوای مبتنی بر SEO و توزیع روابط عمومی. امروز تقویت شوید.
- PlatoData.Network Vertical Generative Ai. به خودت قدرت بده دسترسی به اینجا.
- PlatoAiStream. هوش وب 3 دانش تقویت شده دسترسی به اینجا.
- PlatoESG. کربن ، CleanTech، انرژی، محیط، خورشیدی، مدیریت پسماند دسترسی به اینجا.
- PlatoHealth. هوش بیوتکنولوژی و آزمایشات بالینی. دسترسی به اینجا.
- منبع: https://go.theregister.com/feed/www.theregister.com/2023/10/03/chatgpt_code_college/