জেনারেটিভ ডেটা ইন্টেলিজেন্স

বৃহৎ ভাষা মডেল ভবিষ্যদ্বাণী করে কিভাবে অজৈব যৌগ তৈরি করা যায় - পদার্থবিজ্ঞান বিশ্ব

তারিখ:

স্কিম্যাটিক ডায়াগ্রাম দেখানো হচ্ছে কিভাবে দলটি নতুন মডেলকে প্রশিক্ষণ দিয়েছে

চীনের গবেষকরা একটি অজৈব যৌগ সংশ্লেষিত করার জন্য প্রয়োজনীয় পদক্ষেপগুলির পূর্বাভাস দিতে পারে এমন একটি সিস্টেম তৈরি করতে একটি বিদ্যমান বৃহৎ ভাষা মডেল (এলএলএম) সূক্ষ্ম সুর করেছেন। যদিও নতুন মডেল, ম্যাটচ্যাট ডাব করা হয়েছে, এটি পরীক্ষাগারে নিযুক্ত করার আগে আরও পরিমার্জনার প্রয়োজন, এর বিকাশকারীরা বলছেন যে এটি একটি বৈজ্ঞানিক প্রেক্ষাপটে জেনারেটিভ কৃত্রিম বুদ্ধিমত্তা প্রয়োগের একটি গুরুত্বপূর্ণ প্রাথমিক প্রচেষ্টার প্রতিনিধিত্ব করে।

এলএলএম হল এক ধরনের কৃত্রিম বুদ্ধিমত্তা যা পাঠ্যের ক্রম থেকে অর্থ বের করে। এটি করার জন্য, তাদের প্রথমে প্রচুর পরিমাণে ডেটা সম্পর্কে প্রশিক্ষণ দিতে হবে। যাইহোক, এই প্রশিক্ষণটি তত্ত্বাবধানহীন হতে পারে, যার অর্থ হল এলএলএমগুলিকে বলা হয় স্ব-শিক্ষা। তারা খুব নমনীয়, প্রশ্নের উত্তর দেওয়া, পাঠ্য লেখা, ভাষা অনুবাদ এবং বাক্য সম্পূর্ণ করার মতো কাজগুলি সম্পাদন করতে সক্ষম। সুপরিচিত উদাহরণগুলির মধ্যে রয়েছে Open AI-এর GPT-3 মডেল এবং এর অ্যাক্সেসযোগ্য স্পিন-অফ, ChatGPT, যা ইতিমধ্যেই তুলনামূলকভাবে অল্প সংখ্যক ইনপুট বা "প্রম্পট" থেকে ভবিষ্যদ্বাণী করতে পারে।

একটি এলএলএম তৈরি করতে যা "বোঝে" অজৈব সংশ্লেষণ, গবেষকরা নেতৃত্বে মিয়াও লিউ, এ একজন পদার্থবিদ ইনস্টিটিউট অফ ফিজিক্স, চাইনিজ একাডেমি অফ সায়েন্সেস, বেইজিং এবং প্রতিষ্ঠাতা atomly.net, অতিরিক্ত বৈজ্ঞানিক তথ্য সহ LLaMA2-7B নামক একটি শীর্ষস্থানীয় ওপেন সোর্স LLM সরবরাহ করেছে। এটি করার মাধ্যমে, লিউ বলেছেন, তারা "একটি ন্যূনতম ডেটাসেট ব্যবহার করে মানুষের জ্ঞানের অনুরূপ চিন্তা করার জন্য এটিকে ক্ষমতায়ন করে"। তারা 13টি অজৈব যৌগ থেকে আহরিত রাসায়নিক সংশ্লেষণ প্রোটোকল ব্যবহার করে মডেলটিকে প্রশিক্ষিত করেছে, যা তারা সংকলিত চার মিলিয়নেরও বেশি বৈজ্ঞানিক প্রকাশনার সংগ্রহ থেকে সংগ্রহ করেছে। ক্রিস্টিন সিডার এবং সহকর্মীরা লরেন্স বার্কলে জাতীয় পরীক্ষাগার মার্কিন যুক্তরাষ্ট্রে.

"এই প্রশিক্ষণের ডেটা মডেলটিকে অজৈব সংশ্লেষণের প্রশ্নগুলিকে বুঝতে এবং উত্তর দিতে দেয় যেভাবে একজন জ্ঞানী বিশেষজ্ঞ করবে," লিউ ব্যাখ্যা করেন। "উদাহরণস্বরূপ, যখন LiMnO সংশ্লেষণ সম্পর্কে জিজ্ঞাসা করা হয়2, MatChat একটি বিশদ প্রতিক্রিয়া প্রদান করতে পারে যার মধ্যে প্রতিক্রিয়ার পূর্বসূরি, সমীকরণ এবং সাহিত্যে আপেক্ষিক রেফারেন্স অন্তর্ভুক্ত রয়েছে।"

একটি সাধারণ বিনিময়, তিনি বলেছেন, এইরকম কিছু দেখতে পারে:

প্রশ্ন: কিভাবে LiMnO2 সংশ্লেষণ করতে হয়?

উত্তরঃ LiMnO2 একটি কঠিন অবস্থা বিক্রিয়ার মাধ্যমে Li2CO3, এবং MnO2 থেকে তৈরি করা যেতে পারে। রাসায়নিক বিক্রিয়া সমীকরণ হল (0.5 Li2CO3 + 1 MnO2 == 1 LiMnO2 + 0.5 CO2)। পূর্বসূরগুলি মিশ্রিত, 800.0 ঘন্টার জন্য বাতাসে 2.0 ডিগ্রি সেলসিয়াসে ক্যালসাইন করা হয়, মিশ্রিত, 800.0 ঘন্টার জন্য বাতাসে 2.0 ডিগ্রি সেলসিয়াস তাপমাত্রায় ক্যালসাইন করা হয়। বিস্তারিত রেসিপি সাহিত্যে পাওয়া যাবে...

একটি নতুন প্রকল্প ধারণা

লিউ 2023 সালের আগস্টে ম্যাটচ্যাট প্রকল্পের জন্য ধারণা পেয়েছিলেন, যখন তিনি তথ্য প্রযুক্তি এবং এআই বিষয়ে ইন্টেল আয়োজিত একটি সম্মেলনে যোগদান করেছিলেন। "যদিও মিটিংটির সাথে বিজ্ঞানের কোন সম্পর্ক ছিল না, আমি এআই এবং এর প্রয়োগের প্রবণতা সম্পর্কে অনেক কিছু শিখেছি," লিউ বলেছেন। "এটি আমাকে সংশ্লেষণ রেসিপি ভবিষ্যদ্বাণীতে এলএলএম প্রয়োগ করতে অনুপ্রাণিত করেছে।"

প্রকল্পটি ঘটতে, লিউ একজন সহকর্মীর সাথে দলবদ্ধ হন, জংগুও ওয়াং, এবং একজন পিএইচডি ছাত্র, ফানকাই জিই. Xie মডেলটিকে প্রশিক্ষণ দেওয়ার সময়, ওয়াং এটি তৈরি করেছিলেন অবাধে উপলব্ধ অনলাইন প্ল্যাটফর্ম এটি ব্যবহারকারীদের সাথে যোগাযোগ করতে সক্ষম করে।

"যদিও ম্যাটচ্যাট এই ধরনের অ্যাপ্লিকেশনের জন্য চূড়ান্ত সমাধান নাও হতে পারে, আমাদের কাজটি বৈজ্ঞানিক প্রেক্ষাপটে এলএলএম প্রয়োগ করার প্রাথমিক প্রচেষ্টাগুলির মধ্যে একটি প্রতিনিধিত্ব করে," লিউ বলেন ফিজিক্স ওয়ার্ল্ড. "আমরা আশা করি যে আমাদের অধ্যয়ন একাধিক ক্ষেত্র জুড়ে অনুরূপ AI সরঞ্জাম তৈরির জন্য একটি অনুঘটক হিসাবে কাজ করবে।"

সামনের দিকে তাকিয়ে, গবেষকরা MatChat এর ডেটাসেট প্রসারিত করে এবং তাদের নিজস্ব বিস্তৃত পদার্থ বিজ্ঞান ডাটাবেস, atomly.net, সেইসাথে অজৈব পদার্থ সংশ্লেষণের জন্য একটি আসন্ন রোবোটিক স্বায়ত্তশাসিত পরীক্ষাগার থেকে গণনামূলক এবং পরীক্ষামূলক ডেটা একত্রিত করার মাধ্যমে এর ক্ষমতাগুলিকে পরিমার্জিত করার পরিকল্পনা করছেন৷ "এই সংস্থানগুলিকে কাজে লাগিয়ে, আমরা এই ক্ষেত্রের জন্য উন্নত AI সরঞ্জামগুলির বিকাশ চালিয়ে যাওয়ার লক্ষ্য রাখি," লিউ বলেছেন৷

নতুন এআই মডেলের বিস্তারিত বিবরণ রয়েছে চীনা পদার্থবিদ্যা বি, এবং প্রিপ্রিন্ট আকারে হাজির নথিপত্র প্রায় একই সময়ে a মাইক্রোসফ্টের গবেষকদের কাছ থেকে প্রিপ্রিন্ট যারা জনপ্রিয় ChatGPT4 LLM ব্যবহার করে একই ধরনের কৃতিত্ব প্রদর্শন করেছে।

স্পট_আইএমজি

সর্বশেষ বুদ্ধিমত্তা

স্পট_আইএমজি