মেটা এআই মডেল প্রকাশ করে যা অন্যান্য মডেলগুলি কীভাবে কাজ করে তা পরীক্ষা করতে পারে

[ad_1]

নিউইয়র্ক:

ফেসবুকের মালিক মেটা শুক্রবার বলেছিলেন যে এটি তার গবেষণা বিভাগ থেকে একটি “স্ব-শিক্ষিত মূল্যায়নকারী” সহ নতুন এআই মডেলের একটি ব্যাচ প্রকাশ করছে যা এআই বিকাশ প্রক্রিয়ায় কম মানুষের সম্পৃক্ততার দিকে একটি পথ সরবরাহ করতে পারে।

রিলিজটি আগস্টের একটি গবেষণাপত্রে মেটা-এর টুলটির প্রবর্তনকে অনুসরণ করে, যা বিশদভাবে বর্ণনা করে যে কীভাবে এটি মডেলের প্রতিক্রিয়া সম্পর্কে নির্ভরযোগ্য সিদ্ধান্ত নেওয়ার জন্য OpenAI-এর সম্প্রতি প্রকাশিত o1 মডেলগুলি দ্বারা ব্যবহৃত একই “চিন্তার চেইন” কৌশলের উপর নির্ভর করে।

এই কৌশলটি জটিল সমস্যাগুলিকে ছোট ছোট যৌক্তিক ধাপে ভাগ করে এবং বিজ্ঞান, কোডিং এবং গণিতের মতো বিষয়গুলিতে চ্যালেঞ্জিং সমস্যাগুলির প্রতিক্রিয়াগুলির সঠিকতা উন্নত করে বলে মনে হয়।

মেটার গবেষকরা মূল্যায়নকারী মডেলকে প্রশিক্ষণের জন্য সম্পূর্ণরূপে এআই-উত্পন্ন ডেটা ব্যবহার করেছেন, সেই পর্যায়ে মানুষের ইনপুটও বাদ দিয়েছেন।

এআইকে নির্ভরযোগ্যভাবে মূল্যায়ন করার জন্য AI ব্যবহার করার ক্ষমতা স্বায়ত্তশাসিত AI এজেন্ট তৈরির সম্ভাব্য পথের একটি আভাস দেয় যা তাদের নিজস্ব ভুল থেকে শিখতে পারে, প্রকল্পের পিছনে থাকা দুই মেটা গবেষক রয়টার্সকে বলেছেন।

AI ক্ষেত্রের অনেকেই এই ধরনের এজেন্টকে ডিজিটাল সহকারী হিসাবে কল্পনা করে যা মানুষের হস্তক্ষেপ ছাড়াই বিস্তৃত কাজ সম্পাদন করতে যথেষ্ট বুদ্ধিমান।

স্ব-উন্নতি মডেলগুলি আজকে মানব প্রতিক্রিয়া থেকে রিইনফোর্সমেন্ট লার্নিং নামে ব্যবহৃত একটি প্রায়শই ব্যয়বহুল এবং অদক্ষ প্রক্রিয়ার প্রয়োজনীয়তা কাটাতে পারে, যার জন্য মানব টীকাকারদের কাছ থেকে ইনপুট প্রয়োজন যাদের অবশ্যই ডেটা সঠিকভাবে লেবেল করার জন্য বিশেষ দক্ষতা থাকতে হবে এবং জটিল গণিত এবং লেখার প্রশ্নের উত্তর যাচাই করতে হবে। সঠিক

গবেষকদের একজন জেসন ওয়েস্টন বলেছেন, “আমরা আশা করি, AI যত বেশি সুপার-হিউম্যান হয়ে উঠছে, এটি তার কাজ পরীক্ষা করার জন্য আরও ভাল এবং আরও ভাল হবে, যাতে এটি প্রকৃতপক্ষে গড় মানুষের চেয়ে ভাল হবে।”

“স্ব-শিক্ষিত হওয়ার ধারণা এবং স্ব-মূল্যায়ন করতে সক্ষম হওয়ার ধারণাটি মূলত এআই-এর এই ধরণের অতি-মানবীয় স্তরে পৌঁছানোর ধারণার জন্য গুরুত্বপূর্ণ,” তিনি বলেছিলেন।

Google এবং Anthropic সহ অন্যান্য সংস্থাগুলিও RLAIF ধারণার উপর গবেষণা প্রকাশ করেছে, বা এআই ফিডব্যাক থেকে রিইনফোর্সমেন্ট লার্নিং। মেটা থেকে ভিন্ন, তবে, এই কোম্পানিগুলি তাদের মডেলগুলি সর্বজনীন ব্যবহারের জন্য প্রকাশ করে না।

শুক্রবার Meta দ্বারা প্রকাশিত অন্যান্য AI টুলগুলির মধ্যে কোম্পানির ইমেজ-আইডেন্টিফিকেশন সেগমেন্ট এনিথিং মডেলের একটি আপডেট অন্তর্ভুক্ত ছিল, এমন একটি টুল যা এলএলএম রেসপন্স জেনারেশনের সময় এবং ডেটাসেটগুলিকে গতি দেয় যা নতুন অজৈব পদার্থের আবিষ্কারে সাহায্য করতে ব্যবহার করা যেতে পারে।

(শিরোনাম ব্যতীত, এই গল্পটি NDTV কর্মীদের দ্বারা সম্পাদনা করা হয়নি এবং একটি সিন্ডিকেটেড ফিড থেকে প্রকাশিত হয়েছে।)

[ad_2]

ohl">Source link