একটি এআই সবেমাত্র 'সাধারণ বুদ্ধিমত্তা'-তে মানুষের স্তরে পৌঁছেছে। কি মানে

[ad_1]

একটি নতুন কৃত্রিম বুদ্ধিমত্তা (AI) মডেল এসেছে mhb">মানব-স্তরের ফলাফল অর্জন করেছে “সাধারণ বুদ্ধিমত্তা” পরিমাপ করার জন্য ডিজাইন করা একটি পরীক্ষায়।

20 ডিসেম্বর, OpenAI এর o3 সিস্টেম 85% স্কোর করেছে adl">ARC-AGI বেঞ্চমার্কআগের AI সেরা স্কোর 55% এর উপরে এবং গড় মানুষের স্কোরের সমান। এটি একটি খুব কঠিন গণিত পরীক্ষায় ভাল স্কোর করেছে।

কৃত্রিম সাধারণ বুদ্ধিমত্তা তৈরি করা, বা AGI, সমস্ত প্রধান AI গবেষণা ল্যাবগুলির বিবৃত লক্ষ্য। প্রথম নজরে, OpenAI অন্তত এই লক্ষ্যের দিকে একটি উল্লেখযোগ্য পদক্ষেপ করেছে বলে মনে হচ্ছে।

যদিও সংশয় রয়ে গেছে, অনেক এআই গবেষক এবং বিকাশকারীরা মনে করেন কিছু পরিবর্তন হয়েছে। অনেকের কাছে, AGI-এর সম্ভাবনা এখন প্রত্যাশিত থেকে আরও বাস্তব, জরুরি এবং কাছাকাছি বলে মনে হচ্ছে। তারা কি ঠিক?

সাধারণীকরণ এবং বুদ্ধিমত্তা

o3 ফলাফলের অর্থ কী তা বোঝার জন্য, আপনাকে ARC-AGI পরীক্ষাটি কী তা বুঝতে হবে। প্রযুক্তিগত পরিভাষায়, এটি একটি নতুন কিছুর সাথে খাপ খাইয়ে নেওয়ার ক্ষেত্রে একটি এআই সিস্টেমের “নমুনা দক্ষতার” পরীক্ষা – এটি কীভাবে কাজ করে তা বের করতে সিস্টেমটিকে একটি অভিনব পরিস্থিতির কতগুলি উদাহরণ দেখতে হবে।

ChatGPT (GPT-4) এর মতো একটি AI সিস্টেম খুব নমুনা দক্ষ নয়। এটি মানব পাঠ্যের লক্ষ লক্ষ উদাহরণের উপর “প্রশিক্ষিত” ছিল, সম্ভাব্য “নিয়ম” তৈরি করে যার মধ্যে শব্দের সংমিশ্রণ সবচেয়ে বেশি।

সাধারণ কাজে ফলাফল বেশ ভালো। এটি অস্বাভাবিক কাজগুলিতে খারাপ, কারণ এতে সেই কাজগুলি সম্পর্কে কম ডেটা (কম নমুনা) রয়েছে।

যতক্ষণ না এআই সিস্টেমগুলি অল্প সংখ্যক উদাহরণ থেকে শিখতে পারে এবং আরও নমুনা দক্ষতার সাথে খাপ খাইয়ে নিতে পারে, সেগুলি শুধুমাত্র খুব পুনরাবৃত্তিমূলক কাজের জন্য ব্যবহার করা হবে এবং যেখানে মাঝে মাঝে ব্যর্থতা সহনীয়।

ডেটার সীমিত নমুনা থেকে পূর্বে অজানা বা অভিনব সমস্যাগুলি সঠিকভাবে সমাধান করার ক্ষমতাকে সাধারণীকরণের ক্ষমতা বলে। এটি ব্যাপকভাবে বুদ্ধিমত্তার একটি প্রয়োজনীয়, এমনকি মৌলিক উপাদান হিসেবে বিবেচিত হয়।

গ্রিড এবং নিদর্শন

ARC-AGI বেঞ্চমার্ক নিচের মত সামান্য গ্রিড স্কোয়ার সমস্যা ব্যবহার করে নমুনা দক্ষ অভিযোজনের জন্য পরীক্ষা করে। AI-কে সেই প্যাটার্ন বের করতে হবে যা বাম দিকের গ্রিডকে ডানদিকের গ্রিডে পরিণত করে।

irf">
ARC-AGI বেঞ্চমার্ক পরীক্ষা থেকে একটি উদাহরণ টাস্ক। vrw">ARC পুরস্কার

প্রতিটি প্রশ্ন থেকে শেখার জন্য তিনটি উদাহরণ দেয়। AI সিস্টেমকে তখন নিয়মগুলি বের করতে হবে যা তিনটি উদাহরণ থেকে চতুর্থ পর্যন্ত “সাধারণ” করে।

এগুলি অনেকটা IQ পরীক্ষার মতো যা কখনও কখনও আপনি স্কুল থেকে মনে রাখতে পারেন।

দুর্বল নিয়ম এবং অভিযোজন

ওপেনএআই কীভাবে এটি করেছে তা আমরা ঠিক জানি না, তবে ফলাফলগুলি নির্দেশ করে যে o3 মডেলটি অত্যন্ত অভিযোজিত। মাত্র কয়েকটি উদাহরণ থেকে, এটি এমন নিয়ম খুঁজে পায় যা সাধারণীকরণ করা যেতে পারে।

একটি প্যাটার্ন খুঁজে বের করার জন্য, আমাদের কোন অপ্রয়োজনীয় অনুমান করা উচিত নয়, বা আমাদের সত্যিই হতে হবে তার চেয়ে বেশি নির্দিষ্ট হওয়া উচিত নয়। ইন jhg">তত্ত্বযদি আপনি “দুর্বল” নিয়মগুলি সনাক্ত করতে পারেন যা আপনি যা চান তা করে, তাহলে আপনি নতুন পরিস্থিতিতে মানিয়ে নেওয়ার আপনার ক্ষমতা সর্বাধিক করেছেন।

দুর্বলতম নিয়ম বলতে আমরা কী বুঝি? প্রযুক্তিগত সংজ্ঞা জটিল, কিন্তু দুর্বল নিয়ম সাধারণত হতে পারে eks">সহজ বিবৃতিতে বর্ণিত.

উপরের উদাহরণে, নিয়মের একটি সরল ইংরেজি অভিব্যক্তি এমন কিছু হতে পারে: “প্রসারিত রেখা সহ যেকোন আকৃতি সেই লাইনের শেষে চলে যাবে এবং এটির সাথে ওভারল্যাপ করে এমন অন্য যেকোন আকারকে 'কভার আপ' করবে।”

চিন্তার শিকল খুঁজছেন?

যদিও আমরা এখনও জানি না কিভাবে OpenAI এই ফলাফলটি অর্জন করেছে, এটা অসম্ভাব্য মনে হচ্ছে তারা ইচ্ছাকৃতভাবে দুর্বল নিয়মগুলি খুঁজে পেতে o3 সিস্টেমটিকে অপ্টিমাইজ করেছে। যাইহোক, ARC-AGI কাজগুলিতে সফল হওয়ার জন্য এটি অবশ্যই তাদের খুঁজে বের করতে হবে।

আমরা জানি যে ওপেনএআই o3 মডেলের একটি সাধারণ-উদ্দেশ্য সংস্করণ দিয়ে শুরু করেছিল (যা অন্যান্য মডেলের থেকে আলাদা, কারণ এটি কঠিন প্রশ্নগুলি সম্পর্কে “চিন্তা” করার জন্য আরও বেশি সময় ব্যয় করতে পারে) এবং তারপরে এটিকে ARC-AGI পরীক্ষার জন্য বিশেষভাবে প্রশিক্ষিত করেছে৷

ফরাসি এআই গবেষক ফ্রাঁসোয়া চোলেট, যিনি বেঞ্চমার্ক ডিজাইন করেছিলেন, vrw">বিশ্বাস করে o3 বিভিন্ন “চিন্তার শৃঙ্খল” এর মাধ্যমে অনুসন্ধান করে কাজটি সমাধান করার পদক্ষেপগুলি বর্ণনা করে। এটি তারপর কিছু ঢিলেঢালাভাবে সংজ্ঞায়িত নিয়ম অনুযায়ী “সেরা” বা “হেরিস্টিক” নির্বাচন করবে।

ওয়ার্ল্ড গো চ্যাম্পিয়নকে পরাজিত করার জন্য Google-এর আলফাগো সিস্টেম বিভিন্ন সম্ভাব্য সিকোয়েন্সের মাধ্যমে কীভাবে অনুসন্ধান করেছে তার সাথে এটি “বিচ্ছিন্ন নয়”।

আপনি উদাহরণের সাথে মানানসই প্রোগ্রামগুলির মতো চিন্তার এই চেইনগুলি সম্পর্কে ভাবতে পারেন। অবশ্যই, যদি এটি গো-প্লেয়িং এআই-এর মতো হয়, তবে কোন প্রোগ্রামটি সেরা তা নির্ধারণ করার জন্য এটির একটি হিউরিস্টিক বা শিথিল নিয়ম প্রয়োজন।

হাজার হাজার ভিন্ন আপাতদৃষ্টিতে সমানভাবে বৈধ প্রোগ্রাম তৈরি হতে পারে। সেই হিউরিস্টিক হতে পারে “সবচেয়ে দুর্বলটি বেছে নিন” বা “সরলটি বেছে নিন”।

যাইহোক, যদি এটি AlphaGo-এর মতো হয় তবে তাদের কাছে কেবল একটি AI ছিল একটি হিউরিস্টিক তৈরি। এই AlphaGo জন্য প্রক্রিয়া ছিল. Google একটি মডেলকে প্রশিক্ষিত করেছে যাতে বিভিন্ন পদক্ষেপের ক্রমকে অন্যদের তুলনায় ভাল বা খারাপ হিসাবে রেট করা যায়।

যা আমরা এখনও জানি না

তাহলে প্রশ্ন হল, এটা কি আসলেই AGI-এর কাছাকাছি? যদি এইভাবে o3 কাজ করে, তাহলে অন্তর্নিহিত মডেলটি আগের মডেলগুলির তুলনায় খুব বেশি ভালো নাও হতে পারে।

মডেল ভাষা থেকে যে ধারণাগুলি শেখে তা সাধারণীকরণের জন্য আগের তুলনায় আর উপযুক্ত নাও হতে পারে। পরিবর্তে, আমরা এই পরীক্ষায় বিশেষায়িত হিউরিস্টিক প্রশিক্ষণের অতিরিক্ত পদক্ষেপের মাধ্যমে পাওয়া আরও সাধারণীকরণযোগ্য “চিন্তা চেইন” দেখতে পাচ্ছি। প্রমাণ, সবসময় হিসাবে, পুডিং হবে.

o3 সম্পর্কে প্রায় সবকিছুই অজানা থেকে যায়। ওপেনএআই কয়েকটি মিডিয়া উপস্থাপনা এবং মুষ্টিমেয় গবেষক, পরীক্ষাগার এবং এআই সুরক্ষা প্রতিষ্ঠানের কাছে প্রাথমিক পরীক্ষার মধ্যে সীমিত প্রকাশ করেছে।

সত্যিই o3 এর সম্ভাব্যতা বোঝার জন্য বিস্তৃত পরিশ্রমের প্রয়োজন হবে, যার মধ্যে মূল্যায়ন, এর ক্ষমতার বন্টন বোঝা, কতবার এটি ব্যর্থ হয় এবং কতবার সফল হয়।

যখন o3 অবশেষে প্রকাশ করা হয়, তখন এটি একটি গড় মানুষের মতো প্রায় অভিযোজিত কিনা সে সম্পর্কে আমাদের আরও ভাল ধারণা থাকবে।

যদি তাই হয়, এটি একটি বিশাল, বৈপ্লবিক, অর্থনৈতিক প্রভাব ফেলতে পারে, স্ব-উন্নতি ত্বরিত বুদ্ধিমত্তার একটি নতুন যুগের সূচনা করে। আমাদের AGI-এর জন্যই নতুন মানদণ্ডের প্রয়োজন হবে এবং এটিকে কীভাবে পরিচালনা করা উচিত তা নিয়ে গুরুত্ব সহকারে বিবেচনা করতে হবে।

যদি না হয়, তাহলে এটি এখনও একটি চিত্তাকর্ষক ফলাফল হবে। তবে, দৈনন্দিন জীবন অনেকটাই একই থাকবে।কথোপকথনfec" class="laazy" style="border: none !important; box-shadow: none !important; margin: 0 !important; max-height: 1px !important; max-width: 1px !important; min-height: 1px !important; min-width: 1px !important; opacity: 0 !important; outline: none !important; padding: 0 !important" width="1"/>

(লেখক: vbi">মাইকেল টিমোথি বেনেটপিএইচডি ছাত্র, কম্পিউটিং স্কুল, vgl">অস্ট্রেলিয়ান জাতীয় বিশ্ববিদ্যালয় এবং yki">Perrier নির্বাচন করুনরিসার্চ ফেলো, স্ট্যানফোর্ড সেন্টার ফর রেসপনসিবল কোয়ান্টাম টেকনোলজি, fvn">স্ট্যানফোর্ড বিশ্ববিদ্যালয়)

(প্রকাশ বিবৃতি: মাইকেল টিমোথি বেনেট অস্ট্রেলিয়ান সরকারের কাছ থেকে তহবিল পান। এলিজা পেরিয়ার অস্ট্রেলিয়ান সরকারের কাছ থেকে তহবিল পান)

এই নিবন্ধটি থেকে পুনঃপ্রকাশিত হয় flc">কথোপকথন ক্রিয়েটিভ কমন্স লাইসেন্সের অধীনে। পড়ুন flc/an-ai-system-has-reached-human-level-on-a-test-for-general-intelligence-heres-what-that-means-246529">মূল নিবন্ধ.

(শিরোনাম ব্যতীত, এই গল্পটি NDTV কর্মীদের দ্বারা সম্পাদনা করা হয়নি এবং একটি সিন্ডিকেটেড ফিড থেকে প্রকাশিত হয়েছে।)


[ad_2]

bof">Source link

মন্তব্য করুন