مدل o3 OpenAI هنوز AGI نیست، اما دستاوردی بینظیر است
به گزارش تاک بات، مدل جدید زبان بزرگ OpenAI به نام "o3" که در تاریخ 20 دسامبر معرفی شد، هنوز به طور عمومی در دسترس نیست، اما تواناییهای آن به تدریج در حال روشن شدن است. این مدل در یک ویدیو معرفی شد که به بررسی عملکرد آن در آزمون ARC-AGI پرداخته است.
مدل o3 به عنوان یک مدل بسیار هوشمند توصیف شده است، اما هنوز در مرحلهای نیست که بتوان آن را به عنوان هوش عمومی مصنوعی (AGI) شناخت. این مدل به تازگی در آزمون ARC-AGI که به منظور سنجش قابلیتهای هوش مصنوعی طراحی شده، مورد ارزیابی قرار گرفت و توانست 76% دقت را کسب کند، که این اولین باری است که یک مدل هوش مصنوعی از انسانها در این آزمون پیشی میگیرد.
آزمون ARC-AGI و عملکرد o3
آزمون ARC-AGI به عنوان یک معیار جدید برای سنجش قابلیتهای هوش مصنوعی طراحی شده است و هدف آن ارزیابی توانایی سیستمهای هوشمند در یادگیری مهارتهای جدید است. این آزمون شامل چالشهایی است که به طور خاص برای اندازهگیری سازگاری با نوآوریها طراحی شده است.
François Chollet، سازنده ARC-AGI، اعلام کرده است که امتیاز 76% o3 نشاندهنده یک پیشرفت قابل توجه در تواناییهای هوش مصنوعی است و این مدل از معماری متفاوتی نسبت به مدلهای قبلی GPT-4 استفاده میکند.
تغییر در قابلیتهای هوش مصنوعی
Chollet این دستاورد را به عنوان یک نقطه عطف در قابلیتهای هوش مصنوعی توصیف کرده و پیشبینی کرده است که توانایی o3 در سازگاری با وظایف جدید میتواند به زودی با کار انسانی رقابت کند. با این حال، او تأکید میکند که o3 هنوز به AGI نرسیده و در برخی از وظایف ساده ناکام مانده است.
آزمون ARC-AGI را خودتان امتحان کنید
شما میتوانید آزمون ARC-AGI را در وبسایت Chollet امتحان کنید و با حل چالشها، تواناییهای خود را بسنجید. این آزمون به صورت تصویری طراحی شده و به شما امکان میدهد تا با رنگآمیزی پیکسلها، پاسخ درست را پیدا کنید.
چالشهای پیش روی o3
با وجود موفقیتهای اخیر، هنوز سوالات زیادی در مورد تواناییهای o3 وجود دارد. به دلیل اینکه این مدل به صورت کد بسته است، اطلاعات دقیقی در مورد نحوه عملکرد آن در دسترس نیست. Chollet معتقد است که o3 هنوز در برخی از وظایف ساده ناکام مانده و برای رسیدن به AGI باید پیشرفتهای بیشتری انجام شود.
در نهایت، Chollet پیشبینی میکند که نسخه جدیدی از ARC-AGI در ماه ژانویه معرفی خواهد شد که ممکن است نتایج o3 را به چالش بکشد و نشان دهد که هنوز راهی طولانی برای دستیابی به AGI وجود دارد.