
معرفی مدل o3-mini از OpenAI
OpenAI اخیراً مدل جدیدی به نام o3-mini را معرفی کرده است که به عنوان یک مدل استدلالی سبکوزن و قدرتمند، تحولی در حوزههای علمی، فنی، مهندسی و ریاضیات (STEM) ایجاد کرده است. این مدل که در تاریخ 31 ژانویه 2025 منتشر شد، اولین مدل استدلالی OpenAI است که به کاربران رایگان نیز ارائه میشود. این اقدام نشاندهنده تلاش OpenAI برای کاهش هزینهها و افزایش دسترسی به فناوریهای پیشرفته هوش مصنوعی است.
ویژگیهای کلیدی o3-mini
1. بهبود عملکرد در حوزههای STEM: o3-mini در حل مسائل ریاضی، کدنویسی و علوم عملکردی برتر نسبت به مدل قبلی خود، o1-mini، دارد. این مدل در تستهای استاندارد مانند AIME (رقابتهای ریاضی) و GPQA (ارزیابیهای سطح دکترا) عملکردی قابلتوجه از خود نشان داده است.
2. سرعت و کارایی بالا: o3-mini به طور متوسط 24% سریعتر از o1-mini پاسخ میدهد و زمان پاسخدهی آن به 7.7 ثانیه کاهش یافته است. این بهبود سرعت، تجربه کاربری را بهینهتر کرده و هزینههای عملیاتی را کاهش میدهد.
3. سطحهای مختلف استدلال: کاربران میتوانند بین سه سطح استدلال کم، متوسط و بالا انتخاب کنند. این انعطافپذیری به توسعهدهندگان اجازه میدهد تا بین سرعت و دقت تعادل برقرار کنند.
4. پشتیبانی از قابلیتهای پیشرفته: o3-mini از ویژگیهایی مانند فراخوانی توابع، خروجیهای ساختاریافته و پیامهای توسعهدهنده پشتیبانی میکند. این قابلیتها باعث میشوند که مدل بهراحتی در برنامههای مختلف ادغام شود.
دسترسی و محدودیتها
- کاربران رایگان: برای اولین بار، کاربران رایگان ChatGPT میتوانند از o3-mini با انتخاب گزینه "Reason" در ویرایشگر پیام استفاده کنند. البته تعداد درخواستهای روزانه محدود است.
- کاربران پولی: کاربران ChatGPT Plus، Team و Pro میتوانند از o3-mini با محدودیتهای بالاتر استفاده کنند. بهعنوان مثال، کاربران Plus و Team میتوانند تا 150 پیام در روز ارسال کنند، در حالی که این عدد برای o1-mini تنها 50 پیام بود.
- نسخه o3-mini-high: کاربران پولی میتوانند از نسخه پیشرفتهتر این مدل با نام o3-mini-high استفاده کنند که پاسخهای دقیقتر و هوشمندانهتری ارائه میدهد.
مقایسه با مدلهای قبلی
o3-mini در بسیاری از تستها عملکرد بهتری نسبت به o1-mini نشان داده است. بهعنوان مثال، در رقابتهای ریاضی AIME 2024، دقت o3-mini در سطح استدلال بالا به 87.3% رسید، در حالی که این عدد برای o1-mini حدود 60% بود. همچنین، در تستهای کدنویسی Codeforces، o3-mini امتیاز 2073 ELO را کسب کرد که بهبود قابلتوجهی نسبت به مدلهای قبلی است.
چالشها و محدودیتها
- عدم پشتیبانی از قابلیتهای چندوجهی: o3-mini فاقد توانایی پردازش تصاویر یا دادههای بصری است. برای این نوع وظایف، کاربران باید از مدلهای دیگر مانند o1 استفاده کنند.
- قیمتگذاری: با وجود کاهش هزینهها، قیمت o3-mini هنوز نسبت به برخی رقبا مانند DeepSeek R1 بالاتر است. این موضوع ممکن است برای برخی توسعهدهندگان چالشبرانگیز باشد.
جمعبندی
o3-mini یک گام مهم در جهت کاهش هزینهها و افزایش دسترسی به فناوریهای پیشرفته هوش مصنوعی است. با بهبود عملکرد در حوزههای STEM و افزایش سرعت پاسخدهی، این مدل بهطور قابلتوجهی تجربه کاربری را بهبود بخشیده است. اگرچه محدودیتهایی مانند عدم پشتیبانی از دادههای بصری وجود دارد، اما o3-mini بهوضوح نشاندهنده تعهد OpenAI به پیشرفت در حوزههای علمی و فنی است.
منابع
The Paper
Towards AI
NBD
Sina Finance
Sohu
ZDNet
Huxiu
Huxiu
QQ News
Notebookcheck