خرید API هوش مصنوعی شیائومی | Xiaomi MiMo API

309B
پارامتر کل
15B
پارامتر فعال
256K
پنجره زمینه
#1
رتبه متن‌باز SWE-Bench

هوش مصنوعی MiMo شیائومی (Xiaomi MiMo) یک مدل زبانی پیشرفته با معماری Mixture-of-Experts (MoE) است که با ۳۰۹ میلیارد پارامتر کل و ۱۵ میلیارد پارامتر فعال، یکی از قدرتمندترین مدل‌های متن‌باز جهان محسوب می‌شود. API شیائومی MiMo اکنون از طریق تاک بات در دسترس توسعه‌دهندگان ایرانی قرار گرفته است.

🏆 دستاورد بی‌نظیر: مدل MiMo-V2-Flash در بنچمارک‌های SWE-Bench Verified و SWE-Bench Multilingual رتبه اول مدل‌های متن‌باز جهان را کسب کرده و عملکردی قابل مقایسه با Claude Sonnet 4.5 ارائه می‌دهد - با تنها 3.5٪ هزینه!

Xiaomi AI با توسعه MiMo-V2-Flash نشان داده که یک شرکت فناوری چینی می‌تواند در رقابت با غول‌هایی مانند OpenAI، Anthropic و Google موفق باشد. این مدل با معماری نوآورانه Hybrid Attention و Multi-Token Prediction (MTP) سرعت تولید توکن را سه برابر کرده است.


چرا API هوش مصنوعی MiMo شیائومی؟

مدل MiMo-V2-Flash شیائومی با ترکیب تکنولوژی‌های پیشرفته، مزایای منحصر به فردی ارائه می‌دهد:


مدل MiMo شیائومی + نرخ مصرف:

نام مدل هزینه (TPC) Context Window پارامترها ویژگی خاص
xiaomi/mimo-v2-flash 0.6 TPC 256K 309B / 15B Active MoE - Hybrid Thinking
TPC = Token Per Character نحوه محاسبه توکن

هزینه درک زمینه (Context):

به ازای هر کاراکتر درک زمینه (پیام‌های ارسالی برای دریافت پاسخ در درخواست) 0.2 توکن *دو دهم یک واحد* کسر می‌گردد. منظور از این پیام‌ها، مقدار content موجود در آرایه messages می‌باشد که با JSON انکد شده است. کاراکترها به صورت UTF-8 محاسبه می‌شوند.


مدل MiMo-V2-Flash Flagship Open Source MoE

MiMo-V2-Flash یک مدل زبانی پایه متن‌باز است که توسط شیائومی توسعه داده شده است. این مدل با معماری Mixture-of-Experts شامل ۳۰۹ میلیارد پارامتر کل و ۱۵ میلیارد پارامتر فعال می‌باشد و از معماری Hybrid Attention بهره می‌برد.

ویژگی‌های کلیدی MiMo-V2-Flash:

  • Hybrid Thinking Toggle: امکان فعال/غیرفعال کردن حالت استدلال
  • پنجره زمینه 256K: پردازش متون بسیار طولانی
  • برتری در کدنویسی: رتبه اول متن‌باز در SWE-Bench Verified و Multilingual
  • سناریوهای Agent: بهینه‌سازی عمیق برای Claude Code، Cline و Roo Code
  • عملکرد Claude 4.5: کیفیت مشابه با هزینه بسیار کمتر
💡 نکته مهم: هنگام استفاده از MiMo با ابزارهای عاملی مانند Claude Code، Cline یا Roo Code، برای بهترین و سریع‌ترین عملکرد، حالت reasoning را غیرفعال کنید - این مدل برای این سناریو عمیقاً بهینه‌سازی شده است.

معماری پیشرفته MiMo-V2-Flash

🔧 Hybrid Sliding Window Attention

  • پیکربندی: ترکیب لایه‌های Sliding Window Attention (SWA) و Global Attention (GA) با نسبت 5:1
  • اندازه پنجره: 128 توکن برای کاهش 6 برابری حافظه KV-cache
  • Sink Bias قابل یادگیری: حفظ عملکرد با وجود پنجره کوچک

⚡ Multi-Token Prediction (MTP)

  • ماژول سبک: تنها 0.33B پارامتر در هر بلوک
  • سرعت 3 برابری: تولید همزمان چندین توکن
  • Self-Speculative Decoding: کاهش تأخیر استنتاج

📚 پیش‌آموزش کارآمد

  • داده آموزش: 27 تریلیون توکن
  • دقت: FP8 Mixed Precision
  • طول توالی: 32K نیتیو با پشتیبانی تا 256K

مقایسه عملکرد MiMo با مدل‌های برتر

جدول زیر عملکرد MiMo-V2-Flash را در مقایسه با مدل‌های پیشرو نشان می‌دهد:

مقایسه عملکرد MiMo با مدل‌های برتر
📊 تحلیل: MiMo-V2-Flash در بنچمارک‌های کدنویسی (SWE-Bench) از تمام مدل‌های متن‌باز برتر است و حتی در SWE-Bench Multilingual از Claude Sonnet 4.5 و GPT-5 پیشی گرفته است!

تکنولوژی‌های پس‌آموزش MiMo

🎓 Multi-Teacher On-Policy Distillation (MOPD)

یک پارادایم جدید که دانش‌آموزی را به فرآیند یادگیری تقویتی تبدیل می‌کند. برخلاف روش‌های سنتی که از بازخورد sparse در سطح توالی استفاده می‌کنند، MOPD از مدل‌های متخصص دامنه‌ای برای نظارت در سطح هر توکن بهره می‌برد.

🤖 Scaling Agentic RL

محیط‌های آموزش عاملی در مقیاس بزرگ با بیش از 100,000 وظیفه قابل تأیید از issue‌های واقعی GitHub. خوشه Kubernetes با قابلیت اجرای همزمان بیش از 10,000 pod.

🔬 Advanced RL Infrastructure

بهینه‌سازی‌های زیرساختی شامل Rollout Routing Replay (R3)، Request-Level Prefix Cache و Fine-Grained Data Scheduler برای آموزش RL با توان عملیاتی بالا.


خرید API شیائومی MiMo (Xiaomi MiMo API)

با استفاده از رابط برنامه‌نویسی کاربردی (API) تاک بات، کاربران ایرانی می‌توانند به مدل پیشرفته MiMo-V2-Flash شیائومی دسترسی پیدا کنند. این سرویس امکان اتصال به یکی از قدرتمندترین مدل‌های متن‌باز جهان را با هزینه بسیار مناسب فراهم می‌آورد.

در نمونه کدهای زیر (مستندات مدل) کافیست توکن Bearer را جایگزین کنید.


نمونه کد PHP اتصال به API هوش مصنوعی MiMo شیائومی


<?php
$message = [
    ["role" => "system", "content" => "You are MiMo, an AI assistant developed by Xiaomi. Today's date: 2025-01-15. Your knowledge cutoff date is December 2024."],
    ["role" => "user", "content" => "سلام MiMo! لطفاً خودت را معرفی کن."],
    ["role" => "assistant", "content" => "سلام! من MiMo هستم، یک دستیار هوش مصنوعی که توسط شیائومی توسعه داده شده‌ام."],
    ["role" => "user", "content" => "در چه زمینه‌هایی می‌توانی کمک کنی؟"]
];

$REQ = curl_init();

curl_setopt_array(
    $REQ,
    array(
        CURLOPT_URL => 'https://api.talkbot.ir/v1/chat/completions',
        CURLOPT_RETURNTRANSFER => true,
        CURLOPT_ENCODING => '',
        CURLOPT_MAXREDIRS => 10,
        CURLOPT_TIMEOUT => 0,
        CURLOPT_FOLLOWLOCATION => true,
        CURLOPT_HTTP_VERSION => CURL_HTTP_VERSION_1_1,
        CURLOPT_CUSTOMREQUEST => 'POST',
        CURLOPT_POSTFIELDS =>
        '{
            "model": "xiaomi/mimo-v2-flash",
            "messages": '.json_encode($message).',
            "temperature": 0.8,
            "stream": false,
            "max_tokens": 4096,
            "top_p": 0.95,
            "frequency_penalty": 0.0,
            "presence_penalty": 0.0
        }',
        CURLOPT_HTTPHEADER => array(
            'Content-Type: application/json',
            'Authorization: Bearer sk-YOUR_API_KEY_HERE' // Replace with your actual API key
        ),
    )
);

$Response = curl_exec($REQ);
echo $Response;

$error = curl_error($REQ);
curl_close($REQ);

$data = json_decode($Response, true);

// Access the AI response
if (isset($data['choices'][0]['message']['content'])) {
    echo "AI Response: " . $data['choices'][0]['message']['content'];
}
?>

نمونه کد Python اتصال به API هوش مصنوعی شیائومی (Xiaomi MiMo API)


import json
import requests

# System prompt recommended by Xiaomi
system_prompt = """You are MiMo, an AI assistant developed by Xiaomi.
Today's date: 2025-01-15. Your knowledge cutoff date is December 2024."""

# Define conversation messages
messages = [
    {"role": "system", "content": system_prompt},
    {"role": "user", "content": "سلام MiMo! لطفاً خودت را معرفی کن."},
    {"role": "assistant", "content": "سلام! من MiMo هستم، یک دستیار هوش مصنوعی که توسط شیائومی توسعه داده شده‌ام."},
    {"role": "user", "content": "یک تابع Python برای محاسبه فاکتوریل بنویس."}
]

# API endpoint
url = 'https://api.talkbot.ir/v1/chat/completions'

# Request payload
payload = json.dumps({
    "model": "xiaomi/mimo-v2-flash",
    "messages": messages,
    "max_tokens": 4096,
    "temperature": 0.8,  # Recommended for coding tasks
    "stream": False,
    "top_p": 0.95,
    "frequency_penalty": 0.0,
    "presence_penalty": 0.0
})

# Request headers
headers = {
    'Content-Type': 'application/json',
    'Authorization': 'Bearer sk-YOUR_API_KEY_HERE'  # Replace with your actual API key
}

# Make the API request
response = requests.post(url, data=payload, headers=headers)

# Handle response
if response.ok:
    data = response.json()
    print("AI Response:")
    print(data['choices'][0]['message']['content'])
    print(f"\nTokens used: {data['usage']['total_tokens']}")
else:
    print(f'An error occurred: {response.text}')

نمونه کد Python با حالت Reasoning (تفکر فعال)


import json
import requests

# Enable reasoning mode for complex tasks
messages = [
    {"role": "system", "content": "You are MiMo, an AI assistant developed by Xiaomi."},
    {"role": "user", "content": "لطفاً یک الگوریتم بهینه برای مرتب‌سازی لیست پیوندی بنویس و پیچیدگی زمانی آن را تحلیل کن."}
]

url = 'https://api.talkbot.ir/v1/chat/completions'

# Enable reasoning with chat_template_kwargs
payload = json.dumps({
    "model": "xiaomi/mimo-v2-flash",
    "messages": messages,
    "max_tokens": 4096,
    "temperature": 0.3,  # Lower temperature for agentic/reasoning tasks
    "stream": False,
    "top_p": 0.95,
    "extra_body": {
        "chat_template_kwargs": {
            "enable_thinking": True  # Enable reasoning mode
        }
    }
})

headers = {
    'Content-Type': 'application/json',
    'Authorization': 'Bearer sk-YOUR_API_KEY_HERE'
}

response = requests.post(url, data=payload, headers=headers)

if response.ok:
    data = response.json()
    
    # Check for reasoning content
    if 'reasoning_content' in data['choices'][0]['message']:
        print("=== Reasoning Process ===")
        print(data['choices'][0]['message']['reasoning_content'])
        print("\n=== Final Answer ===")
    
    print(data['choices'][0]['message']['content'])
else:
    print(f'Error: {response.text}')

نمونه کد JavaScript/Node.js اتصال به API MiMo شیائومی


const axios = require('axios');

const messages = [
    { 
        role: "system", 
        content: "You are MiMo, an AI assistant developed by Xiaomi. Today's date: 2025-01-15." 
    },
    { role: "user", content: "سلام! یک REST API ساده با Express.js بنویس." }
];

const apiRequest = async () => {
    try {
        const response = await axios.post(
            'https://api.talkbot.ir/v1/chat/completions',
            {
                model: 'xiaomi/mimo-v2-flash',
                messages: messages,
                max_tokens: 4096,
                temperature: 0.8,
                top_p: 0.95,
                stream: false
            },
            {
                headers: {
                    'Content-Type': 'application/json',
                    'Authorization': 'Bearer sk-YOUR_API_KEY_HERE'
                }
            }
        );
        
        console.log('AI Response:');
        console.log(response.data.choices[0].message.content);
        console.log(`\nTokens: ${response.data.usage.total_tokens}`);
    } catch (error) {
        console.error('Error:', error.response?.data || error.message);
    }
};

apiRequest();

نمونه خروجی API MiMo شیائومی:

این خروجی که توسط تاک بات ارائه می‌شود، استاندارد OpenAI-Compatible را دنبال می‌کند:


{
    "id": "chatcmpl-mimo-xyz789abc123",
    "object": "chat.completion",
    "created": 1736945123,
    "model": "xiaomi/mimo-v2-flash",
    "choices": [
        {
            "index": 0,
            "message": {
                "role": "assistant",
                "content": "من در زمینه‌های متعددی می‌توانم کمک کنم:\n\n**1. برنامه‌نویسی و کدنویسی:**\n- نوشتن، دیباگ و بهینه‌سازی کد در زبان‌های مختلف\n- طراحی الگوریتم‌ها و ساختار داده‌ها\n- کمک در پروژه‌های GitHub و رفع باگ\n\n**2. استدلال و تحلیل:**\n- حل مسائل ریاضی پیچیده\n- تحلیل منطقی و استدلال\n- پاسخ به سوالات علمی\n\n**3. نوشتن و محتوا:**\n- نوشتن مقاله، گزارش و ایمیل\n- ترجمه متون\n- خلاصه‌سازی اسناد طولانی\n\nچه کاری می‌توانم برایتان انجام دهم؟"
            },
            "finish_reason": "stop"
        }
    ],
    "usage": {
        "prompt_tokens": 156,
        "completion_tokens": 245,
        "total_tokens": 401
    }
}

کاربردهای API هوش مصنوعی MiMo شیائومی

با استفاده از Xiaomi MiMo API می‌توانید پروژه‌های متنوعی بسازید:


بهترین شیوه‌های استفاده از MiMo API

🎛️ پارامترهای پیشنهادی

  • top_p: 0.95 (توصیه شده)
  • temperature: 0.8 برای ریاضی، نوشتن و توسعه وب
  • temperature: 0.3 برای وظایف عاملی (vibe-coding، tool-use)

💬 System Prompt پیشنهادی

انگلیسی:

You are MiMo, an AI assistant developed by Xiaomi.
Today's date: {date} {week}. Your knowledge cutoff date is December 2024.

فارسی/چینی:

تو MiMo هستی، یک دستیار هوش مصنوعی که توسط شیائومی توسعه داده شده است.
تاریخ امروز: {date}. تاریخ برش دانش تو دسامبر 2024 است.

⚡ نکته عملکرد برای ابزارهای Agent

هنگام یکپارچه‌سازی با ابزارهای عاملی مانند Claude Code، Cline یا Roo Code، حالت reasoning را غیرفعال کنید تا بهترین و سریع‌ترین عملکرد را داشته باشید. این مدل برای این سناریو عمیقاً بهینه‌سازی شده است.


سوالات متداول درباره API شیائومی MiMo

MiMo-V2-Flash چیست؟

MiMo-V2-Flash یک مدل زبانی پایه متن‌باز با معماری Mixture-of-Experts است که توسط شیائومی توسعه داده شده. این مدل با 309 میلیارد پارامتر کل و 15 میلیارد پارامتر فعال، در بنچمارک SWE-Bench رتبه اول مدل‌های متن‌باز جهان را دارد.

آیا MiMo از زبان فارسی پشتیبانی می‌کند؟

بله، مدل MiMo-V2-Flash از زبان فارسی و همچنین زبان چینی و انگلیسی به خوبی پشتیبانی می‌کند و می‌تواند متون فارسی را درک و تولید نماید.

تفاوت MiMo با Claude و GPT چیست؟

MiMo-V2-Flash یک مدل متن‌باز است که عملکردی قابل مقایسه با Claude Sonnet 4.5 دارد اما با هزینه تقریباً 3.5% ارائه می‌شود. همچنین در بنچمارک SWE-Bench Multilingual از هر دو مدل Claude و GPT-5 برتر است.

Hybrid Thinking Toggle چیست؟

این قابلیت به شما اجازه می‌دهد حالت استدلال (reasoning) را بر اساس نیاز فعال یا غیرفعال کنید. برای وظایف عاملی و سرعت بالا، غیرفعال کردن reasoning توصیه می‌شود.

چگونه می‌توانم API MiMo را خریداری کنم؟

با ثبت‌نام در تاک‌بات و فعال‌سازی بسته یاقوتی یا یکی از بسته‌های فرایاقوتی، می‌توانید بلافاصله به API هوش مصنوعی MiMo شیائومی دسترسی پیدا کنید. هزینه مصرف بر اساس تعداد توکن‌های استفاده‌شده محاسبه می‌شود. همچنین کاربران در هنگام ثبت‌نام ۱۵۰۰۰ توکن مجانی برای تست دریافت می‌کنند.


چرا MiMo را انتخاب کنیم؟

3.5%
هزینه نسبت به Claude 4.5
3x
سرعت تولید توکن
27T
توکن آموزشی
100K+
وظایف Agent قابل تأیید

آزمایش رایگان:

برای آزمایش و تست رایگان این وب سرویس (API) ابتدا در سایت ثبتنام کنید، و سپس از طریق کنترل پنل کاربری، کلید اختصاصی خود را ایجاد کنید. پس از ایجاد کلید، آن را در نمونه کدهای بالا جایگزاری کرده و خروجی را مشاهده کنید. امکان استفاده از کلید آزمایشی فقط تا 15000 توکن میسر است.


سایر وب سرویس ها:

با خرید بسته یاقوتی و یا یکی از بسته های فرایاقوتی، شما علاوه بر وب سرویس یا API پیش رو، از وب سرویس های زیر نیز میتوانید استفاده کنید.