API تبدیل عکس به متن (Image Captioning & OCR)
API تبدیل عکس به متن که توسط تاک بات ارائه میشود، یک راهکار قدرتمند بر پایه هوش مصنوعی برای پردازش تصاویر است. این سرویس شامل دو قابلیت اصلی میباشد:
- 🖼️ توصیف عکس (Image Captioning): تولید توضیحات متنی هوشمند برای تصاویر. به عنوان مثال: «یک سگ قهوهای در حال دویدن در پارک».
- 🔎 تشخیص متن (OCR): استخراج متنهای موجود در تصاویر با دقت بالا، حتی برای زبان فارسی.
این API میتواند در اپلیکیشنها و وبسایتها برای دستیارهای دیجیتال، پردازش اسناد، موتورهای جستجو، سامانههای هوشمند و بسیاری از کاربردهای دیگر به کار گرفته شود.
نحوه استفاده
ارسال درخواست
برای استفاده از این API، باید یک درخواست POST
به آدرس زیر ارسال کنید:
https://api.talkbot.ir/v1/image/convert/REQ
هدرها
در هدرهای درخواست، باید یک توکن بیرر (Bearer token) به عنوان اعتبارنامه ارسال کنید:
Authorization: Bearer YOUR_API_KEY
پارامترهای درخواست
image_url
: لینک تصویر (اجباری در صورت عدم ارسال فایل).image_file
: فایل تصویر (اجباری در صورت عدم ارسال لینک).mode
: حالت پردازش ("caption" برای توصیف عکس یا "ocr" برای تشخیص متن).lang
: زبان متن در حالت caption (پیشفرض: "persian").
نمونه بدنه درخواست (JSON):
{
"image_url": "https://example.com/sample.jpg",
"mode": "ocr"
}
خروجی
در پاسخ به درخواست، یک JSON با ساختار زیر ارائه میشود:
{
"api_version": "1.0",
"AI": "IMG2TEXT-TALKBOT",
"processing_time_ms": 234.56,
"result": {
"mode": "ocr",
"text": "این یک متن نمونه است."
},
"error": null
}
در حالت توصیف عکس (caption):
{
"mode": "caption",
"caption": "یک سگ در حال دویدن در پارک."
}
امکانات و مزایا
- 🔹 تبدیل سریع تصاویر به متن با استفاده از الگوریتمهای پیشرفته.
- 🔹 پشتیبانی از OCR چندزبانه (فارسی، انگلیسی و زبانهای دیگر).
- 🔹 تولید توصیفات هوشمند برای عکسها (Image Captioning).
- 🔹 مناسب برای اپلیکیشنها و سرویسها مانند موتورهای جستجو، شبکههای اجتماعی، پردازش اسناد و رباتهای گفتگو.
- 🔹 دقت بالا در استخراج متن حتی از تصاویر با کیفیت پایین.
- 🔹 زمان پاسخ کوتاه و کارایی بهینه.
- 🔹 پشتیبانی فنی و بهروزرسانی مستمر توسط تیم توسعهدهنده.
نمونه کد PHP
$url = 'https://api.talkbot.ir/v1/image/convert/REQ';
$data = array(
'image_url' => 'https://example.com/sample.jpg',
'mode' => 'caption',
"lang" => "persian"
);
$headers = array(
'Authorization: Bearer YOUR_API_KEY',
'Content-Type: application/json'
);
$curl = curl_init();
curl_setopt($curl, CURLOPT_URL, $url);
curl_setopt($curl, CURLOPT_POST, true);
curl_setopt($curl, CURLOPT_POSTFIELDS, json_encode($data));
curl_setopt($curl, CURLOPT_HTTPHEADER, $headers);
curl_setopt($curl, CURLOPT_RETURNTRANSFER, true);
echo $response = curl_exec($curl);
curl_close($curl);
نمونه کد پایتون
import requests
import json
url = 'https://api.talkbot.ir/v1/image/convert/REQ'
headers = {
'Authorization': 'Bearer YOUR_API_KEY',
'Content-Type': 'application/json'
}
data = {
'image_url': 'https://example.com/sample.jpg',
'mode': 'ocr'
}
response = requests.post(url, headers=headers, data=json.dumps(data))
result = response.json()
print(result)
در این نمونهها، به جای 'YOUR_API_KEY'
باید توکن اعتبارسنجی خود را قرار دهید.
مرتبط با این API:
API تشخیص موجودیتهای نامدار (NER) API تشخیص محتوای غیراخلاقی و خشونتآمیز
هزینه هر بار فراخوانی:
نام مدل | هزینه (TPU) |
---|---|
image-caption-api | 700TPU |
image-ocr-api | 700TPU |
نحوه محاسبه توکن |
آزمایش رایگان:
برای آزمایش و تست رایگان این وب سرویس (API) ابتدا در سایت ثبتنام کنید، و سپس از طریق کنترل پنل کاربری، کلید اختصاصی خود را ایجاد کنید. پس از ایجاد کلید، آن را در نمونه کدهای بالا جایگزاری کرده و خروجی را مشاهده کنید. امکان استفاده از کلید آزمایشی فقط تا 15000 توکن میسر است.
سایر وب سرویس ها:
با خرید بسته یاقوتی و یا یکی از بسته های فرایاقوتی، شما علاوه بر وب سرویس یا API پیش رو، از وب سرویس های زیر نیز میتوانید استفاده کنید.