زیرساخت دیجیو

مدل های هوش مصنوعی و پردازنده گرافیکی

امروز نمایندگان را روی مدل‌های مرزی مدیریت شده اجرا کنید - یا ظرفیت GPU را اجاره کنید، وزن‌های خود را مستقر کنید، و وظایف Digio را به نقاط پایانی خصوصی در همان فضای کاری هدایت کنید.

کلود، GPT، جمینی انتخاب مدل هر نماینده اجاره GPU و BYOM
مدل های مدیریت شده

مدل های موجود در دیجیو امروز

یک مدل پیش‌فرض به ازای هر عامل یا نادیده گرفتن هر کار اختصاص دهید. میزان استفاده در Digio Tokens از موجودی طرح شما اندازه گیری می شود - همان کیف پولی که نماینده با Sonnet، GPT-4o یا Gemini Flash تماس می گیرد.

آنتروپیک کلود

  • Claude Opus 4.7 استدلال شاخص، زمینه طولانی، معماری و کار استراتژی.
  • Claude Opus 4.6 Opus نسل قبلی برای تجزیه و تحلیل پایدار و با کیفیت بالا.
  • Claude Sonnet 4.6 درایور روزانه – کدنویسی، نوشتن، و حلقه های عامل چند مرحله ای.
  • Claude Sonnet 4.5 / 4 سطوح سریع Sonnet با ذخیره سریع در بارهای کاری پشتیبانی شده.
  • Claude Haiku 4.5 پیش نویس های با تأخیر کم، طبقه بندی و وظایف فرعی با حجم بالا.

ترجمه تحت اللفظی: OpenAI

  • GPT-5.5 / GPT-5.4 / GPT-5.2 جدیدترین خانواده GPT-5 برای بارهای کاری عمومی و نمایندگی.
  • GPT-4.1 & GPT-4o چت چندوجهی قابل اعتماد و استفاده از ابزار برای عوامل تولید.
  • GPT-4o mini مسیریابی مقرون به صرفه برای خلاصه ها و مراحل سبک وزن.
  • o3 / o3-pro / o3-mini / o4-mini مدل‌های مبتنی بر استدلال برای ریاضی، برنامه‌ریزی و تأیید.
  • GPT-5.3 Codex & Codex mini تولید کد، بازسازها و مهارت‌های عامل آگاه از مخزن.

گوگل جمینی

  • Gemini 2.5 Pro تحقیق با زمینه طولانی و استخراج ساختار یافته.
  • Gemini 2.5 Flash گام های عامل با توان عملیاتی بالا با نرخ های توکن رقابتی.
  • Gemini 2.0 Flash پاس‌های بسیار سریع برای تجزیه، برچسب‌گذاری و کارهای دسته‌ای.

APIهای باز و تخصصی

  • DeepSeek Chat & Reasoner ارزش قوی برای چت و وظایف سبک زنجیره ای.
  • Mistral Large گزینه میزبانی اروپا برای تیم های نمایندگان چند زبانه.
  • Llama 3.3 70B مدل کلاس وزن باز از طریق API—به خوبی با GPU خصوصی جفت می شود.
  • Grok 3 مدل زمان واقعی برای عوامل نظارت بر اخبار و اجتماعی.
  • Sonar Pro پاسخ های مبتنی بر جستجو برای عوامل تحقیقاتی.
  • Command R+ چت سازمانی و گردش کار بازیابی مناسب RAG.

Model list and token economics evolve with provider releases. Your workspace shows live options when you assign a model to an agent; Digio Tokens debit from the same balance as in pricing.

استفاده

نحوه انتخاب مدل توسط نمایندگان

Coordinator می تواند Sonnet vs Opus را در مقابل یک مدل فلاش ارزان تر بر اساس نوع وظیفه پیشنهاد کند. کاربران قدرتمند پیش‌فرض‌ها را برای هر نقش عامل تعیین می‌کنند - تحقیق در Sonnet، بررسی نهایی در Opus، برچسب‌گذاری انبوه در هایکو یا فلش جمینی.

  • Per agent — default model in agent settings; override in To do or chat when needed.

  • Metered fairly — input, output, and cached tokens map to Digio Token charges (see usage in your wallet).

  • Skills stay the same — tools and integrations work across models; only latency and cost profile change.

  • Plan limits — more agents and monthly Digio Tokens on higher tiers; top up anytime on the pricing page.

اجاره GPU

GPU را اجاره کنید و مدل های خود را اجرا کنید

به یک تنظیم دقیق، یک ایست بازرسی با شکاف هوا، یا قیمت استنتاج قابل پیش بینی نیاز دارید؟ ظرفیت اختصاصی GPU را به فضای کاری Digio خود اضافه کنید، سرویس‌دهی مورد علاقه خود را نصب کنید و عوامل را در نقطه پایانی خصوصی خود مشخص کنید.

نمونه های اختصاصی

گره‌های GPU ساعتی یا ماهانه (کلاس A100، H100، L40S) که به مستاجر شما متصل می‌شوند — جدا از سایر مشتریان.

وزن های شما

محافظ‌های ایمنی، GGUF را آپلود کنید یا از رجیستری خود خارج کنید. Llama، Mistral، Qwen، و ریز کوک های سفارشی را اجرا کنید.

سرویس استاندارد

vLLM، TGI، Ollama یا تصاویر کانتینری که شما نگهداری می‌کنید—عامل‌های Digio یک URL پایه سازگار با OpenAI می‌خوانند.

همان ارکستراسیون

برای انجام، چت تیمی، مهارت‌ها و همکاری بدون تغییر باقی مانده است - فقط نتیجه استنتاج متعلق به شماست.

مسیریابی ترکیبی

مراحل حساس را به GPU خصوصی ارسال کنید و از Claude یا GPT برای تحقیقات عمومی در یک گردش کار استفاده کنید.

کنترل های سازمانی

همتاسازی VPC، خروج ایستا، گزارش‌های حسابرسی، و لیست‌های مجاز مدل برای تیم‌های تنظیم‌شده.

مدل خودت بیار

یک مدل سفارشی را نصب و وصل کنید

راه اندازی معمولی از صفر تا عواملی که نقطه پایانی شما را فراخوانی می کنند:

  1. GPU رزرو کنید

    VRAM، منطقه و زمان فعال (burst vs always-on) را انتخاب کنید. ذخیره سازی برای وزنه ها همراه با نمونه یا سوار سطل شما ارسال می شود.

  2. پشته را مستقر کنید

    یک تصویر یا SSH در حال ارائه را شروع کنید، درایورهای CUDA را نصب کنید و نقاط بازرسی را بارگیری کنید. بررسی های بهداشتی تأیید می کند که مدل آماده است.

  3. ثبت نقطه پایانی

    URL پایه، کلید API و شناسه مدل را در تنظیمات فضای کاری اضافه کنید. دیجیو قبل از پخش زنده، تأخیر و قالب توکن را تأیید می کند.

  4. به نمایندگان اختصاص دهید

    مدل خصوصی خود را به عنوان پیش فرض برای نمایندگان انتخاب شده انتخاب کنید. مدل های کلود/GPT مدیریت شده در کنار هم در دسترس هستند.

صورت‌حساب اجاره GPU جدا از اشتراک‌های طرح دیجیو است. برای برنامه ریزی ظرفیت، SLA و مهاجرت از یک خوشه استنتاج موجود با ما تماس بگیرید.

سوالات متداول

سوالات مدل ها و پردازنده گرافیکی

انتخاب APIهای مدیریت شده در مقابل استنتاج خود میزبان در Digio.

آیا دوبار پرداخت می‌کنم—طرح به اضافه API؟

اشتراک Digio شما زیرساخت ها، نمایندگان و توکن های Digio را پوشش می دهد. استفاده از مدل مدیریت‌شده آن توکن را با توکن‌های ورودی/خروجی واقعی بدهکار می‌کند. اجاره GPU یک افزونه برای ماشین هایی است که شما کنترل می کنید.

آیا عوامل مختلف می توانند از مدل های مختلف استفاده کنند؟

بله، هر عامل می تواند پیش فرض خود را داشته باشد. وظایف و چت‌ها می‌توانند برای یک بار اجرا بدون تغییر پیش‌فرض جهانی لغو شوند.

تفاوت بین Sonnet و Opus چیست؟

Opus برای استدلال سخت تر و برنامه های منسجم طولانی تر تنظیم شده است. Sonnet برای حلقه های عامل روزمره سریعتر و ارزان تر است. مدل های هایکو و کلاس فلش برای کارهای فرعی حجمی بهترین هستند.

آیا می توانم فقط مدل خودم را اجرا کنم و API های ابری را مسدود کنم؟

فضاهای کاری سازمانی می توانند ارائه دهندگان مدل های خروجی را محدود کرده و تمام ترافیک نماینده را به نقطه پایانی GPU شما هدایت کنند. حالت ترکیبی پیش فرض برای اکثر تیم ها است.

کدام اندازه های GPU موجود است؟

پیشنهادات به منطقه و تقاضا بستگی دارد - معمولاً ردیف‌های VRAM 24 تا 80 گیگابایتی برای مدل‌های کلاس 7B-70B و گره‌های چند GPU برای پشته‌های بزرگ‌تر. ما به اندازه گیری VRAM از تعداد پارامترها و کمیت شما کمک می کنیم.

آیا استفاده از GPU خصوصی همچنان توکن های Digio را مصرف می کند؟

ارکستراسیون (عوامل، وظایف، ذخیره سازی) در برنامه شما باقی می ماند. استنباط در GPU شما به عنوان زمان GPU صورتحساب می شود. برای استرداد شارژ داخلی می‌توانید به صورت اختیاری میزان استفاده به شکل توکن را اندازه‌گیری کنید.

مدل های مدیریت شده را انتخاب کنید یا GPU خود را بیاورید

امروز با Claude و GPT شروع کنید، سپس زمانی که آماده میزبانی وزن‌های سفارشی هستید، GPU اختصاصی را اضافه کنید - همان عامل‌ها، وظایف مشابه، استنتاج شما.