واژه‌نامه

مفاهیم پرکاربرد هوش مصنوعی، تولید متن و اجزای پلتفرم فست‌ای‌آی‌جی را اینجا سریع مرور کنید.

مدل زبانی (LLM)

مدلی مبتنی بر یادگیری عمیق که احتمال توالی کلمات را پیش‌بینی کرده و متن منسجم تولید می‌کند.

مدل چند‌حالته

مدلی که علاوه بر متن، ورودی/خروجی‌هایی مثل تصویر یا صوت را نیز پشتیبانی می‌کند.

نسخه مدل

شناسه یا شمارۀ انتشار برای تمایز رفتار، کیفیت و محدودیت‌های هر به‌روزرسانی مدل.

فاین‌تیونینگ

تنظیم دوباره وزن‌های یک مدل پایه بر روی دیتاست اختصاصی برای تخصصی‌تر شدن خروجی.

Adapter / LoRA

روش‌های سبک فاین‌تیونینگ که با افزودن لایه‌های کم‌حجم، هزینه و زمان آموزش را کاهش می‌دهند.

توکن

واحد خردشده متن (کلمه، زیرکلمه یا علامت) که معیار اصلی محاسبه هزینه و ظرفیت است.

توکن‌سازی

فرآیند تبدیل متن خام به رشته‌ای از توکن‌ها جهت پردازش مدل.

حداکثر توکن خروجی

سقف تعداد توکن‌هایی که مدل مجاز است در پاسخ تولید کند (max_output_tokens).

پنجره کانتکست (Context Window)

حداکثر مجموع توکن‌های ورودی + حافظۀ قبلی که مدل می‌تواند همزمان ببیند.

Temperature

پارامتر کنترل تصادفی بودن؛ مقدار بالاتر = خروجی متنوع‌تر، مقدار پایین‌تر = پاسخ پایدارتر.

Top-p (نسمه)

برش تجمعی احتمال؛ مدل فقط از میان کوچکترین مجموعه توکن‌های دارای مجموع احتمال ≥ p نمونه‌برداری می‌کند.

Top-k

محدود کردن انتخاب مدل به k توکن با بیشترین احتمال در هر گام تولید.

Stop Sequences

رشته‌هایی که در صورت مشاهده، تولید متن متوقف می‌شود (مثلا " User:").

Presence Penalty

تنبیه تکرار حضور توکن‌های استفاده‌شده برای تشویق تنوع موضوعی.

Frequency Penalty

تنبیه بر اساس تعداد تکرار توکن‌ها برای کاهش خروجی‌های تکراری.

چت چندنوبتی (Multi-turn)

تعامل زنجیره‌ای کاربر و مدل با حفظ حافظه پیام‌های قبلی.

پیام سیستم

دستور اولیه جهت تنظیم رفتار مدل در شروع یک گفتگو (مثلا نقش دستیار متخصص).

شناسه جلسه (Session ID)

شناسه‌ای برای گروه‌بندی پیام‌های مرتبط در یک رشته گفتگو.

Idempotency Key

کلیدی برای اطمینان از اینکه اجرای تکراری یک درخواست عملیاتی یک نتیجه واحد ایجاد می‌کند.

RAG

ترکیب بازیابی (Retrieval) و تولید (Generation)؛ ابتدا اسناد مرتبط واکشی، سپس پاسخ غنی تولید می‌شود.

بردار (Embedding)

نمایش عددی فشرده از متن جهت سنجش شباهت معنایی.

بردارکد (Vector Store)

پایگاه داده‌ای بهینه برای ذخیره و جستجوی بردارهای معنایی.

امتیاز شباهت

عدد (اغلب بین 0 تا 1 یا منفی تا مثبت) که میزان نزدیکی معنایی دو بردار را نشان می‌دهد.

Prompt

متن یا ساختار ورودی که رفتار و جهت پاسخ مدل را تعیین می‌کند.

مهندسی پرامپت

طراحی و بازآرایی پرامپت برای بهبود کیفیت و کنترل خروجی مدل.

Completion

خروجی متنی نهایی مدل پس از پردازش ورودی.

Streaming

ارسال تدریجی بخش‌های پاسخ به محض تولید شدن برای کاهش زمان انتظار کاربر.

Tool / Function Calling

توانایی مدل در ساخت فراخوانی ساختاریافته به تابع/ابزار خارجی (مثلا JSON Schema).

Post-processing

مراحل پس از دریافت خروجی خام برای پاکسازی، ساختاردهی یا اعتبارسنجی.

Guardrail

لایه‌های کنترلی بیرون مدل برای محدودسازی یا اصلاح پاسخ‌های نامطلوب.

Latency

زمان سپری‌شده از ارسال درخواست تا دریافت اولین بایت پاسخ.

Throughput

تعداد درخواست قابل پردازش در واحد زمان (مثلا درخواست بر ثانیه).

Cache

ذخیره نتایج یا بردارهای پرتکرار برای پاسخ‌دهی سریع‌تر در دفعات بعد.

Retry Backoff

افزایش تدریجی فاصله بین تلاش‌های مجدد برای جلوگیری از فشار بر سرویس.

Rate Limit

حداکثر تعداد یا سرعت درخواست مجاز در بازه زمانی مشخص جهت حفظ پایداری.

Quota

سقف مصرف کل (مثلا مجموع توکن یا مبلغ) که کاربر در دوره صورتحساب می‌تواند استفاده کند.

کلید API

توکن محرمانه احراز هویت برای استفاده از سرویس؛ باید امن نگهداری شود.

احراز هویت (Authentication)

تأیید هویت درخواست‌کننده (کاربر، سرویس یا کلید).

مجوز (Authorization)

بررسی اینکه هویت تأیید شده مجاز به انجام عمل درخواستی هست یا خیر.

Token Leakage

افشای ناخواسته کلید یا توکن در لاگ، مخزن کد یا کلاینت عمومی.

Content Filter

سامانه بررسی و مسدودسازی محتواهای ممنوع یا حساس پیش/پس از تولید.

Moderation

فرآیند ارزیابی خروجی یا ورودی برای تطابق با خط‌مشی‌های ایمنی.

حفظ داده (Retention)

مدت زمانی که لاگ‌ها و محتوا برای اهداف عملیاتی نگهداری و سپس پاکسازی می‌شوند.

ناشناس‌سازی

حذف یا ماسک کردن اطلاعات هویتی جهت کاهش ریسک افشا.

Opt-out

حق کاربر برای عدم استفاده از داده‌هایش در تحلیل یا بهبودهای غیرضروری.

Billing Cycle

دوره زمانی محاسبه و صدور صورتحساب (مثلا ماهانه).

Usage Report

نمایش تفکیک‌شده مصرف بر حسب مدل، تعداد توکن، و مبلغ.

Cost per Token

هزینه واحد توکن ورودی و خروجی؛ معمولا برای مدل‌های مختلف متفاوت است.

Observability

قابلیت رصد وضعیت داخلی سیستم از طریق لاگ، متریک و تریس.

متریک (Metric)

عدد قابل اندازه‌گیری (مثل متوسط لیتنسی یا تعداد خطا) برای ارزیابی سلامت.

Log

ثبت رویدادهای متنی جهت دیباگ یا حسابرسی.

Trace

رشته‌ای از بخش‌های یک درخواست توزیع‌شده برای تحلیل عملکرد سراسری.

Span

بخش منفرد از یک Trace که بازه زمانی یک عملیات را نشان می‌دهد.

HTTP 401

عدم احراز هویت معتبر (کلید اشتباه یا منقضی).

HTTP 403

عدم مجوز؛ هویت معتبر است ولی دسترسی کافی ندارد.

HTTP 404

منبع یافت نشد؛ مسیر یا شناسه اشتباه.

HTTP 429

عبور از نرخ مجاز درخواست؛ باید صبر یا سیاست بک‌آف اعمال شود.

HTTP 5xx

خطای سمت سرور یا زیرساخت؛ معمولا موقتی.

JSON Schema

تعریف ساختار معتبر داده JSON برای اعتبارسنجی و راهنمایی مدل در فراخوانی توابع.

Payload

محتوای اصلی بدنه درخواست یا پاسخ (Body).

Header

بخش متادیتای درخواست/پاسخ HTTP شامل اطلاعات کنترل و احراز هویت.

Alignment

همخوانی رفتار مدل با اهداف ایمنی، اخلاقی و انتظار کاربر.

Hallucination

تولید پاسخ ظاهراً معتبر ولی نادرست یا فاقد پشتوانه واقعی.

Safety Layer

مجموعه مکانیزم‌های فنی و سیاستی برای کاهش خروجی‌های مضر.

Normalization

استانداردسازی یا یکنواخت‌سازی متن (مثلا حذف فاصله‌های اضافه) پیش از پردازش.

Session Timeout

زمان پس از آخرین فعالیت که منجر به انقضای جلسه فعال می‌شود.

Webhook

URL دریافت اعلان خودکار از رویدادهای سیستم (مثل پرداخت موفق).