واژهنامه
مفاهیم پرکاربرد هوش مصنوعی، تولید متن و اجزای پلتفرم فستایآیجی را اینجا سریع مرور کنید.
مدلی مبتنی بر یادگیری عمیق که احتمال توالی کلمات را پیشبینی کرده و متن منسجم تولید میکند.
مدلی که علاوه بر متن، ورودی/خروجیهایی مثل تصویر یا صوت را نیز پشتیبانی میکند.
شناسه یا شمارۀ انتشار برای تمایز رفتار، کیفیت و محدودیتهای هر بهروزرسانی مدل.
تنظیم دوباره وزنهای یک مدل پایه بر روی دیتاست اختصاصی برای تخصصیتر شدن خروجی.
روشهای سبک فاینتیونینگ که با افزودن لایههای کمحجم، هزینه و زمان آموزش را کاهش میدهند.
واحد خردشده متن (کلمه، زیرکلمه یا علامت) که معیار اصلی محاسبه هزینه و ظرفیت است.
فرآیند تبدیل متن خام به رشتهای از توکنها جهت پردازش مدل.
سقف تعداد توکنهایی که مدل مجاز است در پاسخ تولید کند (max_output_tokens).
حداکثر مجموع توکنهای ورودی + حافظۀ قبلی که مدل میتواند همزمان ببیند.
پارامتر کنترل تصادفی بودن؛ مقدار بالاتر = خروجی متنوعتر، مقدار پایینتر = پاسخ پایدارتر.
برش تجمعی احتمال؛ مدل فقط از میان کوچکترین مجموعه توکنهای دارای مجموع احتمال ≥ p نمونهبرداری میکند.
محدود کردن انتخاب مدل به k توکن با بیشترین احتمال در هر گام تولید.
رشتههایی که در صورت مشاهده، تولید متن متوقف میشود (مثلا " User:").
تنبیه تکرار حضور توکنهای استفادهشده برای تشویق تنوع موضوعی.
تنبیه بر اساس تعداد تکرار توکنها برای کاهش خروجیهای تکراری.
تعامل زنجیرهای کاربر و مدل با حفظ حافظه پیامهای قبلی.
دستور اولیه جهت تنظیم رفتار مدل در شروع یک گفتگو (مثلا نقش دستیار متخصص).
شناسهای برای گروهبندی پیامهای مرتبط در یک رشته گفتگو.
کلیدی برای اطمینان از اینکه اجرای تکراری یک درخواست عملیاتی یک نتیجه واحد ایجاد میکند.
ترکیب بازیابی (Retrieval) و تولید (Generation)؛ ابتدا اسناد مرتبط واکشی، سپس پاسخ غنی تولید میشود.
نمایش عددی فشرده از متن جهت سنجش شباهت معنایی.
پایگاه دادهای بهینه برای ذخیره و جستجوی بردارهای معنایی.
عدد (اغلب بین 0 تا 1 یا منفی تا مثبت) که میزان نزدیکی معنایی دو بردار را نشان میدهد.
متن یا ساختار ورودی که رفتار و جهت پاسخ مدل را تعیین میکند.
طراحی و بازآرایی پرامپت برای بهبود کیفیت و کنترل خروجی مدل.
خروجی متنی نهایی مدل پس از پردازش ورودی.
ارسال تدریجی بخشهای پاسخ به محض تولید شدن برای کاهش زمان انتظار کاربر.
توانایی مدل در ساخت فراخوانی ساختاریافته به تابع/ابزار خارجی (مثلا JSON Schema).
مراحل پس از دریافت خروجی خام برای پاکسازی، ساختاردهی یا اعتبارسنجی.
لایههای کنترلی بیرون مدل برای محدودسازی یا اصلاح پاسخهای نامطلوب.
زمان سپریشده از ارسال درخواست تا دریافت اولین بایت پاسخ.
تعداد درخواست قابل پردازش در واحد زمان (مثلا درخواست بر ثانیه).
ذخیره نتایج یا بردارهای پرتکرار برای پاسخدهی سریعتر در دفعات بعد.
افزایش تدریجی فاصله بین تلاشهای مجدد برای جلوگیری از فشار بر سرویس.
حداکثر تعداد یا سرعت درخواست مجاز در بازه زمانی مشخص جهت حفظ پایداری.
سقف مصرف کل (مثلا مجموع توکن یا مبلغ) که کاربر در دوره صورتحساب میتواند استفاده کند.
توکن محرمانه احراز هویت برای استفاده از سرویس؛ باید امن نگهداری شود.
تأیید هویت درخواستکننده (کاربر، سرویس یا کلید).
بررسی اینکه هویت تأیید شده مجاز به انجام عمل درخواستی هست یا خیر.
افشای ناخواسته کلید یا توکن در لاگ، مخزن کد یا کلاینت عمومی.
سامانه بررسی و مسدودسازی محتواهای ممنوع یا حساس پیش/پس از تولید.
فرآیند ارزیابی خروجی یا ورودی برای تطابق با خطمشیهای ایمنی.
مدت زمانی که لاگها و محتوا برای اهداف عملیاتی نگهداری و سپس پاکسازی میشوند.
حذف یا ماسک کردن اطلاعات هویتی جهت کاهش ریسک افشا.
حق کاربر برای عدم استفاده از دادههایش در تحلیل یا بهبودهای غیرضروری.
دوره زمانی محاسبه و صدور صورتحساب (مثلا ماهانه).
نمایش تفکیکشده مصرف بر حسب مدل، تعداد توکن، و مبلغ.
هزینه واحد توکن ورودی و خروجی؛ معمولا برای مدلهای مختلف متفاوت است.
قابلیت رصد وضعیت داخلی سیستم از طریق لاگ، متریک و تریس.
عدد قابل اندازهگیری (مثل متوسط لیتنسی یا تعداد خطا) برای ارزیابی سلامت.
ثبت رویدادهای متنی جهت دیباگ یا حسابرسی.
رشتهای از بخشهای یک درخواست توزیعشده برای تحلیل عملکرد سراسری.
بخش منفرد از یک Trace که بازه زمانی یک عملیات را نشان میدهد.
عدم احراز هویت معتبر (کلید اشتباه یا منقضی).
عدم مجوز؛ هویت معتبر است ولی دسترسی کافی ندارد.
منبع یافت نشد؛ مسیر یا شناسه اشتباه.
عبور از نرخ مجاز درخواست؛ باید صبر یا سیاست بکآف اعمال شود.
خطای سمت سرور یا زیرساخت؛ معمولا موقتی.
تعریف ساختار معتبر داده JSON برای اعتبارسنجی و راهنمایی مدل در فراخوانی توابع.
محتوای اصلی بدنه درخواست یا پاسخ (Body).
بخش متادیتای درخواست/پاسخ HTTP شامل اطلاعات کنترل و احراز هویت.
همخوانی رفتار مدل با اهداف ایمنی، اخلاقی و انتظار کاربر.
تولید پاسخ ظاهراً معتبر ولی نادرست یا فاقد پشتوانه واقعی.
مجموعه مکانیزمهای فنی و سیاستی برای کاهش خروجیهای مضر.
استانداردسازی یا یکنواختسازی متن (مثلا حذف فاصلههای اضافه) پیش از پردازش.
زمان پس از آخرین فعالیت که منجر به انقضای جلسه فعال میشود.
URL دریافت اعلان خودکار از رویدادهای سیستم (مثل پرداخت موفق).