اصل ماجرا
هزینهٔ واقعی یک عامل هوش مصنوعی معمولاً ۴۰٪ بیشتر از قیمت اعلامی فروشنده است. این اختلاف به دلیل تکرارهای بیرویه، ارسال تاریخچهٔ طولانی مکالمه و استفاده از مدلهای گرانقیمت رخ میدهد. با گذاشتن محدودیت هزینه در کد، پیش از فراخوانی API، میتوان این نشتها را بسته و هزینه را به حد دلخواه رساند.
متن کامل ترجمهشده
در هفته گذشته من در مورد IPO Anthropic و صعود هزینه های 40٪ نوشتم. این پست به طور مداوم ترافیک را جذب می کند و سوالی است که من به طور مداوم دریافت می کنم همان است: “خوب، صعود واقعی است. چگونه واقعا آن را ببندم؟” صعود تفاوت بین آنچه که یک عامل AI می تواند هزینه و آنچه که در واقع در تولید هزینه می کند است. فروشندگان شما را به راه خوشبختی شرح می دهند. حساب شما شما را به واقعیت شرح می دهد. این دو 40% برای اکثر تیم ها، گاهی اوقات بدتر است. اینجا چیزی است که هیچ کس به شما نمی گوید. شما آن صعود را با یک داوطلب ببندید. شما آن را در محل تماس، در کد، خط به خط بسته ببندید. اینجا چگونه صعود در سه مکان زندگی می کند قبل از آنکه هر چیزی را اصلاح کنید، بدانید که پولدر مرحله 15 شما پرداخت می کنید برای ارسال دوباره بارها 1 به 14 هر بار. سوم، مدل Overkill. شما یک “چه 2 Plus 2 است” سوال را به مدل گران تر را راه اندازی می کنید، زیرا این چیزی است که آژانس با آن طراحی شده است. اکثر تماس ها نیازی به مدل بالا نیست. Cap هزینه زمانی که تماس اتفاق می افتد اصلاح خسته است و کار می کند. یک چک بودجه را به طور مستقیم قبل از تماس API، نه در یک گزارش ماهانه قرار دهید. اینجا یک مثال کار شده است. بگویید شما یک آژانس را اجرا می کنید که بلیط های پشتیبانی را پردازش می کند. شما می خواهید هر بلیط به هزینه بیش از 5 سنت در هزینه مدل. در حال حاضر شما نمی دانید چه هزینه یک بلیط تا حساب به دست می آید. از آژانس واردات بودجه # 5 سنت برای هر بلیط، سخت استراحت ticket_budgetهیچ شگفت انگیز 80 سنت بلیط به خاطر یک چرخ بازنگری به سمت جانبی رفت. چرخ بر روی زمین و سقف است. این تغییر یکی بیشتر از هر آرایشگر انجام می دهد. یک آرایشگر به شما می گوید دیروز هزینه بیش از حد است. یک چرخ در محل تماس امروز از هزینه بیش از حد متوقف می شود. کشتن مالیات بازنگری بخش شگفت انگیز از صفر است. اضافه کنید یک بودجه بازنگری، نه فقط یک حساب بازنگری. تعداد “3 بازنگری” به طور امن به نظر می رسد. اما سه بازنگری در یک زمینه بزرگ پول واقعی است. کشتن هزینه، نه تلاش های. از Agentguard واردات بودجه بازنگری_budget = بودجه(usd=0.02) تماس def_with_limit(prompt): با بازنگری_budget: بازنگری_budgetخلاصه کنونی قدیمی یک بار، خلاصه را ذخیره کنید و آن را به جای تاریخ خام ارسال کنید. یک تاریخچه 20،000 تیکن به یک خلاصه 2000 تیکن اضافه می شود و دو بازه آخر. شما فقط 70٪ از تیکن های وارد در هر تماس بعدی را کاهش می دهید. این چنگال است، جادویی نیست. اما چنگال در جایی است که شکاف بسته می شود. آنچه اقتصاد IPO برای شما به معنای است جنین می شود قیمت ها سخت تر، هر دو توسط سرمایه گذاران و توسط خریداران مانند شما. فروشنده هر دلیل برای این است که شماره راه خوشبخت به نظر برسد. شما هر دلیل برای اندازه گیری شماره واقعی دارید. تیم هایی که در این بازار برنده می شوند، با ارزان ترین مدل نیستند. آنها کسانی هستند که می دانند چه هزینه هر عامل را اجرا می کنند و آن را قبل از آن اجرا میاین به شما دقیقا می گوید که جایگاه شما کجاست. شما نیازی به پروژه FinOps یک فصل طولانی ندارید. شما نیاز به یک کلاه بر روی یک عملکرد و رشته برای خواندن آنچه سفر می کند. من AgentGuard را برای این دقیقا ساخته ام. این یک بودجه راه اندازی منبع باز، تیکن و محدودیت نرخ برای آژانس های AI است. شما کلاه عامل خود را بسته، یک کلاه دلار را تنظیم می کنید، و آن را متوقف می کند قبل از اینکه حساب را انجام دهد. pip نصب agentguard و شما می توانید یک کلاه بر بدترین مجرمان خود را در حدود ده دقیقه قرار دهید. کلاه هزینه واقعی است. اما این یک راز نیست. این سه کلاه است که شما می توانید در سایت تماس امروز نصب کنید.
چرا مهمه؟
هزینهٔ واقعی بهجای قیمت خوشبینانه فروشنده، ۴۰٪ بیشتر میشود. تیمهای پشتیبانی، توسعهدهندههای عامل هوش مصنوعی و مدیران فنی که هزینهٔ هر درخواست را کنترل میخواهند، مستقیماً تحت تأثیر این روش قرار میگیرند. خواننده با اعمال محدودیت هزینه در کد، از بروز صورتحسابهای سنگین جلوگیری میکند و بودجهٔ پروژه را بهتر مدیریت میکند.
به درد کی میخوره؟
• توسعهدهندههای عامل هوش مصنوعی • مهندسان پشتیبانی نرمافزار • مدیران فنی و DevOps • تیمهای FinOps
تو عمل چی کار کنیم؟
با افزودن یک لایهٔ محدودیت هزینه به کد، میتوانید هزینهٔ هر درخواست را زیر سقف دلخواه نگه دارید، تکرارهای بیمورد را متوقف کنید و تاریخچهٔ مکالمه را خلاصه کنید. این کار باعث میشود هزینهٔ ماهانه پیشبینیپذیر باشد و از سوراخهای مخفی هزینه جلوگیری شود.
نظر Blue IT News
پیشنهاد میشود قبل از هر بار فراخوانی مدل، یک چکساز هزینهٔ ساده پیاده کنید؛ این کار نهتنها هزینه را کنترل میکند، بلکه به تیمها امکان میدهد سریعتر به بهینهسازی بپردازند.
<div class=“disclosure”> این صفحه ترجمه و تفسیر کاملی از گزارش اصلی Dev است که توسط تیم تحریریه بلو آی تی نیوز به فارسی ترجمه و تحلیل شده. برای مشاهده نسخه اصلی، به منبع مراجعه کنید. </div>