Reading a Paginated API Without Holding the Whole Thing in Memory۱۴۰۵ تیر ۵, جمعه
برنامه_نویسی ۲۳ خرداد ۱۴۰۵

Reading a Paginated API Without Holding the Whole Thing in Memory

وقتی با APIهای صفحه‌بندی شده کار می‌کنیم، خیلی‌ها همه صفحات رو توی حافظه جمع می‌کنن تا بعد پردازش کنن. این کار باعث مصرف زیاد حافظه و تأخیر در شروع پردازش می‌شه. اما با استفاده از async generator می‌تونیم رکوردها رو یکی‌یکی از API بگیریم و فقط صفحاتی رو واکشی کنیم که واقعاً نیاز داریم. این روش حافظه کمتری مصرف می‌کنه و پردازش رو هم سریع‌تر شروع می‌کنه.

Reading a Paginated API Without Holding the Whole Thing in Memory

چرا مهمه؟

این مقاله روش معمول واکشی APIهای صفحه‌بندی شده رو به چالش می‌کشه. خیلی از توسعه‌دهنده‌ها همه داده‌ها رو توی یه آرایه جمع می‌کنن که با بزرگ شدن حجم داده، حافظه رو پر می‌کنه و اگه صفحه‌ای خطا بده، کل کار از بین می‌ره. با async generator می‌شه هم حافظه رو مدیریت کرد، هم پردازش رو زودتر شروع کرد و حتی اگه فقط چند رکورد اول رو لازم داشته باشیم، بقیه صفحات واکشی نمی‌شن. این تغییر به ویژه برای توسعه‌دهنده‌های بک‌اند و کسایی که با حجم بالای داده سروکار دارن حیاتیه.

به درد کی می‌خوره؟

• توسعه‌دهندگان جاوااسکریپت و Node.js • مهندسان بک‌اند و یکپارچه‌سازی • معماران نرم‌افزار و داده • تیم‌های DevOps و Data Pipeline

تو عمل چی کار کنیم؟

با خوندن این خبر می‌تونید توی پروژه‌هاتون به جای جمع کردن همه داده‌ها در حافظه، از async generator برای واکشی صفحه‌بندی شده استفاده کنید. این کار مصرف حافظه رو تا چند برابر کاهش می‌ده و امکان پردازش تدریجی و توقف زودهنگام رو فراهم می‌کنه. همچنین می‌تونید فیلترهای lazy روی داده‌ها اعمال کنید و فقط رکوردهای مورد نظر رو واکشی کنید.

نظر BlueIT News

اگر با APIهای صفحه‌بندی شده کار می‌کنید، حتماً الگوی async generator رو جایگزین روش قدیمی جمع‌آوری کنید. فقط یادتون نره برای جلوگیری از نشتی منابع، حتماً cleanup رو با try/finally داخل generator انجام بدید.