خانه/مقالات

مقالات

همه
برنامه نویسی
آموزش وب اسکرپینگ از صفر تا صد
اسکرپینگ با پایتون (Python)
اسکرپینگ با Selenium و Playwright
طراحی خزنده و وب‌کراولینگ
ابزارها و فریم‌ورک‌ها (Scrapy, Puppeteer و …)
مدیریت پروکسی و چرخش IP
بهینه‌سازی درخواست‌ها و جلوگیری از بلاک‌شدن
قوانین، اخلاق و robots.txt در وب اسکرپینگ
استخراج داده از سایت‌های پویا و SPA
پاکسازی، نرمال‌سازی و ذخیره‌سازی داده
زمان‌بندی و اتوماسیون خزش
پاکسازی، نرمال‌سازی و ذخیره‌سازی داده
1404-12-12
ذخیره‌سازی در اسکریپینگ با Scrapy
این راهنما به‌صورت گام‌به‌گام روش‌های متداول ذخیره‌سازی داده در اسکریپینگ با Scrapy را پوشش می‌دهد: خروجی‌گیری به JSON/CSV، ارسال به S3 و ذخیره در MySQL/Postgres با استفاده از Item Pipelines. نکات امنیتی، عملکردی و نمونه‌کدهای عملی برای استفاده در پروژه‌های واقعی ارائه شده است.
زمان‌بندی و اتوماسیون خزش
1404-12-11
استقرار و زمان‌بندی اسکریپینگ با Scrapy
این مقاله مرحله‌به‌مرحله نشان می‌دهد چگونه پروژه‌های Scrapy را برای اجرا در سرور آماده، مانیتور و زمان‌بندی کنید؛ تنظیم ScrapeOps، ساخت requirements، استقرار روی VPS (مثل Digital Ocean)، کلون کردن ریپازیتوری، مدیریت خطاها و ذخیرهٔ خروجی‌ها در PostgreSQL همراه با مثال‌های کد و نکات امنیتی توضیح داده شده‌اند.
ابزارها و فریم‌ورک‌ها (Scrapy, Puppeteer و …)
1404-12-10
اسکریپینگ با Scrapy: پاک‌سازی داده و موارد مرزی
راهنمای عملی برای ساخت اسپایدرهای مقاوم با Scrapy: چگونگی سازماندهی داده با Items، پاک‌سازی هنگام استخراج با Item Loaders و پردازش نهایی و حذف تکراری‌ها با Item Pipelines به همراه مثال‌های کد و نکات عملکردی و امنیتی.
ابزارها و فریم‌ورک‌ها (Scrapy, Puppeteer و …)
1404-12-09
حل خطای 503 در اسکریپینگ با Scrapy
این مقاله گام‌به‌گام به شما نشان می‌دهد چگونه خطای HTTP 503 را هنگام اسکریپینگ با Scrapy تشخیص و رفع کنید: ابتدا بررسی وضعیت سرور، سپس استفاده از User-Agent جعلی و بهینه‌سازی هدرها، و در صورت نیاز به پراکسی‌های چرخان و مدیریت retry برای پایداری بلندمدت. توصیه‌ها عملی و شامل نمونه‌های کد برای pythonscrapy هستند.
بهینه‌سازی درخواست‌ها و جلوگیری از بلاک‌شدن
1404-12-08
رفع خطای 403 در اسکریپینگ با Scrapy
این مقاله تشخیص و رفع خطای 403 در اسکریپینگ با Scrapy را توضیح می‌دهد: چطور بدنهٔ پاسخ 403 را ببینید، چرا سایت‌ها شما را بلاک می‌کنند و چگونه با تنظیمات دانلود، یوزر-اجنت چرخشی، هدرهای بهینه و پراکسی چرخشی از بن شدن جلوگیری کنید.
اسکرپینگ با پایتون (Python)
1404-12-08
چگونه نتایج جستجوی گوگل را با پایتون استخراج کنیم
مقاله می‌گوید اسکرپ نتایج گوگل با پایتون به‌خاطر تغییرات دائمی HTML و ضدبات‌های گوگل سخت و شکننده می‌شود. یک روش عملی با Requests و BeautifulSoup برای استخراج عنوان/لینک/اسنیپت و صفحه‌بندی همراه با ریت‌لیمیت و Retry پیشنهاد می‌کند. در پایان می‌گوید برای استفاده پایدار و مقیاس، بهتر است سراغ APIهای آماده مثل Asanscrape بروید.
ابزارها و فریم‌ورک‌ها (Scrapy, Puppeteer و …)
1404-12-07
اسکریپینگ Walmart با Scrapy: راهنمای عملی
این راهنما نشان می‌دهد چگونه با Scrapy یک اسکریپر عملی برای Walmart بسازید: طراحی معماری discovery + product scraper، استخراج JSON از تگ __NEXT_DATA__, صفحه‌بندی و محدودیت 25 صفحه، ذخیره‌سازی با FEEDS یا پایپلاین، و روش‌های مقابله با محافظت ضد-ربات مثل پراکسی چرخشی و headless browser. همچنین نکات مربوط به مانیتورینگ، بهترین‌روش‌های عملی و استقرار در محیط تولید پوشش داده شده‌اند.
اسکرپینگ با پایتون (Python)
1404-12-05
اسکریپینگ با Scrapy برای جاب‌های LinkedIn
این مقاله یک راهنمای عملی و فنی برای ساخت اسکریپر جاب‌های LinkedIn با Python Scrapy است؛ از کشف endpoint و نوشتن اسپایدر تا صفحه‌بندی، ادغام پراکسی و مانیتورینگ. نکات امنیتی، بهترین‌روش‌ها و مثال‌های کدی برای اجرای تولیدی نیز پوشش داده شده‌اند.
طراحی خزنده و وب‌کراولینگ
1404-12-04
آموزش اسکریپینگ لینکدین با Scrapy
راهنمای عملی ساخت اسپایدر Scrapy برای پروفایل‌های عمومی شرکت در LinkedIn: شامل کد نمونه، نکات استخراج با response.css، روش‌های مقابله با سیستم‌های ضدربات، نمونه تنظیم پراکسی و مانیتورینگ، و توصیه‌هایی برای اجرا و زمان‌بندی در کلود.
استخراج داده از سایت‌های پویا و SPA
1404-12-03
وب اسکریپینگ با Scrapy: اسکریپ کردن نظرات Amazon
در این مقاله عملی با Scrapy می‌آموزید چگونه نظرات محصولات Amazon را با روشی پایدار اسکریپ کنید: از استفاده از ASIN و جستجو برای یافتن آدرس محصول تا استخراج نظرات، مدیریت صفحه‌بندی، ذخیره‌سازی خروجی و مقابله با محافظت‌های ضدبات با پراکسی و مانیتورینگ.
طراحی خزنده و وب‌کراولینگ
1404-12-02
اسکریپ کردن محصولات آمازون با Scrapy
راهنمایی عملی برای ساخت یک اسپایدر Scrapy جهت اسکریپ محصولات آمازون: از طراحی معماری و crawler صفحات جستجو تا parser صفحه محصول، ذخیره‌سازی با FEEDS، مقابله با محافظت‌های ضدربات و نکات عملی برای اجرای پایدار در تولید.
ابزارها و فریم‌ورک‌ها (Scrapy, Puppeteer و …)
1404-12-01
نظارت اسپایدرهای Scrapy در وب اسکریپینگ
این راهنما چهار روش نظارت روی اسپایدرهای Scrapy را بررسی می‌کند: لاگ‌ها و آمار داخلی، ابزارهای اختصاصی مانیتورینگ، Spidermon برای تست‌های اعتبارسنجی و ابزارهای عمومی لاگینگ. با مثال‌های پایتون و تنظیمات عملی، توصیه‌های استقرار و یک چک‌لیست عملی برای تولید ارائه شده است.