🌱 Open Source

🌍 Live Open Source Explorer

Explore live open-source projects and AI models.

Search public open-source repositories from GitHub and AI models from Hugging Face. Every page shows 10 results with clean pagination.

🔎 Live Search

Search live open-source data

Search GitHub repositories and Hugging Face models directly, then explore stars, downloads, source links and project details.

Reset Search
🔎
🌐

Try keywords like automation, CRM, analytics, chatbot, llama or workflow.

Choose where to search live data.

Live Results

GitHub Open Source Repositories

Search: scrapy-mongodb

Page 1

Showing 10 results from 42

L

wistbean/learn_python3_spider

GitHub Python MIT License

python爬虫教程系列、从0到1学习python爬虫,包括浏览器抓包,手机APP抓包,如 fiddler、mitmproxy,各种爬虫涉及的模块的使用,如:requests、beautifulSoup、selenium、appium、scrapy等,以及IP代理,验证码识别,Mysql,MongoDB数据库的python使用,多线程多进程爬虫的使用,css 爬虫加密逆向破解,JS爬虫逆向,分布式爬虫,爬虫项目实战实例等

★ 21,849 Forks 3,923 wistbean Updated 29 Jun 2026
P

Kr1s77/Python-crawler-tutorial-starts-from-zero

GitHub Python

python爬虫教程,带你从零到一,包含js逆向,selenium, tesseract OCR识别,mongodb的使用,以及scrapy框架

★ 4,602 Forks 761 Kr1s77 Updated 26 Jun 2026
D

gnemoug/distribute_crawler

GitHub Python

使用scrapy,redis, mongodb,graphite实现的一个分布式网络爬虫,底层存储mongodb集群,分布式使用redis实现,爬虫状态显示使用graphite实现

★ 3,244 Forks 1,562 gnemoug Updated 23 Jun 2026
F

fankcoder/findtrip

GitHub Python

机票爬虫(去哪儿和携程网)。flight tickets multiple webspider.(scrapy + selenium + phantomjs + mongodb)

★ 486 Forks 247 fankcoder Updated 25 Jun 2026
S

sebdah/scrapy-mongodb

GitHub Python Other

MongoDB pipeline for Scrapy. This module supports both MongoDB in standalone setups and replica sets. scrapy-mongodb will insert the items to MongoDB as soon as your spider finds data to extract.

★ 358 Forks 97 sebdah Updated 08 Apr 2026
T

shisiying/tc_zufang

GitHub CSS

使用scrapy,redis, mongodb,django实现的一个分布式网络爬虫,底层存储mongodb,分布式使用redis实现,使用django可视化爬虫

★ 280 Forks 125 shisiying Updated 19 May 2026
P

kenser/PornHubBot

GitHub Python MIT License

全球最大成人网站PornHub爬虫 (Scrapy、MongoDB)

★ 163 Forks 1,557 kenser Updated 29 Jun 2026
R

Frank-qlu/recruit

GitHub Python Apache License 2.0

recruit 招聘爬虫+数据分析 1.爬虫: 采用Scrapy 分布式爬虫技术,使用mongodb作为数据存储,爬取的网站Demo为51job,数据我目前爬了有几千条 2.数据处理: 采用pandas对爬取的数据进行清洗和处理 2.数据分析: 采用flask后端获取mongodb数据,前端使用bootstrap3.echarts以及D3的词云图,如果喜欢请star or Fork,预览详见

★ 144 Forks 38 Frank-qlu Updated 28 Feb 2026
D

zhangslob/docs

GitHub

《数据采集从入门到放弃》源码。内容简介:爬虫介绍、就业情况、爬虫工程师面试题 ;HTTP协议介绍; Requests使用 ;解析器Xpath介绍; MongoDB与MySQL; 多线程爬虫; Scrapy介绍 ;Scrapy-redis介绍; 使用docker部署; 使用nomad管理docker集群; 使用EFK查询docker日志

★ 137 Forks 30 zhangslob Updated 10 Apr 2026
S

wen-fei/SinaWeiboSpider

GitHub Python MIT License

A web spider for Sina Weibo, based on Scrapy framework and mongodb database.

★ 110 Forks 20 wen-fei Updated 13 Mar 2023
Pagination Page 1 of 5

10 results on this page · 42 total found

Showing first 42 accessible GitHub results.