🌍 Live Open Source Explorer
Explore live open-source projects and AI models.
Search public open-source repositories from GitHub and AI models from Hugging Face. Every page shows 10 results with clean pagination.
🔎 Live Search
Search live open-source data
Search GitHub repositories and Hugging Face models directly, then explore stars, downloads, source links and project details.
Live Results
GitHub Open Source Repositories
Search: scrapy-mongodb
Page 1
Showing 10 results from 42
wistbean/learn_python3_spider
GitHub Python MIT Licensepython爬虫教程系列、从0到1学习python爬虫,包括浏览器抓包,手机APP抓包,如 fiddler、mitmproxy,各种爬虫涉及的模块的使用,如:requests、beautifulSoup、selenium、appium、scrapy等,以及IP代理,验证码识别,Mysql,MongoDB数据库的python使用,多线程多进程爬虫的使用,css 爬虫加密逆向破解,JS爬虫逆向,分布式爬虫,爬虫项目实战实例等
External source
GitHub
Kr1s77/Python-crawler-tutorial-starts-from-zero
GitHub Pythonpython爬虫教程,带你从零到一,包含js逆向,selenium, tesseract OCR识别,mongodb的使用,以及scrapy框架
External source
GitHub
gnemoug/distribute_crawler
GitHub Python使用scrapy,redis, mongodb,graphite实现的一个分布式网络爬虫,底层存储mongodb集群,分布式使用redis实现,爬虫状态显示使用graphite实现
External source
GitHub
fankcoder/findtrip
GitHub Python机票爬虫(去哪儿和携程网)。flight tickets multiple webspider.(scrapy + selenium + phantomjs + mongodb)
External source
GitHub
sebdah/scrapy-mongodb
GitHub Python OtherMongoDB pipeline for Scrapy. This module supports both MongoDB in standalone setups and replica sets. scrapy-mongodb will insert the items to MongoDB as soon as your spider finds data to extract.
External source
GitHub
shisiying/tc_zufang
GitHub CSS使用scrapy,redis, mongodb,django实现的一个分布式网络爬虫,底层存储mongodb,分布式使用redis实现,使用django可视化爬虫
External source
GitHub
kenser/PornHubBot
GitHub Python MIT License全球最大成人网站PornHub爬虫 (Scrapy、MongoDB)
External source
GitHub
Frank-qlu/recruit
GitHub Python Apache License 2.0recruit 招聘爬虫+数据分析 1.爬虫: 采用Scrapy 分布式爬虫技术,使用mongodb作为数据存储,爬取的网站Demo为51job,数据我目前爬了有几千条 2.数据处理: 采用pandas对爬取的数据进行清洗和处理 2.数据分析: 采用flask后端获取mongodb数据,前端使用bootstrap3.echarts以及D3的词云图,如果喜欢请star or Fork,预览详见
External source
GitHub
zhangslob/docs
GitHub《数据采集从入门到放弃》源码。内容简介:爬虫介绍、就业情况、爬虫工程师面试题 ;HTTP协议介绍; Requests使用 ;解析器Xpath介绍; MongoDB与MySQL; 多线程爬虫; Scrapy介绍 ;Scrapy-redis介绍; 使用docker部署; 使用nomad管理docker集群; 使用EFK查询docker日志
External source
GitHub
wen-fei/SinaWeiboSpider
GitHub Python MIT LicenseA web spider for Sina Weibo, based on Scrapy framework and mongodb database.
External source
GitHub
10 results on this page · 42 total found
Showing first 42 accessible GitHub results.