python3.6爬虫需要安装的模块

本文涉及的产品
云数据库 MongoDB,通用型 2核4GB
简介:

  内置库

        urllib

        re

    需要安装的库

        requests

            pip3 install requests

        selenium

            pip3 install  selenium

        chromedriver

            下载驱动,放在配置好的环境变量下

            http://npm.taobao.org/mirrors/chromedriver/

        phantomjs(无界面浏览器)

            下载,并且配置环境变量

            http://phantomjs.org/

        lxml

            pip3 install lxml

            可能下载失败

            用下面的方式安装

            https://pypi.python.org/pypi/lxml

            

            

            首先安装

            pip3 install wheel

            然后载pip3 install 下载的文件路径和名字

        beautifulsoup4(依赖lxml)

            pip3 install beautifulsoup4

        pyquery

            pip3 install pyquery

    存储库:

        pymysql

            pip3 install pymysql

        pymongo

            pip3 install pymongo

        redis

            pip3 install redis

        flask(代理IP的库)

            pip3 install flask

        django

            pip3 install django

        jupyter(强大的记事本)

            pip3 install jupyter

            jupyter notebook(启动服务)

    框架:

        PySpider

            pip3 install PySpider

        scrapy

            1. wheel

                pip install wheel

            2. lxml

                http://www.lfd.uci.edu/~gohlke/pythonlibs/#lxml

            3. PyOpenssl

                https://pypi.python.org/pypi/pyOpenSSL#downloads

            4. Twisted

                http://www.lfd.uci.edu/~gohlke/pythonlibs/#twisted

                链接:https://pan.baidu.com/s/1oAh2Dse 密码:okk0

            5. Pywin32

                https://sourceforge.net/projects/pywin32/files/pywin32/Build%20220/

                https://sourceforge.net/projects/pywin32/files/pywin32/Build%20221/pywin32-221.win-amd64-py3.6.exe/download

                软件和出现问题修复脚本,

                链接:https://pan.baidu.com/s/1mj2VjxI 密码:ls54

            6. Scrapy

                pip3 install scrapy


 

MongoDB 的安装:



   

启动服务:

    D:\Program Files\MongoDB\Server\3.6\bin>"D:\Program Files\MongoDB\Server\3.6\bin\mongod.exe" --dbpath ../data/db


配置可视化服务:

    建立日志文件在c盘创建C:\data\db文件夹和C:\data\logs\logs.txt文件

    D:\Program Files\MongoDB\Server\3.6\bin>mongod --bind_ip 0.0.0.0 --logpath C:\data\logs\logs.txt  --logappend --dbpath C:\data\db --port 27017 --serviceName "mongodb" --serviceDisplayName "mongodb" --install

 


图形化管理页面软件

    https://download.robomongo.org/1.2.1/windows/robo3t-1.2.1-windows-x86_64-3e50a65.exe



redis数据库安装:


参考上篇博客:    

    http://blog.51cto.com/tdcqvip/2072845


本文转自 天道酬勤VIP 51CTO博客,原文链接:http://blog.51cto.com/tdcqvip/2073149

相关实践学习
MongoDB数据库入门
MongoDB数据库入门实验。
快速掌握 MongoDB 数据库
本课程主要讲解MongoDB数据库的基本知识,包括MongoDB数据库的安装、配置、服务的启动、数据的CRUD操作函数使用、MongoDB索引的使用(唯一索引、地理索引、过期索引、全文索引等)、MapReduce操作实现、用户管理、Java对MongoDB的操作支持(基于2.x驱动与3.x驱动的完全讲解)。 通过学习此课程,读者将具备MongoDB数据库的开发能力,并且能够使用MongoDB进行项目开发。   相关的阿里云产品:云数据库 MongoDB版 云数据库MongoDB版支持ReplicaSet和Sharding两种部署架构,具备安全审计,时间点备份等多项企业能力。在互联网、物联网、游戏、金融等领域被广泛采用。 云数据库MongoDB版(ApsaraDB for MongoDB)完全兼容MongoDB协议,基于飞天分布式系统和高可靠存储引擎,提供多节点高可用架构、弹性扩容、容灾、备份回滚、性能优化等解决方案。 产品详情: https://www.aliyun.com/product/mongodb
相关文章
|
10天前
|
数据采集 Python
【python】爬虫-西安医学院-校长信箱
本文以西安医学院-校长信箱为基础来展示爬虫案例。来介绍python爬虫。
【python】爬虫-西安医学院-校长信箱
|
16天前
|
存储 开发者 Python
Python中的collections模块与UserDict:用户自定义字典详解
【4月更文挑战第2天】在Python中,`collections.UserDict`是用于创建自定义字典行为的基类,它提供了一个可扩展的接口。通过继承`UserDict`,可以轻松添加或修改字典功能,如在`__init__`和`__setitem__`等方法中插入自定义逻辑。使用`UserDict`有助于保持代码可读性和可维护性,而不是直接继承内置的`dict`。例如,可以创建一个`LoggingDict`类,在设置键值对时记录操作。这样,开发者可以根据具体需求定制字典行为,同时保持对字典内部管理的抽象。
|
16天前
|
数据采集 安全 Python
python并发编程:Python实现生产者消费者爬虫
python并发编程:Python实现生产者消费者爬虫
23 0
python并发编程:Python实现生产者消费者爬虫
|
18天前
|
存储 缓存 算法
Python中collections模块的deque双端队列:深入解析与应用
在Python的`collections`模块中,`deque`(双端队列)是一个线程安全、快速添加和删除元素的双端队列数据类型。它支持从队列的两端添加和弹出元素,提供了比列表更高的效率,特别是在处理大型数据集时。本文将详细解析`deque`的原理、使用方法以及它在各种场景中的应用。
|
3天前
|
Python
python学习14-模块与包
python学习14-模块与包
|
5天前
|
SQL 关系型数据库 数据库
Python中SQLite数据库操作详解:利用sqlite3模块
【4月更文挑战第13天】在Python编程中,SQLite数据库是一个轻量级的关系型数据库管理系统,它包含在一个单一的文件内,不需要一个单独的服务器进程或操作系统级别的配置。由于其简单易用和高效性,SQLite经常作为应用程序的本地数据库解决方案。Python的内置sqlite3模块提供了与SQLite数据库交互的接口,使得在Python中操作SQLite数据库变得非常容易。
|
7天前
|
Ubuntu Python
python3安装clickhouse_sqlalchemy(greenlet) 失败
如果上述方法仍然无法解决问题,建议查阅相关错误信息和官方文档,以获取更详细的帮助。确保你的Python环境和依赖库都在最新版本,有时问题可能会因为版本不兼容而导致安装失败。
14 0
|
10天前
|
索引 Python
「Python系列」Python operator模块、math模块
Python的`operator`模块提供了一系列内置的操作符函数,这些函数对应于Python语言中的内建操作符。使用`operator`模块可以使代码更加清晰和易读,同时也能提高性能,因为它通常比使用Python内建操作符更快。
27 0
|
11天前
|
数据采集 存储 前端开发
Python爬虫如何快速入门
写了几篇网络爬虫的博文后,有网友留言问Python爬虫如何入门?今天就来了解一下什么是爬虫,如何快速的上手Python爬虫。
17 0
|
11天前
|
数据采集 机器学习/深度学习 人工智能
Python环境搭建—安装Python3解释器
Python环境搭建—安装Python3解释器
31 2

热门文章

最新文章