首页 / NODEJS / 在Node.js中爬取豆瓣数据（详细教程）

在Node.js中爬取豆瓣数据（详细教程）

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了在Node.js中爬取豆瓣数据（详细教程），小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含1482字，纯文字阅读大概需要3分钟。

内容图文

这篇文章通过实例给大家详细分析了Node.js爬取豆瓣数据的过程以及具体方法步骤，有兴趣的朋友可以参考学习下。

一直自以为自己vue还可以，一直自以为webpack还可以，今天在慕课逛node的时候，才发现，自己还差的很远。众所周知，vue-cli基于webpack，而webpack基于node，对node不了解，谈什么了解webpack。所以就自己给自己出了一道题，爬取豆瓣数据，目前还处于初级阶段。今天就浅谈爬取到豆瓣的数据，再另一个页面用自己的方式展现，后续会跟进。

1、需要解决的问题

搭建服务
怎么处理爬到的数据
怎么自动打开默认浏览器

2、搭建服务

搭建服务有好几种方式，一开始我用的http，但是http有个弊端就是不能解析https协议的url，所以就用了express，解析https协议的网址我用了request包，豆瓣的网址是https的，

今天爬取的是https://movie.douban.com/chart这个网址；如下图，我要获取的有三个部分，图片、电影名字、电影链接.

在Node.js中爬取豆瓣数据（详细教程） - 文章图片

3、怎么处理爬到的数据

我们用request爬到的数据，怎么处理呢？cheerio包可以让我们像Jq那样处理爬到的html数据。

①、首先解析数据，取到爬取网页的html数据；

在Node.js中爬取豆瓣数据（详细教程） - 文章图片

②、然后利用cheerio包操作爬到的数据，取到你想要的数据。

在Node.js中爬取豆瓣数据（详细教程） - 文章图片

③、取到数据，创建html，输出到页面。如下图，我用的字符串拼接，办法有点笨，还没有找到更好的办法。

在Node.js中爬取豆瓣数据（详细教程） - 文章图片

4、怎么自动打开默认浏览器

不知道你有没有看vue-cli中webpack的配置，自动打开浏览器，vue-cli用的opn包.

在Node.js中爬取豆瓣数据（详细教程） - 文章图片

这个包用起来很方便，引入包，直接调用opn（url）即可；

5、展示

在Node.js中爬取豆瓣数据（详细教程） - 文章图片

上面是我整理给大家的，希望今后会对大家有帮助。

javaScript实现鼠标在文字上悬浮时弹出悬浮层效果

使用Angular CLI进行单元测试和E2E测试的方法

使用Angular CLI进行Build(构建)和Serve详解

以上就是在Node.js中爬取豆瓣数据（详细教程）的详细内容，更多请关注Gxl网其它相关文章！

内容总结

以上是互联网集市为您收集整理的在Node.js中爬取豆瓣数据（详细教程）全部内容，希望文章能够帮你解决在Node.js中爬取豆瓣数据（详细教程）所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/288475.html

来源：【匿名】

【上一篇】redis在nodejs中应用实战项目分享【下一篇】node.js和php的区别有哪些？

更多 ►

【在Node.js中爬取豆瓣数据（详细教程）】教程文章相关的互联网学习教程文章

nodejs教程安装express及配置app.js文件的详细步骤

来自：http://www.jb51.net/article/36710.htm express.js是nodejs的一个MVC开发框架，并且支持jade等多种模板。下面简单来说说express的安装和app.js文件的配置，然后在今后的教程中一步一步使用express.js搭建个聊天室安装express.js如果你安装了npm，安装变得很简单，只需要在终端中运行下面的代码即可：复制代码代码如下:npm install express -gd -g代表安装到NODE_PATH的lib里面，而-d代表把相依性套件也一起安装。如果沒有...

Nodejs完成一个待办事项的实例教程【代码】

这是一个用Node完成的待办事项的Demo，支持手机端和PC浏览器端同时查看。下载地址：https://github.com/yangfanacc/Todo 在线查看效果可以访问这个网址：http://123.56.44.245:3460 效果图如下：首先介绍一个这个待办事项示例项目的搭建环境：1.Nodejs版本：v0.10.352.Mongodb(使用Mongoose连接Mongodb数据库)3.前台使用了国内比较好用的开源框架[Amaze](http://amazeui.org/)项目的结构二级截图如下：项目思路首先，需要一个网址可...

8/09 Nodejs 菜鸟教程学习笔记-mia

1.使用node.js时，我们不仅仅在实现一个应用，同时还实现了整个http服务器。2.node.js组成： rcquircd模块：rcquirc指令来载入Node.js模块创建服务器：服务器可以监听客户端请求，类似于Apache、Nginx等HTTP服务器接收请求与响应请求：服务器很容易创建，客户端可以使用浏览器或终端发送http请求，服务器接收请求后返回响应数据。3.NPM服务器相当于一个平台，可以下载别人编写的第三方包、命令行程序到本地使用，也允许用...

01Nodejs+MongoDb 零基础入门教程-（21讲）__ZC记录

1、2、3、4、E:\BaiduYunDownload\Koa2+Nodejs+MongoDb 入门实战视频教程\01Nodejs+MongoDb 零基础入门教程-（21讲）IT营大地2017年录制\04 NPM 命令使用第三方模块和 package.json 、cnpm安装 -avi　　npm install md5-node --save-dev　　npm install silly-datetime --save-dev　--save：　　写入 package.js里面的"dependencies"中　--save-dev：写入 package.js里面的"devDependencies"中，不去下载模块的测试和文档框架　...

在Debian（Raspberry Pi）树莓派上安装NodeJS的教程详解

在树莓派上运行NodeJS并不需要特别的配置，你只需要确保可以用openssh远程连接到你的树莓派。安装并配置Open SSH服务器它可以确保你能远程连接到树莓派，它应该已经被安装了，但是这个过程可以确保安装最新版和生成加密密钥。如果Raspberry Pi运行在headerlesss模式。没有显示器，键盘或鼠标的情况下，就需要通过网线连接到树莓派。 sudo apt-get install openssh-server sudo rm -rf /etc/ssh/ssh_host_* sudo dpkg-reconfigur...

nodejs入门教程四：URL相关模块用法分析【图】

本文实例讲述了nodejs入门教程之URL相关模块用法。分享给大家供大家参考，具体如下： 1.URL 模块：用于 URL 处理与解析 1）URI 与 URL ： URI，是uniform resource identifier，统一资源标识符，用来唯一的标识一个资源。 URL是uniform resource locator，统一资源定位器，它是一种具体的URI，即URL可以用来标识一个资源，而且还指明了如何locate（定位）这个资源。 2）URL模块中的方法： ① url.format(urlObject)：将一个 url 对...

安装使用Mongoose配合Node.js操作MongoDB的基础教程

安装mongoose 使用express准备一个TestMongoDB项目，命令序列如下： express TestMongoDB cd TestMongoDB npm install 执行完上面的命令后，使用下面的命令安装mongoose： npm install mongoose --save 这个命令会安装mongoose并将其作为项目的依赖，而mongoose依赖的MongoDB driver以及regexp等等模块也会被自动安装。实例使用mongoose可以新建数据库、新建集合、对集合内的文档进行CRUD操作，在写代码时，可以对照着mongo shel...

Node.js安装及环境配置教程【图】

一、安装环境1、本机系统：Windows 10 Pro（64位）2、Node.js：v6.9.2LTS（64位）本文主要为大家介绍一下Node.js安装及环境配置方法，本文的教程非常的详细，希望能帮助到大家。二、安装Node.js步骤1、下载对应你系统的Node.js版本:https://nodejs.org/en/download/2、选安装目录进行安装3、环境配置4、测试三、前期准备1、Node.js简介简单的说 Node.js 就是运行在服务端的 JavaScript。Node.js 是一个基于 Chrome V8 引擎的 JavaS...

从零开始学习Node.js系列教程四：多页面实现的数学运算示例

本文实例讲述了Node.js多页面实现的数学运算。分享给大家供大家参考，具体如下： app-node.js var http_port = 3000; var http = require(http); var htutil = require(./htutil); var server = http.createServer(function(req, res){htutil.loadParams(req, res, undefined);if (req.requrl.pathname === /){require(./home-node).get(req, res);}else if (req.requrl.pathname === /square){require(./square-node).get(req, re...

nodejs教程安装express及配置app.js文件的详细步骤

安装express.js 如果你安装了npm，安装变得很简单，只需要在终端中运行下面的代码即可：代码如下:npm install express -gd -g代表安装到NODE_PATH的lib里面，而-d代表把相依性套件也一起安装。如果沒有-g的话会安装目前所在的目录(会建立一个node_modules的文件夹)，你可以透过以下指令来比较两者的不同：代码如下:npm list -gnpm list 如果没有npm，那么我可以使用github来git下来最新的express。好了，现在你可以通过express te...

Centos6.8下Node.js安装教程

思路：采用编译好的文件进行安装一使用 wget 下载到 Node.js 官网（https://nodejs.org/en/download/）选择要下载的编译版本（Source Code），复制链接 cd /usr/local/src // 安装路径 wget https://nodejs.org/dist/v6.10.3/node-v6.10.3.tar.gz二解压缩文件包 tar xvf node-v6.10.3.tar.gz三 node 环境配置 vim /etc/profile在最下面加入 # node export NODE_HOME=/usr/local/src/node-v4.2.3-linux-x86 export PATH=$PATH:...

在Mac OS下使用Node.js的简单教程【图】

这里有一篇很好的 Node.js 介绍文章 great nodejs intro ，它将给你一个非常方便的介绍 Node.js 和 CouchDB，并给出一个实例实现 REST 的服务用于执行书签的 CRUD 操作，使用 CouchDB 作为数据库。本文将介绍在 Mac OS X 下安装并开始使用 Node.js ，这个过程大概需要 30 分钟左右的时间，其中我们还将安装 CouchDB，并实现基于 CouchDB 的 REST API。本文假设你机器上已经装有Git，如果还没有，请参考此文进行安装。安装 node....

利用node.js制作命令行工具方法教程（一）

前言之前使用过一些全局安装的NPM包，安装完之后，可以通过其提供的命令，完成一些任务。比如Fis3，可以通过fis3 server start 开启fis的静态文件服务，通过fis3 release开启文件编译与发布；还有vue-cli，可以通过vue init webpack my-project来初始化vue+webpack的项目基础配置。最近有一个需求，需要写一个类似vue-cli的NPM包，通过命令行操作实现项目初始配置，所以就查看了相关资料，学习了一下如何使用node来生成自己的命令...

node.js中EJS模板的使用教程

本篇文章主要介绍了EJS 模板快速入门学习，小编觉得挺不错的，现在分享给大家，也给大家做个参考。一起跟随小编过来看看吧Node 开源模板的选择很多，但推荐像我这样的老人去用 EJS，有 Classic ASP/PHP/JSP 的经验用起 EJS 来的确可以很自然，也就是说，你能够在 <%...%> 块中安排 JavaScript 代码，利用最传统的方式 <%=输出变量%>（另外 <%-输出变量是不会对 & 等符号进行转义的）。安装 EJS 命令如下：npm install ejsJS 调用JS...

详解Node.js 命令行程序开发教程

一种编程语言是否易用，很大程度上，取决于开发命令行程序的能力。Node.js 作为目前最热门的开发工具之一，怎样使用它开发命令行程序，是 Web 开发者应该掌握的技能。下面就是我在它的基础上扩展的教程，应该是目前最好的解决方案了。一、可执行脚本我们从最简单的讲起。首先，使用 JavaScript 语言，写一个可执行脚本 hello 。 #!/usr/bin/env node console.log(hello world);然后，修改 hello 的权限。 $ chmod 755 hello现在，...

NODEJS - 技术教程分类

Node.js 教程 Node.js 安装配置 Node.js 创建第一个应用 NPM 使用介绍 Node.js REPL Node.js 回调函数 Node.js 事件循环 Node.js EventEmitter Node.js Buffer Node.js Stream Node.js 模块系统 Node.js 函数 Node.js 路由 Node.js 全局对象 Node.js 常用工具 Node.js 文件系统 Node.js GET/POST请求 Node.js 工具模块 Node.js Web 模块 Node.js Express 框架 Node.js RESTful API Node.js 多进程 Node.js MySQL Node.js MongoDB nodejs 全部

NODEJS - 最热教程

Node.js Error: Cannot find module ex...如何使用node.js实现获取微信用户授权（...node.js中的npmupdate如何使用 nodejsnpm包管理的配置方法及常用命令介...node.js+Ajax实现获取HTTP服务器返回数...nodejs调用cmd命令实现复制目录_node.j...快速搭建Node.js(Express)用户注册、登...nodejs入门教程五：连接数据库的方法分...nodejs中自动启用服务==类似于前端的热...14款NodeJS Web框架推荐

首页 / NODEJS / 在Node.js中爬取豆瓣数据（详细教程）

在Node.js中爬取豆瓣数据（详细教程）

内容导读

内容图文

内容总结

内容备注

内容手机端

【在Node.js中爬取豆瓣数据（详细教程）】教程文章相关的互联网学习教程文章

nodejs教程安装express及配置app.js文件的详细步骤

Nodejs完成一个待办事项的实例教程【代码】

8/09 Nodejs 菜鸟教程学习笔记-mia

01Nodejs+MongoDb 零基础入门教程-（21讲）__ZC记录

在Debian（Raspberry Pi）树莓派上安装NodeJS的教程详解

nodejs入门教程四：URL相关模块用法分析【图】

安装使用Mongoose配合Node.js操作MongoDB的基础教程

Node.js安装及环境配置教程【图】

从零开始学习Node.js系列教程四：多页面实现的数学运算示例

nodejs教程安装express及配置app.js文件的详细步骤

Centos6.8下Node.js安装教程

在Mac OS下使用Node.js的简单教程【图】

利用node.js制作命令行工具方法教程（一）

node.js中EJS模板的使用教程

详解Node.js 命令行程序开发教程

数据 - 相关标签

NODEJS - 技术教程分类

NODEJS - 最新教程

NODEJS - 最热教程