首页 / JSON / python – Scrapy process.crawl()将数据导出到json

python – Scrapy process.crawl()将数据导出到json

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了python – Scrapy process.crawl()将数据导出到json，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含1009字，纯文字阅读大概需要2分钟。

内容图文

python – Scrapy process.crawl()将数据导出到json

这可能是Passing arguments to process.crawl in Scrapy python的一个子问题,但作者将答案(不能回答我问自己的问题)作为令人满意的答案.

这是我的问题：我不能使用scrapy抓取mySpider -a start_urls(myUrl)-o myData.json
相反,我想/需要使用crawlerProcess.crawl(蜘蛛)我已经找到了几种传递参数的方法(无论如何它在我链接的问题中得到了解答)但我无法理解我应该如何告诉它将数据转储到myData.json … -o myData.json部分
有人有建议吗？或者我只是不理解它应该如何工作..？

这是代码：

crawlerProcess = CrawlerProcess(settings)
crawlerProcess.install()
crawlerProcess.configure()

spider = challenges(start_urls=["http://www.myUrl.html"])
crawlerProcess.crawl(spider)
#For now i am just trying to get that bit of code to work but obviously it will become a loop later.

dispatcher.connect(handleSpiderIdle, signals.spider_idle)

log.start()
print "Starting crawler."
crawlerProcess.start()
print "Crawler stopped."

解决方法:

您需要在设置上指定它：

process = CrawlerProcess({
    'FEED_URI': 'file:///tmp/export.json',
})

process.crawl(MySpider)
process.start()

内容总结

以上是互联网集市为您收集整理的python – Scrapy process.crawl()将数据导出到json全部内容，希望文章能够帮你解决python – Scrapy process.crawl()将数据导出到json所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/809591.html

来源：【匿名】

【上一篇】c# – Automapper：将JSON转换为对象列表【下一篇】浅析php中json_encode()和json_decode()

更多 ►

【python – Scrapy process.crawl()将数据导出到json】教程文章相关的互联网学习教程文章

【python】-- json & pickle、xml、requests、hashlib、shelve、shutil、configparser、subprocess【代码】

json & picklePython中用于序列化的两个模块json 用于【字符串】和【python基本数据类型】间进行转换pickle 用于【python特有的类型】和【python基本数据类型】间进行转换Json模块提供了四个功能：dumps、dump、loads、load1、dumps序列化和loads反序列化dumps()序列化import json #导入json模块 info = {‘name‘:"zhangqigao","age":22 }with open("test.txt","w") as f: #以普通模式写入data = json.dumps(info)...

Jmeter BeanShell PostProcessor提取json数据【代码】【图】

需求：提取sample返回json数据中所有name字段值，返回的json格式如下： {“body”:{“apps”:[{“name”:”111”},{“name”:”222”}]}} jmeter中添加后置处理器BeanShell PostProcessor import org.json.*;String response_data = prev.getResponseDataAsString(); JSONObject data_obj = new JSONObject(response_data); String apps_str = data_obj.get("body").get("apps").toString(); JSONArray apps_array = new JSONArra...

jmeter里json path postprocessor的用法【图】

后置处理器添加 json path postprocessor。用处：当前接口响应返回的json中提取内容，作为变量可以在不同的请求中传递。如下，从登陆接口返回的json中提取user id，变量名设置为id，在其他请求中可以直接调用这个变量，或者作为post参数。次插件对于restful接口非常好用 ??原文：http://www.cnblogs.com/alex007chn/p/6272458.html

利用NodeJS的子进程(child_process)调用系统命令的方法分享_json

NodeJS子进程简介 NodeJS子进程提供了与系统交互的重要接口，其主要API有：标准输入、标准输出及标准错误输出的接口。 NodeJS子进程简介 NodeJS 子进程提供了与系统交互的重要接口，其主要 API 有：标准输入、标准输出及标准错误输出的接口 child.stdin 获取标准输入 child.stdout 获取标准输出 child.stderr 获取标准错误输出获取子进程的PID：child.pid 提供生成子进程的重要方法：child_process.spawn(cmd, args=[], [option...

java.lang.ClassNotFoundException: org.springframework.boot.configurationprocessor.json.JSONException【代码】

原因是：spring-boot-configuration-processor包没有被实际依赖进来。这个有很多种情况会这样，比如说我的是这样的：我coomon工程是通用工程，里面放一些实体类，然后我就加入了myabtisplus的starter，然后myabtisplus依赖了spring-boot-configuration-processor,但是却是optional的，也就是说其他地方如果没有显式的依赖，那么则不会被依赖，而且我的common工程如果被合着业务服务打包后，common是不会携带spring-boot-configur...

javascript – 使用Processing-JS中的JSON

我想用processing-JS编写一个应用程序,我希望能够用服务器端数据加载它.我还没有编写服务器端,所以我可以使用任何东西,但似乎明显的AJAX就是使用JSON将数据上传到页面中. 如何从我的处理代码访问该数据？它是否像数据在范围内一样简单,或者可以附加到窗口对象并直接从处理代码访问？更新：让我稍微改进一下这个问题.我对JSON感到满意(但感谢链接)以及为客户端和服务器编写代码;我真正的问题(这无疑可能有些愚蠢)是：如果我用例如J...