首页 / PYTHON / python-unionAll导致StackOverflow

python-unionAll导致StackOverflow

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了python-unionAll导致StackOverflow，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含3018字，纯文字阅读大概需要5分钟。

内容图文

我在StackOverflow上遇到了自己的问题(how to load a dataframe from a python requests stream that is downloading a csv file?),已经取得了一些进展,但是我收到了StackOverflow错误：

import requests
import numpy as np
import pandas as pd

import sys
if sys.version_info[0] < 3: 
    from StringIO import StringIO
else:
    from io import StringIO

from pyspark.sql import SQLContext
sqlContext = SQLContext(sc)

chunk_size = 1024

url = "https://{0}:8443/gateway/default/webhdfs/v1/{1}?op=OPEN".format(host, filepath)

r = requests.get(url, auth=(username, password), 
                 verify=False, allow_redirects=True, 
                 stream=True)

df = None
curr_line = 1
remainder = ''
for chunk in r.iter_content(chunk_size):
    txt = remainder + chunk
    [lines, remainder] = txt.rsplit('\n', 1)

    pdf = pd.read_csv(StringIO(lines), sep='|', header=None)

    if df == None:
        df = sqlContext.createDataFrame(pdf)
    else:
        df = df.unionAll(sqlContext.createDataFrame(pdf))

print df.count()

堆栈跟踪在这里：

---------------------------------------------------------------------------
Py4JJavaError                             Traceback (most recent call last)
<ipython-input-4-b3a89df3c7d8> in <module>()
     36         df = sqlContext.createDataFrame(pdf)
     37     else:
---> 38         df = df.unionAll(sqlContext.createDataFrame(pdf))
     39 
     40     #curr_line = curr_line + 1

/usr/local/src/spark160master/spark/python/pyspark/sql/dataframe.py in unionAll(self, other)
    993         This is equivalent to `UNION ALL` in SQL.
    994         """
--> 995         return DataFrame(self._jdf.unionAll(other._jdf), self.sql_ctx)
    996 
    997     @since(1.3)

/usr/local/src/spark160master/spark/python/lib/py4j-0.9-src.zip/py4j/java_gateway.py in __call__(self, *args)
    811         answer = self.gateway_client.send_command(command)
    812         return_value = get_return_value(
--> 813             answer, self.gateway_client, self.target_id, self.name)
    814 
    815         for temp_arg in temp_args:

/usr/local/src/spark160master/spark/python/pyspark/sql/utils.py in deco(*a, **kw)
     43     def deco(*a, **kw):
     44         try:
---> 45             return f(*a, **kw)
     46         except py4j.protocol.Py4JJavaError as e:
     47             s = e.java_exception.toString()

/usr/local/src/spark160master/spark/python/lib/py4j-0.9-src.zip/py4j/protocol.py in get_return_value(answer, gateway_client, target_id, name)
    306                 raise Py4JJavaError(
    307                     "An error occurred while calling {0}{1}{2}.\n".
--> 308                     format(target_id, ".", name), value)
    309             else:
    310                 raise Py4JError(

Py4JJavaError: An error occurred while calling o19563.unionAll.
: java.lang.StackOverflowError

我不确定如何解决此问题.任何提示表示赞赏.

解决方法:

您不应该在不控制分区数量的情况下迭代地合并分布式数据结构.您会找到一个完整的解释,说明Stackoverflow due to long RDD Lineage中发生了什么,但是不幸的是DataFrames有点棘手：

dfs = ... # A list of pyspark.sql.DataFrame

def unionAll(*dfs):
    if not dfs:
        raise ValueError()
    first = dfs[0]
    return df.sql_ctx.createDataFrame(
        df._sc.union([df.rdd for df in dfs]), first.schema
    )

unionAll(*dfs)

内容总结

以上是互联网集市为您收集整理的python-unionAll导致StackOverflow全部内容，希望文章能够帮你解决python-unionAll导致StackOverflow所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/692322.html

来源：【匿名】

【上一篇】如何在python中运行多行bash命令？【下一篇】浅谈PHP运行Python脚本的方法

更多 ►

【python-unionAll导致StackOverflow】教程文章相关的互联网学习教程文章

Python load json file with UTF-8 BOM header - Stack Overflow【代码】

Python load json file with UTF-8 BOM header - Stack Overflow12down voteacceptedYou can open with codecs:import json import codecsjson.load(codecs.open(‘sample.json‘,‘r‘,‘utf-8-sig‘))or decode with utf-8-sig yourself and pass to loads:json.loads(open(‘sample.json‘).read().decode(‘utf-8-sig‘))原文：http://www.cnblogs.com/lexus/p/3731344.html

python如何使用 os.path.exists()--Learning from stackoverflow【代码】

Q&A参考连接 Problem：IOError: [Errno 2] No such file or directory。os.path.exists() 如果目录不存在，会返回一个0值。所以，如果你如下使用该函数，会得到 Problem 中描述的错误，而且错误会定位在其他地方：import os try: os.path.exists("E:/Contact") #Check if dir exist except:os.mkdir("E:/Contact") #if not, create正确的使用方式如下：ifnot os.path.exists("E:/Contact"):os.mkdir("E:/Contact") /*‘).a...

[踩坑] Django "OverflowError: Python int too large to convert to C long" 错误【图】

转自：https://blog.csdn.net/June7_/article/details/99991680 问题描述使用Django框架，在使用model操作数据库的时候，出现 Django "OverflowError: Python int too large to convert to C long" 错误。以下参照https://blog.csdn.net/June7_/article/details/99991680 解决该问题。注意：该错误出现原因不仅是model数据库操作导致的，可能还有其他原因，这里只针对数据库操作时报的错误。解决问题 PS：如果不想看流程的...

python-unionAll导致StackOverflow【代码】

我在StackOverflow上遇到了自己的问题(how to load a dataframe from a python requests stream that is downloading a csv file?),已经取得了一些进展,但是我收到了StackOverflow错误：import requests import numpy as np import pandas as pdimport sys if sys.version_info[0] < 3: from StringIO import StringIO else:from io import StringIOfrom pyspark.sql import SQLContext sqlContext = SQLContext(sc)chunk_size = 1...

Python“OverflowError”【代码】

我刚开始学习用Python编写代码.我正在尝试编写一些代码来回答这个Project Euler问题： 13195的主要因素是5,7,13和29. 600851475143的最大主要因素是什么？我的程序适用于13195的测试用例,但是当我尝试输入600851475143时,我收到错误：“OverflowError：range()结果有太多项目”有谁知道我怎么解决这个问题？这是我的代码：class Euler3:"A class to find the largest prime factor of a given number"n = 600851475143primeFacto...

StackOverflow 周报 - 第四周高质量问题的问答（Java、Python）【图】

这是 Stack Overflow 第三周周报，由于本周周四外出，所以只有三篇内容。两篇 Java、一篇 Python。公众号「渡码」为日更，欢迎关注。 DAY1. 枚举对象 == 和 equals 区别我们在比较枚举常量时可以使用 == 运算符或者 equals 方法，如：先考虑第一个问题：为什么可以用 == 判断枚举常量相等？我们都知道判断对象的相等应该用 equals 方法，== 只是判断对象的引用是否相等，枚举常量能够使用 == 判断相等是因为枚举常量除了定义时...

python – OverflowError：(34,’结果太大’)【代码】

我收到溢出错误(OverflowError：(34,’结果太大’)我想计算pi到100的小数,这是我的代码：def pi(): pi = 0 for k in range(350): pi += (4./(8.*k+1.) - 2./(8.*k+4.) - 1./(8.*k+5.) - 1./(8.*k+6.)) / 16.**k return pi print(pi())解决方法:Python浮点数既不是仲裁精度也不是无限大小.当k = 349时,16.** k太大 – 几乎是2 ^ 1400.幸运的是,十进制库允许任意精度并且可以处理大小：import decimal decimal.getcontext().prec = ...

StackOverflow 周报 - 高质量问题的问答（Java、Python）【代码】【图】

这是 Stack Overflow 第三周周报，本周加入了 Python 的内容，原计划两篇 Java、两篇 Python。但明天过节所以今天就先把周报发了，两篇 Java、一篇 Python。公众号「渡码」为日更，欢迎关注。 DAY1. 使用随机数打印"hello world" 今天我们看一个有意思的例子，看看下面的代码为什么每次运行都能输出 "hello world"。public static String randomString(int i) {Random ran = new Random(i);StringBuilder sb = new StringBuilder()...

如何通过python登录stackoverflow.com？

我想我有没有办法通过我的python代码登录我的stackoverflow.com帐户. 是否有任何stackoverflow-pythonAPI,通过它我可以实现上述任务. 我在问这里之前用Google搜索,但是无法找到任何API,也没有找到任何使用python的Hello World示例.解决方法:你很幸运：有一个API,至少有两个python库(Py-StackExchange和Stack.PY)使用该API. 需要注意的是：个人信息要求您使用v2.0 API,但当前发布的Py-StackExchange版本仅支持1.1版本. GitHub repos...

python – 在pyaudio中使用rate / format / chunk中的任何其他值给出错误：[Errno Input overflowed] -9981【代码】

操作系统：Mac OSX 10.7.5Python：Python 2.7.3(自制软件)pyaudio：0.2.7portaudio：19.20111121(自制 – portaudio) 以下脚本输出以下内容并显示我遇到的问题：#!/usr/bin/env python import pyaudio from pprint import pprintp = pyaudio.PyAudio()# SUCCEEDS pprint(p.is_format_supported(input_format=pyaudio.paInt8,input_channels=1,rate=44100,input_device=0)) # => True try:stream = p.open(format=pyaudio.paInt8,c...

python – OverflowError：>编码字符串时不支持的UTF-8序列长度【代码】

在Twisted资源中,我将返回一个json编码的dict作为下面的响应var.这些数据是一个包含姓名,guid和其他几个字段长度少于32个字符的5个人的列表,因此不是大量的数据. 我经常得到这个OverflowError异常,但我不太明白不支持的utf-8序列长度是指什么.self.request.write(ujson.dumps(response))exceptions.OverflowError: Unsupported UTF-8 sequence length whenencoding string解决方法:如有疑问,请查看来源：http://code.google.com/p/...

Stack Overflow 2019 开发者报告：Python 超越 Java，Rust 持续称王！【图】

2019 年 Stack Overflow 开发者调查报告最新出炉了！今年，近 90,000 名开发人员参与了调查，共同分享学习、工具以及未来技术规划上的经验。程序员有很多必备的技能网站，Stack Overflow 就是其中之一——作为全球 IT 界最受欢迎的技术问答社区，很多编程问题都能在上面找到专业的答案，也吸引了大量程序员聚集其中。此前，在《作为程序员，制霸了?Stack?Overflow?是一种怎样的体验？》一文中，我们就分享了 Stack Overflow 上首...

在Windows Server 2012上如何处理“ OverflowError：Python int太大而无法转换为C long”错误,如何获得转换？【代码】

在Anaconda Python 2.7.12,Pandas 18.1,Windows Server 2012上运行时：df['z'] = df['y'].str.replace(' ', '').astype(int)我收到此错误：OverflowError: Python int too large to convert to C long我在MacOS 10.11或Ubuntu 14.04上没有收到此错误.我从其他地方了解到,Windows C编译器对long的定义不同于类似Unix的OS.如果是这样,我该如何在Windows上进行这项工作？此外,data.txt的大小仅为172 KB.如果有帮助,data.txt将采用以下...

首页 / PYTHON / python-unionAll导致StackOverflow

python-unionAll导致StackOverflow

内容导读

内容图文

内容总结

内容备注

内容手机端

【python-unionAll导致StackOverflow】教程文章相关的互联网学习教程文章

Python load json file with UTF-8 BOM header - Stack Overflow【代码】

python如何使用 os.path.exists()--Learning from stackoverflow【代码】

[踩坑] Django "OverflowError: Python int too large to convert to C long" 错误【图】

python-unionAll导致StackOverflow【代码】

Python“OverflowError”【代码】

StackOverflow 周报 - 第四周高质量问题的问答（Java、Python）【图】

python – OverflowError：(34,’结果太大’)【代码】

StackOverflow 周报 - 高质量问题的问答（Java、Python）【代码】【图】

如何通过python登录stackoverflow.com？

python – 在pyaudio中使用rate / format / chunk中的任何其他值给出错误：[Errno Input overflowed] -9981【代码】

python – OverflowError：>编码字符串时不支持的UTF-8序列长度【代码】

Stack Overflow 2019 开发者报告：Python 超越 Java，Rust 持续称王！【图】

在Windows Server 2012上如何处理“ OverflowError：Python int太大而无法转换为C long”错误,如何获得转换？【代码】

UNIONALL - 相关标签

PYTHON - 相关标签

STACK - 相关标签

PYTHON - 技术教程分类

PYTHON - 最新教程

PYTHON - 最热教程