首页 / PYTHON / python – Pandas：使用`df.loc`从datetime64到int的类型转换

python – Pandas：使用`df.loc`从datetime64到int的类型转换

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了python – Pandas：使用`df.loc`从datetime64到int的类型转换，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含4344字，纯文字阅读大概需要7分钟。

内容图文

python – Pandas：使用`df.loc`从datetime64到int的类型转换

当尝试使用df.loc []在列中重新分配某些值时,我得到一个奇怪的类型转换错误,将日期时间转换为整数.

最小例子：

import numpy as np
import pandas as pd
import datetime
d = pd.DataFrame(zip(['12/6/2015', np.nan], [1, 2]), columns=list('ab'))
print(d)
d.loc[pd.notnull(d.a), 'a'] = d.a[pd.notnull(d.a)].apply(lambda x: datetime.datetime(2015,12,6))
print(d)

完整示例：

这是我的数据框(包含NaN)：

>>> df.head()

  prior_ea_date quarter
0    12/31/2015      Q2
1    12/31/2015      Q3
2    12/31/2015      Q3
3    12/31/2015      Q3
4    12/31/2015      Q2

>>> df.prior_ea_date

0         12/31/2015
1         12/31/2015
...
341486     1/19/2016
341487      1/6/2016
Name: prior_ea_date, dtype: object

我想运行以下代码行：

df.loc[pd.notnull(df.prior_ea_date), 'prior_ea_date'] = df.prior_ea_date[pd.notnull(df.prior_ea_date)].apply(dt, usa=True)

其中dt是一个字符串到日期时间解析器,当正常运行时给出：

>>> df.prior_ea_date[pd.notnull(df.prior_ea_date)].apply(dt, usa=True).head()

0   2015-12-31
1   2015-12-31
2   2015-12-31
3   2015-12-31
4   2015-12-31
Name: prior_ea_date, dtype: datetime64[ns]

但是,当我运行.loc []时,我得到以下内容：

>>> df.loc[pd.notnull(df.prior_ea_date), 'prior_ea_date'] = df.prior_ea_date[pd.notnull(df.prior_ea_date)].apply(dt, usa=True)
>>> df.head()

         prior_ea_date quarter
0  1451520000000000000      Q2
1  1451520000000000000      Q3
2  1451520000000000000      Q3
3  1451520000000000000      Q3
4  1451520000000000000      Q2

它已将我的日期时间对象转换为整数.

>为什么会这样？
>我该如何避免这种行为？

我已经设法建立了一个临时工作,所以我会欣赏任何一线黑客,我想要一个熊猫风格的解决方案.

谢谢.

解决方法:

我们将从第一个问题开始：如何避免这种行为？

我的理解是你想将prior_eta_date列转换为datetime对象. Pandas风格的方法是使用to_datetime：

df.prior_ea_date = pd.to_datetime(df.prior_ea_date, format='%m/%d/%Y')
df.prior_ea_date

0   2015-12-31
1   2015-12-31
2   2015-12-31
3   2015-12-31
4   2015-12-31
5          NaT
Name: prior_ea_date, dtype: datetime64[ns]

你的第一个问题更有趣：为什么会这样？

我认为发生的是当你使用df.loc [pd.notnull(df.prior_ea_date),’prior_ea_date’] = ….你在previous_ea_date列的一个切片上设置值而不是覆盖整个列.在这种情况下,Pandas执行默认类型转换以将右侧转换为原始prior_ea_date列的类型.请注意,那些长整数是所需日期的纪元时间.

我们可以用最小的例子看到这个：

##
# Example of type casting on slice
##

d = pd.DataFrame(zip(['12/6/2015', np.nan], [1, 2]), columns=list('ab'))

# Column-a is still dtype: object
d.a
0    12/6/2015
1          NaN
Name: a, dtype: object

d.loc[pd.notnull(d.a), 'a'] = d.a[pd.notnull(d.a)].apply(lambda x: datetime.datetime(2015,12,6))

# Column-a is still dtype: object
d.a
0    1449360000000000000
1                    NaN
Name: a, dtype: object

##
# Example of overwriting whole column
##

d = pd.DataFrame(zip(['12/6/2015', np.nan], [1, 2]), columns=list('ab'))
d.a = pd.to_datetime(d.a, format='%m/%d/%Y')

# Column-a dtype is now datetime
d.a
0   2015-12-06
1          NaT
Name: a, dtype: datetime64[ns]

更多详情：

为了响应OP对更多底层细节的要求,我在Pycharm中跟踪调用堆栈以了解正在发生的事情. TLDR的答案是：最终,将日期时间dtypes转换为整数的意外行为是由于Numpy的内部行为.

d = np.datetime64('2015-12-30T16:00:00.000000000-0800')
d.astype(np.dtype(object))
#>>> 1451520000000000000L

…你能详细说明为什么在使用.loc时会发生这种类型的转换以及如何避免它…

我原来答案中的直觉是正确的.这是因为datetime对象被转换为通用对象类型.这是因为在loc切片上的设置保留了具有设置值的列的dtype.

当使用loc设置值时,Pandas使用indexing module中的_LocationIndexer.经过大量检查维度和条件后,self.obj._data = self.obj._data.setitem(indexer,value)行实际上设置了新值.

走进那一行,我们发现日期时间被转换为整数,line 742 pandas.core.internals.py：

values[indexer] = value

在此语句中,values是对象dtypes的Numpy ndarray.这是原始作业左侧的数据.它包含日期字符串.索引器只是一个元组.而值是Numpy datetime64对象的ndarray.

此操作使用Numpy自己的setitem方法,通过调用np.asarray(value,self.dtype)填充单个“单元格”.在您的情况下,self.dtype是左侧：对象的类型,值参数在各个日期时间中.

np.asarray(d, np.dtype(object))
#>>> array(1451520000000000000L, dtype=object)

……以及如何避免……
不要使用loc.覆盖整个列,如上例所示.

…我认为使用dtype = object的列会避免pandas假设对象类型.无论哪种方式,当原始列包含字符串和NaN时,为什么它应该将其转换为int,这似乎是出乎意料的.

最终,行为是由于Numpy如何实现从datetime到object的转换.现在为什么Numpy这样做呢？我不知道.这是一个很好的新问题和另一个兔子洞.

内容总结

以上是互联网集市为您收集整理的python – Pandas：使用`df.loc`从datetime64到int的类型转换全部内容，希望文章能够帮你解决python – Pandas：使用`df.loc`从datetime64到int的类型转换所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/824396.html

来源：【匿名】

【上一篇】python – 可以在scikit-learn中修改/修剪学过的树吗？【下一篇】浅谈PHP运行Python脚本的方法

更多 ►

【python – Pandas：使用`df.loc`从datetime64到int的类型转换】教程文章相关的互联网学习教程文章

python中时间戳，datetime 和时间字符串之间得转换【代码】

# datetime时间转为字符串def Changestr(datetime1): str1 = datetime1.strftime(‘%Y-%m-%d %H:%M:%S‘) return str1# 字符串时间转为时间戳def Changetime(str1): Unixtime = time.mktime(time.strptime(str1, ‘%Y-%m-%d %H:%M:%S‘)) return Unixtime# datetime时间转为时间戳def Changestamp(dt1): Unixtime = time.mktime(time.strptime(dt1.strftime(‘%Y-%m-%d %H:%M:%S‘), ‘%Y-%m-%d %H:%M:%S‘)) re...

python_datetime模块【代码】

获取当前时间：import datetime # 获取当前时间 ctime = datetime.datetime.now() print(ctime)只显示：年-月-日import datetime # 获取当前时间：只显示年-月-日 ctime = datetime.datetime.now().strftime(‘%Y-%m-%d‘) print(ctime)显示：年月日时分秒import datetime # 获取当前时间：只显示年-月-日-时-分-秒 ctime = datetime.datetime.now().strftime(‘%Y-%m-%d-%H-%M-%S‘) print(ctime) 原文：https://www.cnblogs.com/...

Python基础模块：datetime模块

datetime介绍：datetime是Python处理日期和时间的标准库。它包含了五个类：datetime，date，time，timedelta, tzinfodatetime数据对象：使用strptime把字符串日期转变为此对象，可以使用datetime里的一些方法和属性，比如date(),time(),year,month,day,strftime(),replace()等。导入语句：from datetime import datetime,date,time,timedelta, timezone，把所有类全都都导入。如果只导入包名：import datetime，使用的时候必须dat...

python 学习笔记 14 -- 常用的时间模块之datetime

书接上文，前面我们讲到《常用的时间模块之time》，这次我们学习datetime-- 日期和时间值管理模块使用apihelper 查看datetime 模块，我们可以看到简单的几项：date --- 日期对象，结构为date(year, month, day)time --- 时间值对象，结构为 time([hour[, minute[, second[, microsecond[, tzinfo]]]]])。时间对象所有的参数都是可选的。tzinfo 可以是None 或者是tzinfo子类的一个实例。 datetime --- 日期和时间...

python time,datetime与highchart中的time

http://www.2cto.com/kf/201109/102535.html http://www.cnblogs.com/goodspeed/archive/2011/11/06/python_time.html python time.time(), mktime, datetime解析 highcharts中使用的一种时间形式如下，这个值代表该时间值与1970/1/1之间的差值，注意单位是毫秒，而python mktime的单位是秒，需要x1000 data: [ [1411747200000.0, 0.4], [1411747300000.0, 0.5], [1411...

Python学习笔记__12.1章内建模块——datetime

# 这是学习廖雪峰老师python教程的学习笔记1、概览datetime是Python处理日期和时间的标准库。 1）获取当前日期和时间（datetime.now()）>>> from datetime import datetime>>> now = datetime.now() # 获取当前datetime>>> print(now)2015-05-18 16:28:07.198690>>> print(type(now))<class 'datetime.datetime'>datetime是模块，datetime模块还包含一个datetime类，通过from datetime import datetime导入是datetime这个类。如...

【Python数据分析】时间模块datetime【代码】

目录1.时间模块datetime1.1 date1.2 datetime1.3 timedelta2.日期解析方法dateutil.parser.parse时间模块主要有：datetime.date(),datetime.datetime(),datetime.timedelta()1.时间模块datetime1.1 datedate主要用于获取日期，例如获取当前日期或者特定日期,获取的日期可以由str方法直接转化为字符串格式from datetime import date today = date.today() # 获取当天日期 print(today,type(today)) # 打印结果：2020-02-08 ...

Python时间模块datetime用法

时间模块datetime是python内置模块，datetime是Python处理日期和时间的标准库。1，导入时间模块 from datetime import datetime2，实例 from datetime import datetime now = datetime.now() # 获取当前datetime print(now)3，时间转换，时间转时间戳，时间戳转时间 datetime转换为timestamp >>> from datetime import datetime >>> dt = datetime(2015, 4, 19, 12, 20) # 用指定日期时间创建datetime >>...

【python基础】datetime类各种坑【代码】【图】

import datetimeend_time = 1525104000000 d = datetime.datetime.fromtimestamp(end_time / 1000, None) # 时间戳转换成字符串日期时间 e = datetime.date.fromtimestamp(end_time /1000) # 时间戳转换成字符串日期 str1 = d.strftime("%Y-%m-%d %H:%M:%S.%f") now = datetime.datetime.now() aDay = datetime.timedelta(days=-1) # 减1天 now_aDay = now + aDayprint(d) # 2018-05-01 00:00:00print(e) # 2020-03-15print(str...

python内几种常用内置模块的介绍,包括time模块,datetime模块,random模块,os模块,sys模块,hashlib模块【代码】

介绍Python中的几种常用模块1.time模块与时间处理有关的python内置模块时间戳：自1970-01-01 00.00:00到当前时间，按秒计算，到现在为止一共多少秒importtime # 导入时间模块包importtimeprint(time.time()) # 获取当前时间的时间戳‘‘‘1573887905.6273756‘‘‘?print(time.localtime()) # 获取当地时间格式化对象,即struct.time(为九个元素的元组)‘‘‘time.struct_time(tm_year=2019, tm_mon=11, tm_mday=16, tm_h...

Python与时间相关的time、datetime模块的使用【代码】【图】

一、前言学习python处理时间相关的模块time、datetime二、time模块首先来看下time模块通过help(time)来看一下time模块下都有哪些函数： time() -- return current time in seconds since the Epoch as a floatclock() -- return CPU time since process start as a floatsleep() -- delay for a number of seconds given as a floatgmtime() -- convert seconds since Epoch to UTC tuplelocaltime() -- convert seconds since ...

【转载】Python日期时间模块datetime详解与Python 日期时间的比较,计算实例代码

本文转载自脚本之家，源网址为：https://www.jb51.net/article/147429.htm一、Python中日期时间模块datetime介绍（一）、datetime模块中包含如下类：类名功能说明date日期对象,常用的属性有year, month, daytime时间对象datetime日期时间对象,常用的属性有hour, minute, second, microseconddatetime_CAPI日期时间对象C语言接口timedelta时间间隔，即两个时间点之间的长度tzinfo时区信息对象（二）、datetime模块中包含的常量常量功...

Python学习笔记（三十二）常用内建模块（1）— datetime【代码】

>>> from datetime import datetime >>> now = datetime.now() # 获取当前datetime >>> print(now) 2015-05-18 16:28:07.198690 >>> print(type(now)) <class‘datetime.datetime‘>获取指定日期和时间要指定某个日期和时间，我们直接用参数构造一个datetime：>>> from datetime import datetime >>> dt = datetime(2015, 4, 19, 12, 20) # 用指定日期时间创建datetime >>> print(dt) 2015-04-19 12:20:00datetime转换为timestamp在...

python 时间模块datetime【代码】

datetime模块用于是date和time模块的合集，datetime有两个常量，MAXYEAR和MINYEAR，分别是9999和1.datetime模块定义了5个类，分别是1.datetime.date：表示日期的类2.datetime.datetime：表示日期时间的类3.datetime.time：表示时间的类4.datetime.timedelta：表示时间间隔，即两个时间点的间隔5.datetime.tzinfo：时区的相关信息一、首先看一下datetime.date类：date类有三个参数,datetime.date(year,month,day)，返回year-month-d...

Python下time模块和datetime模块的使用【代码】

时间模块 time模块时间表示格式:1.格式化时间: 【 2018-01-01 01:00:00 】2.时间戳: 【 1518407077.940927 】 -> 秒数(从1970开始到现今)3.以元组方式表示，九个元素(格式化元组)元素如下:(1) tm_year=2018, # 年(2) tm_mon=2, # 月(3) tm_mday=12, # 日(4) tm_hour=11, # 小时(5) tm_min=49, # 分钟(6) tm_sec=13, # 秒(7) tm_wday=0, # 0(Mon)-6(Sun) 从0(周一)开始数 -> 6(周天)(8) tm_yday=43...

首页 / PYTHON / python – Pandas：使用`df.loc`从datetime64到int的类型转换

python – Pandas：使用`df.loc`从datetime64到int的类型转换

内容导读

内容图文

内容总结

内容备注

内容手机端

【python – Pandas：使用`df.loc`从datetime64到int的类型转换】教程文章相关的互联网学习教程文章

python中时间戳，datetime 和时间字符串之间得转换【代码】

python_datetime模块【代码】

Python基础模块：datetime模块

python 学习笔记 14 -- 常用的时间模块之datetime

python time,datetime与highchart中的time

Python学习笔记__12.1章内建模块——datetime

【Python数据分析】时间模块datetime【代码】

Python时间模块datetime用法

【python基础】datetime类各种坑【代码】【图】

python内几种常用内置模块的介绍,包括time模块,datetime模块,random模块,os模块,sys模块,hashlib模块【代码】

Python与时间相关的time、datetime模块的使用【代码】【图】

【转载】Python日期时间模块datetime详解与Python 日期时间的比较,计算实例代码

Python学习笔记（三十二）常用内建模块（1）— datetime【代码】

python 时间模块datetime【代码】

Python下time模块和datetime模块的使用【代码】

PYTHON - 相关标签

DATE - 相关标签

TIME - 相关标签

PYTHON - 技术教程分类

PYTHON - 最新教程

PYTHON - 最热教程