接着我的上一个问题,Python的生存时间,我现在遇到了有关时区的问题,事实证明,时区并不总是为" +0200".因此,当strptime尝试如此解析时,它将引发异常。
我曾想过用[:-6]或其他方法来切断+0200,但是用strptime做到这一点真的有办法吗?
如果有问题,我正在使用Python 2.5.2。
>>> from datetime import datetime
>>> fmt = "%a, %d %b %Y %H:%M:%S +0200"
>>> datetime.strptime("Tue, 22 Jul 2008 08:17:41 +0200", fmt)
datetime.datetime(2008, 7, 22, 8, 17, 41)
>>> datetime.strptime("Tue, 22 Jul 2008 08:17:41 +0300", fmt)
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
File "/usr/lib/python2.5/_strptime.py", line 330, in strptime
(data_string, format))
ValueError: time data did not match format: data=Tue, 22 Jul 2008 08:17:41 +0300 fmt=%a, %d %b %Y %H:%M:%S +0200
最新回答
- 2021-1-121 #
- 2021-1-122 #
is there a real way to do this with strptime?
否,但是由于您的格式似乎是RFC822家族的日期,因此您可以使用电子邮件库更轻松地阅读它:
>>> import email.utils >>> email.utils.parsedate_tz('Tue, 22 Jul 2008 08:17:41 +0200') (2008, 7, 22, 8, 17, 41, 0, 1, 0, 7200)
(7200 =时区与UTC的时差,以秒为单位)
- 2021-1-123 #
您可以使用
dateutil
库非常有用:from datetime import datetime from dateutil.parser import parse dt = parse("Tue, 22 Jul 2008 08:17:41 +0200") ## datetime.datetime(2008, 7, 22, 8, 17, 41, tzinfo=tzoffset(None, 7200)) <- dt print dt 2008-07-22 08:17:41+02:00
- 2021-1-124 #
据我所知,
pstrptime()
无法识别数字时区代码.如果您知道该字符串总是以该格式的时区指定结尾(+或-后跟4位数字),则将其切碎并手动解析似乎是一件很合理的事情。%z似乎对应于时区名称,而不是偏移量。
例如,给定:
>>> format = '%a, %d %b %Y %H:%M:%S %Z'
我可以解析:
>>> datetime.datetime.strptime('Tue, 22 Jul 2008 08:17:41 GMT', format) datetime.datetime(2008, 7, 22, 8, 17, 41)
尽管它似乎对时区没有任何作用,只是观察它是否存在并有效:
>>> datetime.datetime.strptime('Tue, 22 Jul 2008 08:17:41 NZDT', format) datetime.datetime(2008, 7, 22, 8, 17, 41)
我想,如果您愿意,可以找到偏移量到名称的映射,转换您的输入,然后解析它.不过,截断输入可能会更简单。
看来这仅在>= 2.6中实现,我认为您必须手动对其进行解析。
除了删除时区数据,我看不到其他解决方案: