使用python创建一个中文文件夹
内容导读
互联网集市收集整理的这篇技术教程文章主要介绍了使用python创建一个中文文件夹,小编现在分享给大家,供广大互联网技能从业者学习和参考。文章包含1110字,纯文字阅读大概需要2分钟。
内容图文
我现在遇到一个关于中国品格的问题.
我使用beautifulsoup提取数据,并想使用提取数据的名称创建一个文件夹.
数据喜欢:
<A href="love">星座(1824)</A>
我想提取“星座(1824)”,所以我喜欢
soup.find('a',href='love')
但在控制台中,它出来了:
D?×ù(1824)
我在源代码的开头使用了“#-encoding:utf-8-”.
一定是一些编码问题,任何人都可以提供一些有关非英语的python工作的好材料?
我想创建一个名为“星座(1824)”的文件夹
我做 :
if not os.path.exists(dir_name):
os.mkdir('./pic/'+dir_name)
当我找到一个名为“ÐÇ×ù(1824)”的文件夹时,为什么仍然出来:
OSError: [Errno 17] File exists: './vguagua_pic/\xc3\x90\xc3\x87\xc3\x97\xc3\xb9(1824)'
谢谢
解决方法:
即使您的.py脚本是用UTF-8编写的,如果网页不是,解析的文本也可能不正确.
该网页的编码实际上是GB-2312(或GB-18030),但是BeautifulSoup猜测该网页的编码错误地是ISO-8859-1,并且在这种错误的假设下转换为UTF-8并导致了mojibake.我们可以验证:
>>> b'\xc3\x90\xc3\x87\xc3\x97\xc3\xb9'.decode('utf8').encode('latin1').decode('gb2312')
'星座'
您可以在BeautifulSoup构造函数中添加from_encoding =“ gb2312”(在bs4中)或fromEncoding =“ gb2312”(在3.x中)以强制编码,如Beautiful Soup Documentation (and also in Chinese 中文文档)中所述.
内容总结
以上是互联网集市为您收集整理的使用python创建一个中文文件夹全部内容,希望文章能够帮你解决使用python创建一个中文文件夹所遇到的程序开发问题。 如果觉得互联网集市技术教程内容还不错,欢迎将互联网集市网站推荐给程序员好友。
内容备注
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 gblab@vip.qq.com 举报,一经查实,本站将立刻删除。
内容手机端
扫描二维码推送至手机访问。