python-从txt解析IP地址
内容导读
互联网集市收集整理的这篇技术教程文章主要介绍了python-从txt解析IP地址,小编现在分享给大家,供广大互联网技能从业者学习和参考。文章包含2128字,纯文字阅读大概需要4分钟。
内容图文
![python-从txt解析IP地址](/upload/InfoBanner/zyjiaocheng/691/52061d481ead490eb31b9a6b8f4704e4.jpg)
我正在尝试下载一个txt文件,您可以找到here.下载文件不是问题:
testfile = urllib.URLopener()
testfile.retrieve(_proxy_list_download_, "proxies.txt")
但是问题在于,下载后它表现得很奇怪.当我在任何txt编辑器中打开它时,都可以看到内容和IP地址,但是当我尝试将内容打印到控制台中时,它会显示以下内容:
212.3.183.210:8080; 0; 0; anonymous proxy; Italy; ; a; in); an Jose); ree download proxy IP
当我尝试从那里获取IP地址时,输出中没有地址.
with open('proxies.txt') as f:
content = f.read()
ip = re.findall( r"^\d{1,3}\.\d{1,3}\.\d{1,3}\.\d{1,3}$", content )
我已经尝试了另一个正则表达式:
r'([0-9]+)(?:\.[0-9]+){3}'
此正则表达式仅返回3位数字.
您知道如何解析这些IP吗?
编辑:这是从文本编辑器复制粘贴的文本,但是在编辑器中所有内容都在一行中:
# http://proxy-ip-list.com/ provides you this fresh txt proxy list to free download proxy IP
# Date: Sat, 27 Jun 2015 12:53:02 +0000
39.166.95.9:8123; 0; 0; high-anonymous; China;
178.189.92.118:3129; 16.83; 405; high-anonymous; Austria;
198.2.202.33:8090; 8.05; 884; anonymous; United States (CA, San Jose);
171.96.152.89:8080; 0; 0; anonymous; Thailand;
153.149.104.76:80; 0; 0; anonymous; Japan (Tokyo);
106.187.52.191:80; 0; 0; anonymous proxy; Japan;
194.187.214.204:80; 0.91; 6374; anonymous proxy; Finland;
59.78.160.247:8080; 0; 0; anonymous; China (Shanghai);
61.156.3.166:80; 1.12; 1449; anonymous proxy; China (Jinan);
221.238.140.164:8080; 1.39; 257; anonymous; China (Tianjin);
117.178.157.107:8123; 8.44; 847; high-anonymous; China;
39.166.205.95:8123; 0; 0; high-anonymous; China;
117.163.216.8:8123; 4.21; 1577; high-anonymous; China;
189.31.143.250:3128; 0; 0; high-anonymous; Brazil;
183.89.84.82:8080; 0; 0; anonymous proxy; Thailand;
183.88.41.42:8080; 0; 0; anonymous; Thailand;
212.3.183.210:8080; 0; 0; anonymous proxy; Italy;
解决方法:
您需要删除锚点,因为一行不会仅包含一个ip地址.
ip = re.findall( r"\b\d{1,3}\.\d{1,3}\.\d{1,3}\.\d{1,3}\b", content )
第二个正则表达式
r'([0-9]+)(?:\.[0-9]+){3}'
必须返回三位数,因为只有前三位数被捕获,如果有re.findall方法,它将首先返回捕获.如果没有捕获,则只有它会返回匹配项.通过将捕获组变成非捕获组,将为您提供所需的输出.
r'\b[0-9]+(?:\.[0-9]+){3}\b'
内容总结
以上是互联网集市为您收集整理的python-从txt解析IP地址全部内容,希望文章能够帮你解决python-从txt解析IP地址所遇到的程序开发问题。 如果觉得互联网集市技术教程内容还不错,欢迎将互联网集市网站推荐给程序员好友。
内容备注
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 gblab@vip.qq.com 举报,一经查实,本站将立刻删除。
内容手机端
扫描二维码推送至手机访问。