python练习册0004题

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了python练习册0004题，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含2810字，纯文字阅读大概需要5分钟。

内容图文

在任意一个英文文档中，统计单词出现的次数，

分析:

本题不是很难，单词通常以空格隔开，但是有些单词后面跟一些特殊符号，只需把这些特殊符号替换掉就可以了，

代码一

 1 import re
 2 
 3 file_name = 'code.txt'
 4 
 5 lines_count = 0
 6 words_count = 0
 7 chars_count = 0
 8 words_dict = {}
 9 lines_list = []
10 
11 with open(file_name, 'r') as f:
12     for line in f:
13         lines_count = lines_count + 1
14         chars_count = chars_count + len(line)
15         match = re.findall(r'[^a-zA-Z0-9]+', line)
16 
17         #正则 re.findall  的简单用法（返回string中所有与pattern相匹配的全部字串，返回形式为数组）语法：
18         for i in match:
19             # 只要英文单词，删掉其他字符
20             line = line.replace(i, ' ')
21         lines_list = line.split()
22         for i in lines_list:
23             if i not in words_dict:
24                 words_dict[i] = 1
25             else:
26                 words_dict[i] = words_dict[i] + 1
27 
28 print('words_count is', len(words_dict))
29 print('lines_count is', lines_count)
30 print('chars_count is', chars_count)
31 
32 for k, v in words_dict.items():
33     print( k, v)

该代码有些啰嗦，网上找的，说下思路把，利用正则表达式找到所有的不是字母也不是数字的数据保存下来，然后再访问文本中的数据，将非字母和数字的数据替换为空

弱弱的说一句，直接替换掉不就完了。

代码二：

这是本人所写的，较代码一稍微简洁些；

import  re
f=open("code.txt",'r')
s=f.read()
s.replace("[^a-zA-Z]",' ')
s=s.split()
word={}
for i in s:
    if i not in  word:
        word[i]=1
    else:
        word[i]=word[i]+1
for k,v in word.items():
    print(k,v)

代码三：

你以为你写的够简洁了吗？不，python早就帮你封装好函数了。

点开才能看。

import collections
import re
 
def calwords(path):
    word = []
    with open(path) as file:
        data = file.readlines()
    for line in data:
        word += re.split(' |，',line.strip('\n'))
    print(collections.Counter(word))
 
 
if __name__ == '__main__':
    calwords('e://code.txt')

View Code

用到的方法说明

正则 re.findall  的简单用法（返回string中所有与pattern相匹配的全部字串，返回形式为数组）
语法：findall(pattern, string, flags=0)

string的replace方法，用后一个参数替换字符串中的前一个参数。


string.split方法

str.split()

单一分隔符，使用str.split()即可 

str.split不支持正则及多个切割符号，不感知空格的数量

re.split()

 多个分隔符，复杂的分隔情况，使用re.split

原型： re.split(pattern, string, maxsplit=0)

通过正则表达式将字符串分离。如果用括号将正则表达式括起来，那么匹配的字符串也会被列入到list中返回。maxsplit是分离的次数，maxsplit=1分离一次，默认为0，不限制次数。

eg:

>>>a='w w w'

>>>import re

1.空格分

>>>re.split(r'[\s]',a)

['w','w','w']

2.只分割一次

>>>re.split(r'[\s]',a,1)

['w','ww']

3.多个字符分割

>>>c='w!w@w%w^w'

>>>re.split(r'[!@%^],c)

['w','w','w','w','w']

4.还原?:

>>>re.split(r'(?:!@%^),c)

['w!w@w%w^w']

描述
Python strip() 方法用于移除字符串头尾指定的字符（默认为空格或换行符）或字符序列。

注意：该方法只能删除开头或是结尾的字符，不能删除中间部分的字符。

couter 是一个容器，可以统计列表中元素的出现次数.

内容总结

以上是互联网集市为您收集整理的python练习册0004题全部内容，希望文章能够帮你解决python练习册0004题所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/849064.html

来源：【匿名】

【上一篇】python之os.walk()【下一篇】浅谈PHP运行Python脚本的方法

更多 ►

【python练习册0004题】教程文章相关的互联网学习教程文章

问题描述：在比较词表的讨论中，创建一个对象叫做translate，通过它你可以使用德语和意大利语词汇查找对应的英语词汇。这种方法可能会出现什么问题，你能提出一个办法来避免这个问题吗？书上的做法是通过entries()方法来指定一个语言链表来访问多语言中的同源词，再把它转换成一个简单的词典。代码如下：1from nltk.corpus import swadesh 2swadesh.fileids() 3 it2en = swadesh.entries([‘it‘, ‘en‘]) 4 de2en = swadesh.entr...

python3练习-查找文件【代码】

题: 编写一个程序，能在当前目录以及当前目录的所有子目录下查找文件名包含指定字符串的文件，并打印出相对路径import os import os.pathdef find_file(root,param=None):ifnot isinstance(param,str) :raise‘param必需为字符串‘for root, dirs, files in os.walk(root):s = [x for x in files if param in x]if len(s) > 0 :for x in s:print(os.path.join(root,x))find_file(‘../‘,‘4‘)在学习过程中遇到此题，经过API了解...

Python练习实例030【代码】

问题：一个5位数，判断它是不是回文数。即12321是回文数，个位与万位相同，十位与千位相同。#! /usr/bin/env python3 # -*- coding:utf-8 -*-# Author : Ma Yi # Blog : http://www.cnblogs.com/mayi0312/ # Date : 2020-06-22 # Name : demo030 # Software : PyCharm # Note : 一个5位数，判断它是不是回文数。即12321是回文数，个位与万位相同，十位与千位相同。def fun(n: int):"""判断给定的数字是不是回文数...

python练习-for range if continue【代码】

for i in range (1,6): print print print "i=", i, print "hello,how", if i==3: continue print ‘are you today?‘原文：http://huzhongliang.blog.51cto.com/1817180/1890999

python入门练习题2【代码】

1，制作表格　　循环提示用户输入：用户名，密码，邮箱（要求用户输入的长度超过20个字符，如果超过则只有前20个字符有效）如果用户输入q或Q就退出程序，将用户输入的内容以表格形式显示 user_input = None #用户名的初始值 pwd = None #密码的初始值 email = None #邮箱地址的初始值 public = None #公共变量名初始值 flag = False #标志位 while not flag: #当flag不为False时，就执行以下代码块print(‘温馨提醒：如...

python核心编程--第八章 8.15 练习【代码】

#!/usr/bin/python # -*- coding: utf-8 -*-# 8–2. 循环. 编写一个程序, 让用户输入三个数字: (f)rom, (t)o, 和 (i)ncrement . # 以 i为步长, 从 f 计数到 t , 包括 f 和 t . 例如, 如果输入的是 f == 2, # t == 26, i == 4 , 程序将输出 2, 6, 10, 14, 18, 22, 26.f = int(raw_input("Please input from: ")) t = int(raw_input("Please input to: ")) i = int(raw_input("Please input increment: "))print range(f, ...

Leetcode练习(Python)：哈希表类：第138题：给定一个链表，每个节点包含一个额外增加的随机指针，该指针可以指向链表中的任何节点或空节点。要求返回这个链表的深拷贝。我们用一个由 n 个节点组成的链表来表示输入/输出中的链表。

题目：给定一个链表，每个节点包含一个额外增加的随机指针，该指针可以指向链表中的任何节点或空节点。要求返回这个链表的深拷贝。我们用一个由 n 个节点组成的链表来表示输入/输出中的链表。每个节点用一个 [val, random_index] 表示：val：一个表示 Node.val 的整数。random_index：随机指针指向的节点索引（范围从 0 到 n-1）；如果不指向任何节点，则为 null 。思路：先使用哈希表来构建一个新的链表，然后对这个链表赋予ne...

Python小练习（一）【代码】

1：有一个列表，其中包括10个元素，例如这个列表是[1,2,3,4,5,6,7,8,9,0],要求将列表中的每个元素一次向前移动一个位置，第一个元素到列表的最后，然后输出这个列表。最终样式是[2,3,4,5,6,7,8,9,0,1] #!/usr/bin/python #encoding=utf-8 #有一个列表，其中包括10个元素，例如这个列表是[1,2,3,4,5,6,7,8,9,0],要求将列表中的每个元素一次向前移动一个位置，第一个元素到列表的最后，然后输出这个列表。最终样式是[2,3,4,5,6,7,...

python基础 Day01 练习题【代码】【图】

1 字符串格式化 1#!/urs/bin/env python 2 3 name = input("Name: ")4 age = int(input("Age: "))5 job = input("Job: ")6 salary = input("Salary: ")7 8 info1 = """ 910----------- info1 of %s --------- 11name: %s 12age: %s 13job: %s 14Salary: %s 15""" % (name, name, age, job, salary) 1617print(info1) 1819 info2 = """2021----------- info2 of {_name} ---- 22Name: {_name} 23Age: {_age} 24Job: {_job} 25Salary...

python列表生成式和生成器表达式小练习【代码】

题目一：有两个列表，分别存放来老男孩报名学习linux和python课程的学生名字linux=[‘钢弹‘,‘小壁虎‘,‘小虎比‘,‘alex‘,‘wupeiqi‘,‘yuanhao‘]python=[‘dragon‘,‘钢弹‘,‘zhejiangF4‘,‘小虎比‘]问题一：得出既报名linux又报名python的学生列表#常规写法： linux=[‘钢弹‘,‘小壁虎‘,‘小虎比‘,‘alex‘,‘wupeiqi‘,‘yuanhao‘] python=[‘dragon‘,‘钢弹‘,‘zhejiangF4‘,‘小虎比‘] l=[] for i in linux:...

老男孩python基础知识练习题（一）中【代码】

20、字符串是否可迭代？如可以请使用for循环每一个元素？>>> name = " aleX ">>> for i in name:... print(i)21、请代码实现：利用下划线将列表的每一个元素拼接成字符串，li = [‘alex‘,‘eric‘,‘rain‘]li = [‘alex‘,‘eric‘,‘rain‘]v=‘‘.join(li)print(v)22、写代码，有如下列表，按照要求实现每一个功能（所有练习题同样适用于元组）li = [‘alex‘,‘eric‘,‘rain‘]a.计算列表长度并输出li = [‘alex‘,‘eri...

python练习：从番号到封面【代码】

我不知道为什么会选择python去学习，可能和前阵子有在v2ex看到有同学用python抓磁力的有关，今天12点起床闲来无事，继续学习吧。本来也想找个磁力站练练手抓抓magnet的，打开收藏夹的几个站点才发现URL全都加密了。一个个找，终于发现一个可以联手的网站。嘻嘻。 1#!/usr/bin/env python 2 3#coding :UTF-8 4 __auther__ = ‘mashaz‘5import urllib,urllib26import sys7import re8print‘Thank ****** a lot‘ 9 url = ‘http://w...

Python练习题–持续更新【代码】

1、你是一个高级测试工程师，现在要做性能测试，需要你写一个函数，批量生成一些注册使用的账号。产生的账号是以@163.com结尾，长度由用户输入，产生多少条也由用户输入，用户名不能重复，用户名必须由大写字母、小写字母、数字组成，结果如下图： 2、测试机器的磁盘太小，经常报警，要写一个清理日志的脚本，每次运行就把三天之前的日志删除，日志名的格式是xxx-20170623.log。 3、公司服务器，经常被别人攻击，要写个监控ngin...

Python练习【代码】【图】

1.输出hello worldprint(‘hello world‘)2.简单交互name=input(‘name=:‘) print(‘我的名字是:{}‘.format(name))3.计算两数之和print(‘两者之和为:%.0f‘%float(float(input(‘输入第一个数字:‘))+float(input(‘输入第二个数字:‘))))4.计算三角形面积a=float(input(‘a=‘)) b=float(input(‘b=‘)) c=float(input(‘c=‘)) p=float((float(a+b+c))/2) print(‘三角形abc的面积为:%.0f‘%float((p*(p-a)*(p-b)*(p-c))**0.5...

Python基本图形绘制练习题代码记录【代码】

样例Python蛇#PythonDraw.py #调用turtle库import turtle #设置窗口大小（窗口长度、窗口宽度、窗口距离屏幕的距离） turtle.setup(650,350,200,200) #penup抬起画笔turtle.penup() #fd向后画250个像素的直线 turtle.fd(-250) #pendown放下画笔turtle.pendown() #pensize画笔尺寸为25个像素 turtle.pensize(25) #pencolor画笔颜色函数 turtle.pencolor("purple") #seth函数全程为setheading(angle)：控制海龟角度 turtle.seth(-40)...

PYTHON - 技术教程分类

Python3 教程 Python3 简介 Python3 环境搭建 Python3 基础语法 Python3 基本数据类型 Python3 解释器 Python3 注释 Python3 运算符 Python3 数字(Number) Python3 字符串 Python3 列表 Python3 元组 Python3 字典 Python3 集合 Python3 编程第一步 Python3 条件控制 Python3 循环语句 Python3 迭代器与生成器 Python3 函数 Python3 数据结构 Python3 模块 Python3 输入和输出 Python3 File Python3 OS Python3 错误和异常 Python3 面向对象 Python3 命名空间/作用域 Python3 标准库概览 Python3 实例 Python3 CGI编程 Python3 MySQL(PyMySQL) Python3 网络编程 Python3 SMTP发送邮件 Python3 多线程 Python3 日期和时间 Python3 内置函数 Python3 MongoDB Python3 urllib python 全部

PYTHON - 最热教程

python如何统计字符串中字母个数？使用Python进行微信公众号开发（三）回...Python+PyQT5的子线程更新UI界面的实例 python时间戳怎么获得？如何获得当前时...vscode调试python时提示无法将“conda”...python接口自动化全局变量access_token...python收取邮件(腾讯企业邮箱)python如何绘制降水图详解python并发获取snmp信息及性能测试...怎么卸载Python3.6？

首页 / PYTHON / python练习册0004题

python练习册0004题

内容导读

内容图文

内容总结

内容备注

内容手机端

【python练习册0004题】教程文章相关的互联网学习教程文章

《Python自然语言处理》第二章习题解答练习6【代码】

python3练习-查找文件【代码】

Python练习实例030【代码】

python练习-for range if continue【代码】

python入门练习题2【代码】

python核心编程--第八章 8.15 练习【代码】

Python小练习（一）【代码】

python基础 Day01 练习题【代码】【图】

python列表生成式和生成器表达式小练习【代码】

老男孩python基础知识练习题（一）中【代码】

python练习：从番号到封面【代码】

Python练习题–持续更新【代码】

Python练习【代码】【图】

Python基本图形绘制练习题代码记录【代码】

PYTHON - 相关标签

PYTHON - 技术教程分类

PYTHON - 最新教程

PYTHON - 最热教程