python第五天:Hamlet英文词频统计
内容导读
互联网集市收集整理的这篇技术教程文章主要介绍了python第五天:Hamlet英文词频统计,小编现在分享给大家,供广大互联网技能从业者学习和参考。文章包含1028字,纯文字阅读大概需要2分钟。
内容图文
![python第五天:Hamlet英文词频统计](/upload/InfoBanner/zyjiaocheng/840/d2c9d2edfef84543b7570f2bc45dfac2.jpg)
1 #CalHamletV1.py 2 def getText(): #定义函数读取文件 3 txt = open("hamlet.txt","r").read() 4 txt = txt.lower() #将所有字符转换为小写 5 for ch in '!@#$%^&*(_)-+=[]}{|;:\'\"`~,<.>?/': 6 txt = txt.replace(ch, " ") #将所有特殊符号用空格替代 7 return txt 8 hamletTxt = getText() 9 words = hamletTxt.split() #用空格分隔文本并生成列表 10 counts = {} 11 for word in words: 12 counts[word]=counts.get(word,0)+1 #生成字典的内容:若该键存在则取其值并+1 13 items=list(counts.items()) #返回所有键值对信息,生成列表 14 items.sort(key=lambda x:x[1],reverse=True) #对列表反排序:降序排列 15 for i in range(10): 16 word, count = items[i] 17 print("{0:<10}{1:>5}".format(word, count)) #打印前十个元素 18 19 #print(items[:10])
#结果如下:
下面这是嵩天老师视频课件里的代码和结果:
我输出的结果和老师的结果不一致,因为我在遍历特殊字符的时候使用了两个转义符“\”. 不知道谁对谁错?我的理解是这里应该使用转义符。有没有大神帮忙指正一下?
内容总结
以上是互联网集市为您收集整理的python第五天:Hamlet英文词频统计全部内容,希望文章能够帮你解决python第五天:Hamlet英文词频统计所遇到的程序开发问题。 如果觉得互联网集市技术教程内容还不错,欢迎将互联网集市网站推荐给程序员好友。
内容备注
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 gblab@vip.qq.com 举报,一经查实,本站将立刻删除。
内容手机端
扫描二维码推送至手机访问。
来源:【匿名】