首页 / JAVA / java实训一——词频统计

java实训一——词频统计

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了java实训一——词频统计，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含2505字，纯文字阅读大概需要4分钟。

内容图文

---恢复内容开始---

驾驶员：葛晨延（16012010）

领航员：张广哲（16012007）

码云：https://gitee.com/happywindmannn/GCYshixun1/tree/master

实训过程照片：

技术分享图片

             1
            import java.io.*;
 2import java.util.*;
 3import java.io.BufferedReader;  
 4import java.io.FileReader;  
 5import java.util.ArrayList;  
 6import java.util.Map;
 7import java.util.List;  
 8import java.util.Map.Entry;  
 9import java.util.TreeMap;  
10publicclass wtf{
11publicstaticvoid main(String args[])throws Exception{
12         StringBuilder result = new StringBuilder();
13         BufferedReader file = new BufferedReader(new FileReader("D:\\javas\\a.txt"));
14         List<String> s =new ArrayList<String>();
15         String s1 = null;
16while((s1 = file.readLine()) != null){
17             String [] s2 = s1.split("[[^a-zA-Z]]");
18for(String s3 : s2){
19if(s3.length() != 0){
20                    s.add(s3);
21                }
22            }
23        }
24         Map<String, Integer> TreeMap = new TreeMap<String,Integer>();
25for(String s4:s){
26if(TreeMap.get(s4) != null){  
27             TreeMap.put(s4,TreeMap.get(s4)+1);
28            }
29else{  
30                 TreeMap.put(s4,1);  
31            }
32        }
333435         System.out.println("以下是本文章中出现单词频率前十的单词，以及频率：\t");
36        showmap(TreeMap);
37        file.close();
38    }
39publicstaticvoid showmap(Map<String,Integer> oldmap){  
4041         ArrayList<Map.Entry<String,Integer>> map = new ArrayList<Map.Entry<String,Integer>>(oldmap.entrySet());  
4243         Collections.sort(map,new Comparator<Map.Entry<String,Integer>>(){  
4445publicint compare(Entry<String, Integer> o1, Entry<String, Integer> o2) {  
46return o2.getValue() - o1.getValue();   
47            }  
48        });  
4950for(int i = 0; i<10; i++){  
5152             System.out.println(map.get(i).getKey()+ ": " +map.get(i).getValue());  
53        }     
54    }  
5556 }

运行结果：

技术分享图片

需求：

1.读取文件，文件内包可含英文字符，及常见标点，空格级换行符。
2.统计英文单词在本文件的出现次数
3.将统计结果排序
4.显示排序结果

解题思路：

x代表对象
1.BufferedReader x = new BufferedReader(new FileReader(文件绝对路径))；
缓冲流，更加油效率的读取文件，缓冲访问区（类似于内存条）。
另有方法readline（）按行读取可以使用。
相比InputStream()字节流，FileReader()字符流更快。
2.List<String> x = new ArrayList<String>();
创建动态数组，<>中的位数组类型，如int，double，String。
该数组用于存储文章的所有单词。
3. String[] x = readLine.split("[^a-zA-Z]");
创建数组，用readLine（）逐行过滤，括号内位正则表达式。
4.for（String x：y）{}
“增强的for循环”，x为字符串，y为字符数组
作用是将数组内所有元素，赋值到x中，有多少元素创建多少个x。

5.Map<String, Integer> x = new TreeMap<String,Integer>();
HashMap<String, Integer> x = new HashMap<String, Integer>();
map树（有序） hashmap哈希表（无序）
存储单词计数信息，Stinrg是key值为单词，Integer是value为词频
map.put（k，v）给表赋值
map.get（key）获取key的value

ps：因为某些不可抗力原因程序还不够完整，由下次实训补全。

---恢复内容结束---

原文：https://www.cnblogs.com/happywindman/p/10116015.html

内容总结

以上是互联网集市为您收集整理的java实训一——词频统计全部内容，希望文章能够帮你解决java实训一——词频统计所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/1326276.html

来源：【匿名】

【上一篇】Java线程核心基础（上）【下一篇】JAVA/JSP学习系列之五

更多 ►

【java实训一——词频统计】教程文章相关的互联网学习教程文章

java实训一——词频统计【代码】【图】

---恢复内容开始---驾驶员：葛晨延（16012010）领航员：张广哲（16012007）码云：https://gitee.com/happywindmannn/GCYshixun1/tree/master实训过程照片： 1import java.io.*;2import java.util.*;3import java.io.BufferedReader; 4import java.io.FileReader; 5import java.util.ArrayList; 6import java.util.Map;7import java.util.List; 8import java.util.Map.Entry; 9import java.util.TreeMap; 10publicclas...

Java统计程序运行时间

代码如下：第一种是以毫秒为单位计算的。 long startTime = System.currentTimeMillis(); //获取开始时间 doSomething(); //测试的代码段 long endTime = System.currentTimeMillis(); //获取结束时间 System.out.println("程序运行时间：" + (endTime - startTime) + "ms"); //输出程序运行时间第二种是以纳秒为单位计算的。 long startTime=System.nanoTime(); //获取开始时间 doSomeThing(); /...

Javaweb基础--->利用监听器统计在线用户数量和用户信息【代码】

首页布局：index.jsp<%@ page language="java" contentType="text/html; charset=UTF-8"pageEncoding="UTF-8"%><%@ page import="java.util.*"%><%@ page import="com.hanqi.model.*"%><!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd"><html><head><meta http-equiv="Content-Type" content="text/html; charset=UTF-8"><title>Insert title here</title></head><body> 当...

蓝桥杯java 算法提高统计单词数【代码】

问题描述　　统计输入英文文章段落中不同单词（单词有大小写之分,但统计时忽略大小写）各自出现的次数。输入段落中所含单词的总数不超过100，最长单词的长度不超过20个字母.输入格式　　一个包含若干句子的段落, 每个句子由若干英文单词组成. 除空格,逗号和句号外, 这些输入的句子中不含其他非字母字符, 并且, 逗号和句号紧跟在它前面的英文单词后面, 中间没有空格. 段落最后一个字符是回车符,表示输入结束.输出格式　　若段落中共...

代码注释率统计的Python及Java实现【代码】【图】

这是一个简单的Java代码注释率统计工具，能够查找某个指定目录下的每个.java文件注释率及该路径下所有.java文件的总注释率。注释率=注释代码行数/代码总行数，其中代码总行数包括注释行和空格行。在Java中有行注释（//）、块注释（/*……*/）和Javadoc注释（/**……*/）三种风格，通过逐行读取文件，并判断是否包换这些字符就可以实现判断一行代码是否包含注释。为了增加准确率，引号内的字符串不计入统计范围。Python的实现如下：...

Kafka对Java程序员有多重要？连阿里都再用它处理亿万级数据统计

一．了解淘宝Kafka架构在ActiveMQ、RabbitMQ、RocketMQ、Kafka消息中间件之间，我们为什么要选择Kafka?下面详细介绍一下，2012年9月份我在支付宝做余额宝研发，2013年6月支付宝正式推出余额宝，2013年8月担任支付宝淘宝彩票项目经理带领兄弟们一起做研发，期间需要与淘宝和500万对接竞彩接口数据，业余时间与淘宝的同事沟通，了解天猫在电商节如何处理这些大数据的？技术架构上采用了哪些策略呢？一、应用无状态(淘宝session框架)二...

java词频统计——web版支持【代码】

需求概要：1.把程序迁移到web平台，通过用户上传TXT的方式接收文件。2.用户直接输入要统计的文本，服务器返回结果3.在页面上给出链接 (如果有封皮、作者、字数、页数等信息更佳)或表格，展示经典英文小说词频统计结果；4.支持用户自定义单词分隔符；5.词汇范围对比（额外项）。分析和设计：1.创建web工程，利用servlet上传文件的技术实现用户向服务器上传文件。页面设置表单类型为enctype="multipart/form-data"，创建文件上传文本...

第三十一节（java-实现QQ空间访问量统计系统）【代码】

LoginServlet登录页面：package com.tanzhou.servlet;import java.io.IOException; import java.io.PrintWriter; import java.io.UnsupportedEncodingException; import java.util.Enumeration;import javax.servlet.ServletException; import javax.servlet.http.HttpServlet; import javax.servlet.http.HttpServletRequest; import javax.servlet.http.HttpServletResponse; import javax.servlet.http.HttpSession;import com....

Java、PHP、Python、JS 等开发者都如何绘制统计图【图】

原文链接目前很多程序员绘图基本上都是采用后端生成数据传递给前端，然后前端将数据渲染到绘图库上面进行显示，从而得到我们最后看到的各种图，但是有时候，我们发现需要传递的数据很多很多，那么这个时候如果将数据传递给前端进行分析并展示的话是非常慢的，所以有必要在后端进行各种统计图的生成，下面我们就来聊聊各种程序员都是怎么进行图制作的？PHP程序员用php制作过统计图的人都应该知道，JqGraph与PHP的黄金搭档，用JqGra...

java-统计字符串中的汉字个数【代码】

1 String text = "你好，,.。wo"; 2 String Reg="^[\u4e00-\u9fa5]{1}$";//正则3int result=0; 4for(int i=0;i<text.length();i++){ 5 String b=Character.toString(text.charAt(i)); 6if(b.matches(Reg)) 7 result++; 8 } 9 }原文：https://www.cnblogs.com/flyinghome/p/12144630.html

开源 java CMS - FreeCMS2.3 统计分析

原文：http://qiangqiang.iteye.com/blog/2202131

javaEE之-------统计网站刷新量

每个网站都有自己的统计访问量，但是少不了服务器会出现意外情况，（如断电。。）所以就需要我们在网站挂机的前段时间将这个数据存起来。我们就需要用到网站最大的容器，application,我们采用观察者设计模式实现ServletContextListener接口。然后在销毁之前将这个数据存起来ps:属于点点知识，大牛请绕道。开发步骤：第一步：实现ServletContextListener接口。第二步：实现两个方法。contextInitializedcontextDestroyed第三步：在w...

Hbase Java API包括协处理器统计行数【代码】

package com.zy; import java.io.IOException;import org.apache.commons.lang.time.StopWatch; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.hbase.*; import org.apache.hadoop.hbase.client.Delete; import org.apache.hadoop.hbase.client.Get; import org.apache.hadoop.hbase.client.HBaseAdmin; import org.apache.hadoop.hbase.client.HTable; import org.apache.hadoop.hbase.client.Put; imp...

Java生成二维码实现扫描次数统计并转发到某个地址

需求:近几天某个项目需要用户录入个自己的网址,然后系统需要根据用户的的网址生成二维码,然后用户可以拿着它给别人扫描,访问到他录入的网址,在这个过程中.我需要知道用户的二维码被扫描的次数,也就是后面根据其可以做一些扫描排名之类的.思路:先生成二维码,csdn已经有前辈写了,那么我就直接拿过来用了. 将用户的id,和用户录入的网址处理之后作为http get参数封装到二维码中,然后用户扫描会自动跳转到我们系统的某个接口在接口中根据...

java-统计一段句子中各单词出现的次数

问题：统计一段句子中各单词出现的次数。思路：1、使用split方法将文章进行分割，我们这里以空格、逗号和句点为分隔符，然后存到一个字符串数组中。2、创建一个hashMap集合，key是字符串类型，保存单词；value是数字类型，保存该单词出现的次数。3、遍历思路1中的字符串数组，如果key（单词）没有出现过，map中增加一个元素，key为该单词，定义value为1；如果key（单词）出现过，那么value的值加1。4.遍历输入key及其对应的value值...

首页 / JAVA / java实训一——词频统计

java实训一——词频统计

内容导读

内容图文

内容总结

内容备注

内容手机端

【java实训一——词频统计】教程文章相关的互联网学习教程文章

统计 - 相关标签

JAVA - 技术教程分类

JAVA - 最新教程

JAVA - 最热教程