首页 / JAVA / Java实验--统计字母出现频率及其单词个数

Java实验--统计字母出现频率及其单词个数

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了Java实验--统计字母出现频率及其单词个数，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含5635字，纯文字阅读大概需要9分钟。

内容图文

本周的实验要求在之前实现统计单词的基础之上(可以见之前博客的统计单词的那个实验)，对其进行修改成所需要的格式，统计字母出现频率的功能，并按照一定的格式把最终结果的用特定的格式在文本中显示出来

统计过程的实现并不太麻烦，在原来的基础上导入导出函数的基础上修改成通用的类型，统计单词的那一部分的单个字符读取那一段加上统计字母的情况，并加上判断把大小写字母统一起来。

同时，在统计单词的那里加上一个无用字母的表格。这样就可以统计有用意义的前n个最常用的单词了。

实验的代码如下所示：

            package
             pipei;

            //
            洪鼎淇 20173627 信1705-3
            import
             java.io.File;

            import
             java.io.FileInputStream;

            import
             java.io.FileOutputStream;

            import
             java.io.IOException;

            import
             java.io.InputStreamReader;

            import
             java.io.OutputStreamWriter;

            import
             java.text.DecimalFormat;

            import
             java.util.HashMap;

            import
             java.util.Map;

            //
            哈利波特单词统计
            public
            class
             Pipei {
    
            public
            static Map<String,Integer> map1=new HashMap<String,Integer>();
    staticint g_Wordcount[]=newint[27];
    staticint g_Num[]=newint[27];
    
    static String []unUse=new String[] {
        "it",
        "in",
        "to",
        "of",
        "the",
        "and",
        "that",
        "for"
    };
    
    publicstaticvoid main(String arg[]) {
        daoruFiles("piao.txt","tongji");
        traverseFolder2("C:\\Users\\Halo\\javatest\\pipei\\piao");
        
    }
    publicstaticvoid daoruFiles(String a,String dc)
    {
        map1.clear();
        try {
            daoru(a);
        } catch (IOException e) {
            // TODO 自动生成的 catch 块            e.printStackTrace();
            
        }
        String sz[];
        Integer num[];
        finalint MAXNUM=10; //统计的单词出现最多的前n个的个数for(int i=0;i<g_Wordcount.length;i++)
        {
            g_Wordcount[i]=0;
            g_Num[i]=i;
        }
        
        sz=new String[MAXNUM+1];
        num=new Integer[MAXNUM+1];
        Pipei pipei=new Pipei();
        int account =1;
        //Vector<String> ve1=new Vector<String>();try {
            daoru(a);
        } catch (IOException e) {
            // TODO 自动生成的 catch 块            e.printStackTrace();
        }
        System.out.println("英文单词的出现情况如下:");
        int g_run=0;
        
        for(g_run=0;g_run<MAXNUM+1;g_run++)
        {
            account=1;
            for(Map.Entry<String,Integer> it : Pipei.map1.entrySet())
            {
                if(account==1)
                {
                    sz[g_run]=it.getKey();
                    num[g_run]=it.getValue();
                    account=2;
                }
                if(account==0)
                {
                    account=1;
                    continue;
                }
                if(num[g_run]<it.getValue())
                {
                    sz[g_run]=it.getKey();
                    num[g_run]=it.getValue();
                }
                //System.out.println("英文单词: "+it.getKey()+" 该英文单词出现次数: "+it.getValue());            }
            Pipei.map1.remove(sz[g_run]);
        }
        int g_count=1;
        String tx1=new String();
        String tx2=new String();
        for(int i=0;i<g_run;i++)
        {
            if(sz[i]==null)
                continue;
            if(sz[i].equals(""))
                continue;
            tx1+="出现次数第"+(g_count)+"多的单词为:"+sz[i]+"\t\t\t出现次数: "+num[i]+"\r\n";
            System.out.println("出现次数第"+(g_count)+"多的单词为:"+sz[i]+"\t\t\t出现次数: "+num[i]);
            g_count++;
        }
        try {
            daochu(tx1,dc+"2.txt");
        } catch (IOException e) {
            // TODO 自动生成的 catch 块            e.printStackTrace();
        }
        
        //------------------------------int temp=g_Wordcount[0];
        int numtemp=0;
        for(int i=0;i<26;i++)
        {
            for(int j=i;j<26;j++)
            {
                if(g_Wordcount[j]>g_Wordcount[i])
                {
                    temp=g_Wordcount[i];
                    g_Wordcount[i]=g_Wordcount[j];
                    g_Wordcount[j]=temp;
                    numtemp=g_Num[i];
                    g_Num[i]=g_Num[j];
                    g_Num[j]=numtemp;
                    
                }
            }
        }
        int sum=0;
        for(int i=0;i<26;i++)
        {
            sum+=g_Wordcount[i];
        }
        for(int i=0;i<26;i++)
        {
            char c=(char) (‘a‘+g_Num[i]);
            tx2+=c+":"+String.format("%.2f%% \r\n", (double)g_Wordcount[i]/sum*100);
        }
        try {
            daochu(tx2,dc+"1.txt");
        } catch (IOException e) {
            // TODO 自动生成的 catch 块            e.printStackTrace();
        }
        
        //------------------------------        
    }
    publicstaticvoid daoru(String s) throws IOException
    {
        
        File a=new File(s);
        FileInputStream b = new FileInputStream(a);
        InputStreamReader c=new InputStreamReader(b,"UTF-8");
        String string2=new String("");
        while(c.ready())
        {
            char string1=(char) c.read();
            if(WordNum(string1)>=0)
            {
                g_Wordcount[WordNum(string1)]+=1;
            }
            
            //------------------------if(!isWord(string1))
            {
                if(!isBaseWord(string2))
                {
                    if(map1.containsKey(string2.toLowerCase()))
                    {
                        Integer num1=map1.get(string2.toLowerCase())+1;
                        map1.put(string2.toLowerCase(),num1);
                    }
                    else
                    {
                        Integer num1=1;
                        map1.put(string2.toLowerCase(),num1);
                    }
                }
                string2="";
            }
            else
            {
                if(isInitWord(string1))
                {
                    string2+=string1;
                }
            }
        }
        if(!string2.isEmpty())
        {
            if(!isBaseWord(string2))
            {
                if(map1.containsKey(string2.toLowerCase()))
                {
                    Integer num1=map1.get(string2.toLowerCase())+1;
                    map1.put(string2.toLowerCase(),num1);
                }
                else
                {
                    Integer num1=1;
                    map1.put(string2.toLowerCase(),num1);
                }
            }
            
            string2="";
        }
        c.close();
        b.close();
    }
    publicstaticvoid daochu(String txt,String outfile) throws IOException
    {
        File fi=new File(outfile);
        FileOutputStream fop=new FileOutputStream(fi);
        OutputStreamWriter ops=new OutputStreamWriter(fop,"UTF-8");
        ops.append(txt);
        ops.close();
        fop.close();
    }
    publicstaticboolean isWord(char a)
    {
        if(a<=‘z‘&&a>=‘a‘||a<=‘Z‘&&a>=‘A‘||a==‘\‘‘)
            returntrue;
        returnfalse;
    }
    publicstaticboolean isInitWord(char a)
    {
        if(a<=‘z‘&&a>=‘a‘||a<=‘Z‘&&a>=‘A‘||a>‘0‘&&a<‘9‘||a==‘\‘‘)
            returntrue;
        returnfalse;
    }
    publicstaticboolean isBaseWord(String word)
    {
        for(int i=0;i<unUse.length;i++)
        {
            if(unUse[i].equals(word)||word.length()==1)
                returntrue;
        }
        returnfalse;
    }
    publicstaticint WordNum(char a)
    {
        if(a<=‘z‘&&a>=‘a‘)
            return a-‘a‘;
        elseif(a<=‘Z‘&&a>=‘A‘)
            return a-‘A‘;
        return -1;
    }
    //----递归文件夹publicstaticvoid traverseFolder2(String path) {

        File file = new File(path);
        if (file.exists()) {
            File[] files = file.listFiles();
            if (null == files || files.length == 0) {
                System.out.println("文件夹是空的!");
                return;
            } else {
                for (File file2 : files) {
                    if (file2.isDirectory()) {
                        System.out.println("文件夹:" + file2.getAbsolutePath());
                        traverseFolder2(file2.getAbsolutePath());
                    } else {
                        System.out.println("文件:" + file2.getAbsolutePath());
                        String name=file2.getName();
                        daoruFiles(file2.getAbsolutePath(), file2.getParentFile()+"\\"+name.replace(".txt", "")+"tongji");
                        
                    }
                }
            }
        } else {
            System.out.println("文件不存在!");
        }
    }

    
}

将飘的整本小说及其分章节放在一个文件夹中，最终的实验结果如下：

技术分享图片

tongji1位后缀的是文章字母构成比例（以整本飘的英文小说为例子）：

技术分享图片

tongji2的实验结果是有意义单词的出现次数前10的排名：

技术分享图片

对整本飘小说处理的时间级别在1秒以内，处理大文件及其多文件的过程在测试过程中没有出现问题。

原文：https://www.cnblogs.com/halone/p/10809496.html

内容总结

以上是互联网集市为您收集整理的Java实验--统计字母出现频率及其单词个数全部内容，希望文章能够帮你解决Java实验--统计字母出现频率及其单词个数所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/1091200.html

来源：【匿名】

【上一篇】java 基础之语法关键词的使用【下一篇】JAVA/JSP学习系列之五

更多 ►

【Java实验--统计字母出现频率及其单词个数】教程文章相关的互联网学习教程文章

Hbase Java API包括协处理器统计行数【代码】

package com.zy; import java.io.IOException;import org.apache.commons.lang.time.StopWatch; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.hbase.*; import org.apache.hadoop.hbase.client.Delete; import org.apache.hadoop.hbase.client.Get; import org.apache.hadoop.hbase.client.HBaseAdmin; import org.apache.hadoop.hbase.client.HTable; import org.apache.hadoop.hbase.client.Put; imp...

Java生成二维码实现扫描次数统计并转发到某个地址

需求:近几天某个项目需要用户录入个自己的网址,然后系统需要根据用户的的网址生成二维码,然后用户可以拿着它给别人扫描,访问到他录入的网址,在这个过程中.我需要知道用户的二维码被扫描的次数,也就是后面根据其可以做一些扫描排名之类的.思路:先生成二维码,csdn已经有前辈写了,那么我就直接拿过来用了. 将用户的id,和用户录入的网址处理之后作为http get参数封装到二维码中,然后用户扫描会自动跳转到我们系统的某个接口在接口中根据...

java-统计一段句子中各单词出现的次数

问题：统计一段句子中各单词出现的次数。思路：1、使用split方法将文章进行分割，我们这里以空格、逗号和句点为分隔符，然后存到一个字符串数组中。2、创建一个hashMap集合，key是字符串类型，保存单词；value是数字类型，保存该单词出现的次数。3、遍历思路1中的字符串数组，如果key（单词）没有出现过，map中增加一个元素，key为该单词，定义value为1；如果key（单词）出现过，那么value的值加1。4.遍历输入key及其对应的value值...

Java web 实现之 Filter分析ip统计网站的访问次数【代码】

统计工作需要在所有资源之前都执行，那么就可以放到Filter中了。我们这个过滤器不打算做拦截操作！因为我们只是用来做统计的。用什么东西来装载统计的数据。Map<String,Integer>整个网站只需要一个Map即可！Map什么时候创建（使用ServletContextListener，在服务器启动时完成创建，并只在到ServletContext中），Map保存到哪里！（Map保存到ServletContext中！！！） Map需要在Filter中用来保存数据Map需要在页面使用，打印Map中的数...

Java web 实现之 Filter分析ip统计网站的访问次数【代码】【图】

hdu 2017 字符串统计(java)【代码】

问题：本题主要是对字符串输入的处理：String a=cin.next();char [] s=a.toCharArray();字符串统计Time Limit: 2000/1000 MS (Java/Others) Memory Limit: 65536/32768 K (Java/Others) Total Submission(s): 51624 Accepted Submission(s): 28327Problem Description对于给定的一个字符串，统计其中数字字符出现的次数。 Input输入数据有多行，第一行是一个整数n，表示测试实例的个数，后面跟着n行，每行包括一个由字母和数...

java面试题：如果一串字符如"aaaabbc中国1512"要分别统计英文字符的数量，中文字符的数量，和数字字符的数量，假设字符中没有中文字符、英文字符、数字字符之外的其他特殊字符。【代码】【图】

package com.swift;publicclass TotalNumber_String {publicstaticvoid main(String[] args) {/** 如果一串字符如"aaaabbc中国1512"要分别统计英文字符的数量，中文字符的数量，和数字字符的数量，* 假设字符中没有中文字符、英文字符、数字字符之外的其他特殊字符。*/String str="aaaabbc中国1512";int engishCount = 0;int chineseCount = 0;int digitCount = 0;for(int i=0;i<str.length();i++){char ch = str.charAt(i);if(Cha...

Java统计文件中字母个数【代码】【图】

import java.text.DecimalFormat; import java.io.File; import java.io.FileReader; import java.io.BufferedReader; import java.io.IOException; import java.io.FileNotFoundException; public class zimu {private void HandleLetter(File file)throws IOException,FileNotFoundException{DecimalFormat df = new DecimalFormat("#0.00");if(file.length()>0){int[] iNum=new int[26];FileReader fr=new FileReader(file);Buf...

Java实验--统计字母出现频率及其单词个数【代码】【图】

本周的实验要求在之前实现统计单词的基础之上(可以见之前博客的统计单词的那个实验)，对其进行修改成所需要的格式，统计字母出现频率的功能，并按照一定的格式把最终结果的用特定的格式在文本中显示出来统计过程的实现并不太麻烦，在原来的基础上导入导出函数的基础上修改成通用的类型，统计单词的那一部分的单个字符读取那一段加上统计字母的情况，并加上判断把大小写字母统一起来。同时，在统计单词的那里加上一个无用字母的表格...

Java实现的词频统计——功能改进【代码】【图】

本次改进是在原有功能需求及代码基础上额外做的修改，保证了原有的基础需求之外添加了新需求的功能。功能：　　1. 小文件输入——从控制台由用户输入到文件中，再对文件进行统计；　　2.支持命令行输入英文作品的文件名；　　3.支持命令行输入存储有英文作品文件的目录名，批量统计；　　4.从控制台读入英文单篇作品，重定向输入流。实现：　　1.判断输入方式，如果从命令行传递参数则直接对文件进行统计；如果未传递参数，其方式同...

java 每日习题（七）统计字符串中字母、空格、数字和其它字符的个数【代码】

题目：输入一行字符，分别统计出其中英文字母、空格、数字和其它字符的个数。先把String转化成array，再通过Character中的几个方法对每个char进行判断。下面是Character类的介绍：Character 类在对象中包装一个基本类型 char 的值。Character 类型的对象包含类型为 char 的单个字段。此外，该类提供了几种方法，以确定字符的类别（小写字母，数字，等等），并将字符从大写转换成小写，反之亦然。 package everyDay;import java...

javaEE之-------统计站点刷新量【代码】

每一个站点都有自己的统计訪问量，可是少不了server会出现意外情况，（如断电。。）所以就须要我们在站点挂机的前段时间将这个数据存起来。我们就须要用到站点最大的容器，application,我们採用观察者设计模式实现ServletContextListener接口。然后在销毁之前将这个数据存起来ps:属于点点知识。大牛请绕道。开发步骤：第一步：实现ServletContextListener接口。第二步：实现两个方法。contextInitializedcontextDestroyed 第三步：...

javaApi,mapreduce,awk,scala四种方式实现词频统计【代码】

awk方式实现词频统计：方式一： vi wordcount.awk {for (i = 1; i <=NF;i++) //NF 表示的是浏览记录的域的个数 freq[$i]++ } END{for(word in freq) //printf "%s%d\n",word,freq[word] // } 运行：awk -f wordcount.awk words.txt; ---------------------------------- 方式二：运行方式二： vi wordcount_awk.sh #!/bin/sh awk -F " " ‘{for (i = 1; i<=NF; i++) freq[$i]++ } END{for (word in freq)printf "%s%d\n",word,fr...

Java-Hadoop-工作统计

我使用hadoop在集群上运行map-reduce应用程序.这些工作大约需要10个小时才能每天完成.我想知道每项工作所花费的时间,以及最长的工作等所花费的时间.因此,我可以优化这些工作.是否有任何插件或脚本可以做到这一点？谢谢巴拉解决方法:看一下http：//：50030或http：//：50030 / jobhistory.jsp(在底部. 每个工作/任务/任务部分都有一个分析(映射,排序,缩小).很方便.您可以编写自己的日志-我只是“获取”所有Analysis-Pages,并将其通...

[原创]java WEB学习笔记92：Hibernate学习之路-- -QBC 检索和本地 SQL 检索：基本的QBC 查询，带 AND 和 OR 的QBC，统计查询，排序，分页【代码】【图】

内容难免出现问题，欢迎指正，交流，探讨，可以留言，也可以通过以下方式联系。本人互联网技术爱好者，互联网技术发烧友微博：伊直都在0221 QQ：951226918 ----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------- 1...

首页 / JAVA / Java实验--统计字母出现频率及其单词个数

Java实验--统计字母出现频率及其单词个数

内容导读

内容图文

内容总结

内容备注

内容手机端

【Java实验--统计字母出现频率及其单词个数】教程文章相关的互联网学习教程文章

统计 - 相关标签

JAVA - 技术教程分类

JAVA - 最新教程

JAVA - 最热教程