C语言词频统计设计

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了C语言词频统计设计，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含1146字，纯文字阅读大概需要2分钟。

内容图文

项目需求：

1.设计一个词频统计小软件，对给定的英文文章进行单词频率的统计。

2.文章中相应的标点不计入统计。

3.将统计结果以从大到小的排序方式输出。

设计：

1.因为功能相对简单，采用C语言直接进行编写。

2.项目包含的统计功能利用定义的结构体分别对单词和次数进行统计。

3.以字符串的形式读取单词，并对其中的每个字符进行标点分析。

4.统计完成后采用冒泡排序的方式对次数进行排序。

5.将整个统计结果循环输出。

部分核心代码：

结构体定义：

typedef struct addup
{
    char word[50];
    int count;
}R;

读取文本：

            char temp[50];
       R fin[10000]={"\0",0};
       fp=fopen("f:/1.txt","r");
       while(!feof(fp))
       {
           fscanf(fp,"%s",temp);
           q=strlen(temp);
               n++;
               for(i=0;i<n;++i)
                 if(strcmp(fin[i].word,temp)==0)
                {
                     fin[i].count++;
                      n--;
                      break;
                 }
               if(i>=n)
             {
                 strcpy(fin[n-1].word,temp);
                fin[n-1].count++;
               }
       }

标点判定：

            for(i=0;i<q;i++)
{
     if(temp[i]==‘,‘||temp[i]==‘.‘||temp[i]==‘?‘||temp[i]==‘!‘||temp[i]==‘"‘)
     temp[i]=‘\0‘;
}

冒泡排序：

            for (i=0;i<n;i++)  
        for (j=0;j<n-i;j++)  
          {  
            if (fin[j].count<fin[j+1].count)  
               {  
               ls[0]=fin[j+1];  
               fin[j+1]=fin[j];  
               fin[j]=ls[0];  
               }  
          }

输出结果：

 freopen("f:/2.txt","w",stdout);      
       for(i=0;i<n;i++)
       {
         printf("%s : ",fin[i].word);
         s=0;
            for(j=0;j<fin[i].count;++j)
             s++;
         printf("%d 次",s);
         printf("\n");
       }
       fclose(stdout);

测试用例：

因为词频统计单词重复几率不会过高，因此小篇幅文章不一定能得出好的测试结果，选取了马丁路德金的《I have a dream》演讲稿进行统计。

全篇单词量：1666

技术分享

测试结果：

技术分享

原文：http://www.cnblogs.com/shaloo/p/5841877.html

内容总结

以上是互联网集市为您收集整理的C语言词频统计设计全部内容，希望文章能够帮你解决C语言词频统计设计所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/1084097.html

来源：【匿名】

【上一篇】C语言中#define的用法【下一篇】C语言MD5的源码实例详解

更多 ►

【C语言词频统计设计】教程文章相关的互联网学习教程文章

原文:用C语言实现统计一个文件夹中各种文件的比例　　《UNIX环境高级编程》中的程序清单4-7就介绍了如何实现递归地统计某个目录下面的文件！我刚开始看过它的代码后，觉得照着敲太没意思了，所以就合上书自己写了一遍！为此还写了一篇博文，这是博文地址：在linux下用C语言实现递归查看某个目录中的所有文件【CSDN】！今天做《Unix环境高级编程》的课后题，看到题目4.11这里提供了一种新的实现这个程序的思路，那就是每回读到一个...

C语言词频统计设计【代码】【图】

项目需求：1.设计一个词频统计小软件，对给定的英文文章进行单词频率的统计。2.文章中相应的标点不计入统计。3.将统计结果以从大到小的排序方式输出。设计：1.因为功能相对简单，采用C语言直接进行编写。2.项目包含的统计功能利用定义的结构体分别对单词和次数进行统计。3.以字符串的形式读取单词，并对其中的每个字符进行标点分析。4.统计完成后采用冒泡排序的方式对次数进行排序。5.将整个统计结果循环输出。部分核心代码：结...

【c语言】统计一个数字在排序数组中出现的次数【图】

// 题目：统计一个数字在排序数组中出现的次数。// 比如：排序数组｛1。2，3，3，3，3，4。5｝和数字3，因为3出现了4次。因此输出4有一种最简单的算法，遍历。可是有比它效率更高的先看遍历：#include <stdio.h> #include <assert.h>int num_time(int *arr, int len, int a) {int i = 0;int count = 0;assert(arr != NULL);for (; i < len; ++i){if (arr[i] == a)count++;}return count; }int main() {int arr[] = { 1, 2, 3, 3, ...

C语言 · 分数统计【代码】

算法提高分数统计时间限制：1.0s 内存限制：512.0MB 问题描述　　2016.4.5已更新此题，此前的程序需要重新提交。问题描述　　给定一个百分制成绩T，将其划分为如下五个等级之一：　　90~100为A，80~89为B，70~79为C，60~69为D，0~59为E　　现在给定一个文件inp，文件中包含若干百分制成绩（成绩个数不超过100），请你统计五个等级段的人数，并找出人数最多的那个等级段，按照从大到小的顺序输出该段中所有人成绩（保证人数...

C语言编程＞第二十三周 ⑧ 下列给定程序中，函数fun的功能是：统计一个无符合整数中各位数字值为0的个数，通过形参传回主函数，并把该整数中各位上最大的数字值作为函数值返回。【代码】【图】

例题：下列给定程序中，函数fun的功能是：统计一个无符合整数中各位数字值为0的个数，通过形参传回主函数，并把该整数中各位上最大的数字值作为函数值返回。例如。若输入无符号整数10080，则数字值为0的个数为3，各位上数字值最大的是8。注意：不要改动main函数，不能增行或删行，也不能更改程序的结构。代码如下： #include<stdio.h> int fun(unsigned m,int*z) {int n=0,max=0,t;do{t=m%10;if(t==0)n++;if(max<t)max=t;m=m/10...

浙大版《C语言程序设计（第3版）》题目集习题5-5 使用函数统计指定数字的个数

>>>>' rel='nofollow' target='_blank'>- - -》博主推荐，学生党、程序员必备，点击查看- - - >>>>> 热门文章推荐以下50道算法编程题访问量较大，包含常用语法，数据结构，解题思路等等，作为C语言学习者必练题目推荐给各位。创作不易，记得一键三连哦！！！程序设计（C/C++）热门文章一览表公众号【C you again】回复“浙大版C语言”获取完整题目集及代码 1、浙大版《C语言程序设计（第3版）》题目集练习2-6 计算物体自由下落的...

浙大版《C语言程序设计（第3版）》题目集练习4-11 统计素数并求和

ARTS-S c语言统计程序运行时间【代码】

#include <stdio.h> #include <sys/time.h> #include <unistd.h>int main() {struct timeval start, end;gettimeofday(&start, NULL);sleep(2);gettimeofday(&end, NULL);long seconds = end.tv_sec - start.tv_sec;long micros = end.tv_usec - start.tv_usec;printf("Time elpased is %f s.\n", ((float)micros) / 1000000 + seconds);return 0; }

C语言简易程序设计————18、统计英文字母、空字、数字与其他字符【图】

/********************** 题目：输入一行字符，分别统计出其中英文字母、空格、数字和其它字符的个数。 1.程序分析：利用while语句,条件为输入的字符不为'\n'.2.程序源代码： *********************/ #include "stdio.h" void main() {char c;int letters=0,space=0,digit=0,others=0;printf("please input some characters\n");while((c=getchar())!='\n'){if(c>='a'&&c<='z'||c>='A'&&c<='Z')letters++;else if(c==' ')space++;e...

浙大版《C语言程序设计（第3版）》题目集练习3-3 统计学生平均成绩与及格人数（15 分）【代码】

练习3-3 统计学生平均成绩与及格人数（15 分）本题要求编写程序，计算学生们的平均成绩，并统计及格（成绩不低于60分）的人数。题目保证输入与输出均在整型范围内。输入格式: 输入在第一行中给出非负整数N，即学生人数。第二行给出N个非负整数，即这N位学生的成绩，其间以空格分隔。输出格式: 按照以下格式输出： average = 成绩均值 count = 及格人数其中平均值精确到小数点后一位。输入样例: 5 77 54 92 73 60输出样例: aver...

CentOS7环境下使用C语言统计指定端口流量【代码】

之前我在这篇文章里介绍了使用脚本方便地检测特定端口流量的方法。但是实际使用时发现脚本太过臃肿，执行效率不高，遂萌生出将其写为C程序的想法。下面提供我自己写的代码，以供参考。注：本程序在CentOS7x64下编译通过。 #include <stdio.h> #include <stdlib.h> #include <unistd.h> #include <string.h>int daemon(int nochdir, int noclose); int main(int argc, char *argv[], char *envp[]) {daemon(1, 1);//load parameters...

首页 / C语言 / C语言词频统计设计

C语言词频统计设计

内容导读

内容图文

内容总结

内容备注

内容手机端

【C语言词频统计设计】教程文章相关的互联网学习教程文章

用C语言实现统计一个文件夹中各种文件的比例【代码】【图】

C语言词频统计设计【代码】【图】

【c语言】统计一个数字在排序数组中出现的次数【图】

C语言 · 分数统计【代码】

C语言编程＞第二十三周 ⑧ 下列给定程序中，函数fun的功能是：统计一个无符合整数中各位数字值为0的个数，通过形参传回主函数，并把该整数中各位上最大的数字值作为函数值返回。【代码】【图】

浙大版《C语言程序设计（第3版）》题目集习题5-5 使用函数统计指定数字的个数

浙大版《C语言程序设计（第3版）》题目集练习4-11 统计素数并求和

ARTS-S c语言统计程序运行时间【代码】

C语言简易程序设计————18、统计英文字母、空字、数字与其他字符【图】

浙大版《C语言程序设计（第3版）》题目集练习3-3 统计学生平均成绩与及格人数（15 分）【代码】

CentOS7环境下使用C语言统计指定端口流量【代码】

C语言 - 相关标签

统计 - 相关标签

C语言 - 技术教程分类

C语言 - 最新教程

C语言 - 最热教程