#C 期末作业

*Description
在当前目录中存在文件名为"case1.in"(其中case后为数字1,不是字母l,写错提交后会判错)的文本文件,
其内容为一篇英文文章(以EOF作为结束标志)。现要求读取该文本文件内容,统计文章中每个单词出现的次数,
并输出出现次数最多的前5个单词及其出现次数(按出现次数由多到少的顺序输出,次数相同时按字典顺序输出,
不足5个单词时,按序输出全部单词)。程序中注意如下细节:
(1) 空格、标点符号与回车符起到分隔单词的作用。
(2) 文章一行的末尾可能有连字符,出现连字符时,该行最末的字符串与下行最先出现的字符串构一个单词;
(3) 名词缩写算一个单词;
(4) 数字不算单词;
(5) 单词不区分大小写;
(6) 输出时单词全使用小写;
OJ截图
//代码片段。
#include <stdio.h>
#include <stdlib.h>
#include <math.h>
#include <string.h>

//定义结构体。
struct list
{
    int time;
    char words[21];
}word[10001];

int main()
{
    //声明变量。
    FILE *fp;
    fp=fopen("case1.in","r");
    int count=0,num=0,q=0,i;
    char ch,temp[21];

    //初始化结构体数组
    for(num=0;num<10001;num++)
    {
        word[num].time=1;//次数归一
        memset(word[num].words,0,sizeof(word[num].words));
    }

    //重做文件读取操作。更简!更简!更简!!!!
    while((ch=fgetc(fp))!=EOF)
    {
        if(ch>='a'&&ch<='z')
            word[count].words[q++]=ch;

            //大小写转换
        else if(ch>='A'&&ch<='Z')
            word[count].words[q++]=ch+32;

            //分页符转换
        else if(ch=='-')
        {
            ch=fgetc(fp);
            if(ch=='\n')
                continue;
            else
            {
                count++;
                q=0;
                if(ch>='a'&&ch<='z')
                    word[count].words[q++]=ch;
                else if(ch>='A'&&ch<='Z')
                    word[count].words[q++]=ch+32;
            }
        }
        else
        {
            count++;
            q=0;
        }
    }

    //对比相同 加次数 清同串。
    for(num=0;num<count;num++)
    {
        for(i=num+1;i<count;i++)
            if(!strcmp(word[num].words,word[i].words))
            {
                word[num].time++;
                memset(word[i].words,0,sizeof(word[i].words));
            }
    }

    //清其他字符干扰。
    for(i=0;i<count;i++)
    {
        if(word[i].words[0]<'a'||word[i].words[0]>'z')
        {
            word[i].time=0;
        }
    }

    //重做排序 更快!更快!更快!!!!
    for(i=1;i<count;i++)
        for(num=0;num<count-i;num++)
        {
            if(word[num].time<word[num+1].time)
            {
                //次数排序
                int t=word[num].time;
                word[num].time=word[num+1].time;
                word[num+1].time=t;
                strcpy(temp,word[num].words);
                strcpy(word[num].words,word[num+1].words);
                strcpy(word[num+1].words,temp);
            }
            else if(word[num].time==word[num+1].time)
            {
                //字母顺序
                if(strcmp(word[num].words,word[num+1].words)>0)
                {
                    strcpy(temp,word[num].words);
                    strcpy(word[num].words,word[num+1].words);
                    strcpy(word[num+1].words,temp);
                }
            }
        }

    //输出方法。
    for(i=0;i<5;i++)
    {
        printf("%s %d\n",word[i].words,word[i].time);
    }

    //关闭文件
    fclose(fp);
    return 0;
}

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • Ubuntu的发音 Ubuntu,源于非洲祖鲁人和科萨人的语言,发作 oo-boon-too 的音。了解发音是有意...
    萤火虫de梦阅读 99,757评论 9 468
  • 1. Java基础部分 基础部分的顺序:基本语法,类相关的语法,内部类的语法,继承相关的语法,异常的语法,线程的语...
    子非鱼_t_阅读 31,898评论 18 399
  • Spring Cloud为开发人员提供了快速构建分布式系统中一些常见模式的工具(例如配置管理,服务发现,断路器,智...
    卡卡罗2017阅读 135,314评论 19 139
  • linux资料总章2.1 1.0写的不好抱歉 但是2.0已经改了很多 但是错误还是无法避免 以后资料会慢慢更新 大...
    数据革命阅读 14,182评论 2 33
  • “十亩之间”是《诗经·魏风》中的一首诗。 十亩之间兮,桑者闲闲兮,行与子还兮。 十亩之外兮,桑者泄泄兮,行与子逝兮...
    一夕厘阅读 4,459评论 0 0