奇葩版 - fscanf

最近在帮妈妈写一个类似工具箱的小程序时,要用到读取配置文件的功能。一开始用的是:fgets,一行一行地读取再用strtok对内容进行分割。

后来无意中看到一篇文章(文章标题好像是《fscanf读取一行...》在此感谢这位同学),发现fscanf可以直接以格式化读取文件。

我们先看看 fscanf 函数:
int fscanf(FILE*stream, constchar*format, [argument...]); 

其中最重要也最难理解的是第二个参数:format。这个参数的一般用法和scanf一样,网上到处都是,这里不再赘述。
我们要研究的是我们的配置文件如何按格式读取,来看一个配置文件的例子:

vc6 = C:\Program Files\VC6EN\COMMON\MSDEV98\BIN\MSDEV.EXE
python = C:\python36\python.exe

这是配置文件的一般形式(注意“=”左右侧有空格),根据fscanf读取的特性:在遇到空格或换行的时候停止读取。
那我们就可以这样读取全部信息:

int main(int argc, char* argv[])
{
    FILE *fpconf;
    fpconf = fopen("D:\\configure", "r"); //上面的配置信息写在这个文件里
    if(!fpconf)
    {
        printf("读取配置文件失败!");
        return 1;
    }

    struct json
    {
        char key[256];
        char value[256];
    };

    struct json myconf;

    int index = 1;
    while(!feof(fpconf))
    {
        memset(&myconf, 0, sizeof(myconf));

        fscanf(fpconf, "%s = %s", myconf.key, myconf.value);  //这里注意 “=” 左右要有空格
        printf("第%d个应用程序:%s, 路径:%s\n", index, myconf.key, myconf.value);

        index++;
    }

    if(fpconf)
        fclose(fpconf);

    return 0;
}

运行结果:

result1.jpg

可以看到,这明显不是我们想要的结果。这是为什么呢,还是那个原因:在遇到空格或换行的时候停止读取。
因为第一个应用程序的路径中:C:\Program (这里有空格)Files\VC6EN\COMMON\MSDEV98\BIN\MSDEV.EXE,fscanf函数在这里停止了,把后面的内容作为下一行来读取,所以出现了这样的结果。
那么我们应该怎么办呢?这里要用到一个类似正则式的写法:

...
fscanf(fpconf, "%s = %[^\n]", myconf.key, myconf.value);  //这里注意 “=” 左右要有空格
...

结果:

result2.jpg

可以看到,这里就是我们想要的运行结果了。
%[^\n]这是个什么东西呢?其实他类似于正则中的匹配,意思是:不遇到“\n”就一直读取,那"\n"我们都知道,就是“换行”,而空格不是换行,所以就会把空格也读取进来,而不是遇到空格停止读取


根据上面的功能引申一下:我们写好程序,而其它人不知道编写配置文件的规则,不知道要在 = 号两边加空格,而写成这样了:

vc6=C:\Program Files\VC6EN\COMMON\MSDEV98\BIN\MSDEV.EXE
python=C:\python36\python.exe

那会发生什么呢?我们来看看运行结果:

result3.jpg

这明显不是我们想要的。那我们又应该怎么办呢?
首先我们分析一下配置文件的结构:
=号左侧是一个字符串
=号右侧也是一个字符串
所以它一定是用=号来分隔,根据:不遇到XX就一直读取这一原则,我们应该把读取格式写成:

fscanf(fpconf, "%[^=] = %[^\n]\n", myconf.key, myconf.value);  //这里注意 “=” 左右要有空格

结果:


result4.jpg

这就是我们想要的了。

这句话分成两个部分来理解:

  1. %[^=] 理解为不遇到 = 号就一直读取;
  2. %[^\n] 理解为不遇到换行就一直读取(空格也读取)。

那为什么 %[^=] 之后还有一个 = 号呢?那是因为,只要没有写在“格式”中的字符或字符串,fscanf都会理解为是程序员想要的内容,并将其读取到我们的变量中,所以如果我们不想要 = 这个字符,就要把它写上,避免被读取进我们要的内容中。

到这里,这篇文章就写完了,如果后续还有好玩的用法,再更新。

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容