Writer&Reader based on osmpbfreader.h

基于osmpbfreader.h头文件写的存储node的ID、Lon/Lat为dense+Varint形式的文件读写练习

writer.cc
/*
// 这个程序将定义node结构体,
// 将读入的osmpbf文件中的node 存储为结构体,然后保存为二进制文件
To build this file :
g++ -o writer writer.cc -losmpbf -lprotobuf -lz

To run it:
./writer path_to_your_data.osm.pbf path_to_your_write.nd
*/

#include "osmpbfreader.h"
#include <ctime>
#include <algorithm> //for iterator
#include <map>
using namespace CanalTP;

typedef unsigned char byte;
    //////////////////////////////////////////////////////////////////
int o5_uvar64buf(byte* bufp,uint64_t v) {
  // 将一个uint64_t(无符号的64位整数) 按varient写入 缓冲区 ;
  // bufp:缓冲区中当前位置后移
  // 返回: 写入的字节数,bufp 
  byte* p0;
  uint64_t frac;

  p0= bufp; // 备份当前位置
  frac= v&0x7f;
  if(frac==v) {  // just one byte
    *bufp++= frac;
return 1;
    }
  do {
    *bufp++= frac|0x80;
    v>>= 7;
    frac= v&0x7f;
    } while(frac!=v);
  *bufp++= frac;
return bufp-p0;
  }  // end   o5_uvar64buf()
int o5_svar64buf(byte* bufp,int64_t v) {
  // 将一个 int64_t(有符号的64位整数) 作为有符号的Varint写入 buffer ;
  // bufp:缓冲区中当前位置后移
  // 返回: 写入的字节数,bufp 
  byte* p0;
  uint64_t u;
  uint64_t frac;

  p0= bufp;
  if(v<0) {
    u= -v;
    u= (u<<1)-1;
    }
  else
    u= v<<1;
  frac= u&0x7f;
  if(frac==u) {  // just one byte
    *bufp++= frac;
return 1;
    }
  do {
    *bufp++= frac|0x80;
    u>>= 7;
    frac= u&0x7f;
    } while(frac!=u);
  *bufp++= frac;
return bufp-p0;
  }  // end   o5_svar64()
  
int o5_svar32buf(byte* bufp,int32_t v) {
  // 将一个 int32_t(有符号的32位整数) 作为有符号的Varint写入 buffer ;
  // bufp:缓冲区中当前位置后移
  // 返回: 写入的字节数,bufp 
  byte* p0;
  uint32_t u;
  uint32_t frac;

  p0= bufp;
  if(v<0) {
    u= -v;
    u= (u<<1)-1;
    }
  else
    u= v<<1;
  frac= u&0x7f;
  if(frac==u) {  // just one byte
    *bufp++= frac;
return 1;
    }
  do {
    *bufp++= frac|0x80;
    u>>= 7;
    frac= u&0x7f;
    } while(frac!=u);
  *bufp++= frac;
return bufp-p0;
  }  // end   o5_svar32()
////////////////////////////////////////////
struct Node {
    // 定义一个节点结构体
    int64_t ID;
//  double Lon;
//  double Lat;
    int32_t Lon;
    int32_t Lat; // 小数点右移七位取整
    Node() {}
    Node(int64_t ID, int32_t Lon, int32_t Lat) : ID(ID), Lon(Lon), Lat(Lat)
    {}
};
// 需要定义一个visitor,它应该有三个方法,每当读文件时就会调用
struct Writer {
    // Three integers count how many times each object type occurs
    uint64_t n_count = 0; // 记录共有多少节点
      std::ofstream fout;
      byte buf[200000]; // 缓冲区 200KB
    byte* bufp = buf; // 初始指向缓冲区的起始位置
    int t=0; // 写入缓冲区字节数
    Writer(const std::string & filename)
        :  fout(filename.c_str(), std::ios::binary )
    {   // 打开文件
        if(!fout.is_open())
            fatal() << "Unable to open the file " << filename;
        msg() << "writing nodes to the file" << filename;
    }   
    ~Writer() {
        fout.close();
        msg() << "Finished, "<< n_count <<" nodes total.";
      }
///////////////////////////////////
    int flag = 0;
//  int64_t delta_id=0;
//  int32_t delta_lon=0;
//  int32_t delta_lat=0;
    int64_t temp_id = 0;
    int32_t temp_lon=0;
    int32_t temp_lat=0; 
    // 每次读到node时都会调用该方法
    void node_callback(uint64_t node_id, double lon, double lat, const Tags & tags,const Info & Ninfo){
        //    n_count++; // n_count 的初始值在函数外定义,以后由条件重置
        // Node node(node_id, int32_t(lon * 1E7), int32_t(lat *1E7));
/*
        while (flag == 0) {
//          std::cout<<"uuuu\n";
            temp_id = int64_t(node_id);
            temp_lon = int32_t(lon * 1E7);
            temp_lat = int32_t(lat * 1E7);
            t+= o5_svar64buf(bufp+t,temp_id ); 
            t+= o5_svar32buf(bufp+t, temp_lon );
            t+= o5_svar32buf(bufp+t, temp_lat );
            flag = 1;
            n_count++;
        }
*/
        if (n_count++<10000 ){ // 10000个节点一组,大约140KB 
            t+= o5_svar64buf(bufp+t, int64_t(node_id) - temp_id); 
            t+= o5_svar32buf(bufp+t, int32_t(lon * 1E7) - temp_lon);
            t+= o5_svar32buf(bufp+t, int32_t(lat * 1E7) - temp_lat);
            temp_id = int64_t(node_id);
            temp_lon = int32_t(lon * 1E7);
            temp_lat = int32_t(lat * 1E7);
          /*
          for (int i=0;i<t;i++){
            printf("0X%02X ",buf[i]);
          }
          std::cout<<"\n";
          */
        }
        else if (n_count++==10001){
            std::cout<<t<<std::endl;
          fout.write((char*) &t,sizeof(int)); // 写入接下来的数据的大小信息
          fout.write((char*) &buf, t ); // 写入数据 
        }
/*
      else if (){ // 达到10000个,将header、buffer写入文件,并重置计数器
          fout.write((char*) &t,sizeof(int)); // 写入接下来的数据的大小信息
          fout.write((char*) &buf, t ); // 写入数据      
          n_count = 0; // 重置数量计数器
          t = 0; // 重置数据大小计数器
          bufp = buf; // 重置缓冲区当前位置指针
      }
*/
    }
  
/////////////////
        
//      fout.write((char*) &node, sizeof(Node) );

    // This method is called every time a Way is read
    // refs is a vector that contains the reference to the nodes that compose the way
    void way_callback(uint64_t way_id, const Tags &tags, const std::vector<uint64_t> &refs, const Info & Winfo){
    }

    // This method is called every time a Relation is read
    // refs is a vector of pair corresponding of the relation type (Node, Way, Relation) and the reference to the object
    void relation_callback(uint64_t relation_id, const Tags &tags, const References &refs, const Info &Rinfo){
    }
};


int main(int argc, char** argv) {
     if(argc != 3) {
         std::cout << "Usage: " << argv[0] << " file_to_read.osm.pbf file_to_write.nd" << std::endl;
         return 1;
     }
    
     // Let's read that file !
     clock_t start,finish;
     double totaltime;
     start = clock(); //count running time

     Writer writer(argv[2]);
     read_osm_pbf(argv[1], writer);
     // std::cout << "We read " << writer.nodes << " nodes, " << writer.ways << " ways and " << writer.relations << " relations" << std::endl;
     
     finish = clock(); //finish count time
     totaltime = (double)(finish-start)/CLOCKS_PER_SEC;
     msg() << "Total time:"<<totaltime<<" seconds."; //"msg" is a structure defined in the header,used to cout an msg.
     return 0;
}

reader.cc


#include <fstream>
#include <iostream>
#include <iomanip>
#include <stdint.h> // 定义了几种扩展的整数类型和宏
#include <netinet/in.h> // 提供了network-byte-order的转换函数
typedef unsigned char byte;
int32_t pbf_sint32(byte** pp) {
  // 获取有符号整数的值;
  // pp: see module header;
  byte* p;
  int32_t i;
  int32_t fac;
  int sig;

  p= *pp;
  i= *p;
  if((*p & 0x80)==0) {  // 只有一比特
    (*pp)++;
    if(i & 1)  // 负数
return -1-(i>>1);
    else
return i>>1;
    }
  sig= i & 1; // 符号位
  i= (i & 0x7e)>>1;
  fac= 0x40;
  while(*++p & 0x80) {  // more byte(s) will follow
    i+= (*p & 0x7f)*fac;
    fac<<= 7;
    }
  i+= *p++ *fac;
  *pp= p;
    if(sig)  // 负数
return -1-i;
    else
return i;
}  // pbf_sint32()
int32_t pbf_sint64(byte** pp) {
  // 获取有符号整数的值;
  // pp: see module header;
  byte* p;
  int64_t i;
  int64_t fac;
  int sig;

  p= *pp;
  i= *p;
  if((*p & 0x80)==0) {  // 只有一比特
    (*pp)++;
    if(i & 1)  // 负数
return -1-(i>>1);
    else
return i>>1;
    }
  sig= i & 1; // 符号位
  i= (i & 0x7e)>>1;
  fac= 0x40;
  while(*++p & 0x80) {  // more byte(s) will follow
    i+= (*p & 0x7f)*fac;
    fac<<= 7;
    }
  i+= *p++ *fac;
  *pp= p;
    if(sig)  // 负数
return -1-i;
    else
return i;
}  // pbf_sint64()
uint64_t pbf_uint64(byte** pp) {
  // 获取无符号整数的值;
  // pp: see module header;
  byte* p;
  uint64_t i;
  uint64_t fac;

  p= *pp;
  i= *p;
  if((*p & 0x80)==0) {  // just one byte
    (*pp)++;
return i;
    }
  i&= 0x7f;
  fac= 0x80;
  while(*++p & 0x80) {  // more byte(s) will follow
    i+= (*p & 0x7f)*fac;
    fac<<= 7;
    }
  i+= *p++ *fac;
  *pp= p;
  return i;
}  // pbf_uint64()

struct Node {
        // 定义一个节点结构体
        int64_t ID;
        int32_t Lon;
        int32_t Lat;
    Node() {}
    Node(int64_t ID, int32_t Lon, int32_t Lat) : ID(ID), Lon(Lon), Lat(Lat)
    {}
};

int main(int argc, char** argv) {
    if(argc != 2) {
         std::cout << "Usage: " << argv[0] << " file_to_read.nd" << std::endl;
         return 1;
     }
    std::ifstream fin(argv[1],std::ios::in);
    if (!fin.is_open()) {
            std::cout<<"error!\n";
            return 1;
    }
    uint64_t n_count = 0; // 记录共有多少节点
    byte buf[200000]; // 缓冲区 200KB
    int t=0; // 写入缓冲区字节数
    int cnt=0; 
    int64_t temp_id = 0;
    int32_t temp_lon=0;
    int32_t temp_lat=0; 
    
    while ( fin.read((char*) &t, sizeof(int)) ) { // not the end of file
        fin.read((char*) &buf,t); // 
        buf[t] = 0x00;
//      std::cout<<t<<std::endl;
//      cnt++;
        byte* bufp = buf; // 初始指向缓冲区的起始位置
//      for (int i=0;i<t;i++) printf("%02x ",buf[i]);
        byte* bufe = buf+t; // buf's end

        while (*bufp != 0 ){
            cnt++;
            int64_t ID = pbf_sint64(&bufp)+temp_id;
            int32_t LON = pbf_sint32(&bufp)+temp_lon;
            int32_t LAT = pbf_sint32(&bufp)+temp_lat;
            printf("ID: %10d,   lat/lon: %10.7f/%-10.7f\n",ID,LON * (1E-7),LAT * (1E-7));
            temp_id = ID;
            temp_lon = LON;
            temp_lat = LAT;
/*
            std::cout<<pbf_sint64(&bufp)<<"  "
            <<std::setiosflags(std::ios::fixed)<<std::setprecision(7)<<std::setw(11)<<pbf_sint32(&bufp) * (1E-7)<<"  "
            <<std::setiosflags(std::ios::fixed)<<std::setprecision(7)<<std::setw(11)<<pbf_sint32(&bufp) * (1E-7)<<std::endl;

*/
        }   
    }
    fin.close();
    std::cout<<"total number::"<<cnt<<std::endl;
}
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 216,039评论 6 498
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,223评论 3 392
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 161,916评论 0 351
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,009评论 1 291
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,030评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,011评论 1 295
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,934评论 3 416
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,754评论 0 271
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,202评论 1 309
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,433评论 2 331
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,590评论 1 346
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,321评论 5 342
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,917评论 3 325
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,568评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,738评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,583评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,482评论 2 352

推荐阅读更多精彩内容

  • 说明本次redis集群安装在rhel6.8 64位机器上,redis版本为3.2.8,redis的gem文件版本为...
    读或写阅读 14,708评论 3 9
  • Spring Cloud为开发人员提供了快速构建分布式系统中一些常见模式的工具(例如配置管理,服务发现,断路器,智...
    卡卡罗2017阅读 134,650评论 18 139
  • 冬天的开封,晴冷。 举目远眺,到处是虬枝峥嵘的树,叶已然飘落,干依然挺直,人散漫而悠闲。旧时皇城脚下驻足而立,你只...
    濛濛细语阅读 185评论 0 0
  • 一小碟咸菜 轻轻挟块细嚼 咸中微带稍许的酸甜 放上几丝青红辣椒 味美色靓 不经意的点缀 一幅生活画现 日日是好
    六月天气阅读 514评论 49 37
  • 朗读者读的都是出版的文字。了解一些作者写作的方式和习惯,对于理解原文、找对重点有很大的帮助。 1、处女秀要印象深刻...
    朗读者晟焕阅读 731评论 0 0