两种读取entity2id.txt文件方式

2018-06-12

实现TransE算法时,在数据准备阶段,需要读取entity2id.txt和relation2id.txt文件,形成字典格式。
遇到两种读取方法:

  1. 利用open打开文件,按行读取并生成字典
sp = '\t'
file_path = os.path.jon(data_dir,"entity2id.txt")
with open(file_path,"r") as f:
  for line in f1:
    entityAndId = line.strip().split(sp)
    entity2id[entityAndId[0]] = entityAndId[1]
    entity_num +=1

2.利用panda一次性读取,并用借助zip函数转换为字典

file_path = os.path.join(data_dir,"entity2id.txt")
entity_df = pd.read_table(file_path,header=None)
entity2id = dict(zip(entity_df[0],entity_df[1]))
entity_num = len(entity2id)

那么,问题来了- 孰优孰劣???

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • .bat脚本基本命令语法 目录 批处理的常见命令(未列举的命令还比较多,请查阅帮助信息) 1、REM 和 :: 2...
    庆庆庆庆庆阅读 12,557评论 1 19
  • ¥开启¥ 【iAPP实现进入界面执行逐一显】 〖2017-08-25 15:22:14〗 《//首先开一个线程,因...
    小菜c阅读 11,713评论 0 17
  • 我不敢承诺了。
    fupeng阅读 1,137评论 0 0
  • 我和俺奶坐在屋檐下晒太阳,俺奶说现在啥好的都不想吃,喝点稀饭,吃点馍就行哩!俺奶说她心里不用,跟俺爷甚至一个夏天都...
    小马哥的写生簿阅读 2,507评论 0 0
  • 最近订阅了李笑来老师的《财富自由之路》,感慨很多。同时,我发现了什么是我生命中最高贵的财富! 移动互联网时代,带给...
    许多许多许多多阅读 3,401评论 0 2