基于网页版的kegg总网络数据库,获取位置信息

pathview提供了一种下载包含kegg数据库位置信息的xml文件的方法。通过实际操作发现,该文件的位置信息并不太实用。为此,改为直接用kegg的网页进行解析。
(具体方法为:将kegg代谢网络图100%显示,然后进行下载图片和解析)
具体的代码如下:

# -*- coding: utf-8 -*-
"""
Created on Wed Jan 23 15:38:26 2019

@author: MTC
"""
from bs4 import BeautifulSoup
soup=BeautifulSoup(open(b))

import os
import openpyxl
from tkinter import Tk
import tkinter.filedialog as tf

Tk().withdraw()
b=tf.askopenfilename()
soup = BeautifulSoup(open(b)) #打开本地html文件

wb = openpyxl.Workbook()

sheet1=wb.create_sheet('化合物信息');
row_xia=1
for i in soup.find_all('area'):
   if 'circle' in list(i.attrs.values()):
       row_xia=row_xia+1
       sheet1.cell(row=row_xia,column=1).value=i.attrs['title']
       sheet1.cell(row=row_xia,column=2).value=i.attrs['coords']

sheet1.cell(row=1,column=1).value='化合物信息'
sheet1.cell(row=1,column=2).value='化合物坐标'
       
sheet2=wb.create_sheet('反应信息');
row_xia=1
for i in soup.find_all('area'):
   if 'poly' in list(i.attrs.values()):
       row_xia=row_xia+1
       sheet2.cell(row=row_xia,column=1).value=i.attrs['title']
       sheet2.cell(row=row_xia,column=2).value=i.attrs['coords']
sheet2.cell(row=1,column=1).value='反应信息'
sheet2.cell(row=1,column=2).value='反应坐标'        

wb.save('data3.xlsx')

   
   
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • Swift1> Swift和OC的区别1.1> Swift没有地址/指针的概念1.2> 泛型1.3> 类型严谨 对...
    cosWriter阅读 13,798评论 1 32
  • 从三月份找实习到现在,面了一些公司,挂了不少,但最终还是拿到小米、百度、阿里、京东、新浪、CVTE、乐视家的研发岗...
    时芥蓝阅读 42,444评论 11 349
  • 人生若是没有遗憾,该多么无趣啊。”王家卫如是说。 可是当这个季节叶落风起,一个人走在街上,裹紧外套时,我总伴着路边...
    一只柚阅读 1,683评论 0 0
  • 1 一共八个物种拟南芥: (其他7类已下载) 2 将各个物种的refseq单独与基因进行对比过程与之前类似: 建库...
    简单点lili阅读 4,647评论 0 1