一、 通过发票代码判断发票类型
#fpdm_ID 发票代码
def getInvoiceTypeByID(fpdm_ID):
if len(fpdm_ID) == 10:
#发票代码第7位,标识发票类型,1位专票,3为普票
if fpdm_ID[7] == '1':
InvoiceType = 'zp'
elif fpdm_ID[7] == '3':
InvoiceType = 'pp'
#2018年1月1日起,普票改为12位
elif len(fpdm_ID) == 12:
InvoiceType = 'pp'
print(InvoiceType)
return InvoiceType
二、 通过config文件获取列表参数
需要从发票验真网页上获取22个数据,因此需要22个网页元素列表,普票和专票合起来,代码量比较大。如果有修改,可能对代码稳定性造成一定的影响。 考虑将元素数据放到config中。
python config方案: 使用yaml
1、创建config文件
目录: conf/config.yaml
config.yaml文件中直接写内容:
2、文件读取
CONFIG_DATA = {}
def initConfig():
global CONFIG_DATA
f = open('./conf/config.yaml', encoding='utf-8')
CONFIG_DATA = yaml.load(f.read())
f.close()
print(config_data)
def getConfigData():
return CONFIG_DATA
def getInvoiceWebConf():
return getConfigData()["invoice_web"]
调用方法
url = getInvoiceWebConf()["url"] #如果放到文件 或者类中,注意调用关系
返回结果是URL地址 : 'https://inv-veri.chinatax.gov.cn'
invoice_data_zp = getInvoiceWebConf()["invoiceData_zp"]
返回结果是数组列表: ['fpcc_zp', 'fpdm_zp', 'fphm_zp',···]
这样就把数组 变量 列表 字典都可以拿到yaml 的config文件中,读取使用即可。
三、使用更简洁高效的方式编程
获取网页元素,开始使用的方法是,依次获取需要的元素,导致代码量很大。
改进: 将查询的网页元素添加到列表中 , 通过列表轮询的方式,依次获取,如下:
invoiceInfo_pp = invConfig.getInvoiceWebConf()["invoiceData_pp"] # 从config.yaml中读取网页元素列表
for elementKey in invoiceInfo_pp:
if webWrapper.isExistElementByID(elementKey) == True:
print("get invoice data by id:" ,elementKey)
if elementKey == "jshjdx_pp":
invoiceDatainfo.append(webWrapper.getElementTextByID(elementKey)[1:]) #去掉特殊字符
else:
invoiceDatainfo.append(webWrapper.getElementTextByID(elementKey))
else:
print("get invoice data by Xpath")
invoiceDatainfo.append(webWrapper.getElementTextByXPath(elementKey))