import sqlite3
import json
import os
'''
from cjk import *
dbname='cjk_kangxi_bushou.db'
filepath='Unihan12/a.txt'
paraList=u2para(filepath)
mdx2db(dbname,paraList)
'''
def u2para(filepath):
filelist=[]
realist=[]
paralist=[]
for line in open(filepath):
filelist.append(line)
for item in filelist:
item=item.replace('\n','').strip()
if item == '': continue
if item[0] == '#' : continue
realist.append(item)
for item in realist:
slist=item.split(';')
cjk_id=slist[0].strip()
cjk_code=slist[1].strip()
cjk_uni=slist[2].strip()
mkey=u2w(cjk_uni)
paralist.append((cjk_id,cjk_code,cjk_uni,mkey))
print('filelist',len(filelist))
print('realist',len(realist))
print('paralist',len(paralist))
return paralist
def u2w(cstr):
return chr(int('0x'+cstr,16))
def mdx2db(dbname,paraList):
if os.path.isfile(dbname):
os.remove(dbname)
createdb(dbname)
#sqlite
import sqlite3
conn = sqlite3.connect(dbname)
c = conn.cursor()
for item in paraList:
msql='''INSERT INTO cjk_kangxi_bushou(cjk_id,cjk_code,cjk_uni ,mkey) VALUES (?,?,?,?)'''
para=item
c.execute(msql,para)
conn.commit()
conn.close()
def createdb(dbname):
conn = sqlite3.connect(dbname)
c = conn.cursor()
c.execute('''CREATE TABLE cjk_kangxi_bushou
(ID INTEGER PRIMARY KEY AUTOINCREMENT,
cjk_id TEXT NOT NULL,
cjk_code TEXT ,
cjk_uni TEXT ,
mkey TEXT
);''')
conn.commit()
conn.close()
return 'ok'
Python代码库之解析unicode部首
©著作权归作者所有,转载或内容合作请联系作者
- 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
- 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
- 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
推荐阅读更多精彩内容
- Python 代码库之unicode 编码与字符串之间相互转换 U+xxxx 转为字符 方法一 U+xxxx 转为...
- Python代码库OpenCV之08图像处理和分割(含代码) 代码 效果 更多精彩代码请关注我的专栏 seleni...
- Python代码库OpenCV之03读取和显示图片(含代码) 代码 相关问题 opencv图片读取与显示图片窗口未...
- Python代码库OpenCV之04读取和播放视频(含代码) 代码 更多精彩代码请关注我的专栏 selenium ...
- Python代码库OpenCV之02Numpy的基础使用(含代码) 代码 更多精彩代码请关注我的专栏 seleni...