在2月8日的编程课程中,我成功地掌握了以下几项技能:
1. 理解了Series数据的结构;
2. 学会了使用pandas库的Series()函数创建Series结构数据;
3. 学会了使用len()函数统计Series的长度;
4. 学会了使用pandas库的iloc[]截取DataFrame数据;
5. 学会了使用pandas库的loc[]按条件截取DataFrame数据;
6. 学会了修改DataFrame数值的方法;
7. 学会了使用pandas库的to_csv()方法将DataFrame数据导出并写入指定的CSV文件。
本节课代码:
import pandas as pd
import jieba
feature_names=pd.read_csv('data/虚词词频.csv',index_col=0)
data = pd.read_csv('data/红楼梦.csv', index_col=0)
for i in data.index:
content = data.iloc[i-1, 1]
cutwords = jieba.lcut(content)
cutwords = pd.Series(cutwords)
for n in range(46):
word = feature_names.columns[n]
function_word = cutwords.loc[cutwords==word]
counts = len(function_word)
feature_names.iloc[i-1,n]=counts
print(feature_names)