学“《红楼梦》作者之谜(上)”编程课程所掌握的技能

在2月8日的编程课程中，我成功地掌握了以下几项技能：

1. 理解了Series数据的结构；

2. 学会了使用pandas库的Series()函数创建Series结构数据；

3. 学会了使用len()函数统计Series的长度；

4. 学会了使用pandas库的iloc[]截取DataFrame数据；

5. 学会了使用pandas库的loc[]按条件截取DataFrame数据；

6. 学会了修改DataFrame数值的方法；

7. 学会了使用pandas库的to_csv()方法将DataFrame数据导出并写入指定的CSV文件。

本节课代码：

import pandas as pd

import jieba

feature_names=pd.read_csv('data/虚词词频.csv',index_col=0)

data = pd.read_csv('data/红楼梦.csv', index_col=0)

for i in data.index:

content = data.iloc[i-1, 1]

cutwords = jieba.lcut(content)

cutwords = pd.Series(cutwords)

for n in range(46):

word = feature_names.columns[n]

function_word = cutwords.loc[cutwords==word]

counts = len(function_word)

feature_names.iloc[i-1,n]=counts

print(feature_names)

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成，浏览时请结合常识与多方信息审慎甄别。
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

1赞2赞

赞赏

手机看全文