学“《红楼梦》作者之谜(上)”编程课程所掌握的技能

在2月8日的编程课程中,我成功地掌握了以下几项技能:

1. 理解了Series数据的结构;

2. 学会了使用pandas库的Series()函数创建Series结构数据;

3. 学会了使用len()函数统计Series的长度;

4. 学会了使用pandas库的iloc[]截取DataFrame数据;

5. 学会了使用pandas库的loc[]按条件截取DataFrame数据;

6. 学会了修改DataFrame数值的方法;

7. 学会了使用pandas库的to_csv()方法将DataFrame数据导出并写入指定的CSV文件。


本节课代码:

import pandas as pd

import jieba

feature_names=pd.read_csv('data/虚词词频.csv',index_col=0)

data = pd.read_csv('data/红楼梦.csv', index_col=0)

for i in data.index:

    content = data.iloc[i-1, 1]

    cutwords = jieba.lcut(content)

    cutwords = pd.Series(cutwords)

    for n in range(46):

        word = feature_names.columns[n]

        function_word = cutwords.loc[cutwords==word]

        counts = len(function_word)

        feature_names.iloc[i-1,n]=counts

print(feature_names)

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容