Python大杂烩3:随机抽取

1.场景

在很久很久以前,有一个国王。
他有10万士兵,有一天,冯诺依曼找他要3000士兵组成真人计算机。
现在需要从10万个士兵中随机抽3000个。

士兵

我们来帮他实现。


2.代码

python版本:v3.7.3
用法: python randomExtract.py q3.txt a3.txt 3000

#randomExtract.py
#2020.03.20
import sys
import random

def random_extract(in_file, out_file, number):
    #用列表解析一次性将文件所有内容读入,文件大于1GB时最好不要这么做
    #文件最好使用utf-8读取和写入
    in_lines = [line for line in open(in_file, "r", encoding="utf-8")]

    out_lines = []
    #循环number次,每次从所有数据中拿出1条放到out_lines
    for _ in range(int(number)):
        out_lines.append(in_lines.pop(random.randint(0, len(in_lines)-1)))
    #将out_lines排序并写入输出文件
    out_lines.sort()
    with open(out_file, "w", encoding="utf-8") as fw:
        fw.writelines(out_lines)

if __name__ == "__main__":
    #从控制台cmd接收参数列表
    args = sys.argv
    in_file = args[1]
    out_file = args[2]
    number = args[3]

    random_extract(in_file, out_file, number)

3.讨论

国王: 第13行中的下划线“_”是什么意思?
作者:

占位符,没有含义。可以写成for i in range(int(number)),但也用不到这个i,所以直接用个占位符就可以了。该行代码只需要循环number次就可以了。

国王:抽取的数据中会有重复的吗
作者:

没有重复。第14行中的pop()方法会从list中拿出1条记录并从list中删除该条记录,改变了list本身。在每次进入循环时list都会少1条记录,保证了数据的不重复性。

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

  • 写在前面的话 代码中的# > 表示的是输出结果 输入 使用input()函数 用法 注意input函数输出的均是字...
    FlyingLittlePG阅读 3,178评论 0 9
  • 使用原则: 正常业务逻辑,不要使用异常来处理 不要总是尝试去捕获或引发异常,而应该允许异常向调用堆栈往上传播 只有...
    晓龙酱阅读 260评论 0 0
  • 我也不是很想讲道理……
    zokoko阅读 221评论 0 0
  • 在一段感情里,常常有两种角色,追求者和被追求者,这两种角色可以自由切换。 你喜欢我我也喜欢你的运气不是人人都有的,...
    长腿程阅读 1,558评论 2 6
  • 我不知道什么是沟通,只知道很多人一言不合,拔刀相向。 我不知道什么是沟通,只知道很多人在一起生活了一辈子,依然针锋...
    邹永浩阅读 695评论 2 50

友情链接更多精彩内容