-
在windows下安装pip:
(C:\Users\AAA\AppData\Local\Programs\Python\Python37\Scripts)
-
运行easy_install pip进行安装。
(在windows更新中:python -m pip install --upgrade pip)
-
切换至python.exe所在文件夹下 执行python -m pip install --upgrade pip进行更新
upgrade升级不成功
-
删除Python\Python37\lib\site-packages中后缀.dist-info文件
服务器连接超时,执行以下命令(亲测,真比之前快)
python -m pip install --upgrade pip -i https://pypi.douban.com/simple
成功更新后,后缀.dist-info文件会更新生成
解决"'pip' 不是内部或外部命令,也不是可运行的程序或批处理文件"的问题 设置环境变量
添加C:\Users\AAA\AppData\Local\Programs\Python\Python37\Scripts
到系统变量path
pypi库
-
安装库
pip install efficient-apriori
默认下载到Python37\Lib\site-packages下
命令反馈有显示路径
C:\Users\AAA\AppData\Local\Programs\Python\Python37\Lib\site-packages
放置到对应project中即可
from efficient_apriori import apriori
# 设置数据集
data = [('牛奶','面包','尿布'),
('可乐','面包', '尿布', '啤酒'),
('牛奶','尿布', '啤酒', '鸡蛋'),
('面包', '牛奶', '尿布', '啤酒'),
('面包', '牛奶', '尿布', '可乐')]
# 挖掘频繁项集和频繁规则
itemsets, rules = apriori(data, min_support=0.5, min_confidence=1)
print(itemsets)
print(rules)
代码中看出,data 是个 List 数组类型,其中每个值都可以是一个集合。实际上可以把 data 数组中的每个值设置为 List 数组类型,比如:
data = [['牛奶','面包','尿布'],
['可乐','面包', '尿布', '啤酒'],
['牛奶','尿布', '啤酒', '鸡蛋'],
['面包', '牛奶', '尿布', '啤酒'],
['面包', '牛奶', '尿布', '可乐']]
两者的运行结果是一样的,efficient-apriori 工具包把每一条数据集里的项式都放到了一个集合中进行运算,并没有考虑它们之间的先后顺序
其他的 Apriori 算法可能会因为考虑了先后顺序,出现计算频繁项集结果不对的情况。所以这里采用的是 efficient-apriori 这个工具包
详情见-
指定版本安装
安装特定版本的package,通过使用==, >=, <=, >, <来指定一个版本号
-
卸载已安装的库
pip uninstall XXX
-
列出已经安装的库
pip list
-
将已经安装的库列表保存到文本文件中
pip freeze > requirements.txt
-
根据依赖文件批量安装库
pip install -r requirements.txt
使用上面的txt文件,批量安装第三方库