分类变量生成哑变量

Python分析建模,日常问题整理(五)


2018.08.20~2018.08.26


  1. 修改字典keys名称
    将AA改为aa
dict["aa"] = dict.pop("AA")
  1. 返回某个值对应的行列,不能实现,因为这个值可能对应了很多行列
  2. 对分类变量生成哑变量的方法
def dat_dummy(dat,var):
    for i in var:
        temlen = len(list(set(dat[i]))[:-1])
        temix = dat.columns.tolist().index(i)
        temdf = pd.DataFrame((np.array(list(set(dat[i]))[:-1])==dat.ix[:,temix:(temix+1)].values).astype(int))
        temdf.columns = [str(x)+'_'+str(y) for x,y in zip([i]*temlen,temdf.columns.tolist())]
        dat = dat.drop([i],axis = 1)
        dat = pd.concat([dat,temdf],axis = 1)
    return dat
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

  • 基本知识 js的特点 很多语法非常的灵活 随意 兼容性问题。js、html、css浏览器翻译 浏览器分为高级、低...
    Kris_Shin阅读 2,920评论 0 4
  • 网景公司,第一款浏览器,倒闭了mozilla基金会,火狐浏览器哥们:发明了一门语言 js 非常随意 无可取...
    zzzsssr阅读 1,445评论 0 1
  • 网景公司,第一款浏览器,倒闭了mozilla基金会,火狐浏览器哥们:发明了一门语言 js 非常随意 无可取...
    LPP27149阅读 1,184评论 0 2
  • 二级缓存:内存缓存,硬盘缓存。感觉仍然讲述得不大清晰,容我再重组。源码解析的思路: 核心代码的主要功能:核心类的主...
    superKelly阅读 1,823评论 0 0
  • 经过一番心理挣扎,我的理智决定向情感投降。 理智说:“读《少有人走的路》吧,这本书曾经对你有过深远的影响,现在借此...
    可馨一一阅读 1,382评论 0 0

友情链接更多精彩内容