python特征生成中字符类型有哪些?
python特征生成中字符类型有截取、字符长度和频次。
一、python特征生成中字符类型
1、截取
当字符类型的值过多,通常可对字符类型变量做截取,以减少模型过拟合。如具体的家庭住址,可以截取字符串到城市级的粒度。
2、字符长度
统计字符串长度。如转账场景中,转账留言的字数某些程度可以刻画这笔转账的类型。
3、频次
二、python特征类型中字符使用
1、截取第一位字符串
df['I1_0']=df['I1'].map(lambdax:str(x)[:1])
2、字符长度
df['I1_len']=df['I1'].apply(lambdax:len(str(x)))
display(df.head())
3、字符串频次
df['I1'].value_counts()
以上就是python特征生成中字符类型有哪些?希望能对大家有所帮助,更多Python学习教程请关注IT培训机构:千锋教育。
相关推荐HOT
更多>>python中s3cmd是什么?
python中s3cmd是什么?本文教程操作环境:windows7系统、Python3.9.1,DELLG3电脑。简单介绍:可以实现使用s3对象存储安装方式:yuminstalls3cmd...详情>>
2023-11-14 19:15:02python中如何使用pandas实现行数据添加
python中如何使用pandas实现行数据添加python中,pandas是一个数据分析包,可以对数据进行很方便的处理提供了高效地操作大型数据集所需的工具。...详情>>
2023-11-14 16:35:59python迭代器中Yield方法怎么用?
python迭代器中Yield方法怎么用?Yield用于返回数据,程序执行到yield后,返回结果,记住当前状态,暂停执行,下次调用时,根据上次的状态,返回...详情>>
2023-11-14 16:11:13python元组拆包如何实现?
python元组拆包如何实现?1、说明把元组一一对应拆出来,就叫做元组拆包。拆包有个要求,元组中的元素数量必须跟接受这些元素的空挡数一致,否则...详情>>
2023-11-14 13:24:22热门推荐
python中any函数如何使用?
沸python operator模块有何用法?
热python中s3cmd是什么?
热python中getattribute方法作用是什么?
新python如何使用TemporaryFile()方法创建临时文件?
python中sys模块是什么?
python的ndarray与pandas的series如何相互转换?
python中如何使用pandas实现行数据添加
python迭代器中Yield方法怎么用?
python中temp是什么意思?
python中Cartopy是什么
python入门:方差和标准差的区别
python切片如何作为占位符使用
python元组拆包如何实现?