1. Pandas int to string
1 | df['A'].apply(str) |
2. Pandas 去掉数据中空白
Series.str.strip(to_strip=None)去除两边空白
Series.str.lstrip(to_strip=None)去除左边空白
Series.str.rstrip(to_strip=None)去除右边空白
1 | ' spacious '.strip() |
3. Pandas split
4. dropna
删除行 axis=0
删除列 axis=1
一般删除行,若删除列则会删除一个变量
1 | df.dropna(axis = 0) |
5. 随机取样
1 | import pandas as pd |
1. Pandas sample
DataFrame.sample(n=None, frac=None, replace=False, weights=None, random_state=None, axis=None)
n是要抽取的行数。(例如n=20000时,抽取其中的2W行)
frac是抽取的比列。(有一些时候,我们并对具体抽取的行数不关系,我们想抽取其中的百分比,这个时候就可以选择使用frac,例如frac=0.8,就是抽取其中80%)
replace:是否为有放回抽样,取replace=True时为有放回抽样。
weights是每个样本的权重,具体可以看官方文档说明。
random_state,(参考官方文档)int or numpy.random.RandomState, optional
Seed for the random number generator (if int), or numpy RandomState object.
axis是选择抽取数据的行还是列。axis=0的时是抽取行,axis=1时是抽取列(也就是说axis=1时,在列中随机抽取n列,在axis=0时,在行中随机抽取n行)
2. Numpy sample
1 | import numpy as np |
赏
使用支付宝打赏
使用微信打赏
若你觉得我的文章对你有帮助,欢迎点击上方按钮对我打赏
扫描二维码,分享此文章