Julia's BLOG

python常用语句

2019-01-23

1. Pandas int to string

1
2
df['A'].apply(str)
df.applymap(str)

2. Pandas 去掉数据中空白

Series.str.strip(to_strip=None)去除两边空白
Series.str.lstrip(to_strip=None)去除左边空白
Series.str.rstrip(to_strip=None)去除右边空白

1
2
3
4
>>> '   spacious   '.strip()
'spacious'
>>> 'www.example.com'.strip('cmowz.')
'example'

3. Pandas split

4. dropna

删除行 axis=0

删除列 axis=1

一般删除行,若删除列则会删除一个变量

1
2
3
df.dropna(axis = 0)

df.ix[1, :-1] = np.nan # 将指定数据定义为缺失

5. 随机取样

1
2
import pandas as pd
df.sample(n=20000)

1. Pandas sample

DataFrame.sample(n=None, frac=None, replace=False, weights=None, random_state=None, axis=None)

n是要抽取的行数。(例如n=20000时,抽取其中的2W行)

frac是抽取的比列。(有一些时候,我们并对具体抽取的行数不关系,我们想抽取其中的百分比,这个时候就可以选择使用frac,例如frac=0.8,就是抽取其中80%)

replace:是否为有放回抽样,取replace=True时为有放回抽样。

weights是每个样本的权重,具体可以看官方文档说明。

random_state,(参考官方文档)int or numpy.random.RandomState, optional
Seed for the random number generator (if int), or numpy RandomState object.

axis是选择抽取数据的行还是列。axis=0的时是抽取行,axis=1时是抽取列(也就是说axis=1时,在列中随机抽取n列,在axis=0时,在行中随机抽取n行)

2. Numpy sample

1
2
import numpy as np
np.random.sample(Your_index)
Tags: python
使用支付宝打赏
使用微信打赏

若你觉得我的文章对你有帮助,欢迎点击上方按钮对我打赏

扫描二维码,分享此文章