2023-09-25
Python pandas数据分析基础100问(有重复)
2023-09-25 ~ 2023-09-25

题目来自B站上看的一个讲爬虫的老师发的视频,不过代码没完全照那人的来,由于在平板上写的代码,就没有执行结果,感兴趣自行到B站搜原视频。

import pandas as pd

1、将list转为dataframe

2023-09-19
Pandas最常用的15个函数
2023-09-19 ~ 2023-09-19

Pandas是一个功能强大的数据处理库,它提供了大量的函数和方法,用于数据的读取、清洗、转换、分析和可视化。下面是Pandas中最常用的15个函数及其代码示例:

  1. read_csv():用于读取CSV文件中的数据并创建DataFrame对象。
1
2
3
4
import pandas as pd

df = pd.read_csv('data.csv')
print(df)
  1. head():用于查看DataFrame中的前几行数据,默认显示前5行。
1
print(df.head())
  1. tail():用于查看DataFrame中的后几行数据,默认显示后5行。
1
print(df.tail())
  1. info():用于查看DataFrame的基本信息,包括列名、数据类型、非空值数量等。
1
print(df.info())
  1. describe():用于生成DataFrame中数值列的统计摘要,包括计数、均值、标准差、最小值、25%分位数、中位数、75%分位数和最大值。
1
print(df.describe())
  1. shape:用于获取DataFrame的形状,即行数和列数。
1
print(df.shape)
  1. columns:用于获取DataFrame的列名。
1
print(df.columns)
  1. fillna():用于填充DataFrame中的缺失值。
1
2
df.fillna(0, inplace=True)
print(df)
  1. groupby():用于对DataFrame进行分组操作。
1
2
grouped = df.groupby('category')
print(grouped.mean())
  1. sort_values():用于对DataFrame按照指定列进行排序。
1
2
sorted_df = df.sort_values('column_name')
print(sorted_df)
  1. drop_duplicates():用于移除DataFrame中的重复行。
1
2
df.drop_duplicates(inplace=True)
print(df)
  1. value_counts():用于计算DataFrame中某一列的唯一值计数。
1
print(df['column_name'].value_counts())
  1. apply():用于对DataFrame的某一列或多列应用自定义函数。
1
2
3
4
5
6
def custom_function(x):
    # 自定义处理逻辑
    return x * 2

df['column_name'] = df['column_name'].apply(custom_function)
print(df)
  1. merge():用于合并两个DataFrame对象。
1
2
merged_df = pd.merge(df1, df2, on='key_column')
print(merged_df)
  1. plot():用于绘制DataFrame中的数据图表。
1
2
df.plot(x='column_name1', y='column_name2', kind='line')
plt.show()

通过掌握这些常用函数,您可以更加高效地使用Pandas进行数据处理和分析。它们提供了基本的数据操作和转换功能,为您的数据工作提供了便利。