Python数据分析教程
-
Python数据分析 – Python数据分析教程
Python简介 Python是一种跨平台的计算机程序设计语言,是一个高层次的结合了解释性、编译性、互动性和面向对象的脚本语言。Python很适合用来做数据分析,近年…… -
Python数据分析 – Python数据分析简介
为什么要用Python? 基于Python语言的特性,加上历史和文化上的原因,Python发展出了一个大型、活跃的科学计算及数据分析社区。近些年,Python提高了对数据类…… -
Python数据分析 – NumPy数值计算基础
NumPy数值计算基础 NumPy是用于数据科学计算的基础模块,不但能够完成科学计算的任务,而且能够被用作高效的多维数据容器,可用于存储和处理大型矩阵。NumPy的…… -
Python数据分析 – NumPy数组对象ndarray
掌握Numpy数组对象ndarray Python提供了一个array模块。array 和list 不同,它直接保存数值,和C语言的一维数组比较类似。但是由于Python的array模块不支持多…… -
Python数据分析 – NumPy矩阵与通用函数
掌握NumPy矩阵与通用函数 NumPy对于多维数组的运算,默认情况下并不进行矩阵运算。如果需要对数组进行矩阵运算,则可以调用相应的函数。 1、创建NumPy矩阵 在N…… -
Python数据分析 – 利用NumPy进行统计分析
利用NumPy进行统计分析 使用NumPy数组可以使你利用简单的数组表达式完成多种数据操作任务,而无须写些大量循环。这种利用数组表达式来替代显式循环的方法,称…… -
Python数据分析 – pandas统计分析基础
pandas统计分析基础 统计分析是数据分析的重要组成部分,它几乎贯穿了整个数据分析的流程。运用统计方法,将定量与定性结合,进行的研究活动叫作统计分析。统计…… -
Python数据分析 – pandas数据结构介绍
pandas数据结构介绍 为了入门pandas,需要熟悉两个常用的工具数据结构:Series和DataFrame。尽管他们并不能解决所有的问题,但它们为大多数应用提供了一个有效…… -
Python数据分析 – pandas基本功能
基本功能 本节将会指引你了解与Series或DataFrame中数据交互的基础机制。 1、重建索引 reindex是pandas对象的重要方法,该方法用于创建一个符合新索引的新对象…… -
Python数据分析 – pandas描述性统计的概述与计算
描述性统计的概述与计算 pandas对象装配了一个常用数学、统计学方法的集合。其中大部分属于归约或汇总统计的类别,这些方法从DataFrame的行或列中抽取一个Seri…… -
Python数据分析 – 数据载入、存储及文件格式简介
数据载入、存储及文件格式简介 数据读取是进行数据预处理、建模与分析的前提。不同的数据源,需要使用不同的函数读取。pandas内置了10 余种数据源读取函数和对…… -
Python数据分析 – 文本格式数据的读写
文本格式数据的读写 将表格型数据读取为DataFrame对象是pandas的重要特性。下表总结了部分实现该功能的函数,read_csv和read_table可能是后期使用最多的函数。…… -
Python数据分析 – 二进制格式
二进制格式 使用Python内建的pickle序列化模块进行二进制格式操作是存储数据(也称为序列化)最高效、最方便的方式之一。pandas对象拥有一个to_pickle方法可以…… -
-
Python数据分析 – 处理缺失值
处理缺失值 缺失数据会在很多数据分析应用中出现。pandas的目标之一就是尽可能无痛地处理缺失值。例如,pandas对象的所有描述性统计信息默认情况下是排除缺失…… -
Python数据分析 – 数据转换
数据转换 之前,我们主要讲解了数据的重新排列。过滤、清洗以及其他转换是另外一系列重要的操作。 1、删除重复值 由于各种原因,DataFrame中会出现重复行。请…… -
Python数据分析 – 字符串操作
字符串操作 由于Python在字符串和文本操作上的便利性,使Python成为一个流行的原生数据集操作语言已经有很长时间了。字符串对象的内建方法使得大部分文本操作…… -
Python数据分析 – 数据规整:连接、联合与重塑
数据规整:连接、联合与重塑 在很多应用中,数据可能分布在多个文件或数据库中,抑或以某种不易于分析的格式进行排列。本章关注于对数据联合、连接以及重排列…… -
-
Python数据分析 – 联合与合并数据集
联合与合并数据集 包含在pandas对象的数据可以通过多种方式联合在一起: pandas.merge根据一个或多个键将行进行连接。对于SQL或其他关系型数据库的用户来说,…… -
Python数据分析 – 重塑和透视
重塑和透视 重排列表格型数据有多种基础操作。这些操作被称为重塑或透视。 1、使用多层索引进行重塑 多层索引在DataFrame中提供了一种一致性方式用于重排列数…… -
Python数据分析 – Matplotlib数据可视化基础
Matplotlib数据可视化基础 制作提供信息的可视化(有时称为绘图)是数据分析中最重要任务之一。可视化可能是探索过程的一部分,例如,帮助识别异常值或所需的…… -
Python数据分析 – 掌握绘图基础语法与常用参数
掌握绘图基础语法与常用参数 在使用matplotlib时,我们使用以下的导入惯例: 在Jupyter中运行%matplotlib notebook(或在IPython中运行%matplotlib),我们就…… -
Python数据分析 – 使用pandas和seaborn绘图
使用pandas和seaborn绘图 matplotlib是一个相当底层的工具。可以从其基本组件中组装一个图表:数据显示(即绘图的类型:线、条、框、散点图、轮廓等)、图例、…… -
Python数据分析 – 其他Python可视化工具
其他Python可视化工具 和开源代码一样,在Python语言下创建图形的选择有很多。自2010年以来,很多开发工作都集中在创建web交互式图形上。借助像Bokeh和Plotly……