(0人评价)
Python数据分析与挖掘:12天掌握Python语言

12天掌握Python语言,做数据抽取、分析、建模、挖掘的方法。本课程为进阶课程。

价格 ¥ 2999.00
课程介绍

Python数据分析与挖掘

课时16课时(12小时)

授课计划12天,每天90分钟

学习对象:有python语言基础的企业决策者、 财务人员、市场人员、投资理财人员

学习目标:掌握使用python语言做数据抽取、分析、建模、挖掘的方法。

 

第一天 主题:数据分析与挖掘概述

内容:

  1. 数据分析的意义
  2. 数据分析的常规流(Tao)(Lu)
  3. Excel做数据分析
  4. 数据分析工具之cognos
  5. 数据分析工具之powerbi
  6. 谁要用python作数据分析
  7. 如何面对大数据
  8. 大数据分析平台与工具
  9. 什么是数据挖掘
  10. 数据挖掘的意义
  11. python数据分析与挖掘软件开发环境

实验:安装anaconda

 

第二天 主题:一个简单的python数据分析案例

内容:

  1. 分析案例任务拆解
  2. 导入excel数据
  3. 数据清洗
  4. 数据抽取
  5. 数据统计
  6. 数据输出
  7. 数据可视化

实验:生成可以独立运行的python程序

 

第三天 主题:使用postgresql创建数据仓库

内容:

  1. postgresql简介
  2. 安装postgresql数据库软件
  3. postgresql配置文件
  4. 数据库基本概念
  5. postgresql数据库系统构成
  6. 字符集与数据编码
  7. 角色和权限管理
  8. linux系统的postgresql
  9. 创建表
  10. 插入数据
  11. 查询

实验:手工录入示范数据到postgresql

 

第四天 主题:使用python访问postgresql

内容:

  1. pythonpostgresql数据库驱动
  2. python连接数据库
  3. python提交SQL语句
  4. 表的各种操作
  5. postgresql的数据类型
  6. 插入数据
  7. 修改数据
  8. 删除数据
  9. 查询数据

实验:把postgresql数据库的操作封装成class

 

第五天 主题:数据源与数据池

内容:

  1. 数据源概览
  2. 文本数据源
  3. excel数据源
  4. oracle数据源
  5. mysql数据源
  6. sqlserver数据源
  7. 爬虫数据源
  8. 爬虫和html库入门
  9. 目标数据与数据池

实验:把数据源操作封装成class

 

第六天 主题:numpypandas基础

内容:

  1. numpypandas简介
  2. Numpy数组算术
  3. 基础索引与切片
  4. 数组转置和换轴
  5. numpy通用函数
  6. 数学和统计方法
  7. 布尔值数组
  8. 排序
  9. pandas数据结构
  10. Series
  11. DataFrame
  12. 索引与切片
  13. pandas基本功能

实验:用numpypandas处理postgresql中的数据

 

第七天 主题:用pandas做数据分析

内容:

  1. 数据加载
  2. 数据清洗
  3. 数据变换
  4. 统计分析
  5. 分组分析
  6. 结构分析
  7. 交叉分析
  8. 相关分析

实验:使用python制作数据透视表

 

第八天 主题:python数据可视化

内容:

  1. 饼图
  2. 散点图
  3. 折线图
  4. 柱形图
  5. 直方图
  6. 散点图
  7. 地图
  8. excel图表库

实验:根据数学公式绘图

 

第九天主题:用python挖掘客户数据

内容:

  1. 客户数据挖掘的目标
  2. RFM模型
  3. RFM数据分析算法
  4. RFM分析代码实现
  5. 聚类挖掘算法
  6. 客户聚类挖掘代码实现

实验:把客户分析代码写成可独立运行的程序

 

 

第十天 主题:关联规则挖掘

内容:

  1. 关联规则典型案例
  2. 关联规则的算法
  3. apriori算法
  4. 代码调试
  5. 实现关联规则的挖掘算法

实验:测试apriori算法的代码

 

第十一天 主题:大数据平台上的数据分析

内容:

  1. 大数据平台hadoop架构与原理
  2. spark软件简介
  3. 大数据分析工具spark入门
  4. 使用spark做数据清洗
  5. 导出数据
  6. Spark的机器学习算法库

实验:运行spark的关联规则示范代码

 

第十二天 主题:python数据挖掘与机器学习函数库

内容:

  1. 机器学习基础知识
  2. Sk-learn函数库介绍
  3. 分类数据挖掘算法
  4. 回归数据挖掘算法
  5. 聚类数据挖掘算法
  6. 降维数据挖掘算法

实验:用决策树函数接口做广告推荐