• 探索性数据分析

    数据组成结构化 数值型数据 连续型 离散型 分类型数据 分类型 二元型 有序型 非结构化 时序数据:对同一变量连续的采集,多用在IOT领域 空间数据:关注对象与空间座标 图形数据:物理、社交网络上的关系,多用在网络优化和推荐系统 单变量分...
  • 目录规划

    Python商业分析 企业增长/竞争战略 CASE框架:Growth/Competition Strategy 企业增长战略 竞争策略 内部运营效率 CASE框架:Operation 运营效率提升 企业转型与数字化策略 市场营销 CAS...
  • LeetCode 601_体育馆的人流量

    题目描述X 市建了一个新的体育馆,每日人流量信息被记录在这三列信息中:序号 (id)、日期 (visit_date)、 人流量 (people)。 请编写一个查询语句,找出人流量的高峰期。高峰期时,至少连续三行记录中的人流量不少于100。 例如,表 ...
  • LeetCode 185_部门工资前三高的所有员工

    题目描述Employee 表包含所有员工信息,每个员工有其对应的工号 Id,姓名 Name,工资 Salary 和部门编号 DepartmentId 。 1234567891011+----+-------+--------+------------...
  • LeetCode 262_行程和用户

    题目描述Trips 表中存所有出租车的行程信息。每段行程有唯一键 Id,Client_Id 和 Driver_Id 是 Users 表中 Users_Id 的外键。Status 是枚举类型,枚举成员为 (‘completed’, ‘cancelled...
  • AdaBoost

    基本介绍 初始化训练数据的权值分布。每⼀个训练样本最开始时都被赋予相同的权值:1/N 进⾏多轮迭代,⽤m = 1,2, …, M表⽰迭代的第多少轮 使⽤具有权值分布Dm的训练数据集学习,得到基本分类器(选取让误差率最低的阈值来设计基本分类器) 计算G...
  • 随机森林

    基本介绍 从原始训练数据集中,应⽤bootstrap⽅法有放回地随机抽取k个新的⾃助样本集,并由此构建k棵分类回归树,每次未被抽到的样本组成了K个袋外数据(out-of-bag,BBB) 设有n个特征,则在每⼀棵树的每个节点处随机抽取m个特征,通过计...
  • Pandas移动窗口

    简单范例12345678import matplotlib.pyplot as pltimport numpy as npimport pandas as pdindex = pd.date_range('20190116', &...
  • Sklearn

    简单范例123456789101112131415161718192021import warningswarnings.filterwarnings('ignore') from sklearn import neighbor...
  • 堆糖图片多线程抓取

    123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263import r...