EchoYu's blog
  • 首页
  • 归档
  • 分类
  • 标签
  • books
  • 关于
  •   
  •   

Machine Learning-笔记 -XGBoost教程

【1】前言 XGBoost, 全名(eXtreme Gradient Boosting),Kaggle大杀器,在数据挖掘比赛上,Everybody knows it!!! XGBoost作者:陈天奇(华盛顿大学) XGBoost前身:XGBoost是Boosting算法的其中一种,是在GBDT的基础上进行改进,使之更强大,适用于更大范围. 算法发布时间在2014年 本文适用对象:1.了解决策树
2019-03-31
Machine Learning
#Machine Learning

Machine Learning-实战 Titanic生存预测

本文是机器学习实战片,例子是kaggle上老经典的例子了,Titanic生存预测目的是了解机器学习的大体流程。文末百度网盘链接中包含本文用到的数据集和代码。 环境win8, python3,jupyter notebook 目录 项目背景 数据概览 数据预处理 特征分析 特征工程 构建模型 1.项目背景泰坦尼克号是当时世界上体积最庞大内部设施最豪华的客运轮船,当时泰坦尼克号的乘船事件可谓轰动全
2019-03-23
Machine Learning
#Machine Learning

北上广深租房信息的爬取和分析

本文通过爬取链家租房网站的租房信息,对北上广深一线城市的租房信息进行分析。 以下是本篇的思维导图 数据爬取准备工作:安装mongdb数据库,爬取到的数据将保存在mongdb数据库 1.首先找到爬取数据的路口进入链家网的租房网站可以发现规律提取传参https://m.lianjia.com/chuzu/sh/zufang/xujiahui规律提取如下:https://m.lianjia.com/ch
2019-03-23
#Data Analysis #爬虫

构建自己的投资理财体系(1.了解各种投资品)

一.培养理财意识 如果你问有什么技能是越早开始学习越好的,那投资理财一定算一项。因为越早开始享受复利的魔力越大。投资理财是在大学里面学不到的一门学问,但却又是越早学习越好的技能。 下面给大家看一张图,体会一下复利的魔力。50年后,从图中可以看到单利和复利在财富上的巨大分野。巴菲特老爷爷曾经说过复利是世界第八大奇迹。That compound interest was the 8th Wond
2019-03-17
#投资理财

《流浪地球》电影评论的爬取和分析

本文在猫眼电影上爬取了《流浪地球》的上万评论,并对其评论进行分析 爬虫-爬取数据找到评论网页地址先打开猫眼官网找到《流浪地球》的介绍页面:https://maoyan.com/films/248906 打开开发者工具 转换成手机浏览(因为网页版的评论数据只显示部分短评)点击红色箭头指向的位置,然后按F12键刷新,这时候我们就可以看到所有评论了获取评论请求地址在点击打开“查看全部533685条讨论
2019-03-09
Python
#Data Analysis #爬虫

Machine-Learning-笔记 -Bagging&Boosting

本文介绍Bagging和Boosting的概念以及运用它们的集成学习算法Adaboost。 Bagging & BoostingBagging和Boosting都是将多个弱分类器集成起来形成一个强分类器,俗话说三个臭皮匠顶个诸葛亮。首先介绍Bagging BaggingBagging(bootstrap aggregating) ,采用一种有放回的抽样方式,每轮从原始样本集中使用Boots
2019-01-28
Machine Learning
#Machine Learning

Machine Learning-笔记 -决策树

决策树本文介绍的是决策树算法原理 决策树是一种基本的回归与分类算法,是一种模仿人类做决定的思维方式构建的算法,在分类问题中,是基于特征对实例进行分类的过程,决策树本质上是从训练数据集中归纳出一组分类规则。 例如下面这个例子。对下班时间、约会情况、提交截止时间这些条件进行判断,从而决定是否要进行在线课程测试。我们模拟一下今天晚上要不要上课决定的过程。这可能取决于下班时间,如果18:30之前就下班了,
2019-01-20
Machine Learning
#Machine Learning

熟读《影响力》,把销售小哥看得更透

深谙心理学的销售人员可以说是一种很恐怖的存在,房产中介销售商可以利用稀缺性,让本来犹豫不决的你,立马支付了定金。他可能会编造出一个假想的客户,告诉你说,等会我还有一个客户,他很喜欢这套房子,您要是犹豫不决的话,我不敢保证下午这套房子还没卖出去哦。汽车销售员可以利用对比心理让你额外买了一套车险,因为在相比刚刚支付的车的价格,后面随之销售的车险的价格就显得有点微不足道了,这时候的成功率就会更高。
2019-01-19
#life

Machine Learning-笔记 -SVM

本文介绍的是SVM算法原理(NG的ML课程笔记) 适应人群:想了解SVM原理的 为了好好理解SVM算法的原理,我们先从逻辑回归开始。 逻辑函数的假设函数(Hypothesis)如下图:下面将用Z代替等号右边 $$Z=Θ^TX $$ 逻辑回归用来做什么很显然逻辑回归用来分类,如果有一个y=1的样本,我们希望h(x)趋近1,因为我们想正确地将此样本分类,这就意味着当h(x) 趋近于
2019-01-12
Machine Learning
#Machine Learning

做计划,不是一份愿望清单...

做计划,不是一份愿望清单…… 2018年最后一天了,你的愿望是不是改一改时间2019还能继续用,为什么新年愿望总实现不了?就真的只是愿望放在那儿一年又一年。当看到别人纤细苗条的身材,穿漂亮的衣服,而自己眼看漂亮的裙子不合身,急了眼,于是在愿望清单上加上一条,减肥瘦身,每天去健身房。事后坚持一个星期都坚持不下来。对于自己定下来的看书计划,一个星期看一本书,晚上捧着书就开始呼呼大睡。一个月过去了才看到
2018-12-31
#life
1…11121314

搜索

Hexo Fluid
总访问量 次 总访客数 人