《流浪地球》电影评论的爬取和分析 本文在猫眼电影上爬取了《流浪地球》的上万评论,并对其评论进行分析 爬虫-爬取数据找到评论网页地址先打开猫眼官网找到《流浪地球》的介绍页面:https://maoyan.com/films/248906 打开开发者工具 转换成手机浏览(因为网页版的评论数据只显示部分短评)点击红色箭头指向的位置,然后按F12键刷新,这时候我们就可以看到所有评论了获取评论请求地址在点击打开“查看全部533685条讨论 2019-03-09 Python #Data Analysis #爬虫
Machine-Learning-笔记 -Bagging&Boosting 本文介绍Bagging和Boosting的概念以及运用它们的集成学习算法Adaboost。 Bagging & BoostingBagging和Boosting都是将多个弱分类器集成起来形成一个强分类器,俗话说三个臭皮匠顶个诸葛亮。首先介绍Bagging BaggingBagging(bootstrap aggregating) ,采用一种有放回的抽样方式,每轮从原始样本集中使用Boots 2019-01-28 Machine Learning #Machine Learning
Machine Learning-笔记 -决策树 决策树本文介绍的是决策树算法原理 决策树是一种基本的回归与分类算法,是一种模仿人类做决定的思维方式构建的算法,在分类问题中,是基于特征对实例进行分类的过程,决策树本质上是从训练数据集中归纳出一组分类规则。 例如下面这个例子。对下班时间、约会情况、提交截止时间这些条件进行判断,从而决定是否要进行在线课程测试。我们模拟一下今天晚上要不要上课决定的过程。这可能取决于下班时间,如果18:30之前就下班了, 2019-01-20 Machine Learning #Machine Learning
熟读《影响力》,把销售小哥看得更透 深谙心理学的销售人员可以说是一种很恐怖的存在,房产中介销售商可以利用稀缺性,让本来犹豫不决的你,立马支付了定金。他可能会编造出一个假想的客户,告诉你说,等会我还有一个客户,他很喜欢这套房子,您要是犹豫不决的话,我不敢保证下午这套房子还没卖出去哦。汽车销售员可以利用对比心理让你额外买了一套车险,因为在相比刚刚支付的车的价格,后面随之销售的车险的价格就显得有点微不足道了,这时候的成功率就会更高。 2019-01-19 #life
Machine Learning-笔记 -SVM 本文介绍的是SVM算法原理(NG的ML课程笔记) 适应人群:想了解SVM原理的 为了好好理解SVM算法的原理,我们先从逻辑回归开始。 逻辑函数的假设函数(Hypothesis)如下图:下面将用Z代替等号右边 $$Z=Θ^TX $$ 逻辑回归用来做什么很显然逻辑回归用来分类,如果有一个y=1的样本,我们希望h(x)趋近1,因为我们想正确地将此样本分类,这就意味着当h(x) 趋近于 2019-01-12 Machine Learning #Machine Learning
做计划,不是一份愿望清单... 做计划,不是一份愿望清单…… 2018年最后一天了,你的愿望是不是改一改时间2019还能继续用,为什么新年愿望总实现不了?就真的只是愿望放在那儿一年又一年。当看到别人纤细苗条的身材,穿漂亮的衣服,而自己眼看漂亮的裙子不合身,急了眼,于是在愿望清单上加上一条,减肥瘦身,每天去健身房。事后坚持一个星期都坚持不下来。对于自己定下来的看书计划,一个星期看一本书,晚上捧着书就开始呼呼大睡。一个月过去了才看到 2018-12-31 #life
Machine Learning-实战 电信行业智能套餐个性化匹配 本文是关于BDCI 2018-面向电信行业存量用户的智能套餐个性化匹配模型大赛 TOP1开源代码的实现 运行环境 windows python3.6 pandas sklearn xgboost 赛事说明 赛事链接面向电信行业存量用户的智能套餐个性化匹配模型 可以参看链接,里面有详细的训练集数据说明,里面包含了如下信息:数据说明作品要求评分方式 解决方案我复现了top1的解决方案,以下是top1 2018-12-30 Machine Learning #Machine Learning
你对一万小时定律有什么误解? 认识刻意练习 有没有那么一本书里的内容让你觉得相见恨晚?《刻意练习》是我觉得相见恨晚的一本书,里面的学习方法对我的触动很大。 我们都听过一万小时定律,意思是说要成为一个领域的专家,需要一万个小时,这被很多人误解我只要花够一万个小时在某个领域,我就可以成为那个领域的专家。其实这种为了完成任务式的一万个小时根本没有用。我想格拉德威尔先生在《异类》一书中提出一万小时定律的本意并不是为了强调那一 2018-12-28 #life #study skills
搭建自己的个人网站(彩蛋) 本篇彩蛋是基于上两篇个人网站搭建系列博文增加新的功能(评论、打赏)以Anisina主题为例 难度指数:♥♥系统环境:win8 评论功能本文采用的是valine评论系统,首先你需要注册一个leancloud账户,然后创建一个应用来存储管理评论内容,注册和创建新应用完了之后,就完成了准备工作。 1.准备工作就绪后,然后修改 Anisina主题配置文件 _config.yml 1234567891011 2018-12-26 博客 #hexo
一个人越过越年轻是喜还是悲 一个人越过越年轻是喜还是悲故事发生一战结束初期,一位名叫Gateau的知名钟表匠受邀为火车站制作一个大钟,他儿子在战争中失去了生命,他希望时间可以倒转,战争没有发生,世界和平,儿子重返家园。所以把大钟做成了倒转的模样。 就在这时,一个新生儿降临在一个有着124年做纽扣生意历史的家族中,虽是新生儿却没有那般吹弹可破的皮肤,生下来就是充满褶皱的脸,各方面都很糟糕,像极了八十岁的老人。 它一出生,她妈妈 2018-12-23 #life #movies