参加市北-GMIS 2019的感悟 前言市北-GMIS-2019全球数据智能峰会,由机器之心主办,上海市市北高新技术服务业园区承办。 大会以【拥抱数智经济,赋能产业生态】为主题,共进行24场主题演讲、2个主论坛、2个圆桌论坛、4个session、1场AI画展,举行了为期2天的行业峰会。不仅带来联邦学习、认知智能、AutoML等前瞻技术,同时关注技术的落地工程运用。 1day AM:主论坛-Data That Empowers[ 2019-07-20 #峰会
Python -笔记 -内部类&日期格式 本文适用对象: python初级打怪~ 本文介绍两个python的小知识点,内部类和日期格式转换 内部类内部类顾名思义就是类内部包含的类,就叫内部类 123456789101112131415class Car: #外部类 class Door: # 内部类 def open(self): print("open door") 2019-04-13 Python #Python
Python -笔记 -单例模式(Singleton)实现 本文适用对象: python正在进阶的人儿~高级 Python 语法,涉及装饰器 不管是编写类还是函数都是变量之间的传来传去,最简单粗暴的方式就是全局变量。确实在很多场景下用全局变量很方便。不过如果代码规模增大,并且有多个文件的时候,全局变量就会变得比较混乱。你可能不知道在哪个文件中定义了相同类型甚至重名的全局变量,造成悲剧。 这里介绍一种设计模式,单例模式 What单例模式是什么?单例是 2019-04-13 Python #Python
Machine Learning-笔记 -XGBoost教程 【1】前言 XGBoost, 全名(eXtreme Gradient Boosting),Kaggle大杀器,在数据挖掘比赛上,Everybody knows it!!! XGBoost作者:陈天奇(华盛顿大学) XGBoost前身:XGBoost是Boosting算法的其中一种,是在GBDT的基础上进行改进,使之更强大,适用于更大范围. 算法发布时间在2014年 本文适用对象:1.了解决策树 2019-03-31 Machine Learning #Machine Learning
Machine Learning-实战 Titanic生存预测 本文是机器学习实战片,例子是kaggle上老经典的例子了,Titanic生存预测目的是了解机器学习的大体流程。文末百度网盘链接中包含本文用到的数据集和代码。 环境win8, python3,jupyter notebook 目录 项目背景 数据概览 数据预处理 特征分析 特征工程 构建模型 1.项目背景泰坦尼克号是当时世界上体积最庞大内部设施最豪华的客运轮船,当时泰坦尼克号的乘船事件可谓轰动全 2019-03-23 Machine Learning #Machine Learning
北上广深租房信息的爬取和分析 本文通过爬取链家租房网站的租房信息,对北上广深一线城市的租房信息进行分析。 以下是本篇的思维导图 数据爬取准备工作:安装mongdb数据库,爬取到的数据将保存在mongdb数据库 1.首先找到爬取数据的路口进入链家网的租房网站可以发现规律提取传参https://m.lianjia.com/chuzu/sh/zufang/xujiahui规律提取如下:https://m.lianjia.com/ch 2019-03-23 #Data Analysis #爬虫
构建自己的投资理财体系(1.了解各种投资品) 一.培养理财意识 如果你问有什么技能是越早开始学习越好的,那投资理财一定算一项。因为越早开始享受复利的魔力越大。投资理财是在大学里面学不到的一门学问,但却又是越早学习越好的技能。 下面给大家看一张图,体会一下复利的魔力。50年后,从图中可以看到单利和复利在财富上的巨大分野。巴菲特老爷爷曾经说过复利是世界第八大奇迹。That compound interest was the 8th Wond 2019-03-17 #投资理财
《流浪地球》电影评论的爬取和分析 本文在猫眼电影上爬取了《流浪地球》的上万评论,并对其评论进行分析 爬虫-爬取数据找到评论网页地址先打开猫眼官网找到《流浪地球》的介绍页面:https://maoyan.com/films/248906 打开开发者工具 转换成手机浏览(因为网页版的评论数据只显示部分短评)点击红色箭头指向的位置,然后按F12键刷新,这时候我们就可以看到所有评论了获取评论请求地址在点击打开“查看全部533685条讨论 2019-03-09 Python #Data Analysis #爬虫
Machine-Learning-笔记 -Bagging&Boosting 本文介绍Bagging和Boosting的概念以及运用它们的集成学习算法Adaboost。 Bagging & BoostingBagging和Boosting都是将多个弱分类器集成起来形成一个强分类器,俗话说三个臭皮匠顶个诸葛亮。首先介绍Bagging BaggingBagging(bootstrap aggregating) ,采用一种有放回的抽样方式,每轮从原始样本集中使用Boots 2019-01-28 Machine Learning #Machine Learning
Machine Learning-笔记 -决策树 决策树本文介绍的是决策树算法原理 决策树是一种基本的回归与分类算法,是一种模仿人类做决定的思维方式构建的算法,在分类问题中,是基于特征对实例进行分类的过程,决策树本质上是从训练数据集中归纳出一组分类规则。 例如下面这个例子。对下班时间、约会情况、提交截止时间这些条件进行判断,从而决定是否要进行在线课程测试。我们模拟一下今天晚上要不要上课决定的过程。这可能取决于下班时间,如果18:30之前就下班了, 2019-01-20 Machine Learning #Machine Learning