世界杯投注网 > 数空 >

火爆GitHub:100天搞定机器学习编程(超赞信息图+代码+数据集

时间:2018-08-29 23:35

来源:未知作者:admin点击:

  原题目:火爆GitHub:100天搞定机械进修编程(超赞消息图+代码+数据集)!

  但怎样想是一回事,怎样做往往是另一回事。进修和健身一样,不少人都逗留在口头上,有各类托言未曾付诸实施。

  这个应战赛意在号召大师步履起来,从参与勾当的那天起,每天至多破费1小时的时间来进修提拔或者使用编程,学习编程(超赞信息图+代码+数据集持续对峙100天,从而更好的理解和控制机械进修这个壮大的东西。积跬步、至千里。

  并且加入这个勾当,还要利用#100DaysOfMLCode这个标签,在社交平台逐日“打卡”,公然记实本人的事情。

  你想在这100天里学到什么,或者完成一个项目全凭自主决定。大师的取舍八门五花,此中有一个小哥的进修打算,很快激发大师的关心。

  这个小哥名叫Avik Jain(重名的不少),他的百天打算,是从机械进修的根本观点起步,逐层递进,内容比力适合初学者。火爆GitHub:100天搞定机器

  这个100天搞定机械进修编程的项目,此刻曾经是爆红GitHub,很快累积了3000多标星,在Twitter上,也有一大票人热捧这个项目。

  对这个项目标评价,多以awesome、great、fantastic、outstanding、perfect等评价,大师纷纷暗示感激(并祝楼主好人终身安然)。

  数据预处置、线性回归、逻辑回归、K最临近算法、支撑向量机、深度进修专项课程等,最新的内容曾经讲到决策树及实现等。

  Numpy内里有各类数学函数,Pandas是用来导入数据集、办理数据集的。

  数据集凡是是.csv格局。CSV文件,是把表格数据,存储成纯文本。每一行是一个数据记实 (Data Record) 。

  咱们获取的数据,凡是是异构数据。导致缺失数据 (Missing Data) 的缘由有良多,必要处置一下,模子的表示才不会减损。

  能够把缺失的数据,用整列数据的均匀值或者中位数取代。拿sklearn.preprocessing里的Imputer来处置。

  分类数据 (Categorical Data) 里的变量,不蕴含数值,只蕴含分类标签。

  大部门机械进修算法,城市拿两个数据点之间的欧几里得距离 (Euclidean Distance) 做计较。

  而咱们但愿其他特性,也获得划一的注重,所以用特性尺度化(Feature Standardization) 来处理这个问题。

  就是拿已知的那些 (x,y) 数据点,做出一条线性的趋向,来预测其他x值,对应的y。

  blue) 两件必要提示的事总之,大要就是上面这个样子。部门曾经放出的消息图调集如下,大师能够预览一下。

  若是你也想入门或者提拔本人的机械进修威力,没关系尝尝随着这个小哥一路进修前进。尽管这个项目满是英文,但并不艰涩高深,说不定还能趁便提高一下英文程度,当前读paper也用获得~!

  不外目前只进行了第一天内容的汉化。若是你感乐趣,能够连续关心,或者插手汉化的步履中。地点在此。

  声明:该文概念仅代表作者自己,搜狐号系消息公布平台,搜狐仅供给消息存储空间办事。

【责任编辑:admin】
热图 更多>>
热门文章 更多>>