在实际开发中,往往想要计算一段代码运行多长时间,下面我将该功能写入到一个函数里面,只要在每个函数前面调用该函数即可,见下面代码:
开发者成功使用机器学习的十大诀窍(译)
在提供发现埋藏数据深层的模式的能力上,机器学习有着潜在的能力使得应用程序更加的强大并且更能响应用户的需求。精心调校好的算法能够从巨大的并且互不相同的数据源中提取价值,同时没有人类思考和分析的限制。对于开发者而言,机器学习为应用业务的关键分析提供了希望,从而实现从改善客户体验到提供产品推荐上升至超个性化内容服务的任何应用程序。
数据预处理-PDB文件
Machine Learning algorithm - Adaboost
Github源码实现:https://github.com/csuldw/MachineLearning/tree/master/Adaboost
本文主要介绍的是Adaboost算法,利用AdaBoost元算法来提高分类器的性能,主要参考《机器学习实战》来学习Adaboost,同时结合Wikipedia以及各位同道人士的经验等,希望可以通过总结达到学习效果。
Python模拟ls命令
模拟控制台命令
写一个程序 lsrm 要求如下:
模拟linux的命令ls部分功能
当使用命令
lsrm -ll
显示目录下所有 py 结尾的文件
增加难度 (1.使用递归 显示所有目录里的 py 结尾文件)
机器学习算法-Apriori关联分析
引文: 学习一个算法,我们最关心的并不是算法本身,而是一个算法能够干什么,能应用到什么地方。很多的时候,我们都需要从大量数据中提取出有用的信息,从大规模数据中寻找物品间的隐含关系叫做关联分析(association analysis)或者关联规则学习(association rule learning)。比如在平时的购物中,那些商品一起捆绑购买销量会比较好,又比如购物商城中的那些推荐信息,都是根据用户平时的搜索或者是购买情况来生成的。如果是蛮力搜索的话代价太高了,所以Apriori就出现了,就是为了解决这类问题的。
机器学习算法-K-means聚类
Github源码:https://github.com/csuldw/MachineLearning/tree/master/Kmeans
k-Means算法是一种聚类算法,它是一种无监督学习算法,目的是将相似的对象归到同一个蔟中。蔟内的对象越相似,聚类的效果就越好。聚类和分类最大的不同在于,分类的目标事先已知,而聚类则不一样。其产生的结果和分类相同,而只是类别没有预先定义。
sklearn训练模型的保存与恢复(Python)
在做模型训练的时候,尤其是在训练集上做交叉验证,通常想要将模型保存下来,然后放到独立的测试集上测试,下面介绍的是Python中训练模型的保存和再使用。
机器学习算法-朴素贝叶斯Python实现
源码:https://github.com/csuldw/MachineLearning/tree/master/NaiveBayes
前面提到的KNN和决策树DT算法,数据实例最终被明确的划分到某个分类中,下面介绍一种不能完全确定数据实例应该划分到哪个类别,或者说只能给数据实例属于给定分类的概率。
机器学习算法-K最近邻从原理到实现
源码:https://github.com/csuldw/MachineLearning/tree/master/KNN
决策树和基于规则的分类器都是积极学习方法(eager learner)的例子,因为一旦训练数据可用,他们就开始学习从输入属性到类标号的映射模型。一个相反的策略是推迟对训练数据的建模,直到需要分类测试样例时再进行。采用这种策略的技术被称为消极学习法(lazy learner)。最近邻分类器就是这样的一种方法。
机器学习算法-决策树理论
源码下载:https://github.com/csuldw/MachineLearning/tree/master/DecisionTree
在决策树理论中,有这样一句话,“用较少的东西,照样可以做很好的事情。越是小的决策树,越优于大的决策树”。数据分类是一个两阶段过程,包括模型学习阶段(构建分类模型)和分类预测阶段(使用模型预测给定数据的类标号)。决策树分类算法属于监督学习(Supervised learning),即样本数据中有类别标号。下面是两个阶段的简单描述:
Git小结-同步一个fork
如何使用搜索引擎
其实这个问题并不难,我又被坑了。百度搜的东西不靠谱啊,以后这种问题一定要用英文在 Google 或者 Bing 上搜索,这样才能搜到原汁原味的答案。就当是一个教训吧。
搜索 fork sync,就可以看到 GitHub 自己的帮助文档 Syncing a fork 点进去看这篇的时候,注意到有一个 Tip: Before you can sync your fork with an upstream repository, you must configure a remote that points to the upstream repository in Git.
根据这两篇文章,问题迎刃而解!
机器学习算法Top10
以下就是从参加评选的18种候选算法中,最终决选出来的十大经典算法,文章内容参考的是一篇英文paper,下面来看看十大经典算法的具体内容。
腾讯笔试题-字符串匹配
2014,静下来
我想应该静下来想一些话
我想应该静下来走一段路
我想应该静下来看一本书
我只想静下来反省自己