电子书:《机器学习go语言实现》_谢文江等译_2018-10-16《机器学习go语言实现》_谢文江等译_20181016

电子书:《机器学习go语言实现》_谢文江等译_2018-10-16《机器学习go语言实现》_谢文江等译_20181016

资源下载
仅限VIP下载,请先
犹豫不决让我们错失一次又一次机会!!!

电子书:《机器学习go语言实现》_谢文江等译_2018-10-16《机器学习go语言实现》_谢文江等译_20181016

111

内容简介:

3章评估和验证54.1决策树和随机森林概述…1073.1评估54.2决策树和随机森林的31.1连续指标假设及陷阱3.1.2分类指标决策树示例3.2验证544随机森林的例子321训练和测试集55朴素贝叶斯3.2.2保留集5.5.1朴素贝叶斯概念及其3.23交叉验证33参考书目552朴素贝叶斯例子…625.6参考书目第4章回归41理解回归模型的术语第6章集群线性回归6.1理解集群模型术语1线性回归概述62距离或相似度的度量42.2线性回归假设和陷阱63集群技术的评估4.2.3线性回归示例63.1内部集群评估43多元线性回归6.3.2外部集群评估44非线性和其他类型的回归816.4k均值集群4.5参考书64.1k均值集群综述4.6小结642k-均值的假设和陷阱643k-均值集群的例子第5章分类65其他集群技术理解分类模型的术语66参考书目7小结…52.1逻辑回归概述522逻辑回归的假设和陷阱…91第7章时间序列和异常检.测…131523逻辑回归示例…92在go中表示时序数据3k-最近邻……1032理解时间序列的术语53.1knn概述10373与时间序列有关的统计532knn假设和陷阱7.3.1自相关3.3knn示例73.2偏自相关54决策树和随机森林74预测的自回归模型

74.1自回归模型概述842基于go语言的深度学习…14.2自回归模型假设和陷阱…148.5参考书目74.3自回归模型示例428.6小结7.5自回归移动平均和其他时间序列模型第9章部署、分布分析和模7.6异常检測9.1在.远.程.机器上可靠地运行模型…1797.7参考书目9.1.1 docker和 docker术语9..2 docker化机器学习的第8章神经网络和深度学习…15理解神经网络术语9.2构建可拓展和可重现的机器82构建一个简单的神经网络……157学习流水线8.21网络中的节点921搭建 pachyderm和8.22网络架构kubernetes集群…82.3为什么期望这种架构922构建一个 pachyderm机器有作用学习流水线824训练神经网络923更新流水线并检查出处…20283使用简单的神经网络9.24缩放流水线阶段83.在实际数据上训练9.3参考书目神经网络94小结8.3.2评估神经网络84引人深度学习169附录与机器学习相关的算法84.1什么是深度学习模型…170

第1章数据的收集和组织调查结果显示.数据科学家至少有90c?时间是用于收集、组织和清洗数据而不是用于训练或调试复杂的机器学习模型。为什么会这样呢?难道机器学习不才是最有趣的部分吗?为何会如此关注所收集数据的状态呢?首先.如果没有数据机器学习模型将无法学习。虽然这是显而易见的事情.但需注意的是.构建模型的强大与否.有一部分是取决于所给予的数据。常言道.“输入是垃圾.产出也会是垃圾”。只有确定了收集的数据是相关并且干净的.机器学习的模型才能变得强大。也只有这样.才能如预想般操作数据.并产出有价值的结果当使用一种特定模型时.不是所有类型的数据都是合适的。例如.高维数据(例如文本数据)在一些特定模型中运行得就不是很好。另外一些模型假设变量是正态分布的.这种假设并非总是成立的。因此在收集需要的数据时应格外小心.并确保知道数据和模型是如何交互的。数据科学家花如此多时间收集和组织数据还有另一个原因.那就是数据通常是凌乱的并且很难聚合。在大多数的组织中.数据经常以多种格式保存在多种系统中且拥有多种访问权限。通常情况下.很难像指定一个文件路径那样简单地为模型提供训练数据集合为了形成一个训练/测试集合.或者提供变量给一个模型以用于预测.可能需要处理各种各样的数据类型.例如csv、json、数据库中的表.等等。除此之外还可能需要转换其中一些数值。常见的转换包括解析时间格式、转化分类数据为数字数值归一化、使用一些函数交叉处理数据。然而.不能总是假设一个特定变所有可能取值都会出现.或者能被同一种方式解析数据经常有数值缺失、类型混合、数值损坏的情况发生.如何处理这些场景将直接影响所构建模型的质量.因此需要仔细地收集、组织和理解所采用的数据

2◆机器学习:go语言实現虽然本书大部分内容的重点是各种各样的建模技术.但是读者仍应当将数据的收集、解析和组织当作是数据科学项目成功的一个(甚至是最)关键的组成部分。如果在机器学习的项目开发中.这部分数据没有保持高级别的完整性.那么从长远来看将会导致各种麻烦1.1数据处理- gopher方式和其他用于数据科学/分析的处理语言相比.go提供了强大的数据操作和解析能力。虽然其他语言(例如 python或者r)能让用户很快地进行数据交互.但是这些语言经常倡导打破完整性的便利。如果在代码中经常采用动态和交互性数据探索会导致行为变得奇怪。以这个简单的csv文件为例可以迅速写出一些 python代码去解析这个csv文件.然后在无须了解数据是什么类型的情况下.输出整数列的最大值import pandas as pdintegestrigol(myfile.csvt theimum value in the integer col这个简单的程序将输出正确的结果s python myprogram.py如下所示.现在移除其中一个整数用于模拟数值丢失的情况1. blahpython程序随后就会打破数据结果的完整性.明确来讲.上述程序仍然会保持运

数掘的收集和组织◆3行.不会告诉用户有任何不一样的地方.仍然会产生数值.但却是一个不同类型的数值这种情况是无法接受的.一个整数数值可以在用户察觉不到任何变化的时候凭空消失。这种很难迫踪的行为会对建模产生深远的影响。一般来说.一旦选择了动态类型和抽象的便利性.就需要接受这种行为上的变化。重点并不是说 python无法处理这种行为.因为 python专家很快会认识到其实是有办法解决这个问题的。重点是这种便利性在默认情况下并没有提升完整性.因此很容易搬起石头砸自己的脚从另一方面来说.可以利用go语言的静态类型和明确的错误处理方式.来确保数据的解析跟期望的一致。在这个简单例子中.可以毫不费力地写一些go代码去解析的csv(现在暂不用关心具体的技术细节)read in the csv recordslog. fatal errvar intmax intthe maximum value if appropriateif intval intmaxintra// print the maximum valuefmt println(intra如果这个csv文件的所有整型数值都存在.它将会产生同样正确的结果

#############################################

资源下载
下载价格VIP专享
仅限VIP下载升级VIP
犹豫不决让我们错失一次又一次机会!!!
原文链接:https://1111down.com/224383.html,转载请注明出处

本站开启缓存功能

登入后回任何页面即可登入成功,当前页不显示

没有账号?注册  忘记密码?

社交账号快速登录