首页 > 科技 > 正文

AI初创企业如何成功机器学习需要避开的四个错误
2019-10-19 23:47:16 来源：东方头条

标题：AI初创企业如何成功机器学习需要避开的四个错误

图片来自网络

在过去的25年中，我们见过数千次有人犯错误，但从未见过机器犯错误。如今，学习项目中的错误可能使公司损失数百万美元和数年的无用工作。因此，这里收集了与数据，指标，验证和技术有关的机器学习中最常见的错误。

图片来自网络

1.数据。

处理数据时出错的可能性很高。使用数据集时不要犯错误或避开雷区。此外，可能存在几个常见错误：

未处理的数据。未处理的数据是垃圾，不会让您对所构建模型的充分性充满信心。因此，任何AI项目都应仅将预处理数据作为基础。

异常现象。检查偏差和异常的数据并消除它们。消除错误是每个机器学习项目的优先事项之一。数据可能总是不完整，不正确，或者某些信息可能会丢失一段时间。

缺乏数据。也许，最简单的方法是进行多个实验并获得结果，但仍然不是最正确的一个。少量且不平衡的数据将导致得出的结论与事实相去甚远。因此，如果您需要训练网络以区分。

大量数据。有时限制数据量是唯一正确的解决方案。例如，这就是您如何获得将来人类行为的最客观画面。我们的世界和人类是不可预测的。通常，根据某人在1998年的行为来预测其反应就像往常一样。结果完全一样，将与现实相去甚远。

2.指标

准确性是机器学习中的一项重要指标。但是，毫无意义地寻求绝对准确性可能会成为AI项目的一个问题。特别是如果目标是创建预测性推荐系统。显然，如果准确性可以达到令人难以置信的99％。买家会接受它，并且推荐系统也会起作用。以每天购买牛奶的城市居民为例，在这种系统中，重要的是个人的方法和商品的促销（这在以前的购物车中是没有的）。

3.验证方式

一个学习字母表的孩子逐渐掌握了字母，简单的单词和成语。他在一定水平上学习和处理信息。同时，尽管学步中的单词包含了他所学到的相同字母，但对于幼儿来说，对科学论文的分析是难以理解的。

AI项目的模型还可以从特定的数据集中学习。但是，该项目将不会尝试检查同一数据集上模型的质量。要估计模型，必须使用专门选择的用于验证训练中未使用的信息的验证片。通过这种方式，可以实现最准确的模型质量评估。

图片来自网络

4.技术

在AI项目中选择技术仍然是一个普遍的错误，即使不是致命的，但也会导致严重的后果，从而影响项目截止日期的效率和时间。难怪，由于其适用于任何任务的通用算法，您很难在机器学习中找到比神经网络更受炒作的主题。但是对于任何任务，该工具都不是最有效，最快的。

最杰出的例子是Kaggle比赛。神经网络并不总是首屈一指。相反，随机树网络有更多获胜的机会；它主要与表格数据有关。神经元通常用于分析视觉信息，语音和更复杂的数据。如今，使用神经网络作为指导，这是最简单的解决方案。但是同时，项目团队应该清楚地了解哪种算法适合特定任务。

我坚信机器学习的炒作不会是虚假，夸大和毫无根据的。机器学习是另一种工程工具，它使我们的生活更简单，更舒适，并逐渐改变它以改善生活。

图片来自网络

对于许多大型项目，本文可能只是对他们已经犯过的错误的回顾，但他们仍然能够克服产品公司的困难。但是对于那些刚刚开始AI创业的人来说，这是一个好的主意。

相关热词搜索：初创避开机器错误成功

上一篇：不止鸿蒙！曝华为P40首发3D电影5摄，拍照实力欲超单反！
下一篇：最后一页

AI初创企业如何成功 机器学习需要避开的四个错误 2019-10-19 23:47:16 来源：东方头条

AI初创企业如何成功机器学习需要避开的四个错误
2019-10-19 23:47:16 来源：东方头条