首页 > 科技 > 正文

AI初创企业如何成功 机器学习需要避开的四个错误
2019-10-19 23:47:16   来源:东方头条   

标题:AI初创企业如何成功 机器学习需要避开的四个错误

图片来自网络

在过去的25年中,我们见过数千次有人犯错误,但从未见过机器犯错误。如今,学习项目中的错误可能使公司损失数百万美元和数年的无用工作。因此,这里收集了与数据,指标,验证和技术有关的机器学习中最常见的错误。

图片来自网络

1.数据。

处理数据时出错的可能性很高。使用数据集时不要犯错误或避开雷区。此外,可能存在几个常见错误:

未处理的数据。未处理的数据是垃圾,不会让您对所构建模型的充分性充满信心。因此,任何AI项目都应仅将预处理数据作为基础。

异常现象。检查偏差和异常的数据并消除它们。消除错误是每个机器学习项目的优先事项之一。数据可能总是不完整,不正确,或者某些信息可能会丢失一段时间。

缺乏数据。也许,最简单的方法是进行多个实验并获得结果,但仍然不是最正确的一个。少量且不平衡的数据将导致得出的结论与事实相去甚远。因此,如果您需要训练网络以区分。

大量数据。有时限制数据量是唯一正确的解决方案。例如,这就是您如何获得将来人类行为的最客观画面。我们的世界和人类是不可预测的。通常,根据某人在1998年的行为来预测其反应就像往常一样。结果完全一样,将与现实相去甚远。

2.指标

准确性是机器学习中的一项重要指标。但是,毫无意义地寻求绝对准确性可能会成为AI项目的一个问题。特别是如果目标是创建预测性推荐系统。显然,如果准确性可以达到令人难以置信的99%。买家会接受它,并且推荐系统也会起作用。以每天购买牛奶的城市居民为例,在这种系统中,重要的是个人的方法和商品的促销(这在以前的购物车中是没有的)。

3.验证方式

一个学习字母表的孩子逐渐掌握了字母,简单的单词和成语。他在一定水平上学习和处理信息。同时,尽管学步中的单词包含了他所学到的相同字母,但对于幼儿来说,对科学论文的分析是难以理解的。

AI项目的模型还可以从特定的数据集中学习。但是,该项目将不会尝试检查同一数据集上模型的质量。要估计模型,必须使用专门选择的用于验证训练中未使用的信息的验证片。通过这种方式,可以实现最准确的模型质量评估。

图片来自网络

4.技术

在AI项目中选择技术仍然是一个普遍的错误,即使不是致命的,但也会导致严重的后果,从而影响项目截止日期的效率和时间。难怪,由于其适用于任何任务的通用算法,您很难在机器学习中找到比神经网络更受炒作的主题。但是对于任何任务,该工具都不是最有效,最快的。

最杰出的例子是Kaggle比赛。神经网络并不总是首屈一指。相反,随机树网络有更多获胜的机会;它主要与表格数据有关。神经元通常用于分析视觉信息,语音和更复杂的数据。如今,使用神经网络作为指导,这是最简单的解决方案。但是同时,项目团队应该清楚地了解哪种算法适合特定任务。

我坚信机器学习的炒作不会是虚假,夸大和毫无根据的。机器学习是另一种工程工具,它使我们的生活更简单,更舒适,并逐渐改变它以改善生活。

图片来自网络

对于许多大型项目,本文可能只是对他们已经犯过的错误的回顾,但他们仍然能够克服产品公司的困难。但是对于那些刚刚开始AI创业的人来说,这是一个好的主意。

相关热词搜索:初创 避开 机器 错误 成功

上一篇:不止鸿蒙!曝华为P40首发3D电影5摄,拍照实力欲超单反!
下一篇:最后一页

泰安知名律师   电话:18053115917
手机:0531-80961678   微信:18053115917   QQ:709581498   邮箱:709581498@qq.com
网站地图 (XML地图 / 百度地图