监督学习的其他用例包括信用评分、承保、设备故障检测等。
无人监督
对于无监督学习,只有输入数据 X,没有目标变量。然后,机器学习模型根据其推理对输入数据进行分组。人工智能算法处理庞大的数据集,通常会发现人类无法识别的模式和依赖关系。
这种技术通常用于营销聚类。例如,我们可以从上面的示例中获取输 丹麦whatsapp 数据 入数据,然后让 AI 引擎根据人口统计和个人兴趣对人员进行分组。
强化学习
通过强化学习,数据科学家可以指定“游戏”的规则、“游戏”发生的环境以及最终奖励(在国际象棋类比中,那就是胜利)。当机器学习算法开始“玩游戏”时,它们会尝试不同的策略并从以前的经验中学习,以最大化最终奖励。强化学习最著名的例子之一是谷歌的AlphaGo。
深度学习
深度学习是一种利用人工神经网络的技术,适用于所有三种机器学习类型,但最常用于监督学习。深度学习擅长根据对象的特征对其进行分类。例如,它可以用来对猫和狗的图片进行高精度分类。
深度学习是 Facebook 人脸识别技术的基础,准确率高达 99%。该技术还为高级自然语言处理 (NLP)、图像和语音识别软件提供支持,可用于文档处理(例如法律文件)、情感分析和文字处理软件。
机器学习和数据科学在很大程度上依赖于数据工程。在进行数据科学之前,您需要从分散的来源提取数据,将其转换为可用的数据集,并将其加载到 AI 引擎中。坏消息是这些任务通常无法自动化。不同的来源具有独特的数据类型,因此调整它们需要大量的手动工作。
即使数据已被提取、转换和加载,也可能还不足以用于数据科学。因此,下一步是通过删除噪声数据并添加任何缺失条目来清理数据集。ETL(提取、转换和加载)和数据清理通常占用项目约 80% 的时间。
4. 您需要定制开发、API 软件还是初创企业收购?
企业采用机器学习有三种策略。
1.从头开始构建机器学习解决方案。这可能是最冒险的选择,因为据估计只有 10% 的机器学习研发项目能够成功。对于特定领域的一些狭窄的机器学习案例来说,这仍然是最可行的选择。
2. 使用谷歌、亚马逊等公司的云引擎探索机器学习。这是获得机器学习技术的最简单方法。缺点是,您无法自由配置系统参数。例如,亚马逊只使用逻辑回归模型,因此如果您需要为特定项目使用不同的模型,它实际上毫无用处。这意味着,更复杂的机器学习项目需要定制解决方案开发。此外,80% 的机器学习开发仍然与大数据工程有关。这是您不能委托给亚马逊的事情。
3. 购买机器学习初创公司。这是最昂贵的选择,只适合大公司。
数据科学和机器学习经常会产生意想不到的结果并提供宝贵的见解。这项技术将继续存在,并且将以极快的速度发展。回答上述问题将帮助您开始机器学习开发之旅。