一年多以前,我们开始与客户一起开发 AI 项目。一些项目从咨询、研究和评估开始;其中一些我们建立了 PoC (概念验证);还有一些已经进入了开发和实施阶段。
如今,“实施 AI ” 对于一家公司而言似乎是时尚潮流,但是我们发现许多公司尚未完全掌握实现 AI 和 ML (机器学习) 项目的生命周期。
首先,许多公司没有意识到他们需要花费时间进行数据清理。 AI 和 ML 学习过程需要高质量的数据。 “垃圾进、垃圾出” 仍然成立。尽管一些公司已经实施了 CRM 或 ERP 系统很长时间,并且能够从过去的记录中挖掘数据以进行机器学习,但我们仍然需要花费时间来确定有意义的机器学习和测试数据。 (例如,我们可能需要过滤掉一些异常、不合适或重复的数据,以优化 AI 的效率、有效性和准确性)。
典型公司面临的另一个主要问题是缺乏自己的业务运营数据。企业所有者或管理团队可能知道 AI 和 ML 的应用已经可行,并且使用门槛和费用也算可负担。但是,使用 AI 的主要阶段之一是要经过机器学习训练过程:从历史数据和记录中捕获和识别业务价值,以得出可以预测**业务决策的算法。数据不能是其他公司数据,它们必须来自自己的业务活动。
大多数公司应具有良好的会计数据记录,但这还不够。例如,如果我们希望 AI 能够增加营业额,那么至少拥有来自客户资料和销售订单详细信息的数据。
实际上,许多公司可能只有若干类似 Excel 文件和工作表。这些工作表中的数据来自不同的部门或业务单位,过去没有严格的集成。它们还不足以进行机器学习,因为作为数据分析人员我们仍然需要花费时间来理解数据的收集和关联方式,然后才可以选择适当的数据集以用于机器学习训练和测试。来自 ERP 系统的数据相对较好用于机器学习,因为在输入系统中时已承接某些数据关系。
如果客户使用我们提供的 ERP 系统,则启动 AI 项目变得更加容易。我们的 ERP 系统是用Python 搭建,Python 是实现 AI 和 ML 应用程序最常见的计算机语言之一。我们只需要添加几行代码并使用 AWS 或 Google Cloud API 便可以激活客户 ERP 中的 AI 功能。
