AI项目建设规划的(de)起点是(shì)“界定应用场景”,简(jiǎn)单地说,如(rú)何将传统的做法用AI来解(jiě)决。从(cóng)企业运营管理层面来讲(jiǎng),企业关(guān)注(zhù)的无非是“增加收益、减少成本(běn)、提高效率、规避风(fēng)险”等(děng)四(sì)大诉(sù)求(qiú),所以AI项(xiàng)目对应的应用(yòng)场景也不会脱离这四(sì)大诉求,只不过需要(yào)懂业(yè)务的人(rén)员与AI咨询顾问一起(qǐ)在(zài)这四(sì)大(dà)诉求范畴(chóu)内(nèi),梳理出(chū)容易实现的应用需求点,而后予以清晰界定。AI项目应用场景界(jiè)定过(guò)程就(jiù)项目界(jiè)定目标、界定要解决什么问题的过程,同时关(guān)乎(hū)对AI技(jì)术的选(xuǎn)型问题(tí),即如何选择相应的算法或(huò)AI实现技术方法。
AI项目(mù)面临的挑战就是算(suàn)法的(de)问题(tí),广义来讲就是选择哪(nǎ)种AI实现的方法(fǎ)。AI实现的方法有三种:知(zhī)识图谱(pǔ)、深度学(xué)习、增强学(xué)习。大家通(tōng)常所说(shuō)的“算法(fǎ)”是指“深(shēn)度学习”和(hé)“增强学(xué)习”。所以采(cǎi)用“AI实现方法”不(bú)会引起歧(qí)义。
之所以“AI实现方法(fǎ)”的选择,是AI项目(mù)建设的挑战,是因为(wéi),许多企业在建设AI项目时(shí)候使用了不合适的方法而造成项目失败,比如(rú)过(guò)去两年银(yín)行(háng)业采用(yòng)深度(dù)学习的方法(fǎ),来建(jiàn)设“金(jīn)融风控”系统,其(qí)效(xiào)果并没(méi)有得到(dào)很好(hǎo)的体现,现在才意识(shí)到构建“智能(néng)风控系统”,知识图谱才是(shì)最为合(hé)适的。再比(bǐ)如,实现无人驾驶,必须选择“增强学习算(suàn)法”为(wéi)核心的方(fāng)法。
一般来(lái)讲(jiǎng)深度学(xué)习(xí)在处理基于特征感知(zhī)、识别和判断等(děng)方(fāng)面表现突出,能帮助(zhù)构建聪明的AI,如人(rén)脸识别、语音识别、故障分析、客户(hù)画像、时(shí)序(xù)预测等;而知识图(tú)谱在模拟人的思考过程、处理常识知识(shí)和推理,以及理解人的语言方面表现的更加(jiā)突出,如智(zhì)能推荐、智能解释、智能搜索、智能推理分析(xī)等。
“AI实(shí)现的方法”没有选好,整个项(xiàng)目就可能面临的失败风险,而且方法的选择是以业务场景界定为(wéi)前提,同时还需要(yào)借助高水平的AI咨询顾问,还要考虑到实现难(nán)以程度、成本预算(suàn)承(chéng)受能力等等,所(suǒ)以(yǐ)AI实现方法也算(suàn)是一(yī)种大挑战。
目前有一种一劳永逸(yì)的方法,就是在企业部署“算法平(píng)台”(也叫“智(zhì)能中台”或企业大脑),犹(yóu)如传统信(xìn)息化时(shí)代ERP一样,成(chéng)为(wéi)大企业的(de)基(jī)础标配,其中包括了实现(xiàn)人(rén)工智能的三种方(fāng)法。比(bǐ)如公安系统,按照“数据(jù)本地化、算(suàn)法(fǎ)本地化、应(yīng)用本地化”的原则,部(bù)署了“公安(ān)大脑”,其中(zhōng)揽(lǎn)括了AI实现的三大(dà)方法。
才是数(shù)据问(wèn)题。所(suǒ)有(yǒu)的(de)AI项目都是以“数据”为基础的,人工智能之所以能够在近几年(nián)得以重(chóng)生(shēng),就是由于“大数据”的爆发。这不难理解,就(jiù)当(dāng)机器人是人类(lèi)的(de)一(yī)个特殊种(zhǒng)族,“知识就(jiù)是力量(liàng)”同样可(kě)以(yǐ)适合于机(jī)器人,人之所以(yǐ)要读书、要学习,就是为了获取知识(shí)以(yǐ)便能够应付各种(zhǒng)各样的问题。
对应到机器(qì)人,只有(yǒu)当机(jī)器人吸收了大量的(de)样本(běn)化、结构化(huà)的数据(jù),再借(jiè)助AI实现方法(深度学习、知识图谱、增强学习),才能模仿人脑思维和(hé)判断,如人脸识别(bié)、语音识别、智能推荐、无(wú)人驾驶等(děng)等。
而(ér)且(qiě)不同的AI实(shí)现方法,采用的数据策略(luè)是不一样,包括数据存储类型、数据表(biǎo)示方(fāng)式、数(shù)据处理方式则(zé)完(wán)全不一(yī)样(yàng)。比如,如果(guǒ)使用知识(shí)图谱,那么必须将关系型数据进行(háng)抽(chōu)取加工、融(róng)合(hé),以图形/图谱(pǔ)形式存(cún)储(chǔ)、表(biǎo)示和计算,也(yě)就是我们经常说的“图(tú)计算”。
一般来(lái)讲(jiǎng),企业如果要启动AI项目(mù),就要做好三种(zhǒng)数据库的准备(bèi),即“传统的关(guān)系(xì)型数据库”、“时序数据(jù)库”和“图谱数据库”,而且(qiě)对(duì)数据的收集、处理、加工、规范则是与时俱进,不能停顿。要说人工智能成(chéng)本花在(zài)哪(nǎ)里,至少70%以上(shàng)在数据方面。不但要求数据有量(liàng),还(hái)有质量和表示形式的要求,这跟做菜(cài)一样,需要有足(zú)够的食材原料,而且原料质量要够好,原料加(jiā)工成(chéng)食材要符合(hé)烹饪等等,再配合(hé)大(dà)厨的煎炸焖炒炖等手法(算法(fǎ))和火力(算力(lì)),才能搞出一桌好菜。