矩阵软件的人工智能技术与工业企业融合之路

 行业动态     |      2019-06-18 16:45

谨以本文记录矩阵软件的人工智能系列产品研发之路,并向各位传统企业的CEO,CTO,CIO们伸出橄榄枝,希望我们齐心协力改变世界。

  

 

  2018年下半年以来,人工智能泡沫化的消息不断传来,掀起阵阵波澜。但是,投机浪潮的没落,意味着真正的产业春天的开始。2019年3月19日,中央全面深化改革委员会审议通过了《关于促进人工智能和实体经济深度融合的指导意见》,阅读后如沐春风,心潮澎湃。意见着重强调市场导向与产业应用,打造智能经济形态,要求促进人工智能和实体经济深度融合,构建数据驱动、人机协同、跨界融合、共创分享的智能经济形态。指导意见高瞻远瞩,正中要害,矩阵软件两年来的研发实践与此感受完全吻合。由此产生了写作本文的想法,因为矩阵软件的实践表明,只要转变思路,人工智能完全可以走出人脸识别,语音交流,无人驾驶的刻板的模式化应用场景,摆脱高大上与昂贵的面纱,迅速与工业企业具体应用场景实现融合,并带来颠覆性的产品和直接的社会效益。

  矩阵软件自2016年初进入ai自主研发领域,从无到有,从学习到创新,到建立ai实验室并发布出新产品,经历了一个简单而不容易的过程。现将此过程,其中的经验教训,及发展情况,经验总结和一些未必成熟的观点看法分享给大家,以期抛砖引玉。

  一、发展历程

  矩阵软件被称为称重物联网第一股,是一家新三板上市的,从事大宗物资的称重发运物流系统研发的专业it公司。

  矩阵软件有一款货运列车装运控制产品,在货运列车的车厢号识别处理上,经历了手持机抄号、RFID识别、视频图像抓拍等多代产品的演变。2016年年底,矩阵软件的多家客户提出了对货运列车车厢标记信息进行自动识别的需求,这是一个典型的应用AI进行图像识别与处理的应用,但寻遍全国,没有发现一个成熟可用的产品。为实现此应用,矩阵软件踏足进入了人工智能的研发领域。

  2017年初,为获得技术支持,矩阵软件经交流沟通,与中国科学院软件所签订了合作协议,开始了相关算法的研发工作。

  2018年,矩阵软件邀请到业界知名的指纹和人脸识别研发专家李峰先生加入公司,并组建了人工智能实验室,建立了专业开发团队。

  目前,经过两年时间的持续研发,已经有两个产品:货运列车标记信息智能识别和智能发运系统研发成功,并已形成成功案例。在这两个系统进一步硬化的同时,还有另外还有两个产品在研发过程中。

  创新是一个困难的过程,在此两年中,矩阵软件所有的AI研发相关工作全部通过自筹经费予以支撑,把近两年销售收入的15%都投入到了研发上。目前矩阵软件期待实现市场与产品的深度融合。

  二、路径总结

  1、研究和应用人工智能是生存发展刚需

  我的一位做网站新闻编辑的朋友对我说,自打有了今日头条,一切都变得不同了。今日头条基于人工智能的导流算法横扫市场,打败了原有的所有新闻APP和传统媒体。

  矩阵软件的深切体会是,绝不仅仅是互联网应用,如果人工智能空降传统行业,也会产生大量的颠覆性应用。

  比如矩阵软件研发的第二个产品(后文有介绍):汽车智能装运系统。应用目标是,在无人干预的情况下,把数十吨的大宗物资准确装入到大货车挂车中。在过去的技术条件下,实现这个目标是非常困难的,因为车是活的,由司机驾驶,多种多样的,难以精准控制。但是,在引入人工智能建模算法和激光雷达后,通过对现场环境的精确建模和识别,控制变得很简单,无人干预的要求迎刃而解。矩阵软件目前正在进行市场推广,而且认为能够颠覆每年几十亿元规模的货车物资装运设备市场。

  以此类推,当智能技术应用进入无智能的产品设计领域,很可能会颠覆很多原有的产品。广大制造企业。广大工业企业应尽早拥抱人工智能,否则就有可能是被颠覆的对象。

  2、人工智能≠机器人,人工智能≠昂贵,人工智能≠大数据

  有一些大家惯常的思路,延缓了人工智能的进一步普及。

  人工智能≠机器人(超智能)

  正确应用人工智能,要把人工智能当作工具来看待,不能心存神秘感而过度解读。有一个机器人来自动帮助完成任务当然好(但是那时候有可能人类可能已经不存在了或者进化了),但在现在的阶段,人工智能用来解决局部的问题,就能够产生颠覆性的产品。所以,首先应建立对人工智能的正确认识。

  人工智能到目前为止还没有一个普遍认同、严格、准确的定义,但是目前普遍被划分为三个层次:弱人工智能层次、强人工智能层次和超人工智能层次。简单地说弱人工智能就是低于人类智能水平的人工智能。我们现在正处在弱人工智能发展的阶段,像阿尔法狗、人脸识别系统、手机导航系统、无人驾驶系统等等,都属于弱人工智能。强人工智能就是和人类智能并驾齐驱的人工智能,超人工智能就是超出人类智力水平的人工智能。这两个层次的人工智能现在还没有出现,而且距离还相当遥远。所以目前谈到的人工智能,都是弱人工智能,需要人去寻找发现应用方向,以实现突破。

  即便弱人工智能,究其应用方向,也可以大致分成自动化、智能化与智慧化三个层面。 自动化,比如地图里给我们寻找出的最佳路线、比如电商APP里给我们提供的推荐购买商品等等,比如人脸识别。智能化,也就是在运算过程中引入不同维度的辅助判断条件,并能够突破固定公式与规律的限制,以更多感性化的指标与目标,从中得出更为精准与先进的运算结果。比如AlphaGO,自动驾驶汽车,天猫精灵、百度大脑……智慧化,建立了知识图谱和全面的逻辑思维能力,进入自我优化和完善的阶段。这方面的应用还在路上。

  由此我们可以看到,只要解决一部分弱人工智能层次上的自动化应用问题,就能颠覆很多行业。

  人工智能≠昂贵

  在2013-2018阶段,在人工智能的数学算法,研发工具不够普及的时期,人工智能和人工智能人才非常昂贵。但是近几年,随着全世界在人工智能领域的大量投资和人员培养,理论、算法都迅速普及,人才不断涌现,既有新培养的人才,也有受高薪吸引快速转入此行的人才。实现和使用此类算法的TCO迅速下降,虽然依然比较昂贵,但已经远没有那么昂贵。

  人工智能≠大数据

  现在一个明显的误区就是,一些占有了一定量大数据的公司开始宣传,你没有大数据,所以要和我合作。这是一种商业策略,故意塑造的误区。正确的说法应该是,应用人工智能,才能实现数据的有效利用。应用人工智能,能够更快更好的挖掘形成有效的大数据应用。可以想象,无论是头条还是腾讯还是阿里,他们最早的应用获取的数据,来源于他们最早的少量客户。他们分析这些客户的数据,改进他们的算法,最终实现算法和数据齐头并进。这是一个鸡生蛋还是蛋生鸡的问题,并不是只有获取大量数据才能实现某个算法。这个问题后面还有详述。

  3、如何突破数据障碍和技术障碍

  现在说到人工智能,大家一般都会说大数据为人工智能提供了一个基础,但是企业要进入这个ai研发领域,往往首先会遇到数据瓶颈,往往不能像bat那样获得充分的通用数据,我称之为数据音障。这往往会被认为是一个拦路虎,从而导致下列现象:需求方获得一个能够解决问题的针对性的ai应用,困难而昂贵。而大量希望为工业企业提供信息化服务的软件供应商,又会发现自己缺乏相应的数据从而无从形成算法。那么如何解决这个问题,我们的经验就是三点结合:有效数据,特定应用场景,自动快速进化学习算法。

  识别大街上的随机人脸,需要一个经过长时间训练形成的非常有效的算法,而且需要超强的运算能力支持。但是在宾馆实现身份证照片与人脸的比对则容易的多,因为“比对”问题需要的基础数据要少得多。工业领域的很多数据,往往是后一种特定应用需求。比如我们公司研发的第一个产品,货运列车标记信息智能识别系统,我们不需要一个能够识别所有环境和情况下的车厢号信息的超人工智能。因为图像识别领域往往受到摄像机的质量以及安装方法以及天气等等的多重因素影响,所以要产生一个所有货运列车车厢号识别的超人工智能是很困难的。但是如果我们把识别领域限定在特定位置,特定摄像机,进行特定训练后,产生达到效果的算法就会很快。针对货运列车车厢号识别的问题,我们通过对残差网络(ResNet)和特征金字塔网络(FPN)为骨干网络的研发,产生了比较有效的,而且可以自动迭代学习的人工智能算法。该算法对于货运列车车厢信息识别具有95%以上的识别率,而且通过自动迭代学习,其识别率可以快速增长到98%,可以响应50公里每小时的货运列车车厢运行速度,整列列车识别时间小于两分钟。

  根据此例,可以总结如下:第一,采用有效数据。第二,针对特定的应用场景,识别出其应用特征。第三,采用快速自迭代的算法,能够针对特定场景在一个很短的周期内大大提高应用效果。

  上述例子是一个图像识别处理的应用案例,我们可以很容易联想到这种特定应用,可以类比推广到很多其它领域。例如对于流水线上的货物识别操控类需求,可以通过算法的自动优化晋级很快取得较好效果。如果能够深入定制使用,必将解决很多过去难以解决的问题,而其投入产出比可观。

  根据我们的实践经验,对于工业控制类问题,我们通过摄像头和激光雷达,结合人工智能算法分别进行了处理。现广泛应用于无人驾驶的激光雷达,因为其定位的准确性,广泛的适用性,在工业领域里有很好的应用前景。其算法技术,主要是对点云的识别处理,与无人驾驶技术有很大的相通之处。

  在数据处理领域,矩阵软件亦有一定积累。各部门各单位大数据系统上了很多,往往强调各类系统的硬件能力,数据容量,响应速度,但真正有效力的数据分析结果缺往往欠缺。人工智能算法因其自发现能力,在此领域亦大有可为。

  4、工业领域人工智能产品研发的三个步骤

  当问题被定义清楚后,就进入了人工智能产品研发的阶段。根据我们的经验,该阶段通常划分为三个步骤:数据获取,算法建立,算法固化。

  数据获取:包含大部分因变量和结果的有效数据,从而建立算法训练的基础。

  算法建立:通过对问题的具体分析,根据问题分类,改进并形成有效算法。该过程需要多次重复演进,以获得有效的算法能力。

  算法固化:最终,工业领域的智能产品应通过智能芯片、定制板卡予以固化,从而提高运行效率,保证算法的实时有效,降低成本和能耗。

  三、橄榄枝与呼吁

  新年伊始,山东省委和刘家义书记发出了促进山东省进一步深化改革加速发展的号召。山东省在互联网时代,明显落后江浙粤一步。但作为工业大省,山东省是理所当然的工业数据大省,不能在人工智能领域继续落后,把工业数据资源拱手让人,自己却没有能力来开采,挖掘。呼吁山东省的大量工业企业能够充分应用工业生产过程中产生的大量物联网数据,通过与人工智能的创新结合,促进产品快速转型升级,更新换代,乃至研发出颠覆性的新产品,从而拉动山东工业乃至IT产业的全面发展。在此过程,矩阵软件愿意与各企业建立人工智能方面的研发合作,共同推进创新发展。