决定现代数字计算系统主要结构的是资源的组织形式。而人工智能计算的本质,简单来说,非常不同于冯·诺依曼的控制流结构,后者采用线性的记忆体和布尔函数作为基线计算操作。而新的范式是神经网络计算,其特征在于分布式的表示和激活模式。在这里,变量由叠加在共享物理资源(如神经元)上的向量表示,并且通过神经元的激活来进行计算。网络的拓扑架构和激活模式提供了巨大的计算空间,可以有效并且自然地捕获丰富的知识(通过拓扑的超参数、权重、激活函数)。相对于冯·诺依曼架构中的本地化表示(其中变量由诸如寄存器的专用或局部化物理资源表示)和符号计算,神经网络计算在学习和表示物理世界以及社会的丰富的语义知识方面更加自然和强大。
通过神经网络计算的力量,下一波的人工智能技术可以在以下两个维度提升目前的计算系统:
一是自动分层特征/表示学习。这是机器学习容量的实质性提升,因为当今机器学习工作的很大一部分关键在于特征工程。如百度大脑已经拥有万亿级的参数、千亿级的样本和千亿级的特征训练。
二是高级认知,特别是感知能力。这是下一代设备(如无人驾驶汽车)和下一代平台(如自然语言会话)产生的巨大催化剂。
人工智能计算的强大能力将有助于产生许多新品种的智能系统,如机器律师、机器分析师、医疗机器人、智能客服人员等。
人工智能计算的另一个发展方向是组织各种服务于特定物理架构和物理要素的系统,如家、办公室、工厂等的智能系统。其基本模式是通过使用物联网传感器的各种原始信号,人工智能的「感知系统」会对物理架构进行识别和感知;而「认知系统」需要组织信息和学习更多关于物理架构的知识,并去预测、判断和决策,以使各类物理系统更加智能。
目前,在科研领域,人工智能计算可以提供更先进的建模能力,成为多领域和新一波科研浪潮的催化剂。
在商业方面,人工智能可以提供额外的机会,为企业组织创建集成的业务计算系统(Business Computing System,BCS)平台。如记录业务对象(如系统设计模型、交易记录)和业务流程(如ERP(企业资源计划)、CRM(客户关系管理);或者系统设计并模仿人类工作活动,如沟通、协作、阅读、写作、寻求信息等。
目前来说,人工智能的「感知系统」有更广泛、更新的商业机会:一方面,可以构建和部署更多的「传感系统」的子系统,针对的是物理环境或物理系统,如装配线、工厂等。这使得未来人力密集的制造业、商业服务业等,可以采用更先进的信息工具和更强的自动化。另一方面,自然语言处理技术的迅速进步使得我们可以扫描和分析文本文档和信息,并从中提取各种高价值的业务知识,而构建和部署专用的「文本理解子系统」可以得到很多高价值的知识和商业回报。
人工智能「认知系统」的成熟代表了智能时代更长远的未来,所有的行业、职业、社会系统、生活方式都将被重塑。如果数字化社会可以概括为「信息就在指尖」,那么,人工智能时代的本质可以概括为「知识无处不在,任何交互都是智能的。」
这个浪潮对大多数人来说无疑是巨大的机遇。
传统的制造业基本上以器械、电器和电力为主,其生产流水线基本上要用很大规模的投资来建立,后续很难调整。比如一家汽车制造厂,要重新建立一条生产流水线,成本很高,花的时间很多。当数据智能、自动化、精准预测对制造业的改造完成之后,后者的面貌将焕然一新。未来的制造业生产流程将是模块式的,全部是数字控制。当一家汽车制造厂要调整生产,制造另外一种样式的汽车,它不再需要重建生产线,而只需要把新产品模块的接口(API)调过来就可以了。这将彻底改变制造业基础,制造业效率也将会极大地提升。
这个改变的核心是数据和知识,即制造的流程、制造的工艺、制造的设计,制造的每一步都会用数字来控制。
再比如制药行业。以前一款新药的诞生要经历长期的研发过程,去发现某种方式对某种病症有效。未来借助人工智能计算技术,将庞大的基因数据与海量的健康信息结合起来分析,人类可以很快发现规律,找到个性化的基因药物。
大数据之「大」,让不可能成为可能
既然人类运用数据已久,而且自工业革命以来,数据经历过一次又一次的爆发,何以近年来才出现「大数据」的概念?仅仅是它所能记录和计算的数据量更多而已吗?自然数可以无限数下去,1、2、3、4,以至于无穷,但「多」是不够的,还必须具有几大特征:
第一,大数据的「大」。毋庸置疑,这个「大」相对于人类传统数据的储存方式,不是一个量级上的大小之分,而是几何量级的差距。想想百度地图上每日720亿次的定位请求,再想想互联网上每天有多少次点击、社交媒体上每天有多少文字和图片发出……各种大数据平台一天之内收集到的数据量就可以超越人类几千年来文字、图像的总和。
第二,大数据的另一个重要特点是多维度。多维度代表着大数据可以对一个事物进行多方位的描述,从而更准确。
在电影《谍影重重》里出现过一个大数据公司,能够根据互联网数据、交通数据、历史档案等各种维度的数据帮助美国中央情报局(CIA)迅速追踪和定位疑犯。现实中美国的Plantir数据公司便是如此帮助美国政府追踪本·拉登,提供反恐信息和社会危机预警。它们更常见的业务是识破金融诈骗。
以金融征信应用为例,传统金融机构在进行征信时,一般采集20个维度左右的数据,主要包括年龄、收入、学历、职业、房产车产、借贷情况等。然后综合评分来识别客户的还款能力和还款意愿,决定信贷额度。
互联网公司采用大数据方法,所获得的维度可以让传统银行吓一跳。BAT都开设了自己的金融服务,因为拥有全面且巨大的用户数据,可以查询客户的各种线上记录,比如是否有批量申请贷款等异常行为;还可以将客户信息与互联网全局信息比对,通过欺诈行为模式的比对分析其可信度;更进一步,还可以分析客户的消费行为和习惯,结合填报收入分析还款能力如何。当然,作为用户的隐私,这些数据都不会被公开,用户所能感受到的便利是征信排队时间极大地缩短了,因为大数据可以在几秒钟内就对申请者超过1万条的原始信息进行调取和审核,迅速核对数万个指标维度。
编辑:未知
卡戴珊诞下女婴TT深陷出轨丑闻守护身边 网友:感谢你离开哈登
科勒卡戴珊当妈妈啦。 两位知情人士告诉CNN,卡戴珊已经生下一个女孩。 卡戴珊的男友以及女婴的父亲是克里夫兰骑士球员特里斯坦