新闻资讯
news center2020年2月4日,工信部发布《充分发挥人工智能赋能效用 协力抗击新型冠状病毒感染的肺炎疫情倡议书》,要求加大科研攻关力度,尽快利用人工智能技术补齐疫情管控技术短板,快速推动产业生产与应用服务,在疫情发现、预警、防治等方面有所作为。
这是一场特殊的战争,而人工智能已成为一支特殊的尖兵队伍,不怕危险,不知疲倦,正全面加入抗击新冠肺炎的第一线。2月18日上午,厦门创投视频会议连线到了渊亭科技创始人洪万福,聚焦“人工智能总体介绍及在疫情中的应用”这一主题进行直播分享,带大家走近“人工智能时代”。
渊亭科技成立于2014年,是一家在厦门本土成长起来的优秀人工智能企业,在金融、国防、公安政务等领域技术积淀深厚。渊亭科技于2019年11月获得了市产业投资基金参股子基金中电中金基金和厦门创投自主管理的金创集智基金的投资。
洪万福:15年软件行业从业经验,擅长大型系统架构规划、知识图谱、自然语言处理等。历任清华同方软件出口首席架构师、Dell架构师等,主导设计过十几个千万-亿级大型信息化系统。参与《工信部信通院-知识图谱行业标准2018版》、《深度学习评估框架和过程》多项国内及国际标准的制定。2014年创立渊亭科技并推出DataExa产品系列(知识图谱、AI中台等),专注认知智能方向在行业的应用和赋能。
以下为视频会议精选内容——
一、人工智能概况
人工智能定义
人工智能是计算机科学的一个分支, 它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。
“三次浪潮”
人工智能起始于1950年的图灵测试,而1956年的达特茅斯会议标志着人工智能的诞生,并用AI(Artificial Intelligence)代表人工智能。
人工智能共经历了“三次浪潮”:第一次浪潮是1955-1958年,由感知神经网络将人工智能推向第一个高峰,代表公司是美国的DRAPA,由于当时算力、算法的限制,此次浪潮很快陷入低谷;第二次浪潮兴起于上世纪八十年代,当时反向传播算法获得广泛关注,参与人工智能开发的主力军是高校和实验室,但除了算力不足,当时还缺乏运算数据,所以第二次浪潮再次陷入低谷。目前我们处于快速发展第三次浪潮,互联网(含移动互联网)的普及产生了海量信息的数据,GPU、FPGA等芯片研发有效提升了算力,行业参与者也更加多样化,民间机构纷纷投入研发,尝试解决垂直场景问题,预示着本轮人工智能浪潮会持续很长时间。
机器学习
机器学习是对能通过经验自动改进的计算机算法研究,其中包含了:监督学习(Supervised learning): 已知数据和其一一对应的标签,训练一个智能算法,将输入数据映射到标签的过程。无监督学习(Unsupervised learning): 已知数据不知道任何标签,按照一定的偏好,训练一个智能算法,将所有的数据映射到多个不同标签的过程。弱监督学习(Weakly supervised learning): 已知数据和其一一对应的弱标签,训练一个智能算法,将输入数据映射到一组更强的标签的过程。强化学习(Reinforcement learning): 智能算法在没有人为指导的情况下,通过不断的试错来提升任务性能的过程,用于有胜负之分的场景,比如Alphago围棋,告知机器规则后,机器将不断试错达到所需结果。以及半监督学习(Semi supervised learning) 和多示例学习(Multiple instance learning) 。
深度学习是机器学习的分支,是一种以人工神经网络为框架,对数据进行表征学习的算法,传统的机器学习需要人为先总结特征,比如研究航空公司如何降低油耗,需要先提取飞行数据特征如风向、飞行动作等,再同历史数据对比找到存在规律,给机器设定起始态和最终态,深度学习在中间的特征提取部分,可由机器模拟人脑感知链条,自动提取特征,中间过程由机器模拟人脑感知链条,自动提取特征导出结果。
人工智能三层次
计算智能:运算能力和存储能力。例如1996年IBM的深蓝计算机战胜了当时的国际象棋冠军卡斯帕罗夫,其主要靠的就是算力。
感知能力:机器的视觉、听觉、触觉等感知能力。人类都是被动感知的,但是机器可以主动感知,例如激光雷达。
认知智能:独立思考和解决问题的能力,通俗讲是“能理解、会思考”。概念、意识、观念等都是人类认知智能的表现,但目前技术尚未成熟。
人工智能学派
符号学派:模拟人的心智。认知智能、知识图谱业务都属于该学派。
联结学派:模拟脑的结构。
行为学派:模拟人的行为。
近些年人们越来越意识到学派之间相互融合的重要性,比如“知识图谱+深度学习”,试图解决知识图谱在逻辑推理能力强、泛化能力弱和对深度学习不重视人类现有知识体系的矛盾及问题。
人工智能三要素
数据、算法、算力(实际使用中还是以CPU海量廉价节点为主,GPU使用较少)。
人工智能进展及边界
计算智能远超人类,代表案例是深蓝打败国际象棋人类选手。
感知智能中,语音识别整体上超越人类,代表案例是微软2015年发布的翻译软件。
图像识别也属于感知,图像识别和感知、认知计算不是一个层级,常规识别远超人类(例如人脸识别),但泛化识别弱于人类。
认知智能中,文本挖掘的常规任务接近人类,语义理解远不到人类水平,情报分析与人类具有很强互补性。
决策控制属于强人工智能(AGI:Artificial General Intelligence),其中无人驾驶可以在有限条件下使用,暂弱于人类;综合决策要看所在领域的复杂程度(例如Alphastar在星际争霸已达到宗师水平,AlphaGo碾压人类围棋选手)。
人工智能生态圈
基础层:芯片/服务器、云服务、计算平台/框架、数据服务等。
技术层:计算机视觉、自然语言处理(NLP)、机器学习等。
垂直应用层:智慧医疗、智慧教育、智慧金融、智能驾驶等,存在很多行业机会。
人工智能(以深度学习为代表)面临的问题
缺乏常识:例如2016年特斯拉交通事故,调查表明当时有7秒反应时间,但汽车训练时没有遇见过此类情形,错误反应造成事故。
可解释性:例如银行在传统信用卡审批中采用评分制,过程可以解释,但AI审批只输出结果,中间决策过程是个黑盒(卷积神经网络CNN),因此不可解释。
效率问题:机器学习认识一件事物需要大量多维度数据,同时配合相应算力,而人类在某些学习场景只需要很少素材,比如儿童识图。
安全隐患:比如在感知智能里,给机器一些干扰会影响识别准确率。
人工智能威胁和伦理
失业危机:短暂性痛苦,但长期可以解决。
AI偏见:学习过程大量依赖语料,采集过程中会掺杂带有偏见素材。
战争用途:例如美军研发杀人无人机。
人工智能重要发展方向
小样本学习/小数据学习:人类在与世界的观察交互中学习、建立常识并完成新的任务,并不需要如今智能系统的海量标注数据或大量交互。
持续学习:人类的学习可适应持续动态变化的环境,目前的机器学习一般是定期离线训练,不能有效应对无时无刻都可能发生变化的环境。
开放场景 通用AI:人类可以综合利用各种智能解决不同问题,现阶段的智能系统通常仅能解决限定场景领域有清晰边界的问题。
可解释性:时下最热门的深度学习方法往往是“黑箱子”,但缺乏足够的理论支持,对于重大决策问题或监管性的任务,理解模型的内部机制很有必要。
二、人工智能行业应用
目前,人工智能已经广泛用在金融、安防、电信、医疗、教育、工业制造等领域。
渊亭科技服务案例有:
案例1(某银行):帮助公司搭建消费金融征信风控大数据平台,通过结合运营商提供的数据(BOSS计费、支付记录等),精准识别客户,在2017年电商双11期间,在近600万用户中实现近79亿的交易额度。
案例2(某监管机构): 帮助监管机构,把央行条例解读后写成规则,重点挖掘账户异常交易和行为,解决人工漏报误报问题,尤其在针对新出现的洗钱手段上效果显著。
案例3(某券商):帮助券商搭建证券行业第一个智慧大脑项目,把所有数据(工商数据、宏观数据、交易数据等)规整建立大数据库,构建金融证券知识图谱(宏观经济、产业链、企业画像、产品服务),通过分析模型实时解读新闻和上市公司公告,对事件风险预警的准确率提升至59%-72%。
案例4(某监管机构):通过上传交易所数据,无监督学习建模,对可疑交易账户(特点窗口内对敲行为)分组,再结合可视化行为分析,抓取操纵股价行为。
三、人工智能疫情防控应用
人工智能防控概况
这次疫情传播主要有四个痛点问题需要破解:如何阻断传播、病毒传播溯源、调度优化、疫情监控。
目前人工智能在疫情防控中的应用主要有:病例筛查(通过算法筛选)、药物研发(AI临床实验、药物分析)、无人服务(无人机器人)、传播控制(大数据分析)、日常管理(登记)、预警预防。
渊亭科技疫情作战平台总体架构
正月初三,渊亭公司在国家疾控小组的领导下,开始积极搭建疫情作战平台,目前已通过工信部全国疫情防控评测认证,并推荐给各部委采购使用。
其中,数据采集模块:最小集合包括确诊人员信息、交通出行数据、运营商数据,最优集合包括社区数据、城市监控数据、互联网第三方数据等。功能模块:一是预警中心:聚集性疫情预警信息、关键节点发现预警、超级传播源预警、高危群体防控预警。二是研判中心:针对疫情信息大数据,快速构建疫情图谱,提供基于图谱的关联分析、时空分析、流向分析等可视化分析手段,结合人员关系网络快速挖掘关键节点及二三度人群等,帮助防控部门从根源阻断病毒传播途径。
》》交流互动环节——
Q&A
Q:未来3-5年,渊亭在民用领域有哪些拓展计划?
A:公司核心能力是知识图谱,偏向情报分析,抓住图谱赋能方法论就可以实现跨行业服务。比如在工业互联网领域,像内部管理、物料供应链管理都存在需求,渊亭可以带动工艺水平提升,提高人效,难点在于数据标准化,特别针对中小企业。在民用领域方面,判断社会服务性行业存在落地机会,比如无人超市,无人银行。
Q:经历此次疫情, AI未来会对政府公共管理可能产生哪些变革?
A:首先,国家层面会更加重视信息化建设,会深度挖掘,打通各个部门数据,优化数据库;第二,应急指挥将迎来风口,过去传统偏重硬件采购,未来建立智慧大脑,将更多应用大数据、云计算等技术;第三,智慧城市更加深入、向正向发展。
Q:人机连接等AI技术发展未来是否可控,对人类是否构成威胁?
A:短期来看,在人脑控制机器操作、人机交融有应用场景,比例医疗领域辅助治疗老年痴呆;而人脑机器增强,即机器意志代入人脑,对于AI是否对人类构成威胁,我认为所有技术科学的最高境界应该是创造全新的领域。
Q:AI在投资决策上应用的趋势以及公司的布局是什么样的?
A:AI在金融应用时间较久,例如二级市场用机器学习做量化投资分析,还有之前提到公司跟金融机构合作的案例。其中关键点在于把投资特征量化成数据,以便机器学习。
Q:弱监督学习是否适用于方言学习,使得机器可以像人类一样学习语言?
A:监督学习方言比较难,自然语言处理难点在于语言存在多样性、歧义性和上下文语境,以及语言体系本身承载的文化,监督学习更多关注的是特征提取分析,没办法很好解决上述问题。目前斯坦福大学在尝试开发统一语言框架,试图在英语范围内,总结抽取语言的通性,但不可能模拟人类天然学习语言方式。
Q:如何判断AI边缘计算芯片市场?
A:非常可观,尤其在国防领域应用,例如现代战争中,双方实力对比悬殊,其中一方中央控制系统一旦遭遇打击瘫痪,单兵作战将受到限制;此外,战场环境的探测感知,也都需要用到边缘计算。
》》渊亭科技
渊亭科技是一家专注于数据智能、致力于“行业+数据智能”解决方案的创新型公司。公司重点面向运营商、金融、军政和互联网领域提供业界领先的大数据应用产品与解决方案,为客户打造全生命周期的数据价值挖掘体系。公司自主研发了包括DataExa-Insight数据洞察平台、DataExa-Sati认知计算(知识图谱)平台、DataExa-Suite(包括自然语言处理引擎、推荐引擎、规则引擎、社会网络分析引擎、数据采集处理引擎和数据分析挖掘引擎等组件)等产品,并利用该平台在各领域形成具备自学能力的行业知识图谱,将数据服务提升到知识服务。
》》厦门创投