人工智能的三大最核心技术

2019-07-15

近年来，中国人工智能高速发展。无人超市、无人物流、无人加油站、无人驾驶、无人酒店……再加上各种功能健全的机器人！在我们毫无察觉中，人工智能正在日夜不息地自我迭代进化，冲击着我们生活的方方面面。在这些令人诧异和振奋的事件背后，离不开计算机视觉、自然语言处理、生物特征识别及知识图谱等人工智能关键技术。可以说，在人工智能产业中，技术是连接芯片和应用场景的纽带，决定了产品的智能化程度。

计算机视觉

人工智能系统的大门

根据实际解决的问题，计算机视觉技术可分为人脸识别、图像检测、图像检索、目标跟踪、风格迁移等几大板块。其中，人脸识别、图像分类等功能计算机视觉技术已经比人类视觉更精准、更迅速。在医院，一般早期食管癌检出率低于10%，而腾讯觅影通过扫描上消化道内镜图片筛查食管癌，检出率高达90%，且用时不到4秒。商汤科技宣称，利用其计算机视觉技术，视频内容审核能够节省99%的人工。

然而，虽然在解决识别、检测、聚类等问题上，计算机视觉已经可以超越人类，但其发展仍面临挑战。

首先，缺乏可用于人工智能模型训练的大规模数据集。缺乏标注数据是几乎所有应用场景普遍存在的挑战。当前的应用场景多以项目制形式落地，数据仍然在项目建设方，数据不能共享也无法形成闭环，也就导致技术的进步分散在各个企业的各个项目中，难以带来行业整体跨越。

其次，缺乏从技术到产品到规模化应用的工程化经验。计算机视觉技术的应用已不再是单一的软件应用，涉及到新型基础架构，涉及到新的数据分析流程，还涉及到智能硬件如摄像头的安装等等。每一个环节都可能会影响识别效果。将这一技术从实验室扩展到工业化应用的过程本身就是很大的挑战。

自然语言处理

中国领先的人工智能技术

一个完整的自然语言处理系统包含语音识别、语义识别、语音合成三部分。其中，国内企业在语音识别和语音合成已处世界领先地位。

语音识别是指让计算机“听到”人的语音，目前已经比较成熟，尤其汉语的语音识别领先英语。根据2017年IBM、谷歌和微软发布的词错率进展数据，他们的识别率均在94%-95%之间，而在此之前，国内语音识别企业，如百度、搜狗、科大讯飞，识别率均已达到97%左右。

语音合成是指计算机将准备“回复”给人类的语句，通过合成音频的形式，利用扬声器外放。百度地图的语音导航、苹果手机的Siri助手背后都利用了语音合成技术，这项技术已日臻成熟。当前，科大讯飞的语音合成技术代表了世界领先水平。2018年科大讯飞打败卡内基梅隆等众多高校、科研机构和企业，连续13年赢得Blizzard Challenge（国际语音合成大赛）冠军。

区别于语音识别“听到”人类语言，语义识别更加强调“听懂”。当用户对智能系统说出一个饭店的名字，系统对用户语音进行识别，搜索饭店，这是“语音识别”；当用户对智能系统说“自助餐”、“海鲜”、“连锁店”等模糊语句，智能系统根据用户的性别、爱好、饮食倾向等特征进行智能分析，并精准推荐，则是“语义分析”。可见，语义识别比语音识别技术难度高好几个层次。

语义识别是当前自然语言处理发展的瓶颈，仍处于初级研究阶段。由于目前的人工智能技术只能把音变成字，字变成音，不能理解其中含义，很难实现基于场景的生动会话，商业落地的场景十分有限。

知识图谱

人工智能的下一技术风口

知识图谱最初是由google 公司在2012年提出来的一个新的概念。从学术的角度，我们可以对知识图谱给一个这样的定义：“知识图谱本质上是语义网络（Semantic Network）的知识库”。但这有点抽象，所以换个角度，从实际应用的角度出发其实可以简单地把知识图谱理解成多关系图（Multi-relational Graph）。如果说以往的智能分析专注在每一个个体，知识图谱则专注于这些个体之间的“关系”。知识图谱用“图”的表达形式，最有效、最直观地表达出实体间的关系，是最接近真实世界、符合人类思维模式的数据组织结构。

相较于传统的智能分析，知识图谱是基于图的数据结构，即知识图谱需要从海量信息中抽去多个维度的特征信息，并在这些特征信息素材的基础上，通过智能推理实现从数据到可视化图像深加工，从而能够直观易懂的展现给用户，并与用户交互。

目前，知识图谱主要应用于面向互联网的搜索、推荐、问答等业务场景，成为以商业搜索引擎公司为首的互联网公司重兵布局的人工智能技术之一。同时，也开始在金融、医疗、电商及公共安全保障等领域得到广泛的探索。当我们使用搜索软件时，搜索结果右侧的联想，就来自于知识图谱技术。在反洗钱或电信诈骗场景，知识图谱可精准追踪卡与卡间的交易路径，追本溯源识别洗钱/套现路径和可疑人员，并通过他们的交易轨迹，层层关联，分析得到更多可疑人员、账户、商户或卡号等实体。

然而，目前知识图谱尚处于发展初期，受制于抽取数据的样本量限制、深加工准确率和效率较低、数据噪声大等因素限制，应用场景非常有限。相信未来，随着研究的深入，会有越来越多的应用场景被发掘出来，对于知识图谱所能发挥的价值可期。

虽然人工智能在图像识别、语音识别、文本处理、游戏博弈等诸多方面全面赶超人类，取得了突破性进展，但整体来看其还是在婴幼儿时期，远未达到人们所预期的智能水平，也远未到成熟的地步。相信未来，随着时代的进步，技术瓶颈将不断被突破，人工智能的发展将更加多元化，更多的黑科技会使得我们的生活更智能。