回到主页

人工智能的前世今生,23Seed携手六禾组织人工智能沙龙

导语:

由于浙江高考作文题“虚拟与现实”(VR),人工智能又一次显现在众人眼前,成为了时下的新热点。从Alphago战胜了李世乭,Google IO的大会,百度的凡尔纳计划,到阿里巴巴对于《我是歌手》的智能预测……这些科技不知不觉的嵌入,其实质是颠覆现实的改变。毋庸置疑,人工智能的时代已经到来。

究竟人工智能的出路有哪些?作为创业者和投资人该如何把握其中的方向?6月8日 23Seed携手六禾创投,邀请阅面科技CEO赵京雷和达观数据CEO陈运文,深度阐释了人工智能的过去、现在与未来。

正文:

2016年6月8日下午,“模式实验室特别活动——以自然语言和机器视觉为引,畅谈人工智能的应用未来”在上海张江长泰广场2楼成功举办。此次活动由23Seed携手六禾创投共同打造,邀请了阅面科技CEO赵京雷博士与达观科技创始人陈运文博士,分别分享了他们对于人工智能的看法。随后的头脑风暴环节,嘉宾各抒己见,最后由六禾创投总裁王烨点评总结。

如今成为微博热搜的“人工智能”(AI: Artificial Intelligence),曾经是一个非常不受欢迎的说法。虽然早在1956年就被提出,却在发展了20多年之后进入无路可走的低谷。以致于曾有一段时间,在计算机学界发论文,但凡涉及“神经网络/人工智能”,就会被扔到一边。因为在无法承纳足够多信息的条件下,庞大的数据是资源,也是噪音。

然而最近,随着“深度学习”这样一个概念的兴起,“人工智能”这一概念又被重新推上了舞台。大数据时代一切皆有可能。每个人都有一台计算设备,每天都有无数的数据输出。人工智能的前世今生有着许多故事,今天的这股浪潮背后也蕴含着革命性的技术力量。

大数据时代,业内专家都是如何看待的?作为小圈子的分享活动,“模式实验室”是一种新型的活动形式,涵盖了私人董事会,创业真人秀、头脑风暴,是结合了23Seed线上的资源平台优势打造的智慧众筹。主办方23Seed是一家专注于创业和早期投资的信息聚合平台。合作方六禾创投则是六禾投资旗下专注于未上市公司创业投资(VC)的投资平台,专注于投资企业数据服务和数字内容领域的天使和A轮创业项目。

“智能机器需要一双怎样的眼睛?”   ——阅面科技CEO 赵京雷

broken image

“让机器人拥有像人类一样的眼睛,是我们科技所追求的目标。”阅面科技的CEO赵京雷博士自信地说道。

“阅面科技”是一家专注于深度学习和计算机视觉,提供消费级智能机器视觉认知方案的公司。创始人赵京雷是上海交通大学人工智能领域的博士,毕业后也一直从事着相关领域的研究工作。他与当前公司的几个合伙人,在一次聚会中聊天的时候讨论:“什么样的设备能成为替代手机的下一代的设备?什么样的东西能成为下一代真正的智能终端?”

答案有很多,比如全息投影、VR、AR、智能机器人......近几年来深度学习算法的突破,使大家都不约而同地看向了一个领域——新一代人机交互。

“我们发现一个共同的点——移动互联网带来流量红利催生了很多智能硬件的发明,但如果解决不了真正的智能交互、场景感知问题的话,智能硬件永远只是伪硬件。”赵京雷说到。

他举了一个真实案例——关于自动窗帘的故事。一个朋友的朋友家他们家里要装一个自动窗帘,于是买了一个控制窗帘的自动遥控器。遥控器不同的键能控制不同的窗帘。对这个智能硬件,主人觉得十分好用。

问题在于他们全家只有主人一个人会用,每当一个人希望把窗帘拉开,他就必须亲自操作。他儿子要找他开窗帘,老婆则找他关窗帘。确实在这个场景下没有人需要用手拉窗帘了,但智能的人却变成了遥控器。

赵京雷认为需要解决的核心问题是智能交互、场景感知的提升。下一代智能机器根本是数据分析的本地化。这个问题并没有很好地被解决。微软和Intel都做过尝试,但基本没法用。”

“我们希望能够为未来的智能终端提供一双机器人的眼睛,并且能提供一体化的解决方案,让他们成为真正的智能机器。”他说。

首先,这双眼睛一定要以算法为基础,不能单纯是硬件。通过自己的嵌入式和增强算法,在云端处理大量的数据,以此去构建我们的一系列视觉算法。

第二,由于要涉及非常多的硬件加速,我们也涉及到芯片端和硬件端。

第三,要重点提高两种核心能力:人机交互与场景感知的能力。

  1. 人机交互的能力——以非常自然的形式,和智能机器进行智能交互。人机交互要模式的是人与人的交流。包括以下几部分:面部理解的能力(识别你是谁),跟踪你的表情与变化/手势理解的能力,理解你的/人体动作的理解能力。

2.  场景感知的能力——场景识别和重建/基于这样的场景,如何去构建自己的地图,如何确定自己的位置,导航到给定的位置。

这两点能力对于“机器之眼”而言非常重要。人工智能与人的多维度互动也由星星之火慢慢地展开燎原之势。用户使用其视觉认知功能,可以创造出新的交互方式,为机器增加一双智能的眼睛。

“人工智能:广阔天地,大有可为”   ——达观数据CEO 陈运文

“纵观人工智能的发展,不妨用一个汽油、车与路的比喻。”达观数据的CEO陈运文说。

broken image

“首先要有道路,即一个明确要解决的问题。其次是车,也就是算法模型。比如最近几年流行的深入学习,这就是一辆非常棒的高性能跑车。车是必备的,因为车才能带你去远方。”

“但只有车是不够的,你还需要汽油——数据,它是驱动算法模型进步的阶梯。我们今天为什么有非常好的人工智能的技术,就是因为我们今天数据采集的技术大大提高了,分析的成本大大下降。所以这就是为什么我们今天能解决很多20年前解决不了的问题。”

达观数据的CEO陈运文博士温文尔雅,他是来自复旦大学的计算机博士和杰出毕业生(30项国家发明专利),也是数据挖掘专家。他所创立的达观数据是专注于大数据应用服务的高科技创业公司。

在人工智能领域,计算机学界有三个常用术语: AI (Artificial Intelligence)人工智能、ML(Machine Learning)机器学习、DM(Data Mining)数据挖掘。人工智能的目标实现尚有些遥不可及,而现在能做到的是:机器学习+行业数据=具体应用。包括文字、语音、图像。

“其实人工智能的实现和人类学习是很像的。”陈运文说道。“你观察过儿童是如何学习算术的吗?无非三步:1. 老师给出加减乘除的样例:对于计算机来说,就是一定的训练样本;2.做很多习题和标准答案:对等于计算机的有衡量效果的目标函数;3. 反复训练和总结错题:等于让计算机完成一套训练过程。”

在陈运文的眼中,计算机可以代替人来实现很多有固定规则和固定目标的问题,能够极大地提高效率。比如下围棋,下围棋的每一步都是有固定的规则的,有一个最终的目标:赢,这是有一个定义的,谁围出来的棋多谁就赢。有海量棋局的历史数据来训练这个模型,如果这个模型足够有效,结果就会很有价值。

计算机比人更快。在目标函数明确的情况下,计算机的精度和精度远远高于人类。比如加减乘除,全世界人脑的运算能力,都比不上一部的手机。且拥有无限可复制性。你训练好一个模型之后,可以部署在一千一万台机器上。

而目前,就应用而言,人工智能领域已经实现了文本挖掘、分析用户和数据采集三大成熟的技术:

——文本挖掘技术 

陈运文认为,让计算机来阅读文字这件事,计算机是可以比人做得好得多的。原先媒体雇佣了很多编辑对内容进行分类,对于内容的审核和对比是否重复抄袭以前也是依赖于人进行的,今天的计算机性能和计算机模型的效果比最有经验的人精度高50%,效果高1000倍。几乎可以减少80%以往审核编辑的工作。 

——分析每个用户

传统意义上用户的行为是按人群划分的,因为如果看每一个人的话实在看不过来,一个一个看,100万用户运营要看到吐血。但是计算机可以为每个用户生成模型,分析每一个用户的偏好,个性化地为每个用户生成推荐,撮合交易。推荐精度直接提升三倍,从20%提升到60%。

举一个具体例子。在线旅游的网站,计算机看到的是每一个用户的行为记录。你是几月几号几点几分,在网站上定了哪一个城市的哪一个酒店,几点入住几点退房,有没有带小孩是不是抽烟住在几层楼……这些数据当中蕴含着什么秘密,有什么规律呢?需要通过一个计算机机器学习的模型去挖掘的。在后台我们会对用户个性化地进行推荐和挖掘。

——数据采集

这是一个重复性的机械工作,特别适合计算机来做。指定了数据源头,计算机就可以不断地进行数据分类,归档,统计等等。源源不断地适应不同的互联网形态。这远比人来做,效率要高。

陈运文认为在将来,会有越来越多重复性的工作由计算机代劳。未来人可能更多做创造性和发散性工作。

“简而言之,广阔天地,大有可为。” 

broken image

机器在学习,创业者也在学习   ——六禾创投总裁王烨

在现场嘉宾的头脑风暴之后,六禾创投总裁的王烨在投资机构的角度,对于活动进行了总结。

  1. 从企业数据服务看,同意那个汽油、汽车和道路的比喻。原油是数据,但是必须找到应用场景成为汽油,否则没有意义。
  2. 数据本身有很大的分享性。数据的分享跨行业有一个很好的应用,不存在一个纯粹的竞争。有一份著名的斯坦福报告,通过大数据告诉你癌症的七种成因,但除了这固定的七种,系统却自行总结了另外三种原因。由此可见除了因果,果因关系也成为了一个话题,AI已经开始了一轮新的发展。

一般投资机构的投资周期是否能够支撑大数据技术项目成熟,是由一个重要的问题,一般需要10年-20年的时间周期,这对于一家投资公司而言十分漫长,如何更好地与行业应用结合是之后行业需要研究的重点问题。