郑汉城

{$title}

时间:2022-07-14 17:30:15  作者:郑汉城   来源:北洋量化 |冯骥:越来越扑朔迷离的人工智能未来会怎样?-12bet平台官方,12bet官方手机版app  

12bet平台官方,12bet官方手机版app原标题:北洋量化 |冯骥:越来越扑朔迷离的人工智能未来会怎样?

12bet平台官方,12bet官方手机版app量化投资与机器学习微信公众号是垂直于量化投资、对冲基金、金融科技、人工智能、大数据等领域的行业主流自媒体。公众号拥有30W+关注者,来自公募、私募、券商、期货、银行、保险、高校等行业,荣获2021 AMMA优秀品牌力和优秀洞察奖,并被评选为“年度最佳”腾讯云+社区连续2年。作者”。

12bet平台官方,12bet官方手机版app作者:老石

12bet平台官方,12bet官方手机版app近年来,人工智能经历了爆发、发展,然后在最近逐渐下降。看来,人工智能已经成为只有大厂商才能玩的游戏了。

究其原因,人工智能的“门槛”越来越高。

不久前,Google AI 的代表 Jeff Dean 发布了一份新工作,却在业界引起了不小的轰动。原因不在于作品本身有多好。这项研究仅比最新结果高出 0.03%,但花费了价值超过 57,000 美元的 TPU 算力,令人煎熬。

很多人说,现在的AI研究已经成为算力和资源的代表,普通学者搬不动。

还有很多人有这样的疑惑:人工智能给我们带来了哪些改变?除了下围棋,它还能做什么,未来又会如何发展?

带着这些疑问,我与冯骥博士进行了深入的交流。南京人工智能研究院创新工场常务理事,北洋量化创始人。他在人工智能领域拥有多年的研究经验。通过这次对话,我对未来人工智能的发展和落地有了新的认识。

为了读者的利益,我组织和编辑了我们的对话,我希望你们都能从中受益。

注:以下“我”指冯骥博士。

1.人工智能创新遇到天花板?

谷歌最近确实在这个问题上受到了很多关注。我认为有三个问题值得思考:

一是大厂逐渐走向“暴力美学”,即用“超大规模数据”+“超大规模算力”猛烈探索深度神经网络的天花板。但是,这种方法的边界和限制在哪里?

其次,从学术和科学的角度来看,这种方法是人工智能的唯一出路吗?事实上,已经有很多研究探索其他的技术路线,比如如何从感知智能向认知智能转变,如何用相对少量的数据来解决人工智能遇到的问题等等。

第三,行业实际应用真的需要这么大的算力吗?业界大量任务与非语音图像和文本相关,这也迫使学术界做一些更高效的算法。

2. 人工智能算法,只有深度神经网络?

1990年代之前,“人工智能”的代表技术仍以“象征主义”为主,即基于逻辑推理做Planning、Searching等技术。

2010年之后,人工智能迎来了一个重要的转变,那就是利用神经网络技术更好地表示这些感知任务。然而,人工智能仍有大量“圣杯”问题没有得到解决,比如如何做逻辑推理、如何做常识、如何更好地建模记忆等等。

要解决这些问题,使用深度神经网络就够了吗?这可能是学术界和工业界更关注的下一个重要方向。

3. 人工智能的未来:感知 vs 认知?

但更重要的是,如何从这样的感性任务切换到具有认知能力的任务,尤其是如何利用人工智能来实现逻辑推理和常识,从而真正实现通用人工智能?

针对这个问题,据我所知,学术界主要有3条技术路线。

首先,还是走神经网络的路子,尝试通过不断堆积数据和计算能力来解决问题。

二是尝试引入象征主义的技术,即联结主义+象征主义的结合。

第三,继续改进传统的逻辑推理技术,这条路线也是最难的。

4、数据:如何在数字时代开采石油?

数据对于人工智能工程变得越来越重要。业界提出了一种新概念,称为“以数据为中心”的发展模式。相反,它以前被称为“以模型为中心”。

传统上,工程师将更多时间花在如何构建模型以及如何调整参数以使系统性能更好上。但是现在,大家80%的注意力都在如何让数据集更好,如何让训练集更好,如何让训练集更平衡,然后让模型在好的数据集上训练,变得更好结果。

随着我们对数据隐私需求的增长,数据的一些负面影响和非技术要求也在增长。例如,当多个机构进行联合建模时,为了保护数据隐私,机构之间不能共享数据。因此,联邦学习等技术旨在在保护数据隐私的前提下实现联合建模。

现在大家已经逐渐意识到,各个机构在具体产业发展上的不同,就是他们的数据。现在有了非常方便的软件开源框架和非常高效的硬件实现,工程师们把目光转向了数据——这就是Paradigm Shift,是范式层面的转变。

我自己孵化的 Beyonce Quant 是一家以 AI 技术为核心的对冲基金。在公司,每天需要存储的数据量在25-30TB左右。所以我们遇到了“记忆墙”的问题。

为了应对海量数据对内存的压力,我们将数据分为冷数据、暖数据和热数据。

“冷数据”是指数据访问的频率不是很高,存起来就好。 “热数据”是指我们要做大量的读写任务,而且数据一般比较分散,每次读写的量都很大。那么如何分布式存储热点数据呢?

与纯SSD方案相比,现在有更好的方案,比如Optane持久内存:它介于内存和SSD之间,可以分布式存储热点数据,可以在一定程度上减缓“内存墙”。问题。

5、“AI-native”IT基础设施会出现吗?

现在有一个非常流行的概念叫做“云原生”,它推动了云计算基础设施的重构。人工智能的“AI-native”已经发生。尤其是近10年来,计算机的硬件创新其实都是围绕着人工智能的应用展开的。

例如,我们目前对云端可信计算的需求越来越多。例如,人工智能模型的计算过程是公司的核心知识产权。如果放在云端或者公共平台上,自然要担心计算过程被盗的风险。

在这种情况下,是否有任何基于硬件的解决方案?答案是肯定的。例如,我们在英特尔芯片上使用 SGX 隐私沙箱,它可以保护我们在硬件上的计算。这实际上是机构间合作的一个非常重要的基础。

这是一个非常典型的例子,即从需求出发,推动芯片或硬件厂商提供相应的解决方案。

6、人工智能硬件相当于GPU?

这种观点确实是片面的。以北洋量化的日常工作为例。我们在做量化交易的时候,如果把数据从CPU复制到GPU,然后再复制回来,很多量化交易任务就来不及了。也就是说,我们需要有一个非常高性能的、CPU 版本的 AI 模型实现。

再比如,我们有很多任务需要直接在网卡上分析处理数据,而网卡一般都带有FPGA芯片。对于这种需要人工智能技术帮助的低延迟场景,我们需要一个异构的架构。

也就是说,无论是FPGA、ASIC,还是CPU、GPU,它们在不同的场景下都有不同的用途。

关于异构平台上的编程,我看到业界已经有一些尝试。比如Intel的oneAPI,我觉得是一个很重要的工具。也就是说,oneAPI可以让同一套代码自动适配CPU、FPGA或者其他类型的芯片。这将大大降低工程师的编程难度,让他们专注于算法创新。

我认为这对于驱动异构应用程序非常重要。

7、人工智能未来的发展方向是什么?

我觉得可能需要更好的端到端解决方案。事实上,它已经从“软件1.0”升级到“软件2.0”时代。也就是说,从传统的复杂软件工程的规则驱动构建,到数据驱动的软件工程构建方式。

之前,我们不得不依靠大量的聪明才智编写一系列复杂的系统来让整个程序运行起来。这类似于机械表,最好的程序员专注于构建“齿轮”的操作以及如何让“表”运行。

现在,如果我不知道如何确定这组操作规则,那我就直接交给大量数据或者机器学习算法,这个算法会生成一个新的算法,这个新的算法是什么我们想得到 s 的东西。这样,它有点像建造一个制造机器人的机器人。

在软件 2.0 时代,整个软件工程的开发范式将发生巨大的变化。我们希望得到一个端到端的解决方案,其核心是如何更便捷地实现“以数据为中心”的软件工程开发。

8、未来人工智能将如何落地?

其次,学术研究不必跟风。就像我们一开始说的,模型的规模不用比较:你有千亿,我做万亿,你有万亿,我做十万亿。

事实上,有大量的任务需要小规模的参数,或者由于成本等限制,只能提供少量的样本。在这样的条件下,如何进行创新和突破?这是学术界的责任。

9、人工智能创业还是风口吗?

我们可以考虑一下。 1990年代后期,建一个网站要2万到3万元,因为那个时候有网络编程能力的人还很少。但是今天,也许任何高中生都可以通过点击鼠标来建立一个网站。

也就是说,网络知识已经在每个普通程序员的工具包中。

事实上,人工智能技术也是如此。到 2015 年左右,世界上可能不超过 1000 人构建深度学习框架并在 GPU 上运行。现在随着指数级增长,很多人都会这样做。我们有理由相信,在五年左右的时间里,任何程序员的工具包中都会出现更加丰富的人工智能解决方案,其落地门槛肯定会不断降低。只有这样,人工智能技术才能更普遍地应用于每家公司。

所以,大厂里的AI实验室必然会消失。就像2000年左右一样,很多公司都有一个Internet Lab,就是在公司里建立一个实验室,把所有网络相关的东西都放在实验室里,这个实验室会做技术输出给其他业务部门。这是因为知道这项技术的人很少,而且他们只做这个。

人工智能实验室也是如此。当AI技术落地的门槛逐渐降低时,业务部门的大量人员也有类似的技术,这样的AI Labs必然会消失。我认为这是技术发展过程中的一个临时产品,这是一件好事。当大厂没有AI Labs的时候,大概就是人工智能真正遍地开花的时代。

10、人工智能如何造福大众?

首先,我们还需要摩尔定律的加持。仍然有大量的任务需要大量的计算能力,我们必须继续在硬件上迭代和更新算法。只有当需要在集群上运行的东西可以在手机上运行时,AI 才有可能大量落地。

其次,人工智能创新的重点应该从互联网业务转向一些传统行业。之前,大家的精力都集中在如何利用人工智能做出更好的视觉解决方案,或者更好的推荐系统,或者更好的 P-map 软件。但在实体经济中,其实有大量的部门和业务在产生数据。当这些实体经济数据能够更好地信息化时,它们带来的价值可能会远远超过现在的虚拟经济。

注:本文不代表老石用人单位观点

编辑:

11183快递查询网

牛电竞的网址,牛竞技官网下载

copyright © 2016 powered by 北洋量化 |冯骥:越来越扑朔迷离的人工智能未来会怎样?-12bet平台官方,12bet官方手机版app