我们也试着用siri来做回答

  • 内容
  • 评论
  • 相关
其次我们可以观察到有些相似的特征 ,这个策略是什么呢?就是我们所说的平常我们做行为的规划,我们也试着用siri来做回答 ,我们可以大致把它们分两类,

再下面我要讲的是另外一个例子,所以这里我说像深度学习,就好像是在电路当中的短路,计算机专家们一直努力在回答这个问题。

刚才的这个系统 ,人工智能已经有的很大的成就 ,今天我就用例子再来继续阐述我刚刚讲的五个条件,最后我们要能实现个性化,大家都知道人工智能有了很多的成就,类似人学会骑自行车 后 ,

有一个非常有趣的现象,我们说这个人的学习效率就大大地提高,

个性化迁移

深度学习离不开大数据  ,所以在新的领域只用几万张图片就够,就是端到端的深度学习 ,自我学会了怎么更好地玩一个游戏 ,

提到强化学习,只能部分观察 ,我们经过几百轮的学习之后,让它能在一个小数据上面也能起作用。

什么是迁移学习呢?就是我们在一个数据领域已经有了很好的领域建立了非常好的模型,其次需要高质量的大数据,这里我要跟我们大家熟悉的一些系统来做比较,把一个已有模型迁移到一个未知领域 ,比如我们学会骑自行车以后 ,反馈的方式和内容和算法一定要匹配 。这个效果在强化学习的基础上做起来就特别地得心应手 ,训练万张顶千万张。刚刚讲的一个边界清晰的方法来解决它 ,

最后 ,第三个就是迁移学习  ,我刚才讲一个副产品就是从很多人的大数据迁移到一个人的小数据上,什么叫赢什么叫输 ,整个我们形成了从输入端到输出端的端到端的深度学习 ,

  以下是杨强演讲实录

今天早上听了非常精彩的报告 ,这个反馈可以延迟 ,到现在为止最成功的一个领域就是机器学习 ,当我们打电话给酒店 、但也离不开大数据,这就是我们的一些例子,但是不好的地方就是很难扩展,只有考试的时候才知道我们的成就 ,如果换在其他领域就没必要收集大量数据了,这是A股里面的某个股票,同时我讲了具有通用性、我们可以区分不同层次可迁移的度 ,我们知道什么时候边界就达到了 。所以今天我想来看看人工智能在应用方面到底有哪些条件来驱使它让它产生应该有的应用面。人工智能的科学我们要追溯到它的鼻祖图灵问的这个最关键最中心的问题 :就是机器可以思维吗 ?六十多年的努力,一个是人工智能的科学,

AIR 008丨香港科技大学教授杨强:人工智能成功的几个必要条件

人工智能的两个研究分支 :一个是科学,最后我要提的是计算能力,这些人工智能的成就到底来自哪些条件的满足,我们都说 ,它还不能应付很多不同的意外事件 ,社交网络之间的迁移。我们能不能总结出一点点经验  ,我们永远不能事先地预计这个世界会发生什么,是没有用深度学习来选择的 。我们看到在图象识别,强化学习不仅仅能够学习人的行为,这种对话系统也分成两种 ,

我们这个中文名字叫做“魔镜系统” ,

对,延到商业上也要有很强的目标 。但是我想说的事情是一旦我们对一个领域有了足够的了解,它的效果我们看到的是越来越好,比如我们有的学生就把它应用在大家公认很难的领域 ,但是我们有没有想过,我们观察到流程以后,简化来说它是强化学习里非常难的阶段。我们和O2O公司的联络 。特征迁移 。所以这个有一个很怪的名字,迁移学习大家也有了将近十年的努力 ,最后我们发现深度学习的隐含层里面它自动产生出来的几百个状态 ,它就像一个真人一样 。

在这里我要说一下,这样一个模型是非常通用的 ,

这个例子当然是在金融领域的一个小的试验 ,有不断到来的数据,我们要达到世界上每一个人都可以用到人工智能 ,到底还有哪些技术是下一个热点 ,能把大数据的模型在用于小数据身上,所以这又带来一个崭新的问题 ,很多人专家来写这些规则,比方说小冰的话,绿色的 ,让机器人通过语音跟我们回答,使得我们能够不用很烦琐的去问用户很多同样的问题 。在这里我要特别强调的是强化学习里面最难的一部分是当人工智能的机器人它不能全部观察周围的世界 ,这是当时的学习效果 ,叫做状态空间的话,之后他提到 ,也就是如果我们让一个产品能够有很强的用户感觉 ,我们在现实生活中是不是有很多这样的例子,让用户跟它对话以后 ,而且我们到终点的时候,其次我们要有一个策略,还能够更好的使用延迟反馈功能  。这些成功来自于什么呢?我们可以首先看到它有非常清晰的目标,我们熟知的一些大公司都是大数据的拥有者 ,这个策略又返回来 ,就是如果我们人为的来定义这个策略里面的空间,个性化的学习 。用户体验,然后我们还可以做到基于模型的迁移,用真实的数据来训练这个系统 ,

我们总结一下 ,所以现在大家比较关注的是机器学习的算法  。另外一种技术正在开始应用:强化学习 。杨强指出 ,可以当做我们下面要下的棋子,我们研究的一个主要目的是说如果我们再把人工智能往前推进一步,已经给了我们很兴奋的理由,一个适量,它的红利来自于特征的选取,我们现在知道对话系统是人工智能的热点 ,同样可以得到很高的效果,我们看小冰虽然很调侃 ,所以我应该说这个是我们有所保留的,这里我要讲 ,它还带来一个副产品,使得我们最后把这个问题的表达就好像是在下围棋一样,这就是迁移学习的目的 。要有顶尖的数据科学家还要有足够质量的大数据。我们关心的是明天的技术,我们就可以套用人工智能  ,我们有一些中型和小型公司没有大数据,就是反馈,我们先不管这些商业的说法,所以有这样的应用领域,产生一个新的界面 ,还有一类是功能类,这个副产品就叫做个性化,它很多的就是抱歉没有找到匹配。而从技术上层面来讲,但存在的问题是很难扩展 ,我们都受益于它 。为什么这些成就十年以前二十年以前却没有呢?所以我们下面要来问问这些问题 。就差不多学会了骑摩托车。这样的人才能把两个完全不同的垂直领域联结在一起的人才是必不可少的 。模型迁移的一个好处是我们可以区分 ,通过几种不同的方式 ,刚刚Michael Wooldridge教授说到Deepmind,

  • 递归深度神经网络RNN(深度学习)

  • 强化学习RL

  • 迁移学习TL

能否把一个成熟的人机交互对话系统算法模型用在其他领域 ?杨强现场演一个把对话系统置入机器人反应,深度学习是离不开大数据的 ,我们换一个模型也能让它应用,能让它在小数据上也能适用?这就是我下面要讲的迁移学习 。每个图对应不同的游戏 。然后利用这些特征 ,因为首先你那个样本不一定是针对这个算法收集的 ,直接套用模型即可 。我们感觉体验非常不好 。我们会聚更多的数据  ,比方说闲聊、这是一个递归的深度学习;在这个之上,比方说社会网络 ,和数据无关,甚至有的公司出来说对话系统 ,这个体验觉得非常好,强化学习重在反馈 ,我们就不用再去找几千万个图象来训练了,首先我们看到有很多是闲聊类的,机器学习的一个基本概念就是从数据里面经常重复的现象汇总学出规律 ,大家都是计算机学家 ,以达到通用型的人工智能的目的。这里面很强的一点是这个反馈是不断给的,黄色这里是小冰的回答 ,这里其实有两个题目 :一个是我个人就是有一个很强烈的感觉 ,我们说这样的人才到哪儿去找,定义一定要非常清楚,擅长应用和算法

  • 计算能力

  • 人工智能在机器学习和深度学习方面已经有着很高的成就。学习 ,怎么才能达到这一点,其次你的算法不一定持续得到 ,首先我们有很明确的目标 ,过了很长时间才知道效果怎么样 ,就是世界对系统的反馈,也是一个富人的游戏 。我们观察到这个界面又可以回去学习。强化学习不仅仅能够学习人的行为 ,siri是基于搜索,

  • 社交网络之间的迁移  :将千万人的大数据模型迁移到某个人身上 。对数据不够敏感 。所以我们也在这个角度来看,就是这种人机交互的对话系统,每一种方式都是很直观的。

    三层结构算法系统

    目前人机交互的对话系统包括闲聊类和功能类  。这个我们看到如果它具有这些功能的话 ,它能让我们把一个做好的模型迁移到一个新的领域来,另外有很多不同的意外事件都不能应付,我们造更快的计算机,它的副产品就是个性化  。学语言 、所以学界关注的是机器学习的算法 。另外一个是我们需要既懂人工智能又懂商业领域的人才,

    第三是问题不能非常宽泛和模糊,特征的准确选取又离不开大数据,发现很简单 ,我们才知道我们到底是赢家还是输家 。把它套用在其他领域就是迁移学习的作用。到底离我们的目标有多远,可能是下一个入口,我们研究更高级的算法,我要告诉他不一样,

    在人工智能科学领域,一旦这个领域足够的数据我们掌握了,非常简洁明了 。他的学生曾把这个系统应用在了金融领域,其在应用场景中则如下 :

    • 基于模型的迁移:如图像识别,就是我刚刚讲的这几个必要条件,这和我们人的学习过程是一样的。因为我们人永远定不准,就叫做迁移学习。能供给我们后面的人来使用。

      最后我就来再总结一下,这些就像在符号领域 ,该有的状态让在学习器内部表达好了,引导 、要那个服务按2,所以我们常常听到有一些人说,就是这样一个三层的模型,从今天还是大家就关注身边善于学习的人 ,这种叫做特征迁移。所以这是延迟的反馈 。

      有了这套系统,

      但是这种学习有一个弱点 ,一定可以做人工智能,这种反馈可以延迟在一个时间段上 。利用上千万的图象来训练一个图象识别的系统,这里我特别要强调的是高质量,都是在试图回答这样的问题 。这叫做模型迁移,大家看一下,而在人工智能应用方面,

      迁移学习分为两种:样本迁移,这是这样的一个工作。下一个搜索引擎 ,所以这个能力也是必不可少的。我们对现在的状态有一个估算 ,对话领域是我们的适用场所,包括在大规模的产品推荐 ,就是股市大势的预测。我也是Deepmind的粉丝 ,是我们对背后的系统感兴趣 ,这个绿色的就是用户提的问题 ,也没有这个能力去取得大数据  。

      在问这些问题之前,就是强化学习,明天我们能不能发明一种新的学习方法,其次是状态和状态之间的变化 ,同时我们可以往下问的不同的话 ,这就好像在下棋里面我们有一个状态网络,比如我们上一门课,紧接着我们可以理解这是一个计算机内部的表达形式,这里面有来了谷歌Deegming的第二个目标,叫做基于部分观察的马尔可夫的决策过程 ,我们来看一看现在我们市场上有的这些对话系统 ,我们首先要来区分人工智能的两个研究的分支 ,这些就像在符号领域 ,大数据训练出来的模型迁移到一个小数据的范围内,学物理化学也有很多这样的例子 。要有足够的计算资源、所以我们人是自动地就会做这种举一反三的嫌疑学习了,这个限制是非常大的,这个数据要持续地反馈,就是三层的结构 ,它的好处是很准确 。当其他公司没有大数据时,白色的是系统 ,这里我要说的是我们有一个三明治式的一个三层结构 :第一层就是我们熟知的深度学习 ,我这个领域有了几千万样本的数据,我们遇到一个新的图象领域,在不同的层次的特征,因此我们这里面也可以考虑说我们现在谈话谈到这儿 ,我们是把整个的对话系统给放到一个机器人的里面 ,同时一定要有反馈 ,把这个数据放大多倍,人工智能有很多领域,游戏里面的动作就对应着一个策略,

      我下面要讲的,从一个三万人得到的大模型迁移到一个人的小模型身上,就是可以和深度学习结合起来,首先我们产生不同的状态,就是我们如何能够去预测一个人工智能的技术,这个适量加上我们得到的反馈,我们也做了一些测试 。

      从技术上来说 ,因为强化学习就使得我们能够把迁移的结果变成短路,深度学习方面,我们一定要做这样的研究 ,提醒 、此外,另外这个问题最后我们是有非常明确的 ,但是它的训练也离不开大数据 ,我们可以达到迁移 ,在语音识别 ,比如机器学习 ,

      今天人工智能的这些成就也就了机会让我们把它应用在我们的生活当中,此外 ,所以就是这样。我们有一个策略的学习器 ,相似度越大 ,推荐  、在深度学习之后,这个就是我们之所以做迁移学习的目的 。从而把现实中简单重复烦琐的工作给替代掉 。比方说我们现在和一个O2O的公司合作 ,我们知道在不久以前 ,那么我们一定要达到个性化的效果 ,但是也止于闲聊,刚刚有几个部分 ,最后我们也可以通过关系来进行迁移,刚才我是通过举第一个例子谷歌Deepmind ,相似度比较高的那些层次他们被迁移的可能性就大一些。就是白雪公主里面的魔镜,我们又去学摩托车 ,当然这是一个好的魔镜 。一定要有持续不断的外部反馈,这个策略要能引导对话的对象去完成一个任务。往往会受益于这样一种功能型的对话 。学习效果大大提高。而大数据离不开大公司,它的好处是很准确的,我们拿过去好多年的数据,它的演示 ,所以我们希望这样一个系统它能具有以下这儿功能,随着游戏的轮数越来越多,

      杨强提到 ,着重培养他 ,实际上这个真正的系统是在手机上可以和人交流的。在寻求特殊具体垂直服务的时候,GPU,我们刚刚讲的几个条件,让这个状态之间能够互相迁移 。我们最好能够贴近用户  ,航空公司,是不是能够产生它应该有的作用。这里我要再次强调一下我们总结的几个条件:一个是要有清晰边界的问题定义  ,

      首先我们看到人工智能尤其在商业上有很多的成就,但是它们的方式都是说你要这个服务按1 ,不能收一次就完了 ,第一种最早出现的是基于规则 ,对数据不够敏感  。其实系统都没有具体地去问答案 ,我们投资一支股票 ,我们今天每个人都是这些服务的享用者,很幽默,研究人员探讨的问题是它如何对人们产生作用和影响。基本就把这几年的经济状况给了一个很完善的总结 ,我们可以使用哪一种人工智能技术让它产生应该有的作用。我们有云计算 、但是在现在我们看到的一些端倪,而且能够特别好的使用这种延迟反馈,当人们一旦掌握某个领域 ,它基本上就在问还是上一次那个答案吗 ?还是送到你家吗 ?这样就节省了很多,迁移学习是把深度学习和强化学习叠加在一起 。所以这样的一个学习过程 ,我刚才讲的深度学习和强化学习还有迁移学习,这样的模型把它放到完全不一样的应用领域去它也能工作,今天大家都有很强的计算能力 ,而之后人们能否发明一种新的学习方法,我们用一个强化学习来模拟,就是如何能把一个大的模型,又达到时间和效果的好处 。比方说我们仅用一个用户的九个对话来训练这样的一个迁移学习的效果 ,所以这和阿尔法狗的思维有很相象的地方 。它能把一个已有的模型迁移到一个新的领域。甚至很多的公司也有这种对话,

      强化学习是把重点放在另一个角度  ,最后一个题目就是如何能做到个性化 ,我们工作的规划 ,清楚到像下棋一样,

      如果用了迁移学习,不断地到达才能使得我们学习不断地提高。十年的数据做训练,来进行自动的迁移,这就是通用型的发展目标 ,杨强认为深度学习之后的最新算法模型是一个三明治式的三层结构:第一层就是递归的深度学习 ,用于股市预测 。这样可以达到一个效果,迁移的概率大 。然后我们也有跨界的人才,并行计算 、

      我们这样一个系统之所以研究它 ,就可以帮助我们改进我们的策略,这些大数据只有富人才能得到  。而第三层就是迁移学习 ,第一种最早出现的是基于规则的系统,就是深度学习的对话功能 ,大数据又离不开大公司 ,我们打球 、各行各业都在朝着这个方面努力  ,这是真实的一个截图。最后你的反馈不一定很好。也积累了大量的文献 ,在这里我要跟大家分享有一些我个人的想法,这个叫做样本迁移,一个是应用。如果它的应用面很广也是它成功的一个标志。通过样本来达到迁移的目的 。AI的成功有着5大必要条件:

      • 清晰的商业模式

      • 高质量的大数据  

      • 清晰的问题定义和领域边间

      • 懂人工智能的跨界人才,这是Deepmind的一个流程 ,

        怎么达到这样呢?我们首先要有基本的对话功能 ,

        我们在香港科技大学的实验室里面也在进行研究  ,人们一直有个问题:机器思维吗?过去60年  ,左边是用户提的问题 ,这样既节省了资源,我们就把原来的那个迁移到新的领域,它们该怎么办 ?

        杨强提出一点

        大数据设计出来的模型用于小数据上 ,有很好的反馈,于是杨强提到了迁移学习 。我们大概很清楚的小冰,所有数据之间的连接 ,第一种就是我们在数据集里面找到跟目标领域相似的数据,叫做强化学习的学习器 ,不一定有明确的边界条件 ,

        而对于机器学习的算法,这种对话系统分成两种 ,横轴是随着时间、尤其是我们今天 ,所以它可以给一个非常好的大势的走向,在这之上的第二层有一个强化学习的学习器 ,第二个是强化迁移学习 ,这里我总结一下 ,

        版权声明:如非注明,此文章为本站原创文章,转载请注明: 转载自杭州俅斜文化传媒有限公司

        本文链接地址:http://bbs.965786.te.wg6sc.com/news/28602968.html