点标签看更多好帖
开启左侧

[机遇与挑战] 杨强:当媒体遇上人工智能会发生什么好玩的事?

[复制链接] 1
回复
1486
查看
打印 上一主题 下一主题
楼主
跳转到指定楼层
发表于 2016-11-17 13:26 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式

马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有帐号?注册

x
杨强 | 香港科技大学计算机系主任及大数据研究院院长、2015国际人工智能大会主席。

活动:11月14日 2016腾讯网媒体高峰论坛,笔记侠作为合作媒体,经主办方授权发布笔记。

今日笔记侠客:笔记侠   深度好文:4580字 | 6分钟阅读

编者按:京华时报13日转岗交流工作启动,有人说传统媒体的困境越来越明显。随着智媒时代到来,人们感知世界的方式也发生改变。当媒体遇上人工智能,究竟会给媒体带来什么,是会解放媒体生产力,还是牵制媒体生产者?AI究竟能为媒体带来什么?有什么指导方向?

完整笔记·人工智能
一、AlphaGo启示:
人工智能应用流程

今年AlphaGo是一个大事件,它为我们带来了什么?从技术和商业上、从未来的发展方向上,能不能从AlphaGo的发展看出一些端倪?



首先我们看到在过去人工智能的发展经历了几次大事件。


首先是IBM深蓝、沃森为我们带来了很大的惊喜,告诉我们计算能力很重要。有了这种计算能力,我们就能够比人搜索得要深,比人回答得要快,能够回答一些尝试性的任务。

但是AlphaGo又加了一条,告诉我们原来数据也很重要。不仅如此,高质量的数据更加重要。什么是高质量的数据呢?其实创造AlphaGo这个系统是需要几个条件的:

首先就是能够很清楚认识到哪些是我们的目标。这些目标要清楚到什么程度呢?用数学公式写下来。

其次要清楚认识到数据来自于哪里。这不是一天就可以做好的,比如AlphaGo是经历了十几年的时间,才获得了如此高质量的大量数据。

同时对问题的了解要深入到特征的层面,要从一个问题能够抽取出大量的特征。


最后要有非常合适的自学习方法做这件事。


二、智媒进化的基础



A.I.能够为媒体带来什么?说起媒体就离不开文本和自然语言的分析。


什么是文本?


文本就是小说、新闻这些,我们可以把这些数据认为是非结构化的数据,是一个非常有意思的数据,不枯燥,但是对于机器来说却是一个难题,因为没有结构,是需要我们人去理解它才会有结构。

今天有一种技术叫机器阅读,阅读的成果是中间的理解、表达,这个表达叫做隐式表达。

这种表达通过第二种模型,也就是我们所说的机器学习、自然语言的生产模型,能够为我们人产生出各种各样的我们所需要的数据。就好像我们旁边有一个助手在我们帮助进行大量的阅读,然后根据我们每个人的需求可以跟他进行对话来获得他阅读的知识,所以是这样两个过程。一个是机器阅读系统,一个是自然语言的生成系统。

机器阅读有哪些应用呢?


比方在谷歌的邮件中就可以通过模型对大量邮件的阅读形成一个端到端、序列到序列的模型,这个模型通过阅读一个新的用户邮件,自动地产生一个可能的用户反馈,这样用户在给最后一个决策就可以很简洁地恢复邮件,这样就大大提高了用户的体验。



机器翻译就不用说了,这是非常有用。但是最近深度学习的发展,可以让机器能够自动地用算法学习到一种语言到另外一种语言,可以自动对应。这种对应在之前是很少的,但是用机器学习来做就大大增强了。它的效果是可以使注意力机制大大加强。


什么叫注意力机制?


就是在一句话里哪些部分是关键部分,我们可以拿这些部分来代表整个话的意思,这样可以用聚焦的方式来加强理解。应用了这个以后,比分就大大提高了。

还有一个应用可以让计算机做很多阅读,阅读的结果可以由我们人来询问。


比方说让他看了一个语文的试卷、历史的故事,我们可以问一些关于历史人物、历史事件的问题,计算机可以圆满地做出回答。

还有一种就是我刚才说的注意力机制,可以帮助人描画出哪些文本的部分是我们阅读者应该去注意的,就好像我们学生在上课的时候经常会画一些需要关注的重点,这样我们考试的时候就会有的放矢。机器在今天已经会做到这一点了,这个叫做完形填空的回答。




这个再发展下去,又可以让机器大量地背唐诗,并且可以自己写诗。这里是香港科技大学的图片,图片有山有水,这个模型可以在唐诗里选择最合适的唐诗来配这副画。同时利用生成式的模型,还可以自动地产生。


比方说当输入对联上联的时候,就可以拿它作为输入,这样的生成模型可以自动产生下联,而且通过注意力的机制使上下联对仗非常公正。这在人看来都是一个智慧的象征,但是今天对于机器来说已经是非常简单了。

三、智媒体进化的五大实践方向



第一种,AI+新闻编辑室

给了一个文章或文本能不能够自动写出一些摘要?给出一个文章,能不能自动地产生一个吸引用户的标题?


在过去的做法,这个领域叫做摘要的编辑,摘要编辑过去的做法叫做抽取式的新闻写作。

比如在一个足球赛里,通过对解说词的分析,用解说词训练一个模型,最后这个模型可以在解说词当中抽取特征。


另外是再把这些重要的特征所指出的句子给摘出来,再把他们拼接起来形成一个很短的摘要。这个事已经可以做了,在过去十年、二十年已经做得不错了。但是毕竟不像人一样去读一篇文章,再根据我们的理解重新写出一个摘要,或者是编出一个非常好题目。

如果要做到这一点,我们就需要一个所谓的生成式的模型,这个模型可以把每一句话读进来,并且可以对应到输出,这个输出往往是上文对下文的序列到序列的对应。这种对应还不足以产生我们所想要的高质量的摘要。

在这个基础上,我们又在上面可以加一层强化学习或者增强学习,使得这样的摘要过程有目的性。

也就是说两种学习,一种是序列的深度学习,另外一种是增强学习,这两种加在一起就可以产生基本上跟人差不多水平的一个摘要。



我们开一个脑洞,也可以让机器读小说。


比方有《射雕英雄传》、《笑傲江湖》,把这两部小说给合并起来,利用模型合并输出一个新的小说。可以用循环的神经网络(RNN)来产生各自的模型。阅读了以后,产生的模型通过迁移学习迁移到一个共同的空间,这个共同的空间就是什么呢?生成的模型可以使得我们阅读小说。比如洪七公和令狐冲这样的人物可以进行打斗,可以看得非常通顺。这个跟人的反馈、强化学习、增强学习的机制是分不开的,也是今天大数据的一种结果。

第二种,AI+信源捕获

我们可以在一个新的领域利用新的手段获得一些信号,并且把这些信号转变成我们要的新闻内容。在这里举几个例子。


首先是假设我们有很多的文章,可以自动地把这些文章生成一些问题和答案的配对,也就是问题和答案的集合。这就像我们理解了一些过去某个政治人物或某个著名人物写过的文章或关于他的文章,以后自动产生一些想要问他的一些问题,这个过程是需要人去理解文章,然后产生一些高质量的问题。



今天我们可以用深度学习来做到这一点。


这是两种信息的结合:


一种是知识库,也就是对整个领域的认识;另外一种就是文本。我们把这两种结合起来,就可以自动地生成一些挺不错、质量挺高的一些问题,就好像我们可以面对这位被访问的人物了。

这也可以延伸到从文字到图片,比如看了一个图片,现在也有一种方法可以利用计算机神经网络抽取出特征,用另外一个模型来产生问题。也就是说对着一个图片,可以产生对于这个图片的问题。这个问题也就变成了这个图片的一个标注,或者可以到外面邀请别人来回答这样的问题。



假设今天有了很多的传感器,可以把传感器收集的数据、信号自动转变成人可以去读的文章,比方我有一个学生很热爱骑马,它造了一个传感器可以放在马尾巴上去观察马的健康状况,同时可以把它翻译成人可以读懂的信号,以此来了解整个赛马的成长过程。

进一步就是想把传感器放在宠物的身上,在宠物的日常活动当中和人的交互当中,可以把宠物的行动变成人能读懂的自然语言,就好像宠物在跟你用说话的方式在交流一样。

我还有一个学生在用手机作为传感器,记录用户每一天的行为。到晚上的时候就自动把所有收集的手机信号,转成一个自然语言的日记,把这个日记给这个人,可以修改一下,也可以发朋友圈。

第三种,AI+视频和资讯

这方面的数据量是庞大的,边界也足够清晰。但是一个重要的问题是跨界的人才特别少,我指的这个资讯和A.I.的互动到底是什么呢?


比方很多的视频,能不能有能力让计算机看这种视频,然后用文字的形式告诉我们,给我们一个文字的摘要。像这样的是我们的一个梦想,这样就可以自动地检索很多的视频,自动搜索,可以找到我们想要的视频。

另外一些新闻视频也可以帮助编辑找到他们认为的高质量的、适合编辑内容的视频,这个事在大学的实验室里面已经有很多的尝试了。其中一个方法是把视频通过深度学习转化成特征,然后在通过这些特征再转化成文字。从视频到文字,甚至可以从文字到视频,你可以描述一个像电影的脚本一样,然后自动地一个通过拼接的方法产生一个可能的视频。


这方面还有所欠缺,关键点是跨界的人才和用户的反馈还不够多。

第四种,AI+智能分发

这个新闻怎么分发到想看这个新闻的用户的手里?


在过去这个方向叫做推荐系统,在电商里面已经大量地使用。但是新闻有它的特点,因为新闻是靠内容来取胜,所以一定不能忽略信息的内容。比方我们人看新闻,是因为我们好奇,对于新闻感兴趣,怎么样能够把好奇的人和好奇的内容给结合起来?怎么能把桥梁给建立起来?

比方一个用户历史上经常读一些财经的文章,现在又比较关注美国大选,能不能以此来推断他关心的就是特朗普对财经的政策,以此可以推送很多这样的新闻。这种信息既有用户的行为信息,又要有内容的信息,像这种的结合现在已经开始有这方面的研究了。




举个例子:


用推荐系统来做基于内容的推荐。这个时候一个特点重要的点是用户的兴趣会随着时间而变的。比如我去年感兴趣的东西,今年不一定感兴趣。今天在上班时候喜欢看的新闻,和我放假时喜欢看的新闻完全不一样。怎么样通过杂乱的信号源发现用户的兴趣点在哪儿,把变化用模型描述出来?这叫做部分可观察的马可夫决策过程。

但这有很多的计算局限,一个局限是高质量的数据,第二个局限是计算能力。随着时间的推演,我觉得数据一定能够收到,计算能力也一定能达到那一天。我觉得我们有能力预测用户长期的兴趣变化。

第五种,AI+资讯服务

在这一点上,我觉得大家可以关注的是人机对话的系统,也许是用自然语言对话,也许就是人机交互的系统。比方我们在车里,在这样的一个场景中,但是又特别关心美国大选的结果,所以我就可以问机器人这样的问题。




比如问在美国选票情况如何,机器人会告诉我各州开票的情况,这种对话的方式是需要机器人做大量的阅读,去现在的场景。另外对当前的舆情分析也是非常了解,最后根据我的兴趣来做一个总结。



要做到这一点,这个机器人的智能点来自于几个方面。


1)要能够有对话的基本功能,这来自于一个技术,叫做深度神经网络。

2)要能够完成某种任务,比如信息搜索或者是总结,或者是生成一个对话,这个是需要强化学习的能力。

3)是一个新的研究方向,叫做迁移学习。它能够做什么呢?可以把一个通用模型给个性化,把一个大数据产生的模型能够在个人的小数据上面给个性化,这样可以产生一个很体贴的机器人。

未来这三种方式都不可缺少,最好的方式是把这三个放到一个统一的通用模型里面。我们期待这样的机器人可以做些什么呢?他们可以跟你闲聊,可以给你推荐信息,可以引导你学习一些东西,并且可以提醒你该读这样的问题了,该看那样的东西了。

四、降低AI的门槛,
让其真正for everyone


总结起来说,我们今天的这种变革应该说确实是一种变革,因为就类似于工业革命,工业革命对应过来就是我们今天所说的智能的革命。


当时的工业资本家、金融的资本家今天对应过来,应该是所谓的数据资本家。智能的能力能够建模,可以有跨界的能力、计算的能力、好的反馈、明晰的边界,这些能力的总和是我们所说的智能的能力。这种智能的能力如何能够把它赋予给大众,使得人人可以享受智能的红利,这也是今天我们所要严肃思考的。

因为这样发展下去的一个趋势,是数据有可能聚集在少数人手里,智能和智能的服务也许只有少数人才能够控制所有的发展。我们需要把门槛给降低,使得人人都成为内容的生产者,人人都能够用人工智能来促进他和媒体有机的结合。

我们接下来需要思考的内容:


「包括A.I.时代是否还需要内容的生产者呢?」

「是不是还需要人类的编辑?」

「人工智能会带来一个崭新的不一样的内容生产方式吗?」

「如何避免数据寡头的产生?」

「我们如何能够把智能惠及所有的人群,让大家同时进步?」


这些是我们大家一起需要思考的问题。谢谢大家!


更多精选文章,点击以下标题链接☟


后台回复“笔记侠”获得:
500位商业大咖的600篇演讲笔记
22篇读书笔记&干货版图书
笔记侠出品的电子笔记书

[笔记侠]


点击大咖名字,查看精彩笔记
合作伙伴:混沌研习社|创业邦|领英中国|36氪|腾讯|京东|正和岛|中欧|微链...




转载请保留当前帖子的链接:https://www.beimeilife.com/thread-36058-1-1.html 谢谢
沙发
发表于 2016-11-17 13:36 | 只看该作者
未来谁的天下 | 乌镇大会第一天,马云、王兴说了什么! C/ C. z) [7 V2 z

- u; D* l* F$ w; ~3 I/ o

▌马云:未来30年属于用好互联网技术的公司、国家和年轻人

+ L1 Y8 e, T( Y" w

* {" ?- t" b. ^4 D  X
4 f, ?! M/ P- M( y0 l7 o
第三届世界互联网大会开幕式上,阿里巴巴董事局主席马云发表主题演讲,提出“互联网技术革命解放脑力,未来数据将成为核心资源”、“未来三十年,属于用好互联网技术的公司、国家和年轻人”、“未来教育不仅传输知识,更要注重创造力和想象力的培养”、“智慧驱动需要智商,需要情商,更需要‘爱商’。
. a  A4 U/ [3 _# i, F' u- v: O

8 h+ K8 O2 n9 `0 F1 @8 Y0 o

以下为马云演讲全文:

2 e/ B$ a. I* _

( {$ E+ k; W: ?- n

尊敬的各位领导,各位来宾,上午好!

7 v- C0 e, n" k; d" v: `0 i/ V: w. l  T

这是我第三年参加乌镇会议,非常荣幸每年都能和老朋友新朋友在这里见面。

6 `' |5 J; W9 {0 `

中国人讲,神仙是天上一日,人间一年。我们在互联网公司,肯定没有这么夸张,但是都有这个感觉:过了一个季度就象以前过了一年。

$ I4 w7 ~- J, @: f- X

三年来,互联网世界发生的变化,产生的进步,我想至少相当于过去的十二年。

互联网发展很快,世界变化很大,但其中有一些规律性的东西是不变的。


; X; g0 {  `$ y  P; ~1 Y

我们回顾最近两百年三次技术革命,每次技术革命的周期都是大约50年,而且有一个规律,前20年是技术研发的革命,新技术层出不穷,一批批涌现;到了后30年,进入技术应用,新技术开始和传统产业相结合,新产业不断出现,真正影响生活方方面面。


# a0 Y) Y9 l( U; [

三次技术革命中,第一次技术革命,解放了体力,煤炭成为生产资料;第二次技术革命,解放了距离,石油成为生产资料;这一次互联网技术革命,解放了脑力,数据成为核心资源。未来,数据是生产资料,计算是生产力。

6 u$ X/ ~( x. y2 j7 q6 l

今天互联网刚好走过20年,未来的三十年,是人类最关键,最需要重视,最需要把握的30年。

2 t9 `5 `% j9 ?* G4 G: D3 I, S/ V

6 T( }0 m, `: T/ A" a6 P5 g

1 t& |; q: A- e& `7 ?$ [

未来30年,是新技术融合到传统行业的方方面面,是人类社会天翻地覆的30年,不管你是什么人,不管你身处哪里,我们所有每个人都会是这场大变革的一部分。

) L1 b- q2 H% i8 `! D0 X' i

不过,未来30年一定不会只是“互联网公司”的天下,未来30年是“用好互联网技术”的公司,是“用好互联网技术”的国家的天下,是“用好互联网技术”的年轻人的天下。我们必须同把互联网技术,互联网资源能够普惠化,才能成为造福人类的巨大的福祉。

* \. s0 j$ }/ k! Z& W3 D' o

所以未来互联网没有边界,就像电没有边界一样。你不能说这个行业可以用电,那个行业不能用电,电是没有边界的。今天没有人会拒绝用电,未来没有人会拒绝互联网。没有一个人可以离开网络而存在。


0 Y% u7 Y! O, }+ y' v) L5 b

冲击传统商业的不是电子商务,电子商务只是把握了互联网的技术、互联网的思想,知道未来的经济将完全基于互联网,创造出一套适应未来商业的商业模式而已。未来三十年互联网将会冲击很多行业,很多就业会失去。

' U3 q0 u' x/ B# ~

过去二十年,我们把人变成机器,未来,我们将把机器变成人。未来的教育不仅仅传授知识,更注重创造力和想象力的培养。


: j) r/ M5 G. X% ^5 I  ?

前不久我说过,电商未来会消失。


' O, D. P+ E3 Z2 ]  P) M

过去电商从无到有,未来会再从有到无;互联网也会经历一个从无到有,再到无的过程。


' V* u5 j1 ^* j7 {. }6 }3 F1 C

所以,我们今天的会议是为了未来三十年,我们的目标是为未来三十年,三十岁以下的年轻人,三十人以下的小企业。


0 [% g) n+ M; b9 ^' P7 t

' Y/ {; K$ `! C7 i* t

6 U; O4 Y+ w( s# x! X6 N- a* F/ a

电是欧洲发明,但是真正的成功却不是在欧洲,而是美国抓住了机遇普及应用,成为能源时代的强国。


$ a( V9 D! n! P' ]

汽车发明以后,英国通过了一个红旗法案,规定一辆汽车要有三个人开,其中一个人步行在车前,举着红旗,汽车不能跑到红旗前面。因为没有看清未来,英国汽车行业的研发陷入停滞,英国没有抓住这个机遇。这样的红旗法案今天在全世界各国依然存在。


, a3 \0 r# q  Q

过去是知识驱动,未来是智慧驱动;过去把人变机器,未来把机器变人。过去是以制造为中心,未来就是以创造为中心。以制造为中心的时候,需要能源、电、石油;把一切非标准的变成标准。而未来以创造为中心时,需要的是数据、智商、情商,把一切标准变成非标准,变成个性化。只要你对未来有想象,我相信谁都有机会。需要是你敢不敢对未来有想法!


* t! f1 U$ k# w* z

by 阿里研究院 浙江在线

) B3 |) D! p( ]

▌王兴:接下来不仅是互联网的下半场,也是新经济的下半场


) U, s& F9 y4 z, G, h

# h1 L* x: y& H( k' c5 X

被视为BAT之外“互联网第四极”的美团点评CEO王兴在接受媒体采访时称:


/ U( I) g+ V" W9 Y! i) @7 Q
' I7 H# ?) {" H; ~
“接下来不仅是互联网的下半场,也是整个新经济的下半场。互联网企业作为新经济的一部分,可以充分利用信息技术的优势,利用大数据、人工智能的优势,和传统产业的方方面面进行深度结合。美团点评作为全国最大的吃喝玩乐互联网平台,我们也愿意把美团点评平台上数亿网民吃喝玩乐和消费娱乐的大数据开放出来,与我们几百万商户合作,一起让网络惠及广大消费者的生活服务,推动实体经济发展。”

- o5 I" V: ]# ^' D9 t/ S! n- r: f( o% @

对于未来的新机遇,王兴的判断是:“大的方向上,一方面是扎根于我们原有的信息技术和移动互联网的积累。另一方面确实要深入产业链,跟餐饮业,娱乐业,旅游业,电影行业等各个行业去结合。在新经济的下半场,互联网更多不是完全的颠覆,而是要去拥抱传统产业,与传统产业全面结合和进一步升级改造。”


6 v/ b( H2 J: S$ Z9 D9 u5 ]9 F

“经过前面几十年的积累,现在大数据积累到一定程度,人工智能的技术也逐步发展,到了可以接近实用的阶段。”王兴说。

6 k' ~* q9 _1 `

by 焦丽莎《[url=]中国企业家杂志[/url]
; J0 D: i4 `. Y3 ^3 u# t) g/ a( Q' r5 k


4 u  D- H0 ?( P# k8 H
6 [& W7 G* q3 A( Y

使用高级回帖 (可批量传图、插入视频等)快速回复

您需要登录后才可以回帖 登录 | 注册

本版积分规则   Ctrl + Enter 快速发布  

发帖时请遵守我国法律,网站会将有关你发帖内容、时间以及发帖IP地址等记录保留,只要接到合法请求,即会将信息提供给有关政府机构。
快速回复 返回顶部 返回列表