咨询/看点

蛙盟云:瞧,这一款充满人情味的AI产品

2015年12月07日 17:37   0   2453
来源:来源不详

蛙盟云按:智慧全媒体技术提供商-关注产品信息和企业信息透明化的平台,北京金启程科技的产品线:数字报、数字报软件、电子报软件、移动数字报APP、全媒体集群门户、portal网站群、内容管理系统、CMS系统、政府门户、教育门户等。
    xpaper数字报云:注册会员即可获得1000元代金券。我现在就要注册数字报云平台,【点击注册】

                     

Aaron Halfaker刚刚开发了一个人工智能引擎,设计这个引擎的目的,是为了让他自动分析Wikipedia上面的内容变更。

Wikipedia就是那个著名的线上百科全书,任何人都可以对其中的内容进行编辑。这个非盈利网站用众包的思想搭建了一个无所不包的百科全书,而且这个网站永远的改变了我们获取信息的方式。到目前为止,它已经成为了全世界互联网浏览次数排名前十的网站,而且它还让人们将此前出现的各种著名的百科全书都扔进了垃圾箱。虽然如此优秀,但是Wikipedia依然有其缺点。由于任何人都可以对Wikipedia上面的内容进行编辑,这意味着任何人都可能在上面添加虚假或是错误的信息。Wikimedia Foundation是负责监管Wikipedia的组织,作为该组织的高级研究科学家,Halfaker开发了一个人工智能引擎,他希望可以利用这个引擎来解决有人恶意篡改Wikipedia信息的问题。

“我发现,网络上大多数的篡改行为,他们所使用的手段其实都不是特别高级。”

Wikipedia在世界各地有许多志愿者,他们负责网站上文章的编辑和维护。如果Halfaker的引擎可以发挥作用的话,从某个角度来看,它将会让这些志愿者的共组强度大大减少。而且随着这个引擎的不断完善,未来的某个时间点上,Wikipedia将会不再需要这些志愿者编辑,类似的情况我们已经见过太多,很多地方人们都在逐渐被人工智能所取代。然而,Halfaker并不这么认为,他的目的并不是用技术代替人工,而是希望通过技术的方式增加人们对Wikipedia的参与度。尽管有些人预测,在接下来的20年内,47%的人类工作岗位将会被人工智能和机器人所替代,但是有人却持有不同意见。这部分人相信,人工智能将会创造更多的人类工作岗位,Halfaker就是这部分人之一。

Wikipedia研究部门总监Dario Taraborelli表示:“这个项目,是为了尝试让Wikipedia带回更多的人类元素。它的目的是要将人类的注意力分配到最需要的地方。”

不要吓走新人

在过去的时候,如果你对某篇重要的Wikipedia文章进行了修改,通常情况下,你会受到一个自动回复,内容为提醒你无权作出此项修改。只有在完全遵守一套非常严格的规定之下,系统才会批准你的修改请求。Halfaker和其他一些人的研究显示,这种死板的方式让许多人知难而退,其中包括了许多某些领域的专业人士,他们本来有能力在这里分享自己的专业知识,但是过于严格的显示让他们扭头离去。他们在2009年进行的一项调查显示,在Wikipedia成立仅仅8年之后,这个网站的参与度已经开始出现了下滑。

Halfaker表示:“下滑的原因在于,刚刚接触到Wikipedia的新用户不愿意继续在这里逗留,不想继续使用。”

“从本质上看,许多Wikipedia用户想要的是用最高的效率获取信息,而不是辨别虚假信息和不受欢迎的人。而尤其对于新用户来说,他们不会修改信息、也很难辨别信息的真伪,这让他们的体验变得非常不好。”

而有了这个全新的人工智能项目,Halfaker希望可以让Wikipedia的新用户和新编辑感到更加这个网站变得更加友好,从而提高他们的参与程度。这个引擎使用了一套开源的机器学习算法,这就是著名的SciKit Learn。这个服务的目的是自动辨别明显的恶意篡改和善意的信息改善之间的区别。

在部署了这个人工智能引擎之后,志愿者编辑在修改文章内容的时候,引擎会自动判断本次修改是恶意篡改还是信息改善,若属于后者,系统将会自动提供授权,从而让人们在修改信息的时候不再如此痛苦。其实Wikipedia以前就有自动化工具,他们并不是急切的需要一个自动化工具来吸引更多的人类编辑,他们需要的,是一个更好的自动化工具,让网站变得更加友好易用。

在明尼苏达大学攻读博士学位期间,Halfaker就经常使用Wikipedia来查询各种信息,因此他对Wikipedia有着特别的感情。他表示:“许多内容篡改的手段其实并不是十分高明,只要稍加研究就能辨别出来。”

从宏观来看,这个人工智能算法其实只是一种非常简单的机器学习系统。但是这个系统却非常高效。它的工作方式就是监测某些特定的词汇,以及这些词汇的变体或是某些特定的键盘输入方式。例如,某些胡乱键入的长词。Halfaker表示:“信息篡改者常用的做法之一,就是胡乱在键盘上打字,而且字符之间基本没有空格,通过对这种行为的检测,系统可以很轻松的判断本次内容修改是否是恶意篡改。”

Halfaker表示,他明白这种系统也许并不能检测到每一次信息篡改行为,但是他相信这种方式在大多数情况下都是有效的。他表示:“有些人在篡改内容的时候,不会这样的 ‘简单粗暴’。他们会煞有其事的写下一篇看上去无懈可击的文章,然后进行提交。这些人就是喜欢这样恶作剧。面对这样的篡改,这个算法还无能为力。但是研究显示,大部分的篡改行为都不是这样高明的做法。”

Wikipedia可以自动写文章?

在其他一些公司,尤其是谷歌、Facebook、微软等互联网巨头,他们都在纷纷拥抱一种更加新颖的机器学习,也就是所谓的“深度学习”。通过神经网络——机器所组成的高度类似人类大脑的网络——深度学习算法已经证明了自己的能力,人们使用这种技术可以让机器做更多的事情,例如识别图像、识别语音,以及将某种语言翻译成另一种语言。例如,人们在将狗的图片输入到神经网路之后,机器就可以学会识别出所有带有狗的图片。

利用同样的算法,研究人员已经开始尝试搭建能够听懂人类自然语义的系统。所谓自然语义,就是我们每一天所说和所写的语言,而无需在对计算机说话的时候可以放慢语速或是尽可能的大声。研究人员将人类的对话录音输入到神经网络当中,从而教会机器说话。同样,如果我们将足够多的新闻报道输入到神经网络,我们就可以将会机器自己写新闻文章。也许到了未来的某个阶段,我们可以让机器自己编辑Wikipedia。

我不知道我们是否会迎来这么一天,也许算法会击败人们的判断。也有可能这一天根本就不会到来。”

Halfaker认为,这一天也许最终将会到来,但是它离我们依然十分的遥远。他表示,即使这一天真的到来了,Wikipedia依然会继续需要人类的维护,因为神经网络依然需要人类的指导。Halfaker表示:“我不知道我们是否会迎来这么一天,也许算法会击败人们的判断。也有可能这一天根本就不会到来。”正是出于这个想法,他才决定开发这样一个人工智能服务,从而给Wikipedia吸引更多的人类编辑。

据悉,Halfaker和Wikimedia Foundation在最初的阶段并不会直接将这个算法部署到Wikipedia上,而是将其作为一项在线服务提供给所有Wikipedia社区用户。他表示:“我们希望能以一种简单的方式对这个算法进行试验和评论。与用户展开对话,进入到一个全新的世界,那里我们可以用更好的方式获取内容和新编辑。”虽然这是一个人工智能产品,但是它并不缺少人情味。

(编辑:Zoey)


转载请以链接形式注明出处:

本篇文章来源于 "xpaper报刊网|蛙盟云平台" :http://www.womtech.net/html/hssy1/index.shtml

更多技术资讯,请访问公司官网http://www.jinostart.com

xpaper数字报刊系统介绍,请访问http://www.jinostart.com/html/comp1/content/newsmedia/2016-07-22/1-40-1.shtml

Xpaper数字报报刊云&蛙盟云 版权与免责声明:

① 凡本网注明“来源:xpaper&蛙盟云”的所有作品,版权均属于xpaper软件版权归金启程科技所有,未经本网授权不得转载、摘编或利用其它方式使用上述作品。已经本网授权使用作品的,应在授权范围内使用,并注明“来源:金启程科技&蛙盟云”。违反上述声明者,本网将追究其相关法律责任。

② 凡本网注明“来源:XXX(非xpaper&蛙盟云)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。

③ 本网部分内容来自互联网,如因作品内容、版权和其它问题需要同本网联系的,请在30日内进行。

※ 联系方式:xpaper数字报报刊云&蛙盟云运营中心 Email:jinostart@126.com

下载womtech蛙盟云app客户端 关注蛙盟云微信公众号
下载womtech蛙盟云app客户端 关注蛙盟云微信公众号
©2015北京金启程科技有限公司 京ICP备15002495号-2