页面

2017年8月14日星期一

如何下载推特短片、Periscope 直播录像和动画

1. 手机下载:

  1. https://www.snaptubeapp.com/
  2. 可以用PhotoAround下载推特视频。还有Documents下载YouTube 视频,这两个App很好用
  3. KeepVid Android: Download any song or video from YouTube to your Android http://www.pocket-lint.com/news/141382-keepvid-android-download-any-song-or-video-from-youtube-to-your-android
  4. 如何将推特脸书的视频下载发到墙内的方式方法 https://twitter.com/aCEk9l9HstmPJ58/status/892949400816766976

2. 通过下载网站:

  1. 先复制推文的链接,在粘贴到谷歌浏览器上,在前面加mobile.,如图,打开后点击视频,让它开始缓冲和播放,再点击视频,就可以看到下载的菜单
  2. 【教程】如何下载推特直播(Periscope)视频? https://twitter.com/woshiluguode/status/891453800371769345
  3. downloadperiscopevideos.com
  4. https://www.snappea.com/
  5. http://savevideo.me/
  6. http://twittervideodownloader.com/
  7. http://www.downloadtwittervideo.com/
  8. http://twdown.net/
  9. http://www.tubeoffline.com/download-Twitter-videos.php
  10. https://download-twitter-video.com/
  11. http://keepvid.com/
  12. http://99downloader.com/twitter-video-downloader
  13. https://www.igeeksblog.com/how-to-download-twitter-video-on-iphone-and-ipad/

3. 通过浏览器扩展:

  1. Twitter Video Assist https://chrome.google.com/webstore/detail/twitter-video-assist/cledppeceojodgghbbkaciochldmpdfk
  2. Twitter Video Downloader https://chrome.google.com/webstore/detail/twitter-video-downloader/ncopnfnhaehoeebnokdgjfcjgpmcgjmj

4. 通过电脑软件:(功能最强)

  1. Youtube、Twitter、Facebook 等网站视频录像和 Periscope 直播录像都可以用电脑软件 https://rg3.github.io/youtube-dl/https://you-get.org 下载。这两个开源软件支持非常多的网站,经常更新。
  2. Youtube 视频录像或音乐录音下载 https://www.4kdownload.com/

5. 批量下载一个用户的推特相册:

  1. Twitter Media Downloader https://chrome.google.com/webstore/detail/twitter-media-downloader/cblpjenafgeohmnjknfhpdbdljfkndig

参考:

http://goo.gl/yShmp 我用过的最好的用来下载 youtube 录像的 chrome 扩展

如何下载网络视频录像

http://lihlii.blogspot.nl/2013/05/blog-post_4.html
http://lihlii.blogspot.nl/2012/11/fwd_11.html
http://lihlii.blogspot.nl/2012/11/blog-post_22.html
还可以用 nettransport URL 嗅探,chrome 插件 youtube downloader 可以下载 youtube 录像

_*_

2017年6月21日星期三

一五一十 Co-China 周刊 大数据 人工智能 深度机器学习

一五一十

Co-China 周刊156期:可疑的大数据 https://groups.google.com/d/topic/cochinaweekly/73np6XbfJdY/discussion

【人人都玩大数据】
Joshua Brustein:大数据到底怎么影响我们的生活?
大数据如何影响文化产品

【玩转▪大数据】
David Brooks: "大数据"时代,什么是数据分析做不了的?
Tim Harford:大数据,还是大错误?
经济学人:数据,无处不在的数据

【玩坏▪大数据】
Kate Crawford:大数据真有这么神奇吗?
安替:大数据时代的阶级斗争
林靖东:Fuzz:一个反"大数据"的流媒体公司
康国卿,柳小龙:反思大数据时代: 一种全景敞式监狱的视角
推荐阅读:《大数据时代》

【换个角度玩.大数据】
侯世达:关于思考,我一直在思考

Co-China周刊160期:人工智能之惑 https://groups.google.com/d/topic/cochinaweekly/IQynKlUic9U/discussion

【应用·人工智能】
Gary Morgenthaler:人工智能时代已经来临!
Ryan Blitstein:人工智能谱曲的新时代
John Markoff:让机器领会人类语言的"深度学习"
Kevin Kelly:比人类更强:为什么机器人终将也必将接手我们的工作?

【原理·人工智能】
韩彦文:超越逻辑
黃永明:模拟人脑,迄今最大规模
经济学人:人工智能,模仿昆虫智慧
John Searle:《图灵测试:五十五年之后》(《新世纪的哲学》第三章节选)
视频:Alex Wissner-Gross: 一个用来描述人工智能的新方程
荐书:GEB——一条永恒的金带
荐书:奇点临近

【旁观·人工智能】
闻菲:人之为人: 人工智能教会我们什么是真正的智能
陈赛:《黑镜》中照见自己的脸
Gary Marcus:人工智能的威胁
Roger Ebert:影评:《人工智能》(2001)
视频:霍金:人工智能对人类可能是致命的
荐书:The Most Human Human
荐影:2001太空漫游 2001: A Space Odyssey

一五一十周刊111期:"棱镜"聚焦——国家安全与个人隐私警戒线 https://groups.google.com/d/topic/cochinaweekly/jF9g38xwRYg/discussion

【史】
8-1 Paul M. Barrett: 关于美国国家安全局窃听丑闻
8-2涂子沛:政府能否对公民进行网上监控
8-3张哲:永别了,史塔西! ——参访前东德秘密警察总部
【变】
8-4 在信息时代保护公民自由
8-5金雁:如何对待专制时代的 秘密警察和告密行为
 
【思】
8-6 Dahlia Lithwick: 国家安全与隐私权的界限在哪里(译言网)
8-7《经济学人》:秘密、谎言及美国间谍 (译言网)
8-8 周保松:反思性认可与国家正当性

译言:《连线》杂志:三大突破让人工智能终成现实 http://lihlii.blogspot.nl/2017/06/blog-post_21.html

卿子矜:测试:微信如何审查内容 http://lihlii.blogspot.nl/2017/06/blog-post.html


译言:《连线》杂志:三大突破让人工智能终成现实

https://groups.google.com/forum/#!topic/cochinaweekly/78QJhC0CVLg

译言:《连线》杂志:三大突破让人工智能终成现实

译者:沈持盈  
原文作者:Kevin Kelly

我们不仅仅是在一直重新定义人工智能的意义——也是在重新定义人类的意义。过去60年间,机械加工复制了我们曾认为是人类所独有的行为和才能,我们不得不改变关于人机之间区别的观点。随着我们发明出越来越多种类的人工智能产品,我们将不得不放弃更多被视为人类所独有能力的观点。

数月前,我长途跋涉来到位于纽约州约克城高地的IBM研究实验室的林间园区,为的就是能早早一窥那近在眼前却让人期待许久的人工智能的未来。这儿是超级电脑"沃森"(Watson)的研发地,而沃森在2011年就在"危险边缘"(Jeopardy!)[1]节目的比赛里拔得头筹。最初的沃森电脑仍留于此处——它是一个体积约与一个卧室相当,由10台直立的冷柜式机器围成四面墙的计算机系统。技术人员可以通过系统内部的小细孔把各种线缆接到机器背部。系统内部温度高得出奇,仿佛这个计算机集群是活生生的一般。

如今的沃森系统与之前相比有了显著差异。它不再仅仅存在于一排机柜之中,而是通过大量对用户免费开放的服务器传播,这些服务器能够即时运行上百种人工智能的"情况"。同所有云端化的事物一样,沃森系统为世界各地同时使用的客户服务,他们能够用手机、台式机以及他们自己的数据服务器连上该系统。这类人工智能可以根据需求按比例增加或减少。鉴于人工智能会随人们的使用而逐步改进,沃森将始终变得愈发聪明;它在任何一次情况中所获悉的改进点都会立即传送至其他情况中。并且,它也不是一个单一的程序,而是各种软件引擎的集合——其逻辑演绎引擎和语言解析引擎可以在不同的代码、芯片以及位置上运行——所有这些智慧的因素都汇集成了一个统一的智能流。

用户可以直接接入这一永久连接(always-on)的智能系统,也可以通过使用这一人工智能云服务的第三方应用程序接入。正如许多高瞻远瞩的父母一样,IBM想让沃森电脑从事医学工作,因此他们正在开发一款医疗诊断工具的应用程序,这倒也不足为奇。之前,诊疗方面的人工智能尝试大多以惨败告终,但沃森却卓有成效。简单地说,当我输入我曾经在印度感染上的某种疾病症状时,它会给我一个疑似病症的清单,上面一一列明了可能性从高到低的疾病。它认为我最可能感染了贾第鞭毛虫病(Giardia)——说的一点儿也没错。这一技术尚未直接对患者开放;IBM将沃森电脑的智能提供给合作伙伴接入使用,以帮助他们开发出用户友好界面为预约医生及医院方面服务。"我相信类似沃森这种——无论它是机器还是人——都将很快成为世界上最好的诊疗医生",创业公司Scanadu的首席医疗官艾伦・格林(Alan Greene)说道,该公司受到电影《星际迷航》中医用三录仪[2]的启发,正在利用云人工智能技术制造一种诊疗设备。"从人工智能技术改进的速率来看,现在出生的孩子长大后,很可能不太需要通过看医生来得知诊疗情况了。"

随着人工智能发展,我们可能要设计出一些阻止它们拥有意识的方式——我们所宣称的最优质的人工智能服务将是无意识服务。

医学仅仅只是一个开始。所有主流的云计算公司,加上数十家创业公司都在争先恐后地开展类似沃森电脑的认知服务。根据量化分析公司Quid的数据,自2009年以来,人工智能已经吸引了超过170亿美元的投资。仅去年一年,就有322家拥有类似人工智能技术的公司获得了超过20亿美元的投资。Facebook和谷歌也为其公司内部的人工智能研究小组招聘了研究员。自去年以来,雅虎、英特尔、Dropbox、LinkedIn、Pinterest以及推特也都收购了人工智能公司。过去四年间,人工智能领域的民间投资以平均每年62%的增长速率增加,这一速率预计还会持续下去。

纵观所有这些活动,人工智能的未来正进入我们的视野之中,它既非如那种哈尔9000(HAL 9000)(译者注:小说及电影《2001:太空漫游》中的超级电脑)——一台拥有超凡(但有潜在嗜杀倾向)的类人意识并依靠此运行的独立机器那般——也非让奇点[3]论者心醉神迷的超级智能。即将到来的人工智能颇似亚马逊的网络服务——廉价、可靠、工业级的数字智慧在一切事物的背后运行,偶尔在你的眼前闪烁几下,其他时候近乎无形。这一通用设施将提供你所需要的人工智能而不超出你的需要。和所有设施一样,即使人工智能改变了互联网、全球经济以及文明,它也将变得令人厌倦。正如一个多世纪以前电力所做的那样,它会让无生命的物体活跃起来。之前我们电气化的所有东西,现在我们都将使之认知化。而实用化的新型人工智能也会增强人类个体(加深我们的记忆、加速我们的认知)以及人类群体的生活。通过加入一些额外的智能因素,我们想不到有什么东西不能变得新奇、不同且有趣。实际上,我们能轻易地预测到接下来的一万家创业公司的商业计划:"做某项事业,并加入人工智能"。兹事体大,近在眼前。

大约在2002年时,我参加了谷歌的一个小型聚会——彼时谷歌尚未IPO,还在一心一意地做网络搜索。我与谷歌杰出的联合创始人、2011年成为谷歌CEO的拉里・佩奇(Larry Page)随意攀谈起来。"拉里,我还是搞不懂,现在有这么多搜索公司,你们为什么要做免费的网络搜索?你是怎么想到这个主意的?"我那缺乏想象力的无知着实证明了我们很难去做预测,尤其是对于未来的预测。但我要辩解的是,在谷歌增强其广告拍卖方案并使之形成实际收益,以及进行对YouTube的并购或其他重要并购之前,预测未来是很难的。我并不是唯一一个一边狂热地用着谷歌的搜索引擎一边认为它撑不了多久的用户。但佩奇的回答让我一直难以忘怀:"哦,我们实际上是在做人工智能。"

过去数年间,关于那次谈话我想了很多,谷歌也收购了14家人工智能以及机器人方面的公司。鉴于搜索业务为谷歌贡献了80%的收入,因此乍一看去,你可能会觉得谷歌正在扩充其人工智能方面的投资组合以改善搜索能力。但是我认为正好相反。谷歌正在用搜索技术来改善人工智能,而非使用人工智能来改进搜索技术。每当你输入一个查询词,点击搜索引擎生成的链接,或者在网页上创造一个链接,你都是在训练谷歌的人工智能技术。当你在图片搜索栏中输入"复活节兔子"(Easter Bunny)并点击看起来最像复活节兔子的那张图片时,你都是在告诉人工智能,复活节兔子是长成什么样的。谷歌每天拥有12亿搜索用户,产生1210亿搜索关键词,每一个关键词都是在一次又一次地辅导人工智能进行深度学习。如果再对人工智能的算法进行为之10年的稳固改进,加之一千倍以上的数据以及一百倍以上的计算资源,谷歌将会开发出一款无与伦比的人工智能产品。我的预言是:到2024年,谷歌的主营产品将不再是搜索引擎,而是人工智能产品。

这个观点自然也会招来怀疑的声音。近60年来,人工智能的研究者都预测说人工智能时代即将到来,但是直到几年前,人工智能好像还是遥不可及。人们甚至发明了一个词来描述这个研究结果匮乏、研究基金更加匮乏的时代:人工智能之冬。那么事情真的有变化吗?

是的。近期的三大突破让人们期待已久的人工智能近在眼前:
1. 成本低廉的并行计算

思考是一种人类固有的并行过程,数以亿计的神经元同时放电以创造出大脑皮层用于计算的同步脑电波。搭建一个神经网络——即人工智能软件的主要结构——也需要许多不同的进程同时运行。神经网络的每一个节点都大致模拟了大脑中的一个神经元——其与相邻的节点互相作用,以明确所接收的信号。一项程序要理解某个口语单词,就必须能够听清(不同音节)彼此之间的所有音素;要识别出某幅图片,就需要看到其周围像素环境内的所有像素——二者都是深层次的并行任务。但直到最近,标准的计算机处理器也仅仅能一次处理一项任务。

事情在十多年前就已经开始发生变化,彼时出现了一种被称为图形处理单元(graphics processing unit -GPU)的新型芯片,它能够满足可视游戏中高密度的视觉以及并行需求,在这一过程中,每秒钟都有上百万像素被多次重新计算。这一过程需要一种专门的并行计算芯片,该芯片添加至电脑主板上,作为对其的补充。并行图形芯片作用明显,游戏可玩性也大幅上升。到2005年,GPU芯片产量颇高,其价格便降了下来。2009年,吴恩达(Andrew Ng)(译者注:华裔计算机科学家)以及斯坦福大学的一个研究小组意识到,GPU芯片可以并行运行神经网络。

这一发现开启了神经网络新的可能性,使得神经网络能容纳上亿个节点间的连接。传统的处理器需要数周才能计算出拥有1亿节点的神经网的级联可能性。而吴恩达发现,一个GPU集群在一天内就可完成同一任务。现在,一些应用云计算的公司通常都会使用GPU来运行神经网络,例如,Facebook会籍此技术来识别用户照片中的好友,Netfilx也会依其来给5000万订阅用户提供靠谱的推荐内容。
2. 大数据

每一种智能都需要被训练。哪怕是天生能够给事物分类的人脑,也仍然需要看过十几个例子后才能够区分猫和狗。人工思维则更是如此。即使是(国际象棋)程序编的最好的电脑,也得在至少对弈一千局之后才能有良好表现。人工智能获得突破的部分原因在于,我们收集到来自全球的海量数据,以给人工智能提供了其所需的训练。巨型数据库、自动跟踪(self-tracking)、网页cookie、线上足迹、兆兆字节级存储、数十年的搜索结果、维基百科以及整个数字世界都成了老师,是它们让人工智能变得更加聪明。
3. 更优的算法

20世纪50年代,数字神经网络就被发明了出来,但计算机科学家花费了数十年来研究如何驾驭百万乃至亿级神经元之间那庞大到如天文数字一般的组合关系。这一过程的关键是要将神经网络组织成为堆叠层(stacked layer)。一个相对来说比较简单的任务就是人脸识别。当某神经网络中的一组比特被发现能够形成某种图案——例如,一只眼睛的图像——这一结果就会被向上转移至该神经网络的另一层以做进一步分析。接下来的这一层可能会将两只眼睛拼在一起,将这一有意义的数据块传递到层级结构的第三层,该层可以将眼睛和鼻子的图像结合到一起(来进行分析)。识别一张人脸可能需要数百万个这种节点(每个节点都会生成一个计算结果以供周围节点使用),并需要堆叠高达15个层级。2006年,当时就职于多伦多大学的杰夫・辛顿(Geoff Hinton)对这一方法进行了一次关键改进,并将其称之为"深度学习"。他能够从数学层面上优化每一层的结果从而使神经网络在形成堆叠层时加快学习速度。数年后,当深度学习算法被移植到GPU集群中后,其速度有了显著提高。仅靠深度学习的代码并不足以能产生复杂的逻辑思维,但是它是包括IBM的沃森电脑、谷歌搜索引擎以及Facebook算法在内,当下所有人工智能产品的主要组成部分。

这一由并行计算、大数据和更深层次算法组成的完美风暴使得持续耕耘了60年的人工智能一鸣惊人。而这一聚合也表明,只要这些技术趋势继续下去——它们也没有理由不延续——人工智能将精益求精。

随着这一趋势的持续,这种基于云技术的人工智能将愈发成为我们日常生活中不可分割的一部分。但天上没有掉馅饼的事。云计算遵循收益递增(increasing returns)[4]法则,这一法则有时也被称为网络效应(network effect),即随着网络发展壮大,网络价值也会以更快的速度增加。网络(规模)越大,对于新用户的吸引力越强,这又让网络变得更大,又进一步增强了吸引力,如此往复。为人工智能服务的云技术也遵循这一法则。越多人使用人工智能产品,它就会变得越聪明;它变得越聪明,就有越多人来使用它;然后它变得更聪明,进一步就有更多人使用它。一旦有公司迈进了这个良性循环中,其规模会变大、发展会加快,以至于没有任何新兴对手能望其项背。因此,人工智能的未来将有两到三家寡头公司统治,它们会开发出大规模基于云技术的多用途商业智能产品。

1997年,沃森电脑的前辈、IBM公司的深蓝电脑在一场著名的人机大赛中击败了当时的国际象棋大师加里・卡斯帕罗夫(Garry Kasparov)。在电脑又赢了几场比赛之后,人们基本上失去了对这类比赛的兴趣。你可能会认为故事到此就结束了,但卡斯帕罗夫意识到,如果他也能像深蓝一样立即访问包括以前所有棋局棋路变化在内的巨型数据库的话,他在对弈中能表现得更好。如果这一数据库工具对于人工智能设备来说是公平的话,为什么人类不能使用它呢?为了探究这一想法,卡斯帕罗夫率先提出了"人加机器"(man-plus-machine)比赛的概念,即用人工智能增强国际象棋选手水平,而非让人与机器之间对抗。

这种比赛如今被称为自由式国际象棋比赛,它有点儿像混合武术对抗赛,选手们可以使用任何他们想要用的作战技巧。你可以单打独斗;也可以接受你那装有超级聪明的国际象棋软件的电脑给出的帮助,你要做的仅仅是按照它的建议来移动棋子;或者你可以当一个卡斯帕罗夫所提倡的那种"半人半机"的选手。半人半机选手会听取人工智能设备在其耳边提出的棋路建议,但是也间或不会采用这些建议——颇似我们开车时候用的GPS导航一般。在接受任何模式选手参赛的2014年自由式国际象棋对抗锦标赛上,纯人工智能的国际象棋引擎赢得了42场比赛,而半人半机选手则赢得了53场。当今世上最优秀的国际象棋选手就是半人半机选手Intagrand,它是一个由多人以及数个不同国际象棋程序所组成的小组。

但最令人惊讶的是:人工智能的出现并未让纯人类的国际象棋棋手的水平下降。恰恰相反,廉价、超级智能的国际象棋软件吸引了更多人来下国际象棋,比赛比以前增多了,棋手的水平也比以前上升了。现在的国际象棋大师(译者注:国际象棋界的一种等级)人数是深蓝战胜卡斯帕罗夫那时候的两倍多。现在的排名第一的人类国际象棋棋手马格努斯・卡尔森(Magnus Carlsen)就曾接受人工智能的训练,他被认为是所有人类国际象棋棋手中最接近电脑的棋手,同时也是有史以来积分最高的人类国际象棋大师。

如果人工智能能帮助人类成为更优秀的国际象棋棋手,那么它也能帮助我们成为更为优秀的飞行员、医生、法官以及教师。大多数由人工智能完成的商业工作都将是有专门目的的工作,严格限制在智能软件能做到的工作之内,比如,(人工智能产品)把某种语言翻译成另一种语言,但却不能翻译成第三种语言。再比如,它们可以开车,但却不能与人交谈。或者是能回忆起YouTube上每个视频的每个像素,却无法预测你的日常工作。在未来十年,你与之直接或者间接互动的人工智能产品,有99%都将是高度专一、极为聪明的"专家"。

实际上,这并非真正的智能,至少不是我们细细想来的那种智能。的确,智能可能是一种倾向——尤其是如果我们眼中的智能意味着我们那特有的自我意识、一切我们所有的那种狂乱的自省循环以及凌乱的自我意识流的话。我们希望无人驾驶汽车能一心一意在路上行驶,而不是纠结于之前和车库的争吵。医院中的综合医生"沃森"能专心工作,不要去想自己是不是应该专攻英语。随着人工智能的发展,我们可能要设计出一些阻止它们拥有意识的方式——我们所宣称的最优质的人工智能服务将是无意识服务。

我们想要的不是智能,而是人工智慧。与一般的智能不同,智慧(产品)具有专心、可衡量、种类特定的特点。它也能够以完全异于人类认知的方式来思考。这儿有一个关于非人类思考的一个很好的例子,今年三月在德克萨斯州奥斯汀举行的西南偏南音乐节(South by Southwest festival)上,沃森电脑就上演了一幕厉害的绝技:IBM的研究员给沃森添加了由在线菜谱、美国农业部(USDA)出具的营养表以及让饭菜更美味的味道研究报告组成的数据库。凭借这些数据,沃森依靠味道配置资料和现有菜色模型创造出了新式的菜肴。其中一款由沃森创造出的受人追捧的菜肴是美味版本的"炸鱼和炸薯条"(fish and chips),它是用酸橘汁腌鱼和油炸芭蕉制成。在约克城高地的IBM实验室里,我享用了这道菜,也品尝了另一款由沃森创造出的美味菜肴:瑞士/泰式芦笋乳蛋饼。味道挺不错!估计不太有人能想到这样一种菜式。

非人类的智能不是错误,而是一种特征。人工智能的主要优点就是它们的"相异智能"(alien intelligence)。一种人工智能产品在思考食物方面与任何的大厨都不相同,这也能让我们以不同的方式看待食物,或者是以不同的方式来考虑制造物料、衣服、金融衍生工具或是任意门类的科学和艺术。相较于人工智能的速度或者力量来说,它的相异性对我们更有价值。

实际上,人工智能将帮助我们更好地理解我们起初所说的智能的意思。过去,我们可能会说只有那种超级聪明的人工智能产品才能开车,或是在"危险边缘"节目以及国际象棋大赛中战胜人类。而一旦人工智能做到了那些事情,我们就会觉得这些成就明显机械又刻板,并不能够被称为真正意义上的智能。人工智能的每次成功,都是在重新定义自己。

但我们不仅仅是在一直重新定义人工智能的意义——也是在重新定义人类的意义。过去60年间,机械加工复制了我们曾认为是人类所独有的行为和才能,我们不得不改变关于人机之间区别的观点。随着我们发明出越来越多种类的人工智能产品,我们将不得不放弃更多被视为人类所独有能力的观点。在接下来的十年里——甚至,在接下来的一个世纪里——我们将处于一场旷日持久的身份危机(identity crisis)中,并不断扪心自问人类的意义。在这之中最为讽刺的是,我们每日接触的实用性人工智能产品所带来的最大益处,不在于提高产能、扩充经济或是带来一种新的科研方式——尽管这些都会发生。人工智能的最大益处在于,它将帮助我们定义人类。我们需要人工智能来告诉我们,我们究竟是谁。

译注:

[1]"危险边缘"节目:美国哥伦比亚广播公司益智问答游戏节目,已有数十年历史。该节目的比赛以一种独特的问答形式进行,问题设置的涵盖面非常广泛,涉及到历史、文学、艺术、流行文化、科技、体育、地理、文字游戏等等各个领域。根据以答案形式提供的各种线索,参赛者必须以问题的形式做出简短正确的回答。

[2]三录仪、医用三录仪:《星际迷航》中的一个万用工具,能够感知环境四周,并将这些数据记录下来,然后进行计算。它也可以探测生命信号、入侵操作者指定的计算机系统、录音、扫描地形等等;医用三录仪是专门对人体进行扫描以检测病患的工具。

[3]奇点:本是物理学词汇,指"时空中的一个普通物理规则不适用的点"。在美国未来学家雷蒙德・库兹韦尔的理论中,"奇点"是指人类与其他物种(物体)的相互融合。确切来说,是指电脑智能与人脑智能兼容的那个神妙时刻。

[4]收益递增:一种经济现象,表现为投入增加会导致产出以更大的比例增加。

相关链接:
Co-China 周刊 160 期 人工智能之惑

卿子矜:测试:微信如何审查内容

https://groups.google.com/forum/#!topic/cochinaweekly/78QJhC0CVLg

【言论管制】
卿子矜:测试:微信如何审查内容

卿子矜,"泡泡网民报告"作者

随着GFW的升级和对VPN管制的出现,能顺利翻墙的大陆网民在迅速减少,将那些被防火墙封锁的消息传至墙内的可能性持续下降。此般状态下,对墙内平台的审查管制则进一步令传播能力大打折扣,舆论空间急速萎缩。从去年8月的《微信十条》到今年2月4日出台的《互联网用户账号名称管理规定》,短短数月内,中国最受欢迎的社交平台,在法律上受到了一步步的钳制。纽约时报中文网在2月4号发表的一篇评论文章中指出:"共产党强硬的审查策略,越来越多地暴露出他们对于自身应付公众不满情绪能力与日俱增的焦虑"。

由于中国大陆存在的GFW封锁了很多全球知名媒体网站,用户使用大陆平台转发被封锁网站上的文章或讯息一般情况下有四种选择:1、做成长微博;2、截屏发图;3、使用镜像链接;4、复制粘贴在"笔记"或"便签"应用上,以文档链接形式发布。本网近日在微信上做了以下测试,逐一验证这四种方法在当前管制程度下的可行性。
1、做成长微博

做长微博的工具不少,但大部分是国内开发的,它们天生带有关键字审查,含有敏感词的文章或段落会被显示为无法上传或发布后自动被屏蔽。于是,一些境外网站设置了自带的长微博生成器,比如以新闻和时政评论为主题的自由港。自由港建立不到一周便被GFW封锁了,此后用户将文章转发到墙内平台时大多会选择使用"生成长微博"发图片的形式。

2月3日,本网邀请多位身在大陆的微信用户将一篇题为《Wu Tun's Ai Can't Be Here t-shirts for Ai Weiwei》的文章生成长微博图片发布在微信朋友圈,结果显示:图片均被提示"无法上传",且多次验证,结果如一。上述用户发布其他图片(如猫咪或美食)均无障碍,证明非账号本身问题。分析认为,或与微信的图片审查有关——图中含有敏感词条"艾未未"。随即再请身居香港的用户发送该长微博图片,步骤同上,却很轻松的发布成功了,且大陆用户也可见。推测认为,图片审查的确存在,或许以IP所在地区分不同对待。

此后,又选择了同是来自于自由港网站的另外两篇文章,一篇题为《中美8律所围攻阿里 最高检官报曝改差评利益链》,首发于南华早报;另一篇是《郝明义:他们到底所为何来? ——哭后藤健二与James Foley》,转载自唯色博客,均以长微博图片形式发布至朋友圈,结果显示为所有用户可见。这样的结果只能暂时理解为:"艾未未"词条在微信审查过滤器内,而"唯色"和"阿里巴巴"或许不在其中,且被屏蔽的原因与被封锁网站(如自由港)本身无关。

另,在敏感时段针对敏感人物名(或图像)以及事件的屏蔽有可能存在特殊。本网曾有报道,"周小平"高度敏感时期,时政漫画家变态辣椒的相关作品,在微信朋友圈无法顺利发布——海外用户发布,大陆用户看不到;大陆用户发布,只有发布者自己和海外用户可见。

有关长微博监控,泡泡的一位读者,匿名向泡泡爆料说,国内顶尖团队已开发出直接将审查系统接入长微博的技术,虽然相对于纯文字审查速度有所减慢,但直接部署在带审查产品的服务器所在地:

长微博监控也即图片监控确实有开发,主要思路为OCR提取文字信息转为纯文本后接入现有审查系统,OCR模块很nb,国内顶尖团队开发,文本型长微博通吃无压力,对于漫画内文字、图片迭加文字、较规整的手写字体等有干扰的类型也有着极强的识别能力,也就是说只要在审查时接入该模块,所审查的内容是带文字的图片还是纯文本没有太大区别,都可以很好的被审查。弱点是计算量相对于纯文字处理大了几个数量级,单幅图片处理速度约秒级@普通刀片服务器,但是有做分布式设计,实际使用中部署至服务器群后速度会有大幅度提升,系统直接部署在待审查产品的服务器所在的机房,不存在集中的审查中心。早已验收,部署规模未知。

该读者表示,出于安全考虑,不提供信息来源,但"保证所说的都是真的"。
2、截屏发图

利用一些支持滚动截屏的工具截图,其效果等同长微博。如:FS Capturte 、PicPick等。但如果微信的图片审查真的存在,那么截图发布的结果也会如上。目前无法确认的是,微信后台究竟设置了哪些"敏感词",会不会随时变更,以及针对敏感时段敏感对象的处理是否存在相关规定(规则),以及详细内容是什么。当然,长期观察、测试会能找到一些规律。
3、使用网站镜像链接

本网在1月10号的测试发现,邀请多位大陆用户在微信中打开泡泡网的镜像链接,通过右上角的分享按钮将一篇题为《洗脑和反洗脑抗争》的文章发送至朋友圈,结果显示,只有发布者一人可见,包括海外用户,均不可见。第一步测试,选择发布的同时评论一句话"解析周带鱼的昆明之行",特意将墙内已知敏感词"周带鱼"加进去,结果是可以发布,但仅发布者自己可见;第二步测试,不加任何评论,只用分享按钮发布链接,但结果依旧如上。结论:屏蔽针对的是链接本身,与分享评语中是否包含敏感词,没有关系。第三步测试,复制上文链接,直接粘贴在文字发布框内,不通过微信自带的分享按钮,结果显示,所有人都可见。参与同类测试的还有另外三个链接:2月3号,"张尧学和他的透明计算";1月30号,"推特上的五毛外宣";1月27号,"云极权和大数据维稳"。结果显示,只有"云极权"一篇可以正常显示,此外两篇均被自动屏蔽了。从测试的时间线上看,能正常显示与否没有准确日期为界。而同一篇文章,分享到群聊和私聊中,无障碍。推测认为:微信的内容审查很可能存在"过滤器",且它有可能是装在分享按钮上的,并只阻断通往朋友圈的分享。
4、复制粘贴在"笔记"或"便签"应用上,以文档链接形式公开分享

比如大众型笔记应用"有道云"早已被证实存在关键字审查,测试中可以事先将有可能"敏感"的词条字间加分隔符、或以其他语种/拼音/谐音/字头大写字母代替,处理后再上传容易被屏蔽的文章,这样就相当于暂且不考虑应用本身的关键字过滤影响,结果显示,可以在朋友圈发布,且所有人可见。但随后一段不固定时间内,有些文章会被删除,可留存时间的长短与文章本身的敏感程度、发布时间点是否处于敏感时段等因素,存在一定关系。

上述测试文本在私聊和群聊中分享也无障碍,但若内容被删除,则是同步的:不管是分享在朋友圈还是群聊、私聊,甚或个人收藏,内容都会消失。

推测认为,微信的内容审查目前为止主要针对的还是朋友圈,或有应对网信办监管之意。早在去年五月,微信管理部门就已经设置了限制传播能力的红线:"个人好友+关注公众账号+所在群数量不能超过5000人",但即便如此,也无法拦截微信用户将所见消息转发到墙内外各大公开社交平台上,同时朋友圈存在一定程度上既有的辅助传播能力,于是对内容的限制仍然被认为是"必需"的。
微信"处处惊心"

转发敏感内容并不比原创更安全,使用微信与使用微博无二致。去年8月6号,据维权网报道,西安维权人士罗光明因转发了一条关于新疆莎车消息的微信,遭到行政拘留五天,手机被扣押;另有大陆民主维权人士郭春平在去年香港占中抗争期间转发声援香港的微信消息,遭当局威胁。此外,群聊也并不私密,同是维权网报道,去年4月2号,中国民主党浙江委员会数位成员被杭州市公安局国保传唤。警方的询问中包含谭凯先生设立的名为"民主大同思想研讨"的微信群中的聊天内容。如假设,没有群成员走漏消息,那么群聊的私密性就是不存在的;如假设当局及微信后台没有能力将所有微信群全盘监控,那么监控定位重点则很可能是针对"高等级敏感人士"的存在,比如上述消息中的浙江民主党人士。如果上述假设均不成立,也就是说,当局已有能力全盘监控(或以传统的过滤关键字形式进行审查),那么结论只会更可怕。
从公众号实名到普通号实名

官方在去年8月出台的"微信十条"管制措施,明文中显示针对的是微信公众号,并没有提到朋友圈内容以及群聊内容。微信公众号的注册需要实名制,也就是说,在一个公众号在出现之初或已经暗含附带了一定程度上的自我审查,但管理部门似乎完全不考虑公众号持有者"自我审查"的可能性存在,依然制定了苛刻的内容限制和管制条例。据1月21号陆媒报道,在去年的运动式净网中,微信封停了8.5万个"违规公众账号"。这其中究竟有多少是因涉敏而遭封停的,并没有详细说明。

1月13号,陆媒引述中国网信办移动网络管理局负责人徐丰的话说,根据官方在2014年底对即时通讯工具进行的复核结果显示,目前微信用户真实身份注册的比例已经超过80%,而其他的即时通讯工具的真实身份注册比例都在90%以上。2月4号官媒报道,《互联网用户账号名称管理规定》出台,适用于"机构或个人在博客、微博客、即时通信工具、论坛、贴吧、跟帖评论等平台注册或使用的账号名称"。规定:互联网信息服务提供者应当按照"后台实名、前台自愿"的原则,要求使用者通过真实身份信息认证后注册账号。该规定将于3月1号起开始实施。尚且不知届时未实名已注册的账号会不会被停用。规定同时要求用户昵称不得伤害到国家安全。

微信推出后不久就改版为只能使用手机号注册,也就相当于私人用户几乎一经注册就已经被实名制处理了,监控、追踪易如反掌。近期出台的"反间谍法"中包含对言论和传播言论定罪的可能性、"反恐怖法"中包含对言论和思想定罪的可能性,外加各种网络管制条例多方面层层围堵,因言获罪的门槛在极大程度的降低。

微信、微博这类国产应用要生存,就只有老老实实配合审查同时严格实施自我审查这一条出路,控制内容、控制传播、去媒体化只是初级阶段。微博的命运就是一例。最新数据显示,截至2014年12月,中国微博用户规模为2.49亿,较2013年底减少3194万,腾讯、网易和搜狐等昔日"门户"纷纷减少了微博的投入。微博的衰落与管制直接相关,并与党宣专属账号的滋生几乎同步,以大清洗加占领为基本手段、以重夺网络舆论主导权为目的的网络管制,又怎么会放过微信这块迅速膨胀的"肥肉"呢?如今的微信,"最具影响力公众号"榜单中名列前茅者大多为官媒所拥有,近日朋友圈已在插播广告,下一步会不会插入"中国梦"海报、习大大语录、社会主义核心价值观呢?