预测未来,是人类的梦想之一。随着科技的飞速发展,人工智能逐渐能够预测许多事情。最近,美国University of Pennsylvania(宾夕法尼亚大学)的研究团队正在研发一种新的算法,用来预测哪些人在未来会有较高的犯罪几率。
如今,机器算法能够在很多方面对事情的走向及发展做出预测。这些预测结果能够在各行各业对人类起到助力,这种前景广阔的算法也得到了政府和资本的注意。然而,仅凭机器算法对一些事情做出预测的做法涉及到隐私问题和公平问题,也招来了许多质疑。
一、人工智能判断犯罪可能,机器算法可对多领域进行预测
从古到今,关于预测未来的传言不在少数。如诸葛亮可以预测天气借东风,袁天罡能够预测出武则天未来成为皇帝等。这些真假难辨的传言听起来都非常玄,但也从某种程度上反映出了人们对预测未来的渴望。
University of Pennsylvania的统计学教授Richard Berk是预测犯罪算法的主要研发者。他的这种算法是参照Google的Alpha Go研发的。在与李世石对战之前,Google向Alpha Go中灌输了上万的棋局数据,用以训练Alpha Go找到最优的下棋策略,再配合Alpha Go自身的训练,达到提升能力的目的。
Berk研制算法的过程与以上过程类似。Berk和University of Pennsylvania的心理学家Susan Sorenson共同收集了从2009年至2013年10万件家庭暴力案件,将这些数据灌输给电脑程序。数据中包括年龄、性别、第一次犯罪时间、犯罪种类等。这些成果都发表在了《实证法律研究》杂志上。
预测犯罪,听起来那么不可思议。更令人吃惊的是,机器算法的预测功能不仅仅局限于犯罪方面。
去年9月,印第安纳大学伯明顿校区的Jaehyuk Park带领团队利用机器算法预测模特未来事业的成功率。他们下载了Fashion Model Directory(时装模特指南)中431位模特的姓名、年龄、三围、体重等相关信息,结合模特在社交网络上的受欢迎程度以及登上T台的次数等其他数据,预测出模特未来的事业发展情况。
在理科方面,机器算法的预测同样能够发挥作用。宾夕法尼亚Haverford College(哈弗福德学院)的研究团队创造了一种能预测制备晶体方法的机器算法,其预测效果比人工预测更好。
研究人员采用标准的机器算法,用4000次不同的反应下制备晶体的实验数据来对机器算法进行训练。研究团队将存档在实验记录中的暗黑反应和失败信息转换为能够输入机器的格式,让计算机分析试验成功与失败的因素,从而对制备晶体成功的化学条件进行预测。研究员Alex Norquist表示:“失败的反应包含大量未报告和未提取的信息,失败的实验比成功的多得多,但通常只有成功的那些才得以发表。”
机器算法帮助人类实现了预测未来的梦想,随着机器算法在各领域的逐渐拓宽,对生活和社会可以起到许多推动作用。
二、机器算法预测未来,提高生活质量推动社会发展
在研发预测犯罪的算法之前,Berk教授在这方面的研究已经有相当长的一段时间了。他的算法能够帮助监狱决定要把哪些犯人关到高度警戒区,假释部门也用这种算法判断应该对哪类假释人员采取更为严厉的监视手段,警官则可以通过算法预测被捕罪犯是否会再次犯罪。
此外,Berk还编写过一个可以预测哪些工作场所会违反安全规定的算法,能够为Occupational Safety and Health Administration(美国职业安全与卫生管理局)所用。
其实在这种算法出现之前,美国已有用计算机来处理司法案件的先例。上世纪90年代,纽约市曾使用数据信息预测哪些地铁站犯罪率高。
预测犯罪的机器算法可以使警方锁定目标变得更加容易。比如目前涉嫌家暴的罪犯释放率达到了50%,为警方和政府的监控带来了极高的成本。有了预测犯罪的算法,能够为警方的工作带来许多便利,同时也能使社会治安状况良好。
除了治安方面,机器算法预测功能可以提高人们的生活质量。比如MIT(麻省理工学院)计算机科学与人工智能实验室开发了一种预测算法,他们用600个小时让计算机“观看”不同的电视节目,观察其能否预测如接吻、击掌、拥抱等一系列互动行为。
这种算法利用深度学习人工智能来构建其对人类互动的理解。研究者为程序输入原始数据,让算法自己对内容进行区分。
这种算法的目的是让未来的机器人更好地服务于人类。MIT的博士候选人Carl Vondrick表示:“如果你想在家中有一个能够互动的机器人,那么它需要有一些预测未来的基本能力。举个例子来说,在你正要坐在椅子上时,你不会希望机器人恰好在这时候把椅子抽走。”
除了上述领域之外,机器算法还能在好多方面做出预测。比如购物网站能够通过算法知道顾客可能会购买的商品,视频网站能够根据算法预测用户接下去想要看什么视频,气象部门能够根据算法预测出未来一周的天气等等。这些预测能够提高生活质量,推动社会发展。
然而,新技术的发展通常都不够完善,机器算法也是如此。预测未来的功能虽然能为人类提供一些便利,但是这种算法还是存在不少缺陷。
三、机器算法预测未来不太靠谱,准确性值得商榷
机器算法的预测功能对社会和人们的生活起到了一定的推助作用,但细究之下,依然会发现存在许多不完善的地方。
首先,机器算法进行预测时会涉及到隐私侵犯问题。机器在学习的过程中需要大量的数据来进行分析,像是预测犯罪的算法就更需要一些高度隐私的数据。虽然Berk曾表示自己对算法进行训练时用的是公开数据,但是其新算法的功能是判断婴儿是否会在年满18周岁时犯罪,这些数据则是相当私密的。
随着预测算法的发展,未来极有可能会涉及到更多领域。算法在深度学习的过程中,难免会涉及到一些高度隐私的数据。这就牵涉到科技的发展和伦理问题,在预测算法走向成熟之前,需要将这类问题先妥善解决。
其次,这类预测算法的准确性也有待商榷。这是预测算法中最重要的问题,也是被人质疑最多的一点。比如预测犯罪的算法,这种算法的基础都是来源于以往的犯罪统计数据,因此极可能导致把以往的执法模式和认为如穷人和黑人等人群更有犯罪可能的倾向带入算法之中。
根据国外网站ProPublica发布的调查报告显示,佛罗里达州一家法院在风险评分的过程中,发现黑人再次犯罪的几率较高,但实际上白人再次犯罪的情况却比黑人常见。
再如上文提到的预测模特事业成功率的算法,这种算法的预测功效仅限于15名模特,数据并不够全面。此外,这种算法以模特走T台的次数来衡量其成功率并不科学,因为这不足以显示模特真正的价值。
最后,预测算法的技术是否应该公开也是个问题。不只是因为一些数据涉及隐私和人身权利,更涉及到一些商业利益。由于预测算法的技术日益成熟,许多商业公司纷纷入局。密歇根一家商业公司Northpointe开发了一款预测软件,却并未将其公开,这让很多人认为其中存在不可告人的部分,也有人对该公司的做法进行攻击。从商业机密角度来说,商业公司对技术保密也无可厚非,但是对预测算法保密确实会阻碍这方面科技的发展速度。
由此可见,机器算法预测技术给人们带来了一些改变,推动了许多领域的发展。然而这一技术刚刚兴起,许多算法和系统并未经过科学的认证和事实的检验,存在诸多缺陷。因此,尽管机器能够通过学习对一些事情进行预测,但要完全依赖预测的结果,还不是非常靠谱的选择。