说实话,如果古希腊的西西弗斯是一个在2016年编写开源代码的开发者,那他会有宾至如归的感觉。著名的西西弗斯处罚,是神话流传下来的,他被迫推一块巨大的石头上山,当登顶之后,只能眼睁睁看着它滚下去,周而复始直到永远。悄无声息的,全球的开发者在过去的几年里,也在接受类似的处罚。而且巨石还在不断变大。
美国国会图书馆拥有约2400万本各种类型的图书。它是人类有史以来,创造的书写人类知识最大的宝库。
2009年,Github成立。它现在拥有超过3500万软件库或信息库,有着几十万亿行代码。研究表明,这一数额以指数速度增长,每14个月左右还会双倍增长。开放源代码是毫无疑问今天编程技术的前沿,是人类知识最大的、功能最强大、最先进的宝库。
那么,为什么90%-98%的开放式源代码,12个月后会被抛弃?
我们先来看一组惊人的数字:今天写的代码,明年今日,90%以上将永远不会被再次使用。
它们变得无效、过时,在时间的流沙中被遗忘。在2015年调查中,Stack Overflow发现,每个开发者在工作之外一周平均花费大约7小时来编程。 GitHub的报告指出超过1200万用户在开源项目工作。数百万聪明的人花了数百万个小时的工作就这样被人们置之不理了。
最疯狂的一部分是似乎没有人问“为什么?”。为什么绝大多数开放源代码被掩埋,被忘记了?为什么我们每一天一遍又一遍地编写相同的代码,而同一时间该代码几乎可以肯定就在开源平台的某处, 在等待被我们使用的?
这种事发生的主要原因是,因为人们只是把信息库作为存储库。开发者都知道AngularJS,或JQuery的或React,但很少有人知道超过10个开源软件包。这就是让人疯狂的部分,因为人们不知道、或者不使用整个开源软件包,所以没有人使用其中的代码。写于2015年的软件包可能对一个人来说不是整体都有用,但也许它恰好就包含了所需的功能。最有用的部分不总是整个包,有时是其中的一段代码。
比方说,有人正在寻找一个JavaScript的功能以在数组中洗牌元素,或不同的功能来创建随机的字符串。这些小的代码片段在开源平台有几百个相同的。但是,没有人知道他们的存在,即使他们知道,也没有人知道如何找到它们。因此,这些有价值的知识被丢弃或遗忘,只是因为它们难以获得。实在太扯了,对所有人而言都没好处。
那么,我们要如何解决这个烂摊子?回答这个问题很容易,做起来就很难,你需要做三件事情:
从功能方面整理所有开放的源代码,对它们进行详细分类
建立一个模型来表示这些不同代码的实际功能
创建一个容易简单的方法来搜索和查找这些代码片段。
这就是我们建立Cocycles的原因。Cocycles满足上述所有的条件,同时还在继续完善。它的算法可以处理大量的开源代码,阅读和理解每一条不同的代码的功能。然后,它可以让人们使用简单的英文来搜索代码。
例如,用户只需要输入“洗牌阵列”或“创建随机字符串”,然后它们会用各种开放源代码执行、文档、用法示例和更多的方式呈现。它甚至会提供生成的包含所有的附属和子功能的有用片段。
在未来的几年后,人工智能软件也许能够用它来寻找和学习新的代码;不断完善和改变代码。
本文链接:http://linyuehan.com/post/15.html
本文标签: