“你有多少大数据和Hadoop的经验?”他们问我。我一直在用Hadoop,但很少处理几TB以上的任务。我基本上只是一个大数据新手——知道概念,写过代码,但是没有大规模经验。
他们给我一个U盘,里面有所有的数据,600MB,对,他们所有的数据。不知道为什么,我用pandas.read_csv(Pandas是一种Python数据分析库)而不是Hadoop完成了这个任务后,他们显得很不满意。
Hadoop里,所有计算都必须按照一个map、一个group by、一个aggregate或者这种计算序列来写。这和穿上紧身衣一样,多憋得慌啊。许多计算用其他模型其实更适合。忍受紧身衣的唯一原因就是,可以扩展到极大极大的数据集。可你的数据集实际上很可能根本远远够不上那个数量级。
可是呢,因为Hadoop和大数据是热词,世界有一半的人都想穿上紧身衣,即使他们根本不需要。
最近php项目组准备引入一个新的特性: Internals, 这引起了一些程序员的强烈不满。
本文的作者是一名资深php程序员,他很担心php会因为少数人的要求而变得越来越臃肿,
他列出了反对Internals的几点理由:
Intervals会使调用变慢;
Intervals缺乏远见;
Internals缺乏引领能力
Internals缺乏监管:作者认为这是少数人的需求,却被强加给整个社区
某位程序员在论坛上发表了对GO语言的一些看法,引起广泛讨论。
Go语言好不好,快不快,人性化与否这些不讨论,光说google一概的作风,没必要在Go语言上作知识投资。google推出的新玩意太多了,大多数都 是google的人头脑一时发热就搞出来了,头脑一冷静就没下文了。google扔掉的东西太多了,google都没把Go语言当回事,国内却掀起了学 Go的热潮。假如有一天google宣布放弃Go语言项目,码农的无数个挑灯夜读就打水漂了。
Google,我们是说那家打工者天堂公司吗?在这家地球上最大的,最耀眼的明星科技企业工作,怎么可能会很糟糕?好吧,让我们看看这个Quora帖子,在“工作在超级谷歌”小组下的“来自前Googler的流言蜚语”部分。我们摘编了一些比较精彩的评论。
MongoDB 是一个基于分布式文件存储的数据库。比较适合存放JSON数据。
下面是最简单的一段mongodb代码查找代码,先列出所有的数据库名称:listCollections,再列出某个数据集下的所有数据。
可以用 start 命令用来启动一个单独的窗口来运行指定的程序: