Bloom filter

Bloom filter 是由 Howard Bloom 在 1970 年提出的二进制向量数据结构,它具有很好的空间和时间效率,被用来检测一个元素是不是集合中的一个成员,这种检测只会对在集合内的数据错判,而不会对不是集合内的数据进行错判,这样每个检测请求返回有“在集合内(可能错误)”和“不在集合内(绝对不在集合内)”两种情况,可见 Bloom filter 是牺牲了正确率换取时间和空间。

如需要判断一个元素是不是在一个集合中,我们通常做法是把所有元素保存下来,然后通过比较知道它是不是在集合内,链表、树都是基于这种思路,当集合内元素个数的变大,我们需要的空间和时间都线性变大,检索速度也越来越慢。 Bloom filter 采用的是哈希函数的方法,将一个元素映射到一个 m 长度的阵列上的一个点,当这个点是 1 时,那么这个元素在集合内,反之则不在集合内。这个方法的缺点就是当检测的元素量很多时候可能有冲突,解决方法就是使用 k 个哈希 函数对应 k 个点,如果所有点都是 1 的话,那么元素在集合内,如果有 0 的话,元素则不再集合内。

Bloom filter 优点就是它的插入和查询时间都是常数,另外它查询元素却不保存元素本身,具有良好的安全性。它的缺点也是显而易见的,当插入的元素越多,错判“在集合内”的概率就越大了,另外 Bloom filter 也不能删除一个元素,因为多个元素哈希的结果可能在 Bloom filter 结构中占用的是同一个位,如果删除了一个比特位,可能会影响多个元素的检测。

继续阅读

关于因子分析

因子分析是模式识别中降维的一个重要方法,它把具有相关性的多个特征参数去相关性,提取出因子进行分析,有效的减少了计算量,但通过 SPSS 实验发现,如果进行因子分析后,得到的因子对分类的贡献值不相同,通过碎石图可以看到少量因子对聚类贡献大,更多的因子对聚类贡献小,如果把它们同等对待进行下一步的聚类(如 k-means 聚类)会严重影响聚类结果,导致还不如用一个因子进行聚类。下面是计算因子的方法: 继续阅读

怎样做出透过显示器的效果【例】

最近看到穿过显示器效果的一些图,创意不错就用 PS 简单做了一个,图片是手机现场拍得效果不是很好:

  1. 首先拍摄两张图片,只有显示器的与显示器之前的物体(你将要穿过的,我这里的是手)。
  2. 把两张图片在 PS 中对整齐,可以调整前一个图层的透明度。
  3. 把单独拍的显示器图层放在有物体(手)图层的后面,用钢笔或者直接选取工具将显示器的边框选取出来,切换到前一个图层应用这个选取的蒙版,将手遮挡显示器边框的位置遮挡住,这样就只显示了下一个图层的显示器边框。
  4. 调整显示器内手的饱和度和色阶,大功告成了。
  5. 下面上面两张是原始图片,下面一张是结果图。

 

一个不太简单英文句子的分析

ZFS clone: A clone is identical to a filesystem with the exception of its origin. Clones originate from snapshots and their initial contents are identical to that of the snapshot from which it originated.
这句话源于 ZFS 文件系统文档中 ZFS 磁盘结构关于 ZFS 克隆的一句话。前半句好解释:除了它的起源,一个克隆和文件系统相同。

后面一句是个并列句,并列句前半句“ Clones originate from snapshots ”是说“所有克隆来源于快照”。

后半句结构理清楚稍微有点困难,我们一点点分析,首先 their 是指 clones ,后面的 it 指的是前面的 snapshot ,也就是“起源于它的快照”,这里 originated 是主动用法,不是“ be originated from ”,所以要注意翻译的时候不是“ from which it 起源于”,中间 that 指代的是 contents ,因为 identical to 应该前后需要的是相同的东西,如果不要 that of 而是“ their initial contents are identical to the snapshot ”就成了他们(克隆)的初始内容和快照相同了(应该对应的和快照内容相同),如果我还在高中的话,这种语法句子可能会更擅长一些。所以本句就可以翻译成:

“克隆起源于快照并且他们的初始内容都是和起始的那个快照的内容相同”            即:

“克隆起源于快照并且他们( their 克隆)的初始内容都是和起始的那个( from which it originated )快照的内容( that of  the shapshot )相同”

百度知道参考
http://zhidao.baidu.com/question/331491412.html